钱建立-花开满地分享 http://blog.sciencenet.cn/u/paperopen 《电子设计工程》杂志社 西安知先信息

博文

开放存取对期刊影响力绩效研究综述

已有 5601 次阅读 2009-12-6 22:53 |个人分类:公开发表作品|系统分类:论文交流| 影响因子, 开放存取, 开网

摘要:归纳了国内外主要的OA绩效研究方法,并将它们分为3类:对某个期刊群中OA期刊和非OA期刊影响因子的比较、对某个领域大样本OA论文与非OA论文被引频次的统计比较和对某个混合OA期刊中OA论文和非OA论文影响因子平均值的比较。介绍了其中5个代表性研究的方法和结论。这些研究成果表明,OA对提高期刊影响力有着积极的立竿见影的作用。针对未来需要,本文提出了OA论文比例演变、文献引文中OA文献比例演变、搜索引擎对OA绩效影响的研究方案。
关键词:开放存取,期刊影响力,影响因子,搜索引擎,阅读习惯

  相对于传统的学术文献商业出版模式而言,开放存取(Open Access)作为一种全新的出版模式,引起了社会各界巨大的关注,对其影响和未来走势众说纷纭,但总体而言对其社会影响的评价是积极的,包括对科技文献公平应用的推动和对科技文献影响力的提升。而在可持续发展方面,由于目前尚无成功案例,因此造成了对其命运的担心。本文针对关于OA对期刊论文影响力的研究,通过对已发表的研究成果的分析,对现有研究方法进行了归类。截至目前,关于OA绩效的研究方法可概括为3类:(1)对某个期刊群中OA期刊和非OA期刊的影响因子进行比较。(2)对某个领域大样本OA论文和非OA论文的被引频次进行统计比较。(3)对某个混合OA期刊中OA论文和非OA论文的影响因子平均值进行比较。

1 特定期刊群中OA期刊和非OA期刊影响因子的比较
  采用这种研究方法的重要的OA调查包括汤姆森路透科技集团副总裁J. Pringle对SCI收录期刊中OA期刊和非OA期刊影响因子平均值和分布情况的比较[1],中国的程维红和任胜利在2006-2007年间对1608种中国科技核心期刊中OA期刊和非OA期刊进行的3次统计[2] 。
  J. Pringle的研究方法是,计算2004年ISI引证报告中不同领域OA期刊和非OA期刊影响因子的平均值,计算被引频次在某个范围的OA论文和非OA论文的比例并与SCI收录期刊中OA期刊和非OA期刊的比例进行比较。
J. Pringle得出的结论是:在SCI收录的8700种期刊中,在影响因子和被引频次方面,191种OA期刊与其他非OA期刊不存在明显的区别。
  这项研究成果可能会被一些人理解为,OA对提高期刊影响力没有明显的提升作用。但是笔者从另外一个视角去看待这个研究报告,认为它是对很多人认为OA期刊水平低下、不应被SCI收录的OA怀疑者的一剂清醒剂。对OA是否有效的最有说服力的研究应该是,同一个期刊(其论文质量在OA之前可视为基本相同)OA前后影响因子的比较,而不是拿SCI期刊中2%的OA期刊和98%的非OA期刊的影响因子的平均值来进行比较(当然这种比较也能从一个侧面来反映出OA的绩效),但这是拿苹果和橙子在比较。
  程维红和任胜利在2006年1月、2006年7月和2007年1月先后3次(即每隔6个月),采用Google搜索引擎,对《中国科技期刊引证报告》2005年版所收录的1608种中国科技核心期刊的OA状况进行了搜索调查,并对OA期刊比例的变化、不用领域OA期刊的比例、OA期刊和非OA期刊的影响因子等期刊评价指标的差异进行了统计分析。该研究是迄今为止中国学者进行的OA绩效研究中最有代表性的质疑。其调查结果显示:在这1608种中国科技核心期刊中,2006年1月有OA期刊167种(占10.39%),2006年7月有198种(占12.31%),到2007年1月增加到230种(占14.30%),每隔半年增长约2%。列出了各主要学科非OA期刊与2006年1月搜索到的102种OA期刊的主要引证指标的平均值。表1列出了各主要学科非OA期刊和OA期刊的主要引证指标的平均值。

  由表1可见,OA期刊的总被引频次、影响因子和即年指标的平均值分别是非OA期刊的180%、150%和159%。

2 特定领域OA论文和非OA论文被引频次的比较
  采用对特定领域OA论文和非OA论文的被引频次进行比较来研究OA绩效的代表性研究包括:H. Stevan对ISI数据库中12年的1400万论文的不同发布年度、不同领域的OA论文和非OA论文的引用情况进行了统计研究[3]; S. Lawrence对119924 篇计算机领域相关学科的OA会议论文和非OA论文的被引用情况进行了近1年的跟踪和统计[4],K. Antelman 从哲学、政治、电子电气工程、数学4个领域对SCI收录期刊中影响因子排名前10的期刊中随机选出50篇论文和50篇非OA论文,对其被引频次进行比较[5] 。
  最早进行OA绩效研究的S. Lawrence,对119924 篇计算机领域相关学科的会议论文(非期刊论文)进行了传播方式和效果的研究。研究使用的搜索引擎是ResearchIndex,其研究主要的目的是比较在线论文对期刊影响力的推动,同时也统计了OA对论文影响力的提升作用。其研究方法是:(1)确定统计对象。把DBLP (dblp.uni-trier.de)数据库的计算机领域发表于1989-2000年间的相关论文定为研究对象。(2)发表年度分组。把被调查论文按发表年度从1989年到2000年分成6组,两年一组。(3)论文被引频次分组。把每年组的论文按被引频次0、1、2~3、4~7、8~15、16~31、32~63和64~127进行分组,然后统计这些论文能在搜索引擎ResearchIndex找到全文的比例。
  S. Lawrence的统计结果表明,离线论文的平均影响因子为2.74,而在线论文的平均影响因子为7.03,提高了157%。
  S. Lawrence又对发表这些论文的会议文集进行了筛选,选择出了1494种可以发现5篇OA论文和5篇非OA论文的会议文集,对这些随机选出的OA文献和非OA文献的影响因子进行了统计。统计结果表明:会议文集中90%的论文显示出OA文献的引用率比非OA高,同一个会议文集中OA文献的引用频次平均比非OA文献高336%,在发表后第一季度、第二季度和第三季度的数据分别是58%, 158%和361%。
  S.Harnad等人对SCI收录的7000种期刊1991-2001年收录的1400万篇论文和arXiv.org(主要收录物理学、数学和计算机科学)收录的26万篇全文进行了比较统计,把在ISI数据库和arXiv.org中同时存在的文献定义为OA文献。统计结果显示,OA文献的影响因子大约是非OA文献的3倍,其统计结果印证了S. Lawrence的统计。具体统计如图1和图2所示,其中图1为核物理和原子物理领域的统计结果,图2为整个物理学领域的统计结果。
 
       红色:OA和非OA论文影响因子的比值;绿色:OA论文的比例;灰色:论文总数
         图1  核物理和量子物理领域OA论文和非OA论文的比较
 
  红色:OA和非OA论文影响因子的比值;绿色:OA论文的比例;灰色:论文总数
            图2  整个物理学领域OA论文和非OA论文的比较

3 特定OA期刊中OA论文和非OA论文影响因子的比较
  G. Eysenbach对2004年6月8日到2004年12月20日之间出版的PNAS(Proceedings of the National Academy of Sciences)上的212篇OA文章和1280篇非OA文章共1492篇论文发表后16个月内的被引情况进行了3次统计[6] 。该研究是对同一种期刊中OA文献和非OA文献影响力的统计,而同一种期刊论文质量的离散程度和同一领域不同期刊,甚至不同领域期刊论文质量的离散程度不可同日而语,相对于本文已经提到的其他OA绩效研究方法,该方法更能如实地反映出OA真正的绩效。
  G. Eysenbach所进行的3次统计分别是在2004年12月(论文发表后0–6个月)、2005年4月(论文发表后4–10个月)、2005年10月(论文发表后10–16个月)。 
  G. Eysenbach的统计结果显示:发表平均206天后,没有被引用的非OA论文有 627 (占49.0%),没有被引用的OA论文有78篇,比例为36.8% ;平均发表288天后,未被引用的非OA论文有172 篇,比例13.6%,未被引用的OA论文有11篇,比例为5.2%。统计还发现,OA文章的平均被引次数高于非OA论文,在2005年4月是1.5:1.2,在2005年10月是6.4:4.5。采用Logistic回归模型(logistic regression model)的分析结果为:在发表后的前4-10个月内,OA论文被引频次是非OA论文的2.1倍,倍数分布范围1.5–2.9;发表后10-16个月,OA论文被引频次变为非OA论文的2.9倍,分布范围扩大为1.5–5.5。同时发现在期刊网站上即时OA论文(金色OA)比作者自存档(绿色OA)的被引频次更高。

4 与OA绩效相关的其他研究
  M. J. Kurtz通过对NASA天文数据系统数字图书馆的2003年10月访问日志(每年大概有800万次访问)的分析,研究数据请求次数和全文下载次数之间的比例关系[7, 8] 。研究表明,第一集团期刊的下载和请求的比率较高,而二流期刊的下载和请求之间的比例则稍低,最高的为63%,最少的为29%。详细统计结果如表2所示。

  这项研究可用于期刊订阅价格的制定。考虑到很多作者对高质量期刊文献的认可和追捧,一些期刊即便OA,其下载率也会因读者认可度而受到一定的限制,表2可从另外一个角度反映出OA给全文下载比例带来的上升空间。
该研究还对用户的查阅习惯进行了统计。被统计的有效浏览中,50%为浏览二次文献, 38%是下载全文,8%是查看引文。
  有趣的是,M. J. Kurtz还对阅读次数引用次数之间的关系进行了统计,并抽象出如下的公式[8]:
          
  其中,

5 OA绩效研究的未来
  截至目前,关于OA的重要研究成果,大都发表在Nature、PNAS、Plos Boilogy等知名期刊上,这在某个层面上反映出国际社会对OA的关注;而关于OA绩效的研究,大多是OA对提高期刊影响力(影响因子和被引频次)的研究。国内外专家对OA绩效的研究是卓有成效的,其研究结果也令人信服。
  随着OA的发展,人们对OA在提高期刊影响力方面的功效已不再怀疑,但关于OA的发展速度,尚无令人信服的研究成果。程维红和任胜利的研究虽然涉及了OA发展的统计,但其研究内容是OA期刊比例逐年变化的趋势。笔者认为,还需要通过论文的OA比例和引文中OA文献的比例变化来研究OA的发展,即从以下几个角度开展更加细致深入的探索。
  1) 学术文献中OA文献比例的变化。
  由于绿色OA的发展,即便是非OA期刊,大多也允许作者进行自存档。据Romeo网站统计,截至目前已有97%的出版机构允许作者自存档[9],因此公开出版物上所发表的论文中OA论文的比例应该有大幅的上升,但是迄今为止尚无权威性的研究成果发布。
  关于OA论文比例的变化,可以从不同领域、不同发表年度、不同等级、不同语言等多个侧面来进行统计和分析。
  2) 文献引文中OA引文比例的演化。
  引文中OA文献比例的变化也能从某个侧面反映出OA的发展趋势。这方面的研究可细分为:①从不同领域引文中OA文献比例的变化或不同国家作者论文中OA引文比例的统计,观察不同领域或不同国家的作者对OA认识的不同;②从不同影响因子期刊所发表文章的引文中OA引文比例的统计,观察不同影响因子期刊中OA引文比例的差异;㈢从OA期刊和非OA期刊引文中OA文献比例的统计,发现OA期刊和非OA期刊中OA引文的比例是否存在差异。
  3) 搜索引擎收录时滞的统计和搜索引擎收录时滞、收录比例对OA效能的影响。
  基于到读者对搜索引擎特别是诸如Scholar.google、Scirus这样的科技学术搜索引擎高度依赖这个现实,很有必要研究不同搜索引擎的收录时滞(从发布日期到能搜到全文日期)、可达比例(如发表之后3个月后还不能在某个搜索引擎上查到全文就认为不可达),以及OA引擎时滞、可达比例对OA效能的影响。
  为了开展这个方面的研究,首先需要界定文献是否属于OA文献。根据OA的定义,所谓OA文献就是在互联网上存在免费全文文件的科技学术文献。遗憾的是,有些文献在互联网上存在,但是用户不一定能够找到或免费获取。考虑到目前大多数读者是通过搜索引擎和OA仓储来寻找OA文献的,可以将OA文献定义为在常用科技学术专业搜索引擎和OA仓储能搜索到的文献。空军工程大学OA研究中心已经开发出了一个应用程序,用来判断某个文献是否为OA文献。只要输入论文标题,该程序即可从Scholar.google、Scirus、HighWrie、CiteSeerX、DOAJ、OpenJgate、ArxiV、Paperopen等科技搜索引擎和OA仓储判断是否可查到对应的PDF格式OA全文,并给出其全文的链接地址。欢迎有兴趣进行这方面研究的同仁与笔者联系。

  注:该文章发表在2009年第11期的《数字图书馆论坛》。



https://wap.sciencenet.cn/blog-65283-276611.html

上一篇:Nature的开放式同行评阅试验
下一篇:谷歌真的要退出中国?
收藏 IP: .*| 热度|

5 赵星 蒋新正 周春雷 赵大良 贺天伟

发表评论 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 21:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部