崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

且读且议论(3):普赖斯初识引文(续)

已有 5146 次阅读 2014-5-30 14:57 |个人分类:文献计量学|系统分类:科研笔记| 研究前沿, 普赖斯, 引文年代分布

【这篇文章发表于1965年,SCI试刊于1961年。SCI的出现,打开了一道通向引文世界的大门。作为第一批进入引文引用领域的探险者,Price的文章上半阕首先描述了这个世界的基本情况,奇花异草;而在下半阙则有了想象驰骋的神情。文章的后半部分则是畅想用引文数据进行与研究前沿有关的研究了。】

即时因子

即时因子表示的是与早期论文相比对最近论文相对集中的高频引用,当然与大家熟知的文献老化现象有关。这种因子的计量测量指标可以推导出来,而且这种指标十分有用。计算表明,所有被引文献中有70%符合正常的生长曲线,每13.5年翻一番。30%的被引文献形成了即时隆起曲线。因此,我们可以说,70%的被引文献其年代分布是随机的【正常的?】,而30%的被引文献则是高度选择性的近期发表的文献【异常的?】。我们通过曲线的形状可以看到对新发表论文引用的分布,30%的被引文献中,有一半是1-6岁的。

普赖斯很惊诧于这种对最新文献引用的程度,希望找到其重要意义。如果所有论文在引用旧文献和新文献的比例上都遵循一种标准模式,那么就是说所有论文的引文中有30%将是最近的研究前沿。

换一种说法,假设有一半论文的引文是按照发表年代均匀分布的,那么被另一半论文的引用文献中,有60%的论文是最近发表的【这一句我不懂是什么意思】。普赖斯猜测,粗略的猜测,真相就隐藏我们此时发现的关于论文中有一半的引文与最近发表的论文密切相关的特征,和另一半论文表现出规范统一并与近期发表文献关系不那么密切的现象之间。

这种状况可以用时间上的分布加以说明,被引较多的论文比低被引论文要年轻。这样,在Garfield1961SCI中索及的论文中,在1961年被引4次及以上的论文只有7%是在1953年前发表的,而相比之下,所有在1961年被引用的论文中则有21%1953年前发表的。这种高被引论文也是最年轻的论文的趋势也可以在图5中看到(基于Garfield的数据),每篇论文的引文数成为被引文献年龄的函数。

我注意到,R. E. BurtonR. W. Kebler已经推测,尽管是证据比较弱,期刊文献由半衰期截然不同的两部分组成:一种是经典的,另一种是一过性的文献【没找到巴尔顿-开普勒的原文,从这句话可以看出,最早提出半衰期的是巴尔顿和开普勒,我们在文献老化中学习过他们提出的老化模型,并且知道他们的推测根基不是很牢固的】。目前的证据证实了这种推测,很明显需要进一步的探索BurtonKebler提出的另一个假设:半衰期以及经典和一过性文献各自的比例会因领域不同而不同:数学、地质学、植物学中经典文献比例会高,而化工、机械工程、以及冶金工程和物理学则一过性文献稍强一些,化学和生理学则处于中间水平。【R. E. Burton and R. W. Kebler, “The ‘halflife’ of some scientific and technical literatures,” Am, Dot. 11, 18 (1960).

历史案例


6 该矩阵显示的是200篇论文相互引用的情况,涵盖了一个特定独立领域(N射线的虚假现象)的始终(1904年),这些论文按照年代排列(0表示最早的,200表示最新的文献),图中每一列的圆点表示的是其参考文献中对该系列中相应顺序编号论文的引用,这些参考文献当然是系列中比较旧的文献。因此,竖着的线比较多表示的是综述文献,图中斜着的短线标出的是“研究前沿”,从引用文献向后扩展大约50篇论文。除了研究前沿和综述论文,图中也显示了些许背景噪音,前12篇论文的高密度原点形成的紧密链接象征着一个新的研究领域正在开始。



我们惊异地发现,一系列的历史案例印证了存在研究前沿的说法,我们可以构建一个矩阵(图6)来说明。图中显示的是一组按照时间顺序排列文献【行和列的数字】,这些文献代表了某领域的全部文献(该领域恰好十分紧密并在讨论期间结束),点代表了每篇文献对应的参考文献,在这个矩阵中,接近对角线的一条引文带有比较高的引用概率,每篇论文依次扩展到其发表之前最近的30-40篇论文。三角矩阵的其余部分有很多则引用很少,剩余部分代表了某种背景噪音。这样一来,在能够分离出来密集的主题这种特殊的环境下,我们发现有半数的参考文献是最新论文的研究前沿,而且其余的一半则均匀地分散。还显示出,每过30-40年就需要一篇综述文献来替代早期从研究前沿视野中淡出的论文。更为奇妙的是,还能看到经典论文,就是那些图中行填满了原点(而不是列)的论文,被引频次基本相同,形成了一个对称图,这种现象蕴含着重要的理论意义。

两种书目需求

从这两种不同的联系可见,引文网络显示出存在着两种不同文献实践和科学家们有两种不同需求。(1)研究前沿是建立在最近的工作之上的,并且网络会变得十分紧密。为了应对这种情况,科学家们(普赖斯猜想尤其是物理学和分子生物学的科学家)需要提示服务,让他们经常得到有关自己同行和同事工作进展的通告,这种通告可以通过引文索引得到的。【学科馆员啊?】(2)图6中的随机分散点表明对以往工作总的吸收情况。从某种意义上讲,这是网络中将每一发表的文献当做人类知识永恒记录的真实部分。在已经被这种第二种态度主导的主题领域里,传统的步骤一直是系统化地随时从图书中一个一个主题地增加知识,或者利用认为有点儿永恒模样的分类系统,如植物学或者化学的分类。如果这种分类法一直能合理存在下去,我们就有了客观的尺度来减少全球总知识量到一个相当小的包裹里,这个小包裹里的条目间按照自然的顺序相互对应。【本体吗?】

很明显,任何针对研究前沿主题和分类学主题的分类中总有大量的文献不能完全达到非此即彼。我们建议大多数论文,通过引用关系,可以紧密地连接起来。而科学研究的总前沿从来就不是一行环环相扣的编制带,而是由漏针分割开的相当小的片和段。;从一项期刊间引用研究中,我得出结论:大多数的片段最多与几百个男人的工作相对应。这些片段代表了客观定义的主题,对主题的描述各年代在材料上会有不同,但是仍然保留着知识整体。如果有人愿意揭开此类片段的属性,就先要有一种描绘当前科学文献概貌的方法。利用这种方法,人们就可以指出期刊之间的重叠以及期刊相对的重要性,以及国家、作者、单个论文的重要性,通过它们在地图上占据的位置,以及它们在特定片段中的战略中心程度。

期刊引文为检验这种方法提供了最为可靠地变量数据。通过对这些数据相当粗糙的探索,我斗胆得出结论:号称35000种的期刊中有相当一部分现在估计不过是遥远的背景噪音,并且远离任何编制片段战略的中心,在那里科学的衣裳已经变形了。【是丑陋的吗?】

【译后记:大师的文章不比现实的一过性的论文,读起来十分吃力,经典的文献往往要读3-4遍才能咂摸出滋味,到现在我还是领会不太深刻,希望有造诣的同行大家多多指正。主要是感觉文献计量学中有很多以讹传讹的概念,需要进一步梳理和重新思考,这样我们说话才有底气】

 




https://wap.sciencenet.cn/blog-82196-798980.html

上一篇:且读且议论(1):SCI的诞生
下一篇:应用BICOMB2处理EXCEL数据软件生成共现矩阵案例
收藏 IP: 202.118.47.*| 热度|

6 赵星 许培扬 曹聪 武夷山 杜建 刘宇

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-2 00:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部