Medjaden美捷登
美捷登精彩点评:谷歌学术H5指数及其与汤森路透影响因子对比分析 精选
2015-8-5 09:22
阅读:29699

每年汤森路透(Thomson Routers)的期刊引用报告(Journal Citation Report, JCR)在中国都引起了高度的关注。原因是在中国科研评价中,科研论文是否发表在被科学引文索引(Science Citation Index, SCI)或科学引文索引扩展版(Science Citation Index Expanded, SCI-E)收录的杂志上,以及该杂志的影响因子的高低都起着举足轻重的作用,甚至成为某些部门和单位唯一的科研评价指标。近年来,依赖汤森路透JCR的科研评价系统受到了质疑、争议、批评和诟病,因而出现了寻求新的科研评价系统的呼声。

谷歌学术(Google Scholar)在2012年推出了一个杂志评价系统,即谷歌学术计量(Google Scholar Metrics),用来评价各个领域杂志的影响力。该系统主要包括H指数(h-index或Hirsch index),H核心(h-core),H中值(h-median),H5指数(h5-index),H5核心(h5-core)和H5中值(h5-median)。

H指数于2005年由美国加利福尼亚大学圣地亚哥分校物理学家乔治·希尔施(Jorge Hirsch)首先提出,原本用来评价某一个学者的影响力,计算基于论文总数及各论文被引用的次数,即某学者如果在其所有学术论文中至少有N篇论文分别被引用了至少N次,那么该学者的H指数就是N。例如,王教授共发表200篇论文,其中有至少50篇被引用至少50次,那么他的H指数就是50。

在谷歌学术计量系统,杂志的H指数指在所有发表的论文中有至少h篇论文分别被引用了至少h次,那么这份杂志的H指数就是h。例如,某杂志共发表5篇论文,分别被引用17,9,6,3和2次,那么这份杂志的H指数就是3;H核心指该杂志最高被引用的h篇论文,如上述杂志的H核心包括被引用17,9和6次的三篇论文;H中值指H核心中位数论文的引用次数,如上述杂志的H中值为9。

相应地,H5指数,H5核心和H5中值的计算基于那些收录在谷歌学术系统中的杂志最近5年的论文数量及各论文被引用的次数。例如,如果某杂志在过去5年内所发表的论文中至少有h篇论文分别被引用了至少h次,那么这份杂志的H5指数就是h。H5核心和H5中值依上述方法计算。谷歌学术计量报告虽然公布各杂志的H5指数,H5核心和H5中值,但最重要的还是H5指数。值得一提的是,只有那些在5年内发表了100篇以上论文并且至少有一个引用的杂志才会被收录到谷歌学术。


一、谷歌学术计量报告简介:

到目前为止,谷歌已经连续四年发布了杂志学术计量报告。今年(2015年)所发布的报告共包括7211份杂志,由于其中有1761份杂志在不同领域排名中重复出现,因此该报告中实际上只收录了5450份杂志。报告中给出了9种不同语言(英语、中文、葡萄牙语、德语、西班牙语、法语、意大利语、日语、荷兰语)杂志的前100名的信息。另外,该报告对英文类杂志的统计更详细,包括八大领域(商务、经济与管理、化学与材料科学、工程与计算机科学、健康与医学科学、人文、文学与艺术、生命科学和地球科学、物理与数学、社会科学)及261个学科杂志的详细分类排名。每学科只有top20杂志信息,所以没有其余中低档次杂志的排名信息。

谷歌学术指标系统中还提供了搜索功能,输入杂志名称关键词就会给出包含该关键词前20名杂志的排名信息。但是,与汤森路透的JCR数据库不同的是:JCR数据库有往年的报告信息而谷歌学术计量报告没有往年报告信息,所以这两者之间不能进行横向比较。


二、英文杂志Top20分析:

Nature(自然)杂志以H5指数377(H5中值为529),排名第一(图1),也就是在2010年到2014年这5年期间,Nature发表的所有论文中引用数不低于377次的共有至少377篇论文;而在今年汤森路透的JCR报告中,Nature以41.456的影响因子(Impact factor)排名第7。

New England Journal of Medicine(新英格兰医学杂志)以H5指数328(H5中值为520),排在第二。这个排名和汤森路透JCR报告的排名一致。

Science(科学)杂志,H5指数为316(H5中值为446),排名是第三位;而该杂志在汤森路透JCR报告中排在第16位。

著名Lancet(柳叶刀)杂志以其258(H5中值为415)的H5指数排在第四位,其排名也和汤森路透JCR报告中排名一致。

Cell(细胞)杂志和Proceedings of the National Academy of Sciences(PNAS,美国国家科学院刊)杂志以216的H5指数并列排在第五位;而它们的H5中值数据不同,分别为330和280。另外,这两个杂志在汤森路透JCR报告中影响因子分别排在第20和186位。

其他进入Top20的杂志H5指数分别为:Journal of Clinical Oncology(202)、Journal of the American Chemical Society199)、Chemical Reviews(196)、Chemical Society reviews(194)、Physical Review Letters(194)、Advanced Materials(190)、Journal of the American Medical Association(184)、Circulation(182)、Nature Genetics(182)、Nano Letters(181)、Angewandte Chemie International Edition(181)、Nucleic Acids Research (172)、ACS Nano(170)、arXiv Cosmology and Extragalactic Astrophysics(astro-ph.CO)(166)。其中排在第十八位的Nucleic Acids Research杂志在汤森路透JCR报告中排在第213位。有趣的是,排在汤森路透JCR报告中第一名的超牛杂志CA: A Cancer Journal for Clinicians,其影响因子为115.84,而其H5指数为57,没有排进前100名。


图1. Top20杂志


三、H5核心论文发表时间分析:

H5指数是对某杂志过去5年期间所发表的论文引用数进行的评价,例如,2015年对2010-2014期间所发表对论文引用数进行的评价。笔者根据汤森路透JCR报告中的影响因子,选择了五份高中低档次发杂志,对H5核心论文发表时间进行力分析。这五份杂志分别为Nature,CA: ACancer Journal for Clinicians,Cancer Research,PLoS ONE和Cutis,他们的H5指数分别为377、57、138、161、16。

Nature:对Nature杂志的这377篇论文发表时间分析发现,其中2010年有163篇(43.24%),2011年有128篇(33.95%),2012年有76篇(20.16%),而2013和2014年各有9篇(2.39%)和1篇(0.27%)(图2A)。也就是说,该杂志H5指数的377篇论文主要是来自于2010-2012这三年(97.34%);2013和2014年的论文比例仅为2.66%。

CA: A Cancer Journal for Clinicians:对影响因子排名第一的综述性牛刊CA: A Cancer Journal for Clinicians的57篇论文发表时间分析发现,其中2010年有16篇(28.07%),2011年有17篇(29.82%),2012年有12篇(21.05%),2013年有7篇(12.28%),以及2014年的5篇(8.77%)(图2B),综述性牛刊的57篇论文在2010-2012三年的占78.95%,而后两年2013和2014年的论文所占比例“高达”20%之多(相较其他四份杂志而言)。

 



图2. Nature, CA: A Cancer Journal for Clinicians, CancerResearch, PLoS ONE和Cutis杂志H5核心论文发表时间分析

Cancer Research:对CancerResearch杂志的138篇论文分析发现,2010年有77篇(55.80%),2011年有41篇(29.71%),2012年有14篇(10.14%),而2013和2014年各有5篇(3.62%)和1篇(0.72%)(图2C)。从中看出,前三年论文数占95.65%,2013和2014两年仅为4.35%。

PLoS ONE:PLoSONE杂志的161篇论文,其中2010年有91篇(56.52%),2011年有45篇(27.95%),2012年有21篇(13.04%),而2013和2014年各有3篇(1.86%)和1篇(0.62%)(图2D);前三年论文数占97.52%,而2013和2014两年仅为2.48%。

Cutis:Cutis杂志的16篇论文,其中2010年有10篇(62.5%),2011年有5篇(31.25%),2012年有1篇(6.25%)(图2E)。从中看出前三年论文数占100%,而2013和2014两年没有论文进入H5考量范围。

分析如上数据发现,这五份杂志H5指数论文中,前三年(2010-2012)发表的论文所占比例78.95%-100%。除了综述性牛刊后两年占20%以上外,其余杂志学术指标中后两年的论文都在5%以下。也就是说,虽然谷歌学术计量报告声称H5指数是对杂志过去五年发表论文的引用数进行评估分析,但实际上只是对杂志前三年所发表论文的引用情况进行评估,因此可以说是对一个杂志的持久影响力进行评估。然而,汤森路透JCR报告是对杂志2012和2013年所发表的所有论文在2014一年中的总引用数进行统计分析,是对一个杂志的当前影响力进行评估。所以,只有同时使用这两种评价系统来对杂志进行综合评估才算相对全面和客观。


四、谷歌学术H5指数和汤森路透影响因子的关系:

笔者对120个杂志的谷歌学术H5指数汤森路透影响因子进行分析后发现两者具有一定相关性,尤其是低影响因子范围的杂志(图3)。

 


图3. H5指数和影响因子相关性


但这个相关性对个别杂志不适用,例如:个别杂志的影响因子很高,而H5指数相对偏低;有的杂志则相反,H5指数很高但影响因子却相对偏低;也有些杂志虽然影响因子不同,但是有相同的或相近的H5指数,比如NanoResearch和CA: A Cancer Journal for Clinicians的H5指数都为57,而它们的影响因子分别为7.01和115.84,相差甚远。这是由于在过去的五年内,NanoResearch发表的论文总量为500多篇,是CA: A Cancer Journal for Clinicians杂志论文发表总量的5倍,也难怪如此低影响因子的杂志会和CA: ACancer Journal for Clinicians有相同的H5指数,即Nano Research的500篇论文中有57篇论文的单篇引用数超过57次,而CA: A Cancer Journal for Clinicians的100篇论文中也有57篇论文的单篇引用数超过57次;就算CA: ACancer Journal for Clinicians的全部(100篇左右)论文的单篇引用数都超过100,那它的H5指数也就才100,挤进H5指数排名的Top100都有困难。

同样,PLoS ONE的H5指数为161,即在该杂志近五年内发表的10.6万多篇(106936)论文中,有161篇(占总发表量的0.15%)的单篇引用数超过161次。H5指数似乎更强调“大网捞鱼”,论文发表数量多的杂志很占优势(图4)。笔者从汤森路透官网收集了Top20杂志的2010-2013四年的论文发表总量,如图1数据显示:Top20杂志多数既有较高的“论文发表总量”,同时也有较高的“单篇论文引用数”;这两者犹如天平的两端,像CA: ACancer Journal for Clinicians这样的牛杂志,由于总论文发表量低,导致其H5指数偏低。


图4.影响谷歌学术H5指标和汤森路透影响因子平衡的两大因素


也有少数杂志是影响因子很高,H5指数也很高,比如新英格兰医学杂志(图3红框内最上面的杂志),前提是该杂志论文发表数量要足够多。谷歌学术H5指数前100名杂志的汤森路透JCR排名和影响因子见附表。


五、谷歌学术H5指数优缺点

优点

1.汤森路透集团JCR报告需要购买账号查询,而谷歌学术H5指数查询是免费的。

2.H5指数对9种不同语言的出版物前一百名进行评估分析,因此有广泛代表性。

3.H5指数不受有超高引用单篇论文的影响,相对比较客观。

4.谷歌学术数据库收入范围非常广泛,不仅包括学术期刊,而且还收录书籍、会议、以及各种预印本。

缺点

1.主要评估杂志近五年内头三年所发表论文的引用情况。

2.偏重年发表论文量大的杂志。

3.由于不能查看谷歌的H5指数往年数据,所以不能进行年度横向对比(除非有心人每年都存下当年数据)。

4.谷歌学术指标数据库只提供了英文杂志各领域前20名杂志信息,其余中低档次杂志信息未知。

5.谷歌没有提供对各领域及学科分类的标准,也没有提供每个杂志所隶属的学科信息。

综上所述,谷歌学术指标具有一定的代表性和指导意义,但由于谷歌的学术指标才发布了四年,有些问题仍有待完善,比如杂志数据库收录的各项指标等,一旦修改就会影响全部数据。

笔者花费数日完成以上数据的分析,希望惠及您及您的同事,并期望与您共同学习交流。更多精彩内容请继续关注美捷登。


进一步阅读请参考

http://scholar.google.com/intl/en-US/scholar/metrics.html#metrics

https://scholar.google.com/citations?view_op=top_venues

http://scholar.google.com/intl/en-US/scholar/metrics.html

http://nihlibrary.campusguides.com/c.php?g=38330&p=244518

EnriqueOrduña-Malea, Emilio Delgado López-Cózar. Google Scholar Metrics evolution: ananalysis according to languages. Scientometrics, 2014, Volume 98, Issue 3, pp2353-2367


附表:谷歌学术H5指数Top100杂志及其汤森路透JCR排名和影响因子  

杂志名称   H5指数(JCR影响因子)   H5中值   H5指数排名   JCR影响因子排名#  

Nature   377 (41.456)   529   1   7  

The New England Journal of Medicine   328 (55.873)   520   2   2  

Science   316 (33.611)   446   3   16  

The Lancet   258 (45.217)   415   4   4  

Cell   216 (32.242)   330   5   20  

Proceedings of the National Academy of Sciences   216 (9.674)   280   6   186  

Journal of Clinical Oncology   202 (18.428)   296   7   56  

Journal of the American Chemical Society   199 (12.113)   263   8   133  

Chemical Reviews   196 (46.568)   351   9   3  

Chemical Society reviews   194 (33.383)   282   10   17  

Physical Review Letters   194 (7.512)   271   11   286  

Advanced Materials   190 (17.493)   262   12   62  

The Journal of the American Medical Association   184 (35.289)   277   13   13  

Circulation   182 (14.43)   278   14   99  

Nature Genetics   182 (29.352)   268   15   25  

Nano Letters   181 (13.592)   257   16   110  

Angewandte Chemie International Edition   181 (11.261)   243   17   147  

Nucleic Acids Research   172 (9.112)   296   18   213  

ACS Nano   170 (12.881)   255   19   122  

arXiv Cosmology and Extragalactic Astrophysics   166 (NA)   233   20   NA  

Journal of the American College of Cardiology   163 (16.503)   244   21   73  

NBER Working Papers   163 (NA)   233   22   NA  

Nature Materials   162 (36.503)   259   23   12  

arXiv High Energy Physics - Phenomenology (hep-ph)   162(NA)   236   24   NA  

PLoS ONE   161 (3.234)   210   25   1458  

The Astrophysical Journal   155 (5.993)   202   26   426  

Nature Medicine   153 (27.363)   228   27   27  

Blood   152 (10.452)   202   28   162  

arXiv Mesoscale and Nanoscale Physics (cond-mat.mes-hall)   148 (NA)   204   29   NA  

arXiv High Energy Physics - Experiment (hep-ex)   146 (NA)   221   30   NA  

arXiv Materials Science (cond-mat.mtrl-sci)   145 (NA)   225   31   NA  

British Medical Journal   143 (17.445)   191   32   63  

Nature Biotechnology   141 (41.514)   221   33   6  

Energy & Environmental Science   141 (20.523)   191   34   45  

Nature Nanotechnology   140 (34.048)   218   35   15  

Journal of High Energy Physics   140 (6.111)   208   36   412  

The Cochrane Database of Systematic Reviews   140 (6.032)   207   37   417  

Neuron   139 (15.054)   198   38   85  

Gastroenterology   138 (16.716)   190   39   71  

Cancer Research   138 (9.329)   179   40   201  

Physical Review D   138 (4.643)   178   41   687  

The Lancet Oncology   137 (24.69)   228   42   31  

Nature Photonics   133 (32.386)   201   43   19  

The Journal of Clinical Investigation   133 (13.215)   180   44   116  

Nature Reviews Cancer   131 (37.4)   250   45   10  

Nature Reviews Genetics   131 (36.978)   232   46   11  

Nature Physics   131 (20.147)   183   47   46  

Physical Review B   131 (3.736)   172   48   1085  

arXiv Quantum Physics (quant-ph)   130 (NA)   186   49   NA  

Chemical communications (Cambridge, England)   130 (6.834)   169   50   333  

Nature Immunology   129 (20.004)   218   51   48  

Nature Reviews Molecular Cell Biology   129 (37.806)   216   52   9  

The American Economic Review   129 (3.673)   196   53   118*  

Hepatology   129 (11.055)   181   54   152  

IEEE Conference on Computer Vision and Pattern  Recognition, CVPR   128 (NA)   203   55   NA  

European Heart Journal   128 (15.203)   202   56   84  

Immunity   128 (21.561)   177   57   41  

Nature Reviews Immunology   127 (34.985)   214   58   14  

Monthly Notices of the Royal Astronomical Society   126 (5.107)   177   59   567  

Nature Methods   125 (32.072)   185   60   21  

Nature Neuroscience   125 (16.095)   175   61   76  

Annals of Internal Medicine   125 (17.81)   166   62   58  

Journal of Materials Chemistry   125 (NA)   164   63   NA  

The Journal of Neuroscience   125 (6.344)   158   64   377  

Molecular Cell   123 (14.018)   171   65   107  

Accounts of Chemical Research   122 (22.323)   190   66   36  

NeuroImage   122 (6.357)   168   67   376  

Nature Communications   121 (11.47)   163   68   145  

Nature Reviews Neuroscience   120 (31.427)   202   69   22  

Biomaterials   120 (8.557)   156   70   232  

arXiv High Energy Physics - Theory (hep-th)   120 (NA)   153   71   NA  

The Journal of Experimental Medicine   119 (12.515)   173   72   126  

The Lancet Neurology   118 (21.896)   191   73   39  

Diabetes Care   118 (8.42)   178   74   241  

Nature Cell Biology   118 (19.679)   165   75   49  

The Journal of Physical Chemistry C   118 (4.772)   151   76   659  

Clinical Cancer Research   118 (8.722)   148   77   224  

Cell Stem Cell   117 (22.268)   187   78   37  

Cancer Cell   117 (23.523)   177   79   33  

Advanced Functional Materials   117 (11.805)   162   80   140  

American Journal of Respiratory and Critical Care Medicine   117 (12.996)   160   81   118  

Environmental Science & Technology   117 (5.330)   159   82   539  

Pediatrics   116 (5.473)   168   83   506  

Astronomy & Astrophysics   115 (4.378)   160   84   791  

Clinical Infectious Diseases   114 (8.886)   153   85   219  

Science Translational Medicine   114 (15.843)   153   86   78  

Journal of Allergy and Clinical Immunology   114 (11.476)   147   87   144  

Journal of Financial Economics   113 (4.047)   173   88   84*  

Journal of Biological Chemistry   113 (4.573)   141   89   710  

Renewable and Sustainable Energy Reviews   112 (5.901)   165   90   436  

Bioresource Technology   112 (4.494)   163   91   743  

Chemistry of Materials   112 (8.354)   156   92   246  

CEPR Discussion Papers   112 (NA)   149   93   NA  

The Journal of Clinical Endocrinology & Metabolism   112 (6.209)   144   94   400  

Applied Physics Letters   111 (3.302)   142   95   1398  

Genes & Development   110 (10.798)   154   96   157  

Nature Reviews Microbiology   109 (23.574)   164   97   32  

Nature Chemistry   109 (25.325)   157   98   30  

Physics Letters B   109 (6.131)   150   99   410  

IEEE Transactions on Industrial Electronics   109 (6.498)   147   100   359  

                 

#:JCR science edition rank; NA: Not available; *: JCR Social Sciences Edition

 

美捷登:Mike


--------------------------------------

本文由美捷登编辑原创,转载请注明来自美捷登科学网博客,并附美捷登微信二维码

   


    1.欢迎关注我们的微信
           

    2.来自江城的邀约:第一届国际医学与发展高峰论坛 详细查看

    3.免费在线讲座8月季《如何让论文中的统计分析不出错 点击报名




转载本文请联系原作者获取授权,同时请注明本文来自Medjaden美捷登科学网博客。

链接地址:https://wap.sciencenet.cn/blog-475824-910701.html?mobile=1

收藏

分享到:

当前推荐数:11
推荐到博客首页
网友评论19 条评论
确定删除指定的回复吗?
确定删除本博文吗?