科学网-超大规模作者论文对学术评价的新挑战-孙学军的博文

超大规模作者论文对学术评价的新挑战

2023-2-28 10:45

阅读：8069

学术论文作者是个很严肃的问题，但今天一篇论文中作者数量越来越多的情况已经非常普遍。本文对为什么会产生这种变化，什么样的人可以作为作者，论文作者数量增加对学术评价带来的影响等问题进行了探讨。

本文提到一个问题是，因为作者数量巨大，而作者本人一般对引用自己署名论文有更大的偏爱，这导致超量作者论文被引用会产生非常大的引用泡沫，导致对量化分析带来错误信息。其实我们还会注意到一些临床医学的专家共识，因为都是学术界的领袖，会有非常高的引用，导致这些学者引用量的虚高。这些虚假的学术引用，容易让人们忽视真正的学术问题，带来不必要的干扰。关于论文作者，现在有一些更严重的问题值得我们关注，例如许多没有贡献的学者放在重要位置上，成为论文的通讯作者。许多年轻作者相互赠送作者位置，以换取更多学术论文发表背景。

Hyperauthorship: the publishing challenges for ‘big team’ science (nature.com)

在1964年的三篇论文中提出存在希格斯玻色子。其中两篇由英国理论物理学家彼得·希格斯（Peter Higgs）单独撰写，另一篇由美国罗伯特·布劳特和比利时弗朗索瓦·恩格勒特合著。近半个世纪后，希格斯场存在的实验证实发表在一篇论文中有2932位作者。三年后，一篇论文详细测量希格斯玻色子质量的论文作者人数再创5154人新纪录。然后 COVID-19 大流行打破了这一记录，一篇15025 名合著者论文，是检查SARS-CoV-2疫苗接种对术后COVID-19感染和死亡率的影响。

图片1.png

“超量作者Hyperauthorship”一词归功于布卢明顿的印第安纳大学信息科学家布莱斯·克罗宁（Blaise Cronin）。他在2001年使用这个词描述100名或更多作者的论文。但随着大型国际和多机构科学合作的兴起——比如发现希格斯玻色子背后的ATLAS联盟——拥有数百甚至数千名作者的论文变得越来越普遍。这种转变有许多正当的理由，但它引发了对作者身份的性质以及超量作者身份对科学成就指标的影响的质疑和担忧。

科睿唯安（Clarivate）旗下科学信息研究所（ISI）2019年的一份报告指出，作者超过100名的论文数1998年到2011年间翻了一番，从大约300篇增加到大约600篇。分析超量作者率在两个五年时间段（2009年至2013年和2014年至2018年）之间如何变化时，他们还发现增幅最大数量是作者超过1000人的文章。

与1980年代相比，这是一个很大的变化，主要是由国际科学合作的增加推动的，ISI首席科学家兼该报告的合著者Jonathan Adams说。在1980年代，大多数科学论文（超过90%）列出了来自一个国家的作者。亚当斯说，这种情况在2000年代中期发生了变化，两国研究人员之间的双边合作发生了显着转变，“一旦你得到双边主义，作者人数当然不可避免地会增加”。然后是涉及多个国家的合作增加，特别是涉及多达30个国家的论文增加。多作者制和超量作者制的扩展不仅限于特定国家或受国家政策的驱动。“这只是科学和研究普遍变化的方式，”他说。

根据“自然指数”中的数据分析显示，在某些领域，拥有50名或更多作者的论文数量大幅增加。例如，在医学和健康科学领域，作者超过50人的论文数量从2015年的58篇，增加到2021年203篇。其中，2019 年（COVID-2020 大流行的第一年）增加了19%。与此同时，物理科学是这些多作者论文最常见的研究领域，2021年有335篇。

这些变化反映了对分布在不同类型和地区的大型研究小组的需求日益增长，以回答复杂的问题。还反映了对更具包容性的作者身份的渴望，这种作者身份认可来自过去可能被忽视的背景的研究人员。这些变化也可能是欧洲研究理事会等机构资助的结果，该委员会帮助和鼓励跨国合作。

超大量作者身份给研究人员和发表其工作的期刊带来了挑战。在众多机构和国家之间协调如此多的个人贡献是一项巨大的后勤壮举。超量作者身份正在引发哲学问题，即成为研究论文的作者意味着什么。

在探索遗传学在精神健康障碍中的作用的研究中，一个关键问题是统计能力，澳大利亚布里斯班QIMR Berghofer医学研究所的精神病遗传学家Sarah Medland说，这也是她的领域适合超量作者的原因之一。为了研究遗传变异对大脑结构和功能的影响，她和她的同事经常使用全基因组关联研究 - 其中扫描大量基因组以查找与特定疾病或特征相关的基因 - 以及磁共振成像（MRI）和精神病学评估。但是单个遗传变异的神经学影响可能非常小，因此研究需要大量参与者来发现影响是否具有统计学意义和可复制性。研究规模越大，费用就越高，尤其是涉及MRI时。

由于缺乏统计能力而感到沮丧，Medland和她的同事成立了ENIGMA联盟，通过荟萃分析增强神经成像遗传学，该联盟汇集了来自全球50个工作组的成像基因组学，神经病学和精神病学研究人员。

ENIGMA生成的论文是对来自这些工作组内各个研究团队的未发表数据的荟萃分析。“所有这些小组都可以写自己的论文，但如果他们这样做，他们将用所有这些动力不足的研究污染文献，”梅德兰说。相反，他们将这些未发表的数据或其摘要提供给meta分析。最终结果是有数百名贡献者的研究，但足够大，可以产生具有统计学意义和有意义的发现。

亚当斯说，像这样的超量作者身份是通过良好的沟通来实现的，无论是在线还是面对面的沟通。它通常从国际会议开始，研究人员意识到他们最亲密的潜在合作者“肯定不是他们机构走廊上的人”，而且“可能不是同一个国家的人”，而是他们所在领域的科学家在国外工作。“与此同时，因为我们有所有这些新的沟通方法，我们有能力将非常大的数据集汇集在一起。

梅德兰认为，对科学更具包容性的渴望也有助于延长作者名单。她说，“我认为，如果你说你只能有四个人”，那么在一篇论文中列出来，留下来作为作者的人往往是最资深的。“我怀疑我们的作者名单更年轻，更女性，更多样化，”现在更多的作者可以包括在内，她补充道。

超量作者身份也是某些领域的科学家寻求答案的结果，这些答案不仅需要大规模的合作，还需要巨大的资源和设备。这在高能物理学中尤其明显，粒子加速器等设备的成本可能高达数十亿美元，没有一个国家能完全负担得起，马里兰州大学公园美国物理学会的核物理学家兼主编Michael Thoennessen说。“如果你想站在最前沿，做最令人兴奋的物理，做以前没有人做过的事情，作者名单的长度越来越长，这确实导致了一个问题，即研究人员在多大程度上的贡献才有资格被纳入。ManyBabies联盟（发展心理学研究领域的国际多实验室合作）的执行董事海蒂·鲍姆加特纳（Heidi Baumgartner）表示，该项目使用所谓的CRediT或贡献者角色分类法来确定什么有资格成为作者。该分类法由美国国家信息标准组织开发;它描述了研究环境中常见的14个角色，从概念化和资金获取到监督和写作。

“我们说你必须至少为其中一个类别做出贡献，再加上审查手稿，这就是值得作者身份的地方，”鲍姆加特纳说，他也是加州斯坦福大学的社会科学研究学者。这种期望在合作协议的任何项目开始时都明确列出，并确保每个付出时间和精力的人都得到平等的认可。

然而，这并不总是那么简单。斯坦福大学（Stanford University）实验心理学家、全球心理科学实验室网络“心理科学加速器”（Psychological Science Accelerator）主任尼古拉斯·科尔斯（Nicholas Coles）表示，尽管科学贡献在作者身份方面没有得到充分认可，但也有充分记录的滥用作者身份导致过度认可的历史。他提到了“直升机作者身份”，即研究人员“招募大型团队来收集数据，然后从未承认过他们的贡献”。

这也引出了一个更大的问题，即什么样的科学研究贡献值得作者身份——科尔斯称之为科学领域的“硬币”——而不仅仅是在论文末尾的致谢部分提及。

鲍姆加特纳说，这是“学术界房间里的哲学大象”：“你如何根据某人的贡献来量化作者身份意味着什么，然后如何将其用作一种货币，就招聘或晋升的意义而言？”保持实验室设备和计算机运行的技术人员或收集血液样本的护士是否应列为作者？”

Thoennessen说，根据他的经验，作者身份仅限于科学人员，他们是根据其科学产出进行评估和奖励的人。

发表一篇研究论文通常需要大量的工作，即使是只有几位作者的论文，更不用说几千人了。为了降低如此大的船沉没的风险，ManyBabies使用一种称为注册报告的早期同行评审形式，在收集数据之前评估研究项目的可行性。该倡议由位于弗吉尼亚州夏洛茨维尔的非营利性技术组织开放科学中心推动，以鼓励科学方法的最佳实践。采用该倡议的期刊，如《自然》，承诺如果问题和方法符合要求的标准，将发表论文（见Nature 614，594; 2023）。

鲍姆加特纳说，使用注册报告“让我们遍布世界各地的贡献者有一点保证，坚持这个项目会带来一些结果，而不是典型的过程，你进行一项研究，你真的不知道它是否会在某个地方找到一个家”。

一旦研究结果被整理和分析，并且手稿的写作和编辑过程开始，协调大型作者群体的进一步挑战就会出现。“发生的情况是，从事荟萃分析的核心团队通常会准备草稿，这通常涉及高级作者以及第一和最后作者，”Medland说。“一旦有他们满意的草案，它就会公开征求意见。

ENIGMA和ManyBabies都使用Google Docs与所有合著者分享论文草稿，并整理他们的评论和编辑。“Google Docs在这方面既好又坏”，Medland说，因为你最终可能会得到多个冗长的评论线程。鲍姆加特纳说，谷歌文档文件可能会变得有点混乱，“但是在谷歌文档中，一群其他人也在编辑它，你可以看到某人在哪里工作，并遵循他们的思维过程，然后跳进去其他人”。

下一个挑战是确保所有作者的隶属关系和利益冲突都是正确的。科尔斯说，在这方面一个有用的工具是一个名为Tenzing的网络应用程序，由一个国际研究团队开发，它基本上需要一个包含作者姓名，隶属关系和贡献的电子表格，并“写下你的作者页面”。

与这么多作者打交道也是出版商头疼的问题。美国物理学会期刊让作者有责任验证他们是论文的贡献者。它的系统“会自动向这些作者发送电子邮件，说'论文已经提交了你的名字——除非我们收到你的来信，否则我们认为这是一个协议，是的，你做出了贡献，你是合著者，'”Thoennessen说。

期刊中作者身份的最终结构在领域甚至子领域之间差异很大。“我们实际上有一个所谓的第一作者小组，然后我们有一个分析师小组，等等。在群体中，通常是按姓氏的字母顺序排列，“梅德兰说。因此，一篇涵盖全基因组关联研究的多作者论文可能有几个作者列表，每个作者按字母顺序排列。相比之下，超量作者的希格斯玻色子论文有一个按字母顺序排列的列表。

当研究人员因其在职业生涯中的贡献而获得适当认可时，作者身份惯例的差异可能会产生问题。“作为一名在这类领域工作的早期职业研究人员，你拥有大量的作者身份，你经常会遇到这样的陈述，'你什么都没做，因为你是中间作者，'”梅德兰说。“一般来说，作者身份惯例确实被误解了。她将医学研究与心理学进行了对比，在医学研究中，最后一位作者被认为是最资深的，在心理学研究中，处于该职位的人做出了最小的贡献。

Thoennessen希望看到适用于所有领域的作者标准，以确保个别研究人员不会因学科惯例而处于不利地位。

当大约15000名研究人员为一篇论文做出贡献时，它会扭曲通常用于评估特定研究项目的影响和重要性的指标。

亚当斯说，这些论文通常确实代表了“比单一作者论文更接近科学前沿的东西”。但他们“离谱”的引用次数也是“两个家庭人群”效应的结果，即这些超量作者论文中代表的所有国家 - 以及所有作者 - 都将吹嘘他们的成就，从而推动更高的引用率。这也可能扭曲有关国家和机构的科学成就指标，特别是如果它们是全球科学池塘中的小鱼。

亚当斯建议，在查看机构或国家的引用计数时，应考虑出版物的作者数量，就像引用计数对出版年份和领域进行标准化一样。“我们应该对作者身份进行规范化，这样你才能得到一个更具代表性的引用指标。他说，甚至有理由将最大的超量作者论文完全排除在引用过程之外。“如果是欧洲核子研究中心或其中一个大型望远镜，就像你要么在俱乐部里，要么不在俱乐部，”亚当斯说。“然后，我们在拿什么比较你？”

尽管超量作者论文的数量和概况有所增加，但如何处理它们仍然存在很多不确定性。科尔斯说，一些期刊对超量作者论文持谨慎态度，而另一些期刊则欢迎它们。但随着“大团队”科学变得越来越普遍和受到尊重，它可能会迫使人们反思这些论文对科学事业的意义。

“与你合作的作者越多，事情就越复杂，”科尔斯说。“这需要研究人员和期刊以及评估科学的人的一些非常新的思维。

转载本文请联系原作者获取授权，同时请注明本文来自孙学军科学网博客。

链接地址：https://wap.sciencenet.cn/blog-41174-1378282.html?mobile=1

当前推荐数：12

推荐人：

姚小鸥何应林李升伟许培扬王启云武夷山晏成和祁贤张朋杨正瓴刘立崔锦华

推荐到博客首页

网友评论1 条评论

该博文允许注册用户评论请点击登录