孙学军
专业打假公司标识大规模问题论文 精选
2024-10-23 07:00
阅读:3328

专业打假公司将让问题论文难以遁形

伪造论文的工厂非常猖獗,现在又有了对付问题论文的专业公司。这显然也是一种产业,且相对比较成功,因为已经受到大型出版企业的重视。从该公司披露的数据显示,问题论文数量巨大,过去被撤稿的只不过是其中小部分。如果说过去的打假人只相当于个体户,现在的这种操作成了有组织的团队,且可以在资本的推动下快速发展。这一公司的出现,将科技打假事业推向一个组织化团队作战的新高度。

其实示别问题论文从技术上难度并不大,且早就有一些比较好的技术提供。打假最有效的方法是出版社主动建立警戒线和核查系统。但是出版商为利益可能会不积极。现在的积极应对只不过是被动行为。

科技诚信初创公司标记的可疑论文比例高的期刊

Scitility的工具“阿戈斯”识别出其作者有不当行为记录的作品。

图片23.png 

通过分析引文和作者的出版记录,“阿戈斯”识别出需要进一步调查的“高风险”论文。图片来源:bernie_photo/Getty

哪些科学出版商和期刊最受欺诈或可疑研究论文的影响——哪些在清理其出版物组合方面做得最少?一家旨在帮助出版商发现潜在问题论文的技术初创公司表示,它有一些答案,并已将其初步发现与《自然》杂志分享。

由总部位于内华达州斯帕克斯的技术公司Scitility于九月份推出的科学诚信网站“阿戈斯”,根据论文作者的出版记录以及论文是否大量引用已被撤回的研究来给论文打风险分。例如,被归类为“高风险”的论文可能拥有多名作者,这些作者的其他研究因不当行为而被撤回。高分数并不意味着论文质量低,但表明值得调查。

 

“阿戈斯”是越来越多的寻找论文中红旗的研究诚信工具之一。这些包括由Clear Skies制作的Papermill Alarm和Research Signals制作的Signals,这两家公司都位于伦敦。由于此类软件的创建者向出版商销售他们的手稿筛选工具,他们通常不愿意点名受影响的期刊。但是,“阿戈斯”提供免费账户给个人以及对科学诚信侦探和记者更全面的访问权限,是第一个公开展示见解的工具

Scitility联合创始人Erik de Boer表示:“我们想要构建一项能够看到隐藏模式并为行业带来透明度的技术。”他居住在荷兰的Roosendaal。

10月初,“阿戈斯”已经标记了超过40,000篇高风险180,000篇中等风险的论文。它还索引了超过50,000篇被撤回的论文。

出版商风险评级

“阿戈斯”的分析显示,现已关闭的出版商Hindawi——总部位于伦敦的出版商Wiley的一个子公司——拥有最高数量和比例的已被撤回的论文(见“处于风险中的出版商”)。这并不令人惊讶,因为过去两年里,Wiley应编辑和侦探提出的担忧撤回了超过10,000篇Hindawi出版的论文;这相当于该品牌过去十年总投资组合的4%以上。其中一本期刊,《循证补充与替代医学》,已撤回741篇论文,超过其产出的7%。

“阿戈斯”的风险评分还将1000多篇剩余的Hindawi论文——另外的0.65%——标记为仍然“高风险”。这表明,尽管Wiley做了很多工作来清理其投资组合,但它可能还没有完成这项工作。出版商告诉《自然》杂志,它欢迎“阿戈斯”和类似工具,并且一直在努力纠正Hindawi的问题。

图片22.png 

来源:阿戈斯

其他出版商似乎还有更多的调查工作要做,与被“阿戈斯”标记的高风险论文数量相比,撤回的论文数量相对较少(出版商可能已经审查了其中一些论文,并确定不需要采取任何行动)。

总部位于阿姆斯特丹的出版巨头爱思唯尔有大约5,000篇撤回论文,但根据《自然》杂志对“阿戈斯”数据的分析,有超过11,400篇高风险论文——尽管这些加起来只占过去十年出版社产出的略高于0.2%。MDPI出版社撤回了311篇论文,但有超过3,000篇高风险论文——约占其产出的0.24%。施普林格·自然拥有超过6,000篇撤回论文和超过6,000篇高风险论文;约占其产出的0.3%。(《自然》新闻团队独立于其出版商。)

在回应置评请求时,所有被标记为拥有最多高风险文章的出版商都表示,他们正在努力进行研究诚信工作,使用技术筛查提交的文章,并且他们的撤回操作展示了他们清理问题内容的承诺。

施普林格·自然表示,它在六月推出了两个工具,自那以后帮助发现了数百篇伪造的提交手稿;几家出版商提到了他们与一个提供可以标记可疑论文的软件的联合诚信中心的合作。MDPI在瑞士巴塞尔的出版经理Jisuk Kang表示,像“阿戈斯”这样的产品可以给出潜在问题的广泛指示,但她指出出版社无法检查网站上数字的准确性或可靠性。她补充说,最大的出版商和期刊不可避免地会有更多高风险论文的数量,因此产出份额是一个更好的衡量标准。

“阿戈斯”数据显示,在其投资组合中高风险论文比例最高的出版品牌是Impact Journals(0.82%)、Spandidos(0.77%)和Ivyspring(0.67%)。Impact Journals告诉《自然》杂志,尽管其期刊过去遇到过问题,但现在它们已经提高了诚信度。该出版社表示,由于采用了图像检查工具如Image Twin等,在过去两年中其期刊Oncotarget“没有不规则情况”,这些工具仅在过去几年内变得可用。Portland Press在其投资组合中有0.41%的高风险论文,表示已经采取了纠正措施,引入了更严格的核查。

期刊风险评级

“阿戈斯”还提供了个别期刊的数据。不出所料,Hindawi的标题因其被撤回的论文数量和比例而突出,而其他期刊则有很多“阿戈斯”认为是高风险的工作尚未处理(见“处于风险中的期刊”)。按数量计算,施普林格·自然的巨型期刊Scientific Reports领先,有450篇高风险论文和231篇撤回论文,总共约占其产出的0.3%。10月16日,一群侦探向施普林格·自然发出了一封公开信,对该期刊中的问题文章表示关注。

 

作为回应,施普林格·自然的研究诚信负责人Chris Graf表示,该期刊会调查提出的每一个问题。他补充说,鉴于其规模,被强调的内容比例相对较低。

撤回作品数量与潜在问题论文之间差距特别大的期刊包括MDPI的Sustainability(20篇撤回和312篇高风险论文;占其产出的0.4%)以及爱思唯尔的Materials Today Proceedings(28篇撤回和308篇高风险论文;占其产出的0.8%)。爱思唯尔的Biomedicine & Pharmacotherapy拥有最高比例的高风险论文——占其产出的1.61%。

爱思唯尔的一位发言人表示:“欺诈材料的量在规模上增加,这得益于系统性操纵,比如‘论文工厂’为了商业利益生产欺诈内容,以及AI生成的内容。”他补充说,作为回应,“我们正在增加对人力监督、专业知识和技术的投资”。

图片21.png 

来源:阿戈斯

开放数据

“阿戈斯”的创建者强调,该网站依赖于他人收集的开放数据。其数据源包括网站Retraction Watch,该网站维护了一个被撤回论文的数据库——通过与非营利组织CrossRef的交易免费获取——其中包括撤回的原因,以便审查作者记录的工具可以专注于提及不端行为的撤回。分析还依赖于由法国图卢兹大学的计算机科学家Guillaume Cabanac整理的大量引用被撤回论文的文章记录。

尽管“阿戈斯”也关注那些有不端行为历史的作者网络的分析家,但其他研究诚信工具也会根据可疑内容标记论文,比如与伪造作品的文本相似度过高,或Cabanac创造的术语“受折磨的短语”,当作者为了避免触发抄袭检测器而做出奇怪的措辞选择时。

 

 

“两种方法都有优点,但识别从事不当行为的研究者网络可能更有价值,”曾在《自然》旗下期刊和《柳叶刀》担任出版商、现在在英国利物浦经营咨询公司Journalology的James Butcher表示。这是因为AI辅助写作工具可能被用来帮助骗子避免明显的文本线索,他说。Butcher补充说,许多主要出版商已经建立或获得了自己的诚信工具,以筛查手稿中的各种红旗。

对于主要依靠作者撤回记录的诚信工具来说,最棘手的问题之一是正确区分名字相似的作者——这个问题可能会使“阿戈斯”的数据出现偏差。“作者去歧义问题是行业面临的最大单一问题,”Clear Skies的创始人Adam Day说。

曾在施普林格·自然工作的De Boer表示,任何人都可以免费创建一个账户来访问“阿戈斯”,但Scitility的目标是向大型出版商和机构销售工具的一个版本,他们可以直接将其插入到他们的手稿筛选工作流程中。

Butcher赞扬了“阿戈斯”团队的透明度。“需要对那些走捷径并且在发表和货币化论文上未能进行适当尽职调查的期刊和出版商有更多的能见度,”他说。

转载本文请联系原作者获取授权,同时请注明本文来自孙学军科学网博客。

链接地址:https://wap.sciencenet.cn/blog-41174-1456524.html?mobile=1

收藏

分享到:

当前推荐数:4
推荐人:
推荐到博客首页
网友评论1 条评论
确定删除指定的回复吗?
确定删除本博文吗?