||
今年是施普林格·自然连续第八年与Digital Science公司、Figshare知识库联合开展有关开放数据的年度全球调查,并据此于11月14日发布了2023年度《开放数据状况报告》(The State of Open Data 2023)。全球共有6000多名研究人员对调查作出了回复,其中印度(12%)、中国(11%)和美国(9%)的回复比例最高。2023 年调查显示,研究人员开放数据的主要动机与往年非常相似,其中研究论文的全文引用或数据引用排名靠前
此外,中国科学院计算机网络信息中心获得授权,对其中来自中国研究人员的调查结果,即600多份有效的问卷反馈进行分析,并撰写了《中国开放数据白皮书2023》,揭示了中国科研群体在开放数据的动机、存在的挑战、看法和实践行为等方面的最新情况。
需要支持的人得不到支持——近四分之三的受访者在公开数据方面从未获得过支持。
一刀切的做法不可取——来自不同学科专业和地域的受访者的回答各不相同,这凸显出需要在全球范围内采取更加细致入微的方法来提供研究数据管理支持。
挑战刻板印象——职业生涯晚期的学者真的反对进步吗?2023 调查的结果表明,职业阶段并不是影响开放数据意识或支持水平的重要因素。
认可不足问题由来已久——连续八年来的调查都揭示了研究人员反复关注的一个问题:他们认为公开共享数据没有得到足够的认可。
人工智能意识尚未转化为行动——虽然近一半的受访者了解用于数据收集、处理和元数据创建的生成式人工智能工具,但大多数人尚未使用这些工具。
近四分之三的受访者从未获得过研究数据规划、管理或共享方面的支持。
随着全球公开数据的政策和要求不断增加,研究人员向谁寻求支持成为一个绕不开的问题。若受访者表示他们了解“数据管理计划”这一概念,那么随后的问题便是他们是否可以获得专业数据经理的支持,调查发现超过50%的受访者表示他们确实可以在其研究生涯中获得专业研究数据经理的支持,但并不了解还有谁可以提供支持?
近四分之三的受访者从未获得过研究数据规划、管理或共享方面的支持。当被问及是否曾经获得过管理或公开数据方面的支持时,只有23%的受访者给予了肯定回答。在这23%的受访者中,61%得到了来自同事或导师等非官方的内部支持。在受访者中排名较高的另外两个支持来源分别是所在机构图书馆(31%)和研究办公室/内部机构专业意见(26%)。
该图所示为“您是否能获得专业数据经理的支持?”这一问题的回答。只有当受访者表示他们了解数据管理计划概念时,才需要回答该问题。每种回答对应的受访者数量已在图中注明。
我们需要一种细致入微的全球性研究数据管理方法。
2023年《开放数据状况报告》调查揭示出的区域性差异清楚地表明,目前全球对数据共享的方法和态度存在巨大差异。从围绕认知展开的关键问题来看,例如受访者是否了解数据管理计划概念,我们发现从各个区域收到的回答迥然不同。
不同国家/地区受访者对于数据管理计划概念的认知程度。该图突出显示了给予肯定回答最多的前十个国家/地区的受访者的认知程度。
不同专业领域受访者对于数据管理计划概念的认知程度,按照回答为“是”的占比排序。
分主要学科来看,各科受访者亦展现出显著差异。专业领域不同,不仅对于数据管理计划的认知程度不同,共享数据的动机也有区别。
对于哪些因素会激励其共享数据这一问题,不同专业领域受访者所给出的各种回答的占比。
这些各不相同的回答突出地表明,需要通过一种细致入微的研究数据管理方法,大力鼓励和支持全球数据共享。
处于职业生涯后期的学者真的反对进步吗?职业生涯的长短并不是影响对于开放数据认知程度或支持水平的重要因素。
从2023年的调研结果来看,无论是对于数据管理计划概念的认知程度,还是对于日常公开数据的支持程度,都没有受到学者职业生涯长短的显著影响。
受访者发表同行评议论文首年对于数据管理计划概念的认知程度。
这表明,存在着这样一种误解——处于职业生涯早期的研究人员正在推动数据共享向前发展,而处于职业生涯后期的学者反对这方面的进步。不论处于职业生涯哪一阶段,广大研究人员都面临着相同的挑战,拥有相同的数据共享动机。
对于给定的四项关键开放实践是否应成为“普遍性学术实践”,不同职位受访者答以“非常同意”的百分比。
研究人员仍然认为他们没有因为公开共享数据而获得应有的认可。
连续八年的“开放数据状况”调研揭示了研究人员一直以来关注的一个问题,那就是公开共享数据没有让他们获得应有的认可。2023年的调研结果再次反映出这一点,充分表明这是一个旷日持久的问题,亟待科研共同体在未来予以解决。
关于“您认为目前共享数据的研究人员是否获得了应有的认可?”这一问题,2019-2023年的纵向调查数据。
关于什么因素会激励研究人员共享数据,今年收到的回答与往年非常相似,即研究论文的完整引用或数据引用排名靠前。然而,当被问及“哪些因素最能激励您共享数据?”时,受访者回答第二多的是“公共利益”。
该图所示为受访者受特定因素激励而公开共享数据的百分比。
这个领域还处于萌芽阶段,但机会比比皆是。
今年,首次要求受访者说明他们是否使用ChatGPT或类似的人工智能工具收集、处理数据或收集元数据。
对这三个问题最常见的回答是“我知道这些工具,但还没有考虑使用”。
人工智能工具及其应用正在快速发展,目前我们已经掌握了研究人员在研究数据及其管理方面使用ChatGPT或类似人工智能工具的基准情况,期待看到上述问题的回答在未来几年将发生怎样的变化。
施普林格·自然是积极参与研究领域的合作,率先采用新的数据共享方法,并致力于支持科研人员使数据共享成为新常态。了解施普林格·自然更多有关开放数据的信息。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-9 07:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社