Springer Nature 科研服务分享 http://blog.sciencenet.cn/u/SpringerNature 汇聚施普林格、Nature Portfolio、BMC、Discover、帕尔格雷夫·麦克米伦和《科学美国人》等深得信赖的品牌

博文

近八成学者支持,为何数据共享仍面临困境?|《中国开放数据白皮书2025》 精选

已有 1037 次阅读 2026-2-25 11:19 |系统分类:观点评述

本文摘自《中国开放数据白皮书2025》,作者:姜璐璐,张泽钰,李宗闻,李成赞,周园春(中国科学院计算机网络信息中心)

今年是 figshare 与施普林格·自然(Springer Nature)携手面向全球科研人员发放《开放数据状况调查问卷》的第 10 年,也是《中国开放数据情况分析报告》连续发布的第 3 年。本次报告主要基于 2025 年中国受访学者填写《开放数据状况调查问卷》的情况(筛选出 772 份有效问卷),对本年度中国开放数据总体情况做出分析和梳理。

查看并下载《中国开放数据白皮书2025》,了解详情

调研主要发现

1. 中国学者对开放数据的支持度稳定保持在高位

在开放获取方面,2023 年至2025 年三年间,支持开放获取的人数占比常年稳定在 80% 以上,且每年有轻微增长。

图1 中国受访者对研究论文开放获取的态度(2023-2025)

在开放数据态度方面,自 2023 年起,支持“让研究数据开放获取成为学术惯例”的中国受访者占比稳定在 78%;同时,2025 年反对开放数据的受访者占比为 5%,较 2024 年有轻微下降。

图2 中国受访者对研究数据开放获取的态度(2023-2025)

2. 中国学者数据共享的阻碍因素并未得到有效缓解

在数据共享时的主要担忧方面,抢发(40%)、担心数据滥用(38%)和数据含有敏感信息(33%)是 2025 年中国受访者排名前三的担忧因素。总体来看,与 2023、2024 年调研情况基本一致。

图3 中国受访者数据共享时的担忧(2025)

不容忽视的是,数据贡献认可度依旧是科研人员关注的重点,24% 的中国学者认为贡献未得到适当承认或认可是他们在共享数据时的主要担忧。事实上,中国受访者常年认为自己在数据共享方面的贡献并未获得足够认可。数据显示,认为自己未获得适当认可的受访者占比在逐年小幅下降,但常年超过 50%;同时,认为自己在数据共享方面的贡献获得适当认可的受访者占比逐年上升,从 2023 年的 18% 上涨至 2025 年的 27%。可见,中国受访者的数据贡献认可度虽逐年提升,但整体认可度仍明显不足。

与此同时,“数据引用”依然是中国受访者数据共享的第一驱动因素,占比达到 71%,连续 4 年居于首位;其次,“期刊或出版商要求”、“提升我的研究影响力和可见度”,分列第二、三位,成为驱动中国受访者共享数据的重要动因。

图4 中国受访者数据共享的驱动因素(2025)

关于“您在公开研究数据方面需要哪些领域的帮助”,56% 的学者需要数据版权或许可协议方面的帮助,其次是寻找合适的基金(48%)和数据管理政策(39%),相较前两年结果并无改善。统计显示,近一半的学者在数据共享时会寻求同事或导师(46%)、网络搜索(39%)等非正式渠道的帮助。此外,统计显示,30% 的学者没有可用的数据共享资金,其中 19% 的学者不知道有何可用资金,11% 的学者自费进行数据共享。这在一定程度反映出,我国在数据共享方面的政策宣传、培训支持、专用资金方面存在明显缺口

图5 中国受访者共享数据所需要的帮助(2025)

3. 中国学者已在数据共享中广泛遵循 FAIR 原则

数据整理作为数据管理流程中的关键环节,是实现高质量数据共享的重要基础。今年的统计结果显示,超过 82% 的学者已经养成数据整理的习惯,另有 10% 的学者虽有意愿但因缺乏相关资源未能付诸实践。从受访学者所属学科分布来看地球与环境科学(90%)、社会科学(88%)和工程学(84%)等 5 个学科,具有数据整理习惯的受访者超过 80%。从受访学者所属机构的类型来看,研究机构(87%)、私营公司(85%)及大学(84%)拥有数据整理习惯的受访者超过 80%。

对于 FAIR 原则的认知,《中国开放数据报告2024》显示,2020 年起,熟悉或听说过 FAIR 原则的中国学者占比超过从未听说过此原则的人数占比,越来越多的中国学者开始了解并逐渐熟悉开放数据文化与基础知识对于 FAIR 原则的实践,2025 年的调查结果显示,已有超过 87% 的学者认为自己的数据共享实践已经完全或部分遵循 FAIR 原则,且这一比例在近三年统计中也呈现稳步增长态势。

图6 完全/部分遵循 FAIR 原则的中国受访者比例(2023-2025)

从受访者所属学科来看,社会科学(93%)、化学(89%)、医学(89%)和生物学(89%)的受访者遵循 FAIR 原则情况较好,占比均在 90% 左右。从受访者所属机构来看,来自医学院、研究机构和私营公司的受访者在数据共享中遵循 FAIR 原则的占比超过 90%。

可以发现,数据管理与 FAIR 化共享已成为中国学者的普遍共识,并在实践中取得显著成效。浅析其原因:社会科学研究数据多源自调查统计,更易于实现结构化与标准化;生命科学领域的国际期刊与资助方较早推行数据共享要求,为该领域数据 FAIR 化提供了强大动力。

4. AI 在辅助数据管理实践上发挥了更多积极作用

在数字化智能化快速演进的今天,AI 工具是否帮助更多科研工作者开展数据管理与数据共享实践,成为一个值得关注的问题。

近三年的统计数据显示,越来越多的中国受访者开始使用AI 工具辅助数据管理工作“经常使用”和“已开始使用”AI 工具进行数据管理的受访者占比逐年稳定增长;其中,在“数据处理”阶段使用 AI 工具的受访者比例高于其他阶段。

图7 中国受访者使用 AI 工具管理数据的情况(2023-2025)

此外,不同学科背景的受访者在使用 AI 工具辅助数据管理方面表现出明显差异:

地球与环境科学领域的中国受访者在各个阶段的 AI 工具使用或计划使用占比均为最高,数据收集阶段为 80%,数据处理阶段为 88%,元数据创建阶段为 78%。其中,20% 的该领域受访者表示经常使用 AI 工具,38% 已开始使用,另有 30% 计划使用 AI 工具进行数据处理。

材料科学与化学领域的中国受访者也具有较高的 AI 工具使用或计划使用占比,数据收集阶段分别为 75% 和 77%,数据处理阶段分别为 87% 和 79%,元数据创建阶段分别为 75% 和 73%。

社会科学和工程学在“尚未考虑使用”或“尚不了解 AI 工具”的占比较其他学科高,医学与生物科学领域的使用情况与中国受访者的整体情况基本一致。

尽管各学科间存在明显差异,但普遍更倾向在“数据处理”阶段使用 AI 工具。

欢迎阅读《中国开放数据白皮书2025》获取“2025 年中国开放数据情况分析报告”完整内容,包含基于调研结果的对策与建议。

此外,白皮书还邀请国内数据开放共享领域专家,专题解读了高能物理、气象科学、冰冻圈研究、医学数据、催化科学、化学化工等多个领域的数据管理与共享实践。同时,报告聚焦数据驱动科研新范式、高质量科学数据集建设、数据资源统筹发展等核心议题,Springer Nature 研究数据创新总监 Graham Smith 亦在书中探讨了基础设施建设、自动化技术应用与跨主体合作对推动开放科学实践的重要影响。

点击下载《中国开放数据白皮书2025》报告,了解更多内容



https://wap.sciencenet.cn/blog-3432244-1523260.html

上一篇:新书访谈 | 专访Nonlinear Physical Science / Nonlinear Systems and
收藏 IP: 222.71.128.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-2-25 19:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部