|||
胡升华 朱 蔚
科研数据已经获得了与经验、理论、模拟方法平起平坐的地位,共同成为现代科学方法的统一体
技术进步引入了一些原来没有的竞争要素,如平台技术、网络技术、语义分析、算法、数字决策工具等等,这些因素与大资金和大数据结合,形成了强大的科研产业壁垒,强大到让科研产出如此巨量、科研投入如此巨大的中国,也有成为外国科学组织的“外包”服务商的巨大风险
学术评价话语权和优质数字资源支配权,与中国期刊和中文期刊影响力相互制约、相辅相成
在互联网和大数据时代,科研成果创造与科研成果经营已经变得密不可分
期刊经营事关国家数字资源安全和创新型国家建设
中国科技期刊落后的深层原因是数字资源经营的国家力量缺位和市场竞争主体孱弱无力
一定要把论文抓在自己手里,让科研成果真正为我所有,为我所用。
数字资源已经成为网络化、数字化环境下科研活动和教育活动的主要信息源[1],成为当代社会信息资源的主体,成为国民经济和科技发展的最重要的战略资源。21世纪以来,我国的基础研究成果呈现突飞猛进的发展态势,SCI论文数量在国际上已经连续多年排名第二,我们已经成为科研数字资源的生产大国,但由于我国科技期刊的发展远远滞后于科研实力的增长,加之学术评价体系的问题,导致我国优秀科研论文呈现整体性外流的恶劣状况,我们在科研数字资源的获取、利用和长期保存诸方面都受到很大的制约,形成我国科技发展的战略缺陷和潜在危机。
2016年我国科技期刊论文数保守估计已经突破100万篇,其中,SCI论文达到了32.42万篇,连续第八年排在世界第二位,占世界份额的17.1%;Ei数据库 2016 年收录中国论文22.65万篇,占世界论文总数的33.2%,排在世界第一位[2]。据Scopus数据库统计,2010-2014年中国学者发文量在化学、物理、材料三个学科已经排名世界第一[3]。科研论文数量的不断增长,是我国科研投入和科研实力快速提升所产生的良好效果。可以预期,随着我们国民经济和科研投入的持续增长,论文数快速增长的势头将得以持续。值得高兴的是,在数量增长的同时,我国科技论文的影响力指标也在同步提升,“2007年至2017年(截至2017年10月)我国科技人员发表的国际论文共被引用1935.00万次,与2016年统计时比较,数量增加了29.9%,超越英国和德国,前进到世界第二位。”“我国国际热点论文数量占世界四分之一,高被引论文数量继续保持世界排名第三位。”[4]然而,与我国的科研实力相比较,我国科技期刊的发展状况却很不尽人意,虽然我国出版的科技期刊数量已经达到5000种,但其国际影响力、资源吸引力、学术服务能力、经营水平都与我国科研成果产出大国的地位不相称,与创新型国家建设的要求不相符。由于学术期刊的落后和学术评价体系设计的缺陷,造成我国大量优秀学术成果流向国外。
中国科学技术协会2018年1月发布的《中国科技期刊发展蓝皮书(2017)》有这样一项统计,14个论文产出大国所属的SCI期刊论文数和该国作者产出的全部SCI论文数的比值。显然,比值大于1 的国家为论文流入国家,小于1 的国家为论文流出国家。结果显示,有3个国家超过1,依次为荷兰(3.79)、英国(2.65)和美国(1.39)。其余11个国家的比值小于1。中国以0.12的比值位于倒数第二名[5],也即中国有88%的SCI文章流向国外期刊。不仅如此,中国作者在中国SCI期刊所发论文的影响力仅为5.63,远远低于中国作者全部SCI文章的影响力(9.27)[6],即,我们大量外流的是优秀论文。
这些数据揭示,我国科技期刊,特别是具有国际影响力的英文期刊已经远远满足不了我国科技成果发表和国际交流的需要了;同时也说明,在学术评价方面长时间唯SCI、唯数量指标已经带来显著的危害。
学术论文的外流还仅仅是一种表面上的危害,更深层次的危害在于,我们长期将学术评价话语权和优质数字资源拱手让人,最终必在数据话语权和数字资源安全方面蒙受大的损失。
科学职业化是最近100多年发生的事,此前,科学是贵族的一种业余游戏。我们在这里不讨论科学是怎么变成一个职业的,而要分析作为一个“职业”得以延续下去的条件。
既是一种职业就需要成本和投入,有投入就要有产出,这里的产品当然是科学成果、科学知识,论文是产品的主要形式之一。把产品卖给“消费者”,形成投入-回报机制,这个“职业”才能进行下去!那么,这个产品的目标用户是谁?价值谁来确定?显然,这个价值不可能仅由科学共同体自己标定(所谓“业内承认”),需要买家认可(所谓“社会承认”)[7]。这就是为什么美国科学工作者必须去向公众解释、宣传,求得纳税人认可和支持;为什么日本政府要设立“日本科学技术振兴机构(JST)”,“以实现科技创新立国为目标,促进从基础研究到产业化全过程的研究开发,营造包括促进科技信息流通在内的科技振兴所必需的基础环境”[8]。
按照这样的逻辑,如果把发表论文作为科研终极目的、以SCI判定科研成果优劣等级,以论文数目衡量科研业绩,显然是偏离了方向。近年来学术主管部门和社会各界对我国科研评价重数量,不重质量;重视外国期刊,不重视中国期刊,有不少批评声音,汪品先院士的批评很有代表性:“现在我国有不少单位,从外国文献里找到题目立项,使用外国仪器进行分析,然后将取得的结果用外文在国外发表,获得SCI的高分以后再度申请立项。这种循环看起来也是科学的进步,但实际上是外国科学机构的一项“外包”业务[9]。大面积地出现这种以完成“外包业务”为特征的科研工作,说明我们有相当一部分科研管理部门和研究工作者在“为什么做科研?为谁做科研”这个问题上还不甚了了。也就是说,我们的科研职业化还没有完全走上正道。事实上,“把论文写在祖国大地上”、发表在中国期刊上、用在中国的科技发展和社会建设中是科学职业化时代“国家科学”的基本属性,是对中国学术共同体的基本要求,我们的“消费者”不认可,我们的职业就不可持续。在职业化时代,为科学而科学、为研究而研究,虽然可以是少部分人的追求,但不应是整个从业群体的主要工作目标。
为了改变上述不良现象,国家有关部门和学术领导机构已经采取了一些措施,试图扭转学术评价唯SCI、唯数量指标的局面,注重学术成果的内在质量、创新性和适用性,支持中国期刊的发展[10]。
数字资源是当代社会信息资源的主流,它已经成为国民经济和科技发展的最重要的战略资源。随着出版技术的更新换代,数字出版、网络出版已经成为科研成果出版发布的主要形式,基于科技期刊的优质数字资源也已经成为全球科技出版竞争的主要目标。
2007年,美国科学家、1998年度图灵奖获得者吉姆·格雷提出了科学研究第四范式的概念,指出科学研究在已有的实验范式、理论范式和计算仿真范式下,又以互联网和大数据技术为基础,迎来了数据密集型科学范式,这种范式可以“在未知规律的情况下, 运用计算能力从大数据中发现规律并发挥规律的作用”[11]。“数据”是这个新范式的核心,处理、存储、分析数据,及可视化数据的能力是科学必须适应的新事实。数据获得了与经验、理论、模拟方法平起平坐的地位,共同成为现代科学方法的统一体[12]。
生产数据、采集数据、保存数据、处理数据、分析数据、运用数据(形成方案、结果、方法),再生产新的数据,形成了科研创新的一种新的工作流程。在这个流程中,科技期刊应该在生产数据、采集数据、保存数据几方面发挥重要作用。规模化期刊经营者或期刊大数据权利人占据了排他优势,可以结合平台工具,控制数据的采集、处理、分析、运用,控制前所未有的数据密集型的知识发现过程。
由于我国在发表科研结果这个环节相当程度的失控,造成我们数据话语权的不足,带来采集数据和保存数据方面的困难,再加上平台和工具劣势,我们在处理数据、分析数据、应用数据方面又受制于人,使得我们在第四种模式下的科研工作呈现出潜在的危机。更加危险的是,我国论文数量的繁荣还掩盖了这种危机!
拒绝中国期刊,追逐外国期刊在开放获取还处于非主流的时代,事实上是把数据话语权拱手相让,是很明显的战略短视。
不久前在“科学网”上针对中国期刊和中文期刊的地位开展了不少讨论[13]。科学网的人群主要是科学共同体从业人员,从讨论的情况看,我国相当一部分学者对学术成果外流、对支持中文期刊和中国期刊的相关规定并不以为然。若仅仅从研究成果的国际交流功能看,追逐有影响力的英文刊、SCI刊并无不可,但因技术进步带来的学术传播方式、科技资源利用方式、获取方式、保存方式,以及科研模式的革命性变化,使得科研成果的生产形成了一个完整的产业链,包含诸多的环节:选题、研究基础准备、研究模式、成果发布、成果集成、数据结构化和可视化等处理、成果永久保存、决策工具开发使用等等。可以说当代科研工作的国际竞争已经变成全产业链的竞争,技术进步引入了一些原来没有的竞争要素,包括平台技术、网络技术、语义分析、算法、数字决策工具等等,这些因素与大资金和大数据结合,形成了强大的科研产业壁垒,强大到让科研产出如此巨量、科研投入如此巨大的中国,也有成为外国科学组织的“外包”服务商巨大风险。对于这种危险,我们下面试做进一步阐述。
数字资源(是指以数字形式存储在光、磁等非纸介质的载体中,通过网络通信、计算机或终端再现出来的资源,其表现形式可以是文字、图像、声音、动画等多种形式[14]。在数据密集型科学范式下,科研是数据驱动的科研,“数字化的数据本身成为科研的基础设施” [15],世界各国科研教育机构和图书馆都已将数字资源作为文献情报采集、存储、服务的主流形式。在这种背景下,数字资源的长期保存和长期有效利用,日益成为国际上关注的战略问题,但我国科学界关注数字资源长期保存的价值和意义的人并不多。
我国各大图书馆和科研机构主要通过购买国内外数据库资源提供服务,深受数据库商掌控资源,操纵价格之害,花费巨资往往只仅获得有限的权利。如爱思维尔公司的合同就不容许订阅客户“实质性或系统性复制、保留或再分发订阅产品”。合约到期后,已购买资源也不能免费再继续使用,更别说“永久保存”了。即便是在合约期内的使用,也往往会受到各种条条框框的制约,如“限制图书馆对所采购数据库的数据进行编目、链接等二次开发”,限制使用者对元数据进行集成开发形成的新产品。“这样做的目的是为了降低其他厂商利用自己的资源进行二次开发的可能和保证自有资源的不可替代性。”[16]我国图书馆和科研机构付出了很高的代价,最终得到是数字资源不完备的使用权,很多情况下仅仅是“远程访问权”,并且需要每年大幅增加使用费用,一旦停止订购,则无法继续使用。这种状况引发了图书情报界对国外数据库商的强烈不满,“程焕文之问”[17]以及随后对数据库商的广泛声讨算是一次集中爆发,但收效甚微。
联合国教科文组织《保存数字遗产宪章》指出,信息以及信息的创造性表达方式形成了数字化资源,在其生产、传播、使用和保存产生了一种新的遗产,即数字遗产,这种遗产将为人类知识的创造、交流和共享提供更多的机会,数字化遗产关系到当代人和子孙后代的利益[18]。数字遗产保存是全世界关注的紧迫问题,一切数字资源的开发与利用都是以“长期保存”作为前提和基础的,不能做到长期保持就谈不上资源的安全。
“十二五”期间,我国科学与文化领域无论是国家层面的规划还是部委层面的规划,都绝少涉及数字资源长期保存的问题[19]。“十三五”期间,这种状况有所好转,但并未根本改观,2016年5月中共中央、国务院印发的《国家创新驱动发展战略纲要》、2016年8月中国科学院发布的《“十三五”发展规划纲要》、2016年12月22日科技部发布的《“十三五”国家社会发展科技创新规划》均没有明确提出数字资源长期保存的计划和制度安排。国家保存体系涉及政治、经济、法律、科技、外交各方面的问题,任重道远,亟待加强顶层设计,长远规划。
我国图书情报界对数字资源建设重要性有切身体会,在建立国家保存体系方面的呼声日益高涨。2015年9月23日,由国家科技图书文献中心(NSTL)牵头,联络国内多家知名举办的图书文献机构共同签署了《数字文献资源长期保存共同声明》[20],呼吁进一步完善国家数字科技文献资源长期保存体系的建设,并明确宣示,图书馆拥有对所采购的数字文献资源进行本土长期保存的权利。截至2017年9月30日有215家图书馆或文献情报中心签署了声明。NSTL声称,将代表所有签署机构向国内外出版社提交《共同声明》。拉开了数字资源话语权博弈的新的篇章,然而由于图书情报界对国外数据库商的垄断地位并没有有力的制约手段,《共同声明》能产生多大效果商待观察。
面对国外数据库商因其垄断地位形成的垄断价格,我国科研和教育机构的文献采购经费越来越感到捉襟见肘,而工矿和中小企业则普遍缺少“享受”充分的数据库服务所需的资金。除了经济制约之外,产业界和基层科技工作者还受到严重的语言困扰。我国虽然科技论文已居世界第二位,但由于绝大多数科研创新成果以英文发表在国外期刊上,因此我国科技成果在促进企业技术进步、实现成果转化方面收效甚微。以致有战略科学家向中国科学院提出建议,“创建科技文献中文摘要数据库和公共服务平台,促进企业自主创新”,目的是让我国企业界广大科技人员和行业能工巧匠及时、方便地吸收国际科技新发现、发明新成果,加快技术创新和成果转化,为社会发展、经济建设提供科技支撑[13]。
“在过去100 多年中,80%以上的世界科技创新成果首先发表在科技期刊上”[21]优秀科技期刊除了在传播科技成果方面发挥着难以替代的作用之外,在吸引和聚集数字资源方面也发挥着基础性的作用。第二次世界大战以后,美国在学术期刊出版领域逐渐占据领先地位,科技期刊数量和影响力均遥遥领先。2017年JCR报告共收录期刊8856种,美国期刊便有2962种,超过三分之一,可谓一支独大。我国科技期刊虽然达到了5000种的规模,但SCI期刊仅179种(2017年JCR报告),与我国科研产出极不相称。中国科学院上海药物研究所所长蒋华良认为:“美国目前基础研究投入不增加,创新能力还能提高的一个重要原因,就是利用全世界基础研究投入产生的数据,进行大规模的深度大数据分析,很快就能研发出新药、新材料等应用型成果,真正实现创新驱动发展。”[22] 当今社会,谁掌握优秀期刊,谁就掌握着它源源不断地产生的科研数据;谁掌握优秀期刊群,谁就有可能掌握科技大数据;谁掌握科技大数据,谁就掌握了第四种范式下的科研主动权。爱思维尔公司通过旗下2500种期刊,已经集聚了6500万篇研究论文,仅2016年,它就发表了42万篇论文,但它收到的全球投稿有150万篇[23],这些都成为它掌握的资源。爱思维尔通过自有资源和全球合作资源成为第四种范式下科研工作不可或缺的基础条件,同时也就成了一个强大的制约条件。我们急需要通过提升期刊影响力来提高优秀论文的吸引力,把更多的优秀论文留在国内,形成中国特色的资源优势和全球资源合作共享的有力筹码,厚植科研大数据的基础。
我国是严重的论文流出国家,80%以上的优秀科研论文发表在外国期刊上。因此,我们在各类科研考核、评奖、基金审批、学术职位选拔等方面需要评判论文水平时,不得不主要考察英文期刊和英文文章,需借助国外的评价体系(如SCI、CiteScore、Altmetrics等)来确定期刊和论文的等次。期刊评价假手他人的结果是形成了非常明显的马太效应,加重优秀论文外流的程度、加重科研价值观的偏差。评价体系是一个有效的指挥棒,是一个关系到我们建设创新型国家、建成科技强国的根本性问题。应该提升到国家战略的高度,高度重视、合理规划、加大投入、合力推动。不管历史因素影响多么广泛、习惯势力多么根深蒂固,评价体系都不能继续假手他人,急需要按照科研职业化的国家需要,建立自己的科研价值观,建立具有中国特色、有利于促进我国科技创新和科技强国战略,有利于我们应对国际竞争、有利于促进中国科学持续发展、有利于科技成果转化、有利于优质资源集聚的评价体系,让评价体系与我国科技发展、科技期刊发展、数据话语权和数字资源安全形成相辅相成、正向互动的关系,让科研成果为我所有、为我所用。
论文层面的数字资源还仅仅是“原材料”,所谓“资源经营”是指获取海量“原材料”并对其进行组织加工,形成结构化、智能化、可视化的数据分析、关系揭示、策略依据、路径引导,使大数据以前所未有的方式对研究视野、研究模式、研究方法、研究过程发挥巨大作用,从而影响到科研过程、科研组织方式,引导所谓数据密集型科学发现。
在生产数据、采集数据、保存数据、处理数据、分析数据、运用数据(形成方案、结果、方法),再生产新的数据,这种新的科研创新工作流程中,我国除了在生产数据环节具备一定的优势之外,其他环节都存在明显的不足。采集数据、保存数据主要受到国外垄断出版商的制约;处理数据、分析数据、运用数据则受到期刊出版与知识服务平台,以及数字决策工具不足等的制约。事实上,数据力量和平台工具力量互为前提和因果,不可偏废。
在互联网和大数据时代,在国家层面上说,科研成果创造与科研成果经营已经变得密不可分,需要两条腿走路。改革开放以来,国家虽然日益加大科研投入,但学术成果经营主要交由市场,而这个市场事实上是一个受到高度制约的市场,在行业集中度的形成、出版资源配置、经营决策权力、企业制度、资金使用等方面都离不开行政力量和出版管理体制的约束,难以形成与国外出版大鳄相抗衡的市场竞争主体。
中国科技期刊落后的深层原因是数字资源经营的国家力量缺位和市场竞争主体孱弱无力。需要把期刊经营提升到事关国家数字资源安全和创新型国家建设的高度进行规划,发挥国家和企业两个积极性,在思想意识上高度重视、组织管理上加速改革、资金投入上重点保障,抓住评价体系、科研价值观回归、国家保存体系建设、市场主体培养、成果发布平台建设、数字决策工具开发等重大问题,尽快提高我国学术评价的话语权,保障数字资源安全,消除创新型国家建设的潜在威胁。
数字资源是当代社会信息资源的主流,它已经成为国民经济和科技发展的最重要的战略资源。随着出版技术的更新换代,数字出版、网络出版已经成为科研成果出版发布的主要形式,科技期刊是数字资源最重要的来源之一,基于科技期刊的优质数字资源也已经成为全球科技出版竞争的主要目标。虽然我国已经是科技论文生产大国,但由于认识上、组织形式上、运作方式上远远跟不上行业发展的需要,我国的科技期刊远远不能满足学术研究、国际交流、成果转化、资源汇聚等方面的需求,从而使我们在学术评价方面缺少话语权,在成果转化方面因政策导向、语言和资源获取障碍而失去优势,在资源集聚方面缺乏强有力的抓手,在数字资源长期保存和开发利用方面受到数据库版权和技术的严重制约。我们大量生产论文,却并不真正拥有它们。长此以往,必将对我们建设创新型国家、建成科技强国带来隐患。为此,应该把发展科技期刊和期刊产业、强化学术评价话语权和数字资源安全、让科研成果为我所有且为我所用提升到国家战略的高度,高度重视、合理规划、加大投入、合力推动,为我国科技事业的长远发展和创新型国家建设奠定坚实的基础。
一定要把论文抓在自己手里,让科研成果真正为我所有,为我所用。
参考文献:
[1]师昌绪.数字资源长期保存国际会议主旨报告(北京,2007)[EB/OL].[ 2017-10-24].http://www.cas.cn/hy/xshd/200710/t20071016_1692471.shtml.
[2]中国科技技术信息研究所.2017中国国际科技论文产出状况[EB/OL].[2017-11-06]. http://conference.istic.ac.cn/cstpcd2017/document/正文2017_2国际.pdf.
[3]朱作言.中国科技期刊发展战略研究项目进展报告(PPT)[Z].北京:2016.
[4]中国科技技术信息研究所.中国科技论文的整体表现(新闻稿)[EB/OL].[ 2017-11-06].http://conference.istic.ac.cn/cstpcd2017/document/正文2017_1新闻稿.pdf.
[5]中国科学技术协会主编.中国科技期刊发展蓝皮书(2017)[M].北京:科学出版社,2018:72.
[6]中国科学技术协会主编.中国科技期刊发展蓝皮书(2017)[M].北京:科学出版社,2018:83.
[7]李正风.产权制度创新——科学是如何职业化的[J].科学与社会,2015,(2):55-69.
[8]程永明.日本科技中介机构的运行机制及其启示——以JST为例[J].日本问题研究, 2007,(1):50-55.
[9]汪品先.汉语被挤出科学,还是科学融入汉语?[N]文汇报,2015-02-27.
[10]严谨,彭斌,柴钊.发展中国科技期刊,服务创新型国家建设[J].科技与出版,2017,(1):33-40.
[11]黄晓艳,单晓钊.关于大数据——访中国工程院院士倪光南[J].高科技与产业化,2013,(5):40-45.
[12]潘教峰,张晓林,等译.第四范式:数据密集型科学发现[M].北京:科学出版社,2012:216.
[13]胡升华.为什么做科研?为谁做科研?——再谈中文期刊与“文化自信”[EB/OL]. [2017-08-14].http://blog.sciencenet.cn/blog-980214-1071034.html.
[14]马费成,等.数字信息资源规划、管理与利用研究[M].北京:经济科学出版社,2012:2.
[15]张晓林.重新认识知识过程和知识服务[J].图书情报工作,2009,53(1):6-8.
[16]苏建华.国内高校图书馆外文电子期刊采购的困境及应对策略[J].新世纪图书馆,2016,(7):48-50.
[17]程焕文.十问数据商[EB/OL].[2014-04-09]. http://blog.sina.com.cn/s/blog_4978019f0102e5zu.html.
[18]联合国教科文组织.第32届会议大会记录(巴黎)[EB/OL].[2017-10-24].http://unesdoc.unesco.org/images/0013/001331/133171c.pdf#page=90.
[19]聂云霞.国家层面数字资源长期保存策略研究[D].武汉:武汉大学,2014.
[20]数字文献资源长期保存共同声明(2015.9)[EB/OL].[2017-10-24]. http://www.nstl.gov.cn/nstl/facade/help/declare.jsp.
[21]中国科学技术协会主编.中国科技期刊发展蓝皮书(2017)[M].北京:科学出版社,2018:序言.
[22]争夺科技大数据:高影响因子期刊出现“中国阵营”[EB/OL].[2017-09-20]. http://money.163.com/16/0615/19/BPKH0QCF00253B0H_3.html.
[23]RELX Group annual reports and financial statements 2016[EB/OL]. [2017-10-24].http://www.relx.com/~/media/Files/R/RELX-Group/documents/reports/annual-reports/relx2016-annual-report.pdf.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-14 00:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社