《科学史的历史》
第十七章:开放科学与知识民主——从皇家学会到预印本革命
一、知识的交易
1660年11月28日,伦敦格雷欣学院的一间教室里,一群年轻人正在讨论一个新兴的自然哲学实验——罗伯特·波义耳的空气泵。这个实验装置能够抽走玻璃罩中的空气,制造出某种程度的"真空",从而研究空气对燃烧、声音和生命的影响。讨论者中有数学家、医生、建筑师、绅士学者,他们分享观察、争论解释、记录结果。会议结束时,他们决定成立一个"促进物理-数学实验学习的学会"——这就是后来著名的英国皇家学会。
皇家学会的创始章程中包含了一个革命性的条款:会员的研究成果应当被公开记录和分享。学会秘书亨利·奥尔登伯格建立了与欧洲大陆学者的通信网络,将英国的发现传递到巴黎、阿姆斯特丹、罗马,同时也将大陆的最新进展带回伦敦。1665年,世界上第一份科学期刊《哲学汇刊》(Philosophical Transactions)创刊,奥尔登伯格担任首任编辑。他在发刊词中写道:"这些汇刊的目的,是向那些致力于研究和追求真理的人们,提供一种迅速的交流方式。"
这个"迅速的交流方式"在当时是缓慢的——论文通过邮船穿越英吉利海峡需要数天,到达美洲需要数月。但与之前的私人通信和手稿流传相比,它已经是一种制度化的公开。知识从私人财产转变为公共讨论的对象,从赞助人的宫廷转变为学者的共同体。
但这种"公有性"从来不是纯粹的。皇家学会的会员资格是排他性的——需要付费、需要推荐、需要符合绅士标准。女性被排除在外(尽管玛格丽特·卡文迪什等贵族女性通过私人渠道参与讨论),工匠被边缘化(他们的技艺被视为"非知识的"),殖民地学者被忽视(他们的地方性知识不被承认为"普遍的")。《哲学汇刊》的发表是选择性的——编辑决定什么值得发表,什么不值得;什么符合"实验哲学"的标准,什么不符合。
更根本的是,皇家学会的"公开"是一种受控的公开。知识被分享,但分享的范围、方式、节奏都受到权力关系的制约。波义耳的空气泵实验需要昂贵的设备,只有富有的绅士才能复制;实验的"见证"需要在特定空间(皇家学会的会议室)由特定人群(认可的会员)进行,才能被承认为"事实"。这种公开性服务于特定群体的利益——建立实验哲学的权威,区分"真正的知识"与"江湖骗术",巩固英国相对于欧洲大陆的科学地位。
从活性算法的角度看,皇家学会建立了一种早期的分布式推断网络。节点(会员)生成假设,通过行动(实验、观测)检验假设,将预测误差(实验结果与预期的差异)反馈回网络,更新集体模型(自然哲学的共识)。但这种网络的拓扑是层级化的:中心节点(皇家学会的核心会员)拥有更大的话语权和资源控制权,边缘节点(外围会员、外国通信者、未入会者)的贡献被选择性吸收。
二、期刊的革命与知识的商品化
19世纪见证了科学期刊的爆炸式增长。随着科学职业化的推进,期刊成为学术评价的核心机制。发表数量、期刊影响因子、引用次数——这些指标逐渐成为科学家职业晋升的硬通货。知识从"公共财产"转变为竞争性资源,期刊从"交流工具"转变为** gatekeeping 的权力装置**。
这种转变有三个关键节点:
第一是同行评审的制度化。1752年,皇家学会建立了论文评审委员会,对投稿进行质量把关。但现代意义上的同行评审直到20世纪中叶才成为标准——尤其是二战后,随着研究经费的增加和投稿量的爆炸,期刊需要系统化的筛选机制。同行评审被包装为"质量保证",但它实际上是一种认知权力的分配:谁有资格评审?什么标准被使用?谁的偏见被编码?
评审的偏见是系统性的。研究表明,评审人倾向于支持与自己观点相似的论文,倾向于认可知名机构的研究,倾向于偏好"主流"方法而非"边缘"方法。女性作者、非英语母语者、发展中国家的研究者——这些群体在评审中面临隐性的歧视。同行评审不是中立的过滤器,而是社会结构的再生产。
第二是出版商的商业垄断。二战后,商业出版商(如Elsevier、Springer、Wiley)逐渐控制了学术期刊市场。它们与学术学会合作(或竞争),获取期刊的出版权,然后通过订阅费和文章处理费获利。这种模式创造了惊人的利润:学术出版是利润率最高的行业之一,而利润的来源是免费的劳动力——作者免费投稿、评审人免费评审、编辑免费工作。
更荒谬的是知识的私有化循环:公共资金资助研究,研究者免费生产知识,出版商收费获取知识,公共机构(图书馆)用公共资金购买访问权。纳税人三次付费——资助研究、支付出版商、购买访问——却从未真正"拥有"知识。这种循环在20世纪末引发了开放获取运动的反弹。
第三是语言霸权的巩固。英语在二战后成为科学的主导语言,这既是美国科学霸权的结果,也是其工具。非英语研究者面临双重负担:他们需要用外语写作,这增加了表达的难度;他们的本土知识传统被排除在"国际"话语之外,除非被翻译成英语。期刊的英语中心化是一种认识论暴力:它定义了什么可以被全球"听见",什么被沉默。
三、默顿的理想与现实的张力
罗伯特·默顿在1942年提出的科学规范中,"公有性"(communism,后来改为communalism以避免政治联想)是核心之一:科学知识应当被视为公共财产,而非私人财富。科学家通过发表成果,将其贡献给整个共同体;作为回报,他们获得承认和尊重,而非经济利润。
默顿的规范是描述性的(科学家实际上如何行为)还是规范性的(科学家应该如何行为)?默顿本人摇摆于两者之间。他观察到,科学家确实倾向于分享知识——否则科学无法积累。但他也承认,这种分享是有条件的:分享发生在获得优先权承认之后,分享的范围限于认可的共同体,分享的方式遵循特定的格式和渠道。
默顿的"公有性"因此是一种理想化的建构,它掩盖了知识流通的权力不对称。当一位哈佛教授在《自然》发表论文时,她的"分享"与一位肯尼亚研究者在本地期刊发表论文时的"分享"是不可通约的:前者的知识被全球数千万研究者访问,后者的知识可能只被数十人阅读。默顿的规范忽视了这种结构性不平等,将"公有性"呈现为普遍的理想,而非特定历史条件的产物。
科学奖励系统的研究进一步揭示了这种张力。默顿本人最早注意到优先权之争的普遍性——从牛顿与莱布尼茨到沃森与克里克,科学家为"谁先发现"而激烈竞争。这种竞争不是个人怪癖,而是制度结构的产物:在公有性规范下,科学家无法通过专利或利润获得回报,唯一的"货币"是承认。对优先权的争夺,是对这种稀缺资源的竞争。
但承认的分配是极度不平等的。默顿的"马太效应"指出:有名望的科学家更容易获得承认,即使他们的贡献与无名科学家相同;无名科学家的贡献更容易被忽视,即使它们与名望科学家的贡献同等重要。这种不平等不是偶然的,而是系统性的——它源于科学共同体对"可信度"的社会分配:我们更愿意相信已经证明自己的人。
四、开放获取运动:知识的解放?
1990年代末至2000年代初,互联网的发展催生了开放获取运动(Open Access, OA)。其核心主张很简单:学术文献应当免费在线获取,任何人都可以阅读、下载、使用,无需付费或授权。这个主张直接挑战了商业出版商的垄断,也呼应了默顿的"公有性"理想。
开放获取有两种主要模式:
"金色"OA:作者在出版时支付文章处理费(Article Processing Charge, APC),出版商承诺论文立即免费开放。这种模式将付费主体从读者转向作者,但保留了出版商的商业角色。它创造了新的不平等:富裕机构和富裕国家的研究者能够支付APC,贫穷机构和全球南方的研究者被排除在外。一些期刊的APC高达数千美元,这相当于许多发展中国家研究者数月的工资。
"绿色"OA:作者在传统期刊发表后,将自存档版本(通常是接受稿或预印本)存放在机构知识库或学科仓库中,免费开放。这种模式不依赖出版商的配合,但需要机构的政策支持和作者的时间投入。许多出版社限制自存档的时限(如 embargo 12-24个月),削弱了开放的即时性。
开放获取运动取得了显著进展。2021年,全球约50%的新发表研究论文是开放获取的。欧盟的"Plan S"倡议要求由公共资金资助的研究必须在开放获取期刊或平台上发表。美国的OSTP政策要求联邦资助的研究论文在发表后立即免费开放。
但这些进展也引发了新的问题。开放获取是否真正民主化了知识?还是创造了新的分层——能够在高APC期刊上发表的"富人"与只能在低质量或闭源期刊上发表的"穷人"?开放获取是否提高了质量?还是降低了门槛,导致掠夺性期刊的泛滥——这些期刊收取APC但不进行真正的同行评审,发表大量低质量甚至伪造的论文?
更根本的是,开放获取主要解决了获取的问题(access),但没有解决生产的问题(production)。谁有权生产知识?谁有权定义什么是"知识"?谁有权验证知识?这些更深层次的问题,需要更激进的变革。
五、预印本革命:速度的挑战
预印本(preprint)是开放科学运动中最激进的创新之一。预印本是研究论文的初稿,在正式同行评审之前公开发布,允许任何人阅读、评论、引用。这种模式彻底颠覆了传统期刊的时序控制——知识不再被延迟到评审完成才公开,而是即时分享。
物理学界是预印本的先驱。1991年,保罗·金斯帕格在洛斯阿拉莫斯国家实验室建立了arXiv——一个基于电子邮件和后来万维网的预印本服务器。arXiv的初衷是解决物理学界信息过载的问题:高能物理学论文数量爆炸,传统期刊的出版周期(数月甚至数年)无法满足快速交流的需求。arXiv让研究者能够在完成论文后立即分享,同行可以在正式发表前阅读、引用、反馈。
arXiv的成功依赖于物理学界的文化特征:高度竞争、快速迭代、紧密的共同体。物理学家信任彼此的初步结果,愿意在未经评审的情况下引用预印本。这种信任不是普遍的,而是特定历史条件的产物——物理学在20世纪建立了强大的专业认同和共同体规范。
2013年,生物学界跟随物理学的脚步,建立了bioRxiv。这与物理学界不同:生物学传统上更依赖正式发表作为优先权标志,更重视同行评审的质量保证。bioRxiv的兴起反映了生物学研究加速的压力——基因组学、结构生物学、CRISPR等领域的竞争极其激烈,延迟发表意味着失去优先权。
预印本在COVID-19大流行期间展示了其变革性潜力。2020年1月至5月,关于SARS-CoV-2和COVID-19的预印本数量爆炸式增长,研究者能够在数天内分享病毒基因序列、传播模型、临床试验结果、疫苗设计方案。这种速度对于应对紧急疫情至关重要:传统期刊的评审周期(数周至数月)在快速演变的疫情中是不可接受的。
但预印本的速度也带来了风险。未经评审的研究可能包含错误——2020年初,一篇预印本声称羟氯喹能够有效治疗COVID-19,引发了全球范围内的药物抢购和政治争论,但后来的随机对照试验否定了这一结论。未经评审的研究可能被媒体夸大——预印本的"初步结果"被报道为"突破性发现",误导公众和政策制定者。未经评审的研究可能被恶意利用——反疫苗运动者引用预印本来支持其主张,无视后来的修正和撤回。
预印本因此体现了开放科学的核心张力:速度 vs. 质量,开放 vs. 责任,民主 vs. 权威。它要求科学共同体发展新的规范——如何快速但负责任地分享?如何区分"初步结果"和"确立事实"?如何在开放的环境中进行有效的质量控制?
六、公民科学:知识民主的极端
如果说预印本让专业科学家更快分享,那么公民科学(citizen science)则让非专业者参与知识生产。这种模式挑战了科学的专业边界,将"公众"从知识的消费者转变为共同生产者。
公民科学有悠久的传统。18世纪的博物学很大程度上是"业余的"——绅士和淑女收集标本、记录观察、参与分类。19世纪的职业化将业余者边缘化,但20世纪的某些领域保留了参与传统:鸟类观察(如奥杜邦学会的圣诞鸟类调查)、气象记录(如CoCoRaHS降水网络)、天文观测(如美国变星观测者协会)。
数字技术让公民科学获得了新的规模和组织形式。2007年,凯文·肖文斯基和克里斯·林托特启动了星系动物园(Galaxy Zoo)项目:志愿者通过互联网平台对数百万张星系图像进行分类,判断它们是椭圆星系、旋涡星系还是不规则星系。人类视觉模式识别能力在某些任务上优于当时的算法,而志愿者的集体判断(通过多数投票)产生了可靠的数据集。星系动物园的成果发表在高影响因子期刊上,志愿者被列为共同作者。
公民科学的逻辑是分布式认知:将认知任务分解为简单的、可大规模复制的单元,利用大量非专业者的集体智慧。这种模式在模式识别任务上特别有效:识别星系形状、发现系外行星凌日、分类蛋白质折叠、转录历史文献。但在理论建构和因果推断任务上,公民科学的作用有限——这些任务需要专业的训练和深度的思考。
公民科学也面临认识论挑战。志愿者的判断是"客观的"吗?还是受到培训材料、界面设计、社会期望的影响?星系动物园的分类系统(椭圆/旋涡/不规则)是专业天文学家的框架,志愿者只是执行分类,而非参与框架的建构。这种"参与"是真实的(志愿者确实贡献了劳动),但也是有限的(他们没有挑战分类系统本身)。
更激进的是社区参与式研究(Community-Based Participatory Research, CBPR),特别是在公共卫生和环境科学中。CBPR要求研究问题由社区定义,研究方法由社区参与,研究成果由社区控制。这种模式挑战了传统的"研究者-被研究者"关系,将知识生产重新嵌入地方语境和民主协商。
但CBPR也面临张力:社区的知识是局部的、具体的,科学的目标是普遍的、抽象的。如何在尊重地方知识的同时,不陷入相对主义(所有知识都同样有效)?如何在社区参与的同时,维持方法论的严谨性?这些张力没有简单的解决方案,但它们揭示了开放科学的深层目标:不仅是知识的开放获取,更是知识生产的民主重构。
七、活性算法视角:分布式推断网络的制度史
从活性算法的框架看,开放科学运动是分布式推断网络的拓扑重构。
传统科学出版建立了一种层级化的星形网络:中心节点(高影响因子期刊、知名机构、权威科学家)控制信息流动,边缘节点(普通研究者、发展中国家、非专业公众)被动接收。这种拓扑是高效的(信息快速从中心传播到边缘),但也是脆弱的(中心故障导致全网瘫痪)、不公正的(边缘节点被排除在闭环之外)。
开放获取试图将星形网络转变为网格网络:节点之间的直接连接增加,信息流动更加多向。但这种转变是不完全的:APC模式创造了新的中心(富裕机构和付费期刊),绿色OA的embargo限制了即时连接,语言霸权继续过滤节点。
预印本进一步推动了去中心化:节点可以直接发布,无需中心 gatekeeper。但预印本服务器本身成为新的中心(arXiv、bioRxiv的控制权),质量控制的缺失导致噪音增加,快速传播加速了错误放大。
公民科学引入了新的节点类型:非专业者参与推断网络,增加了认知多样性,但也增加了协调成本。专业节点需要设计任务分解机制(什么可以由公民完成?什么需要专业训练?),需要建立信任机制(如何判断公民数据的质量?),需要处理知识产权(谁拥有集体生产的知识?)。
从UV自由方案的角度看,开放科学的核心是V(o|s)的民主化。传统出版将观测似然(什么被发表、什么被验证)控制在少数 gatekeeper 手中;开放科学试图让更多节点参与生成和评估观测。但这种民主化需要U(s)的协调:如果每个节点有自己的先验模型,且模型之间不可通约,那么分布式推断可能发散而非收敛。开放科学的成功,依赖于共享的推断规范——不是强制的统一,而是协商的一致。
八、结语:在开放中寻找边界
开放科学运动从皇家学会的"知识交易"到当代的预印本革命,经历了三个多世纪的演变。它的核心张力始终未变:知识的公有性理想 vs. 知识的权力现实。
默顿的"公有性"是一种规范性承诺:科学应当服务于公共利益,知识应当被自由分享。但这种承诺在实践中总是被权力关系所扭曲:谁的知识被分享?以什么方式?在什么条件下?对谁有利?
开放获取、预印本、公民科学——这些创新试图纠正历史上的扭曲,但它们也创造了新的问题。开放不是无条件的善;它需要责任——对质量的负责、对来源的负责、对后果的负责。民主不是简单的多数决定;它需要协商——不同立场之间的对话、妥协、共同学习。
未来的科学史,应该是一部有开放的历史。它讲述的不仅是知识的增长,也是知识流通结构的演变;不仅是发现的辉煌,也是分享的政治;不仅是专业的成就,也是公众的参与。它追问:当知识真正开放时,谁受益?谁受损?什么被放大?什么被沉默?
因为最终,科学不是私人的财产,也不是公共的荒地。它是共同的花园——需要耕耘、需要守护、需要公平的分享。而花园的边界,永远是协商的结果。
转载本文请联系原作者获取授权,同时请注明本文来自王涛科学网博客。
链接地址:https://wap.sciencenet.cn/blog-41701-1535576.html?mobile=1
收藏