氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究:sunxjk@hotmail.com 微信 hydrogen_thinker

博文

AI是“思维的飞机”:确保科学家成为负责任“飞行员”的五大原则

已有 273 次阅读 2026-3-4 07:33 |系统分类:海外观察

AI“思维的飞机”:确保科学家成为负责任“飞行员”的五大原则

本文作者Dashun Wang

· Dashun Wang is the Kellogg Chair of Technology and the founding director of the Northwestern Innovation Institute at Northwestern University in Evanston, Illinois, USA.

随着人工智能系统在科研流程中承担越来越多的工作,我们的核心目标不应是实现完全自动化,而应是设计能保留创造力、责任感与意外发现的平台。

 

插图展示了一位研究人员抬头望向天空的特写,天空中有一个神经网络,上面叠加着5架数字化风格的飞机。

20世纪80年代初,苹果公司联合创始人史蒂夫·乔布斯将计算机描述为“思维的自行车”。这一灵感源自他童年时在《科学美国人》上看到的一张图表——图表显示,骑自行车的人类比任何动物都更节能¹。这一隐喻精准捕捉了个人电脑的核心价值:让人们以更少的努力走得更远、更快。但自行车更深层次的精妙之处在于它“不做什么”:它既不模仿人类生物学特征,也不复制自然界中的任何形态,而是对移动方式进行了全新构想。

相比之下,我认为人工智能代理是“思维的飞机”——它们能比自行车更显著地为人类提速,但操控难度更大,且失误引发的后果可能极为严重。而科学家群体尤其有望从这些工具中受益。科研的核心本质,是一场向未知领域的探索之旅。然而,在新领域开展研究总会遭遇意想不到的挑战²,失败也屡见不鲜³。

为了快速且负责任地拓展知识前沿,科学界和科学家们迫切需要一份操控这些“飞机”的行动指南。在我看来,要在研究中有效运用人工智能,或许需要开发基于可靠、特定领域科学信息的人工智能代理。真正的问题不在于机器是否会取代科学家,而在于当我们学会操控这些“飞机”后,将成为什么样的科学家。

为将这一理念付诸实践,我的团队开发了SciSciGPT⁴——这是一个多代理原型系统,由多个专业人工智能代理分工协作,共同完成科研流程。我们运用了科学学⁵的研究方法,这一领域结合大数据集与计算方法,旨在探究科学进步的动态规律。

SciSciGPT的核心是“研究管理代理”(ResearchManager)。它负责统筹整个工作流程:将研究人员通过聊天界面输入的自然语言查询拆解为具体任务,再分配给专注于文献综述、数据提取或数据分析的专业代理。这些代理会规划并执行子任务——包括检索文献、编写代码、开展分析和生成图表,同时“评估专家代理”(EvaluationSpecialist)会持续审核它们的输出结果。每个步骤都会被记录在案,形成端到端的透明溯源记录。

在我们的案例研究⁴中,SciSciGPT完成了一组大学间合作关系的可视化分析,并验证了某篇论文中的图表是否能通过其数据库中的数据重现。与经验丰富的研究人员使用人工智能工具相比,SciSciGPT完成这些研究任务的速度更快、结果质量更高。

在此,我将分享我的团队在构建科研专用人工智能代理过程中获得的经验教训,以及科学家在使用代理开展研究时应遵循的核心原则。

协作优于自动化

如今,人们很容易陷入“完全自动化科研流程”的诱惑中⁶⁻⁸——转向“人工智能科学家”或“自动驾驶实验室”,让其端到端地完成假设生成、实验设计和论文撰写。这些系统可能令人惊叹,但科学并非装配线,也没有固定的优化目标。它是一项建立在解读、争论和责任之上的事业,人类的判断在其中至关重要。

例如,一个完全自动化的系统可以完成牛顿的棱镜实验:测量白光通过棱镜时的色散情况,并将数据拟合到模型中。但牛顿做了一件本质上截然不同的事:他反转了实验装置,将色散后的彩色光束重新合成白光——这一决定性举动证明,颜色是光本身的属性,而非玻璃赋予的。这种将“明显异常”视为研究现象而非需排除误差的判断,是一种解读上的飞跃,而非单纯的计算。而自动化流程的设计初衷,是抹平异常、优化数据拟合度。相比之下,科学家的优势正在于利用意外发现。

以“机长主导”模式开展科研

随着人工智能工具成为科研核心,科学界不仅面临技术拐点,也面临公民责任拐点。科学的合法性建立在一份共同的社会契约之上:结论应接受审视、作者需为证据负责、知识的产生应秉持诚信原则并服务于公共利益。

在公众对科学的信任本就脆弱的当下,我们更应强化支撑科学的基础,通过将透明度、可追溯性和问责制融入发现过程的核心架构,重新践行这份社会契约。完全自动化或许能给出一些答案,但会侵蚀这些答案所承载的可信度。

更具可持续性的路径是“机长主导”式科研:研究人员作为“机长”,由一组人工智能代理担任“机组人员”,为机长的最大利益服务。机组人员可包括负责起草的分析代理、负责质疑的批评代理、负责规划下一步的统筹代理,以及负责协调同步的调度代理。

界面设计应注重“可操控性”和“异议包容性”,鼓励研究人员核查推理过程、比较替代方案并推翻不合理结论。人类科学家应始终保有核心权限——负责提出问题、验证研究路径并最终认可结论,同时承担相应责任。要让这一模式稳健运行,需要研究领域的科学家、人工智能工程师、设计师和伦理学家的蓄意协作,确保代理是增强人类创造力,而非取代它

纵观历史,所有发现都是由人类完成的。随着人工智能具备助力发现的能力,核心问题不再是机器单独能做什么,而是我们应如何设计它们,以确保科学的问责性和可重复性。

速度本身具有变革性

当失败的成本大幅降低,更具风险和雄心的想法就变得合理可行——那些曾经因成本过高或耗时过长而无法验证的问题,如今有望得到探索。

基因组学领域的变革就是例证:解码首个人类基因组耗时超过十年、耗资数十亿美元;而如今,测序成本不足1000美元,耗时仅需数小时。这一转变让该领域从对单个基因的研究,拓展到对整个基因组的广泛探索。随之而来的是全新的研究视角,让研究人员能够发现此前隐匿的科学关联。

速度还改变了“谁能提出问题”。技术门槛和时间成本的降低,让小型实验室、科研新人甚至个体研究人员能够开展曾经需要大型团队和数月协调才能完成的分析工作。但推动发现加速的力量,也可能放大错误。缺乏反思的“快速科学”,可能导致大规模的错误共识。这进一步凸显了人机协作而非完全自动化的重要性。

代理应具备专业性

SciSciGPT是一个天然的初步测试案例:科学学领域数据丰富、方法多样,且其研究对象正是“发现本身的运作规律”。但这一理念同样适用于其他学科,只是支撑这些代理的训练数据会有所不同。每个领域都有自己的基础——包括文献、数据集、工具和标准。在化学领域,这可能意味着与动力学模型相关的数据库,这些模型可预测反应速率并指出实验易失败的环节;在生物医学领域,可能是与试验数据、诊断协议和多模态患者信息相关联的临床指南;在数学领域,则可能是形式化的证明库。

不同领域的人工智能研究代理可能形态各异,但都应遵循相同的基本原则:结果可追溯、方法可验证、责任可明确。制定这些规则需要科学学会、资助机构、期刊、公共研究基础设施以及开发当前模型的人工智能实验室共同协调。目标是建立一个公私共享的互操作性框架——例如,制定代理决策记录的通用标准,让一个实验室开展的分析能被另一个实验室审核或重现。

 图片4.png

配图:中国某实验室内部,一个带机械臂的箱型机器人正在运作。一些实验室正尝试使用“人工智能科学家”实现研究工作的全流程自动化。

我的团队研究表明,人工智能对科学的益处遍及各个学科⁹。但当我们分析大学课程大纲,考察各学科对人工智能相关课程的教学投入时,发现了一个系统性错位:人工智能教育主要集中在计算机科学、数学和工程学领域,而同样能从中大幅受益的学科——从医学、心理学到经济学——所提供的相关培训却少得多⁹。

与此同时,学术界的组织架构仍围绕院系壁垒展开,随着知识负担的加重,这些壁垒愈发坚固。科学政策制定者应认识到这些摩擦,支持跨学科的研究所式架构,促进人工智能专家与领域科学家之间的持续协作。

信任必须通过设计实现

自行车发生事故时,后果通常局限于局部。飞机则不同:一旦失事,可能给机上所有人带来灾难性后果,还常常会对地面造成连带损害。这正是我们在人工智能代理领域面临的规模差异。随着它们的广泛应用,其失误不仅会给单个研究人员带来不便,还可能误导整个领域、改变资金流向,并侵蚀公众对科学的信任。

大型语言模型(LLMs)的一个关键优势是具备写作能力。这意味着它们能用通俗易懂的文字记录自己的所有行为。在我们的 SciSciGPT 项目中,系统生成的每一个步骤、每一行代码和每一个决策,都会由大型语言模型自动记录。这产生了海量数据,但也带来了变革性的影响。即使是我最优秀的学生做实验,我也无法奢望看到或重现他们得出结果的每一个步骤。但有了代理,这一切都成为可能。

人工智能可能改变科研评估方式 —— 一些学者对此表示担忧

然而,这也带来了另一个挑战:信息过载。一些研究人员抱怨,核查人工智能的输出结果比自己亲自完成工作还要耗时。解决方案不在于记录更多信息,而在于记录 “更有价值” 的信息 —— 设计能将原始溯源数据转化为可理解信息的系统。

合理的设计应包括结构化的溯源记录,不仅记录 “做了什么”,更要突出 “为何做此决策”;同时通过分层摘要,让关键偏差和决策一目了然。

透明度需要专属的架构支撑。人工智能系统的构建应配备严谨的科学溯源记录器和审计追踪机制。若设计得当,人工智能代理能有效应对科学领域最核心的挑战之一:可重复性。速度本身也能构建信任 —— 由于代理可在数秒或数分钟内重新运行整个工作流程,按需重现结果变得轻而易举。这带来了极具吸引力的可能性:研究表明,当多个人类团队分析同一数据集时,往往会得出不同结论 ¹⁰。人工智能代理让我们能够系统性地研究这些分歧,同样重要的是,我们可以通过回放确切步骤来验证结论。

人工智能将造就新型科学家

飞机的诞生催生了对飞行员的需求,人工智能代理也将要求科学家实现转型。2016 年,谷歌 DeepMind 旗下的围棋人工智能系统 AlphaGo 在与世界冠军李世石的对局中,下出了著名的 “第 37 手”—— 这一步棋非常规到令专业解说员震惊。然而短短几年内,顶尖棋手便将许多人工智能的策略纳入了自己的棋库 ¹¹。如今,科学界正面临类似的挑战。

代理提出的理念 —— 无论是理论构建、异常现象挖掘还是假设设计 —— 起初可能显得陌生。关键问题在于,科学家接受的训练是将这些理念斥为干扰项,还是从中学习。其结果可能是人机协同进化:适应最快的科学家,或许将成为引领未来发现的先行者。

我打算将论文产出减半。你也该考虑 “慢科学”

但这对科学家个人和整个科学界而言都存在风险。对科学家来说,风险在于技能退化。借助全球定位系统(GPS)导航工具开车固然便捷,却会削弱我们对路线的记忆。代理可能提高研究人员的效率,但会降低他们挑战人工智能的能力。

与此同时,若许多研究人员依赖相同的代理组合(即各自承担不同任务的代理集群),科学界可能面临同质化风险。越来越多的人担忧,尽管人工智能可能提升个人的研究质量或表现,但可能会降低集体的多样性 ¹²⁻¹³—— 除非我们刻意采取应对措施,否则研究成果将趋于一致。这触及了人机协作问题的核心。设计时必须注重思维和方法的多样性,包括培育多种模型(采用不同框架或思维方式),从多角度解决问题;同时建立奖励异议的制度规范。

从长远来看,人工智能的价值不仅取决于代理的表现,还取决于它们彼此 “思考” 方式的差异。归根结底,就像合作伙伴会塑造我们(有时是以深刻且意想不到的方式)一样,作为探索伙伴的人工智能代理也会塑造我们。通过合理设计,它们能拓宽科学判断的边界,为研究人员提供更强大的助力。

重构科学的结构

SciSciGPT 等系统仍在模仿当前的发现模式,只是加快了速度、拓宽了问题的范围。但人机协同发现的未来未必需要遵循熟悉的形式。

当钢材和钢筋混凝土问世时,建筑师最初只是用它们模仿砖石结构,将新结构隐藏在传统设计之下。真正的突破来自于他们意识到,墙体不再需要承重:建筑可以用玻璃包裹,由此诞生了纽约联合国秘书处大厦、巴黎玻璃屋等现代主义标志性建筑。

经济学家观察到,当机器首次开始使用电力时,也出现了类似的模式 ¹⁴。起初,仅仅用电动机替代蒸汽机几乎没有带来任何改变,因为工厂并未随之重新设计。直到工厂布局调整以利用电力的核心优势 —— 动力可输送到车间的任何地方,而非仅来自中央动力源 —— 生产力才实现飙升。

在我们构想(并重新构想)充满人工智能代理的科学未来时,这一视角至关重要。为当今的科学插上翅膀固然能带来诸多收获,但如果我们能为新的框架进行设计,可能会实现跨越式变革 ¹⁵。当初启发乔布斯的那张图表,以体重为横轴、运输成本为纵轴,骑自行车的人位于图表最下方 —— 是所有移动方式中效率最高的。然而,在图表的重量端,是飞机:成本高昂、效率低下,却极具开拓性,打开了曾经难以想象的领域。这两个隐喻我们都需要。自行车提醒我们,设计应追求效率与超越;飞机则警示我们,规模越大,越需要信任体系的支撑。这份行动指南将随着人工智能的发展而不断演进,但对它的需求已迫在眉睫。



https://wap.sciencenet.cn/blog-41174-1524136.html

上一篇:如何评价人工智能的科研能力?《科学》
下一篇:“量子蛋白质”或成下一个重大突破
收藏 IP: 117.143.183.*| 热度|

2 许培扬 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-3-4 18:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部