||
2025年11月25日,Science发表达里奥·吉尔 (Darío Gil)和凯瑟琳·A·莫勒 (Kathryn A. Moler)撰写的题为“Accelerating science with AI”的编辑论评。达里奥是美国能源部负责科学事务的副部长,也是“创世纪”任务的负责人。凯瑟琳是斯坦福大学马文·乔多罗 (Marvin Chodorow) 讲席教授,同时也是该校应用物理系、物理系以及能源科学与工程系的教授。
论评内容如下(https://www.science.org/doi/10.1126/science.aee0605):
通过将人工智能 (AI) 成功融入科研工作流程,研究人员可以大幅提升科研效率。本周白宫宣布的美国“创世纪计划”(US Genesis Mission) 引发了一场关于如何实现这一潜力的关键对话。这场对话应围绕两项并行工作展开:一是构建从数据、算法到硬件和智能体控制的集成基础设施,以应用人工智能加速科研;二是制定政策和资源,赋能科学家,从而推动科学进步和人工智能创新之间的良性循环。
成功始于提出正确的科学问题——识别那些可能带来变革性突破、推动人工智能方法和人机协作进步的问题,进而激发更广泛的科学发展。例如,在聚变能源领域,这意味着利用人工智能预测等离子体不稳定性,从而实现对温度高于太阳的等离子体的实时控制。在分子和材料领域,这意味着开发动力学和功能预测模型,以期获得新的发现。而在量子前沿领域,这意味着加速算法开发,以模拟自然并解决目前难以解决的问题。
人工智能模型能否成功也取决于驱动其运行的数据。以蛋白质数据库(PDB)为例,它为蛋白质结构预测提供了数据集。PDB的成功是数十年来在实验工具(例如用于生成数据的先进光源)以及用于共享信息的开放获取存储库方面投入大量时间和精力的成果。维拉·鲁宾天文台、先进光子源和大型强子对撞机等主要仪器提供了丰富的、相对结构化的数据,为其奠定了坚实的基础。然而,对于研发领域庞大而杂乱的异构数据而言,挑战则要大得多。不同的标准和不完整的元数据阻碍了发现。将孤立的数据集转化为统一的发现引擎,需要科学家、联邦机构和其他利益相关者共同努力,使现有数据能够用于人工智能,并建立相关标准,从而确保未来的数据一经发布即可访问并适用于人工智能。
下一代科学家需要将百亿亿次级高性能计算、专用人工智能、量子超级计算机、安全网络、按需云计算能力以及海量数据集存储整合在一起的计算基础设施。与传感器和控制器等设备的连接,以及这些设备上的专用人工智能算法,将实现实时数据采集和对实时实验的控制。
超越通用型、基于语言的人工智能,专用模型将结合人工智能的学习能力和基于物理和化学自然规律的传统模拟的物理预测能力。至关重要的是,这些模型将增强而非取代已建立的科学模型,其中包括用于验证或修正人工智能生成结果的检查点,以对照已知的物理模型和真实世界数据进行验证。将混合模型与科学代理(即在人类指导下自主协调部分研究步骤的人工智能系统)相结合,有望缩短发现时间,因为每次人工智能分析产生的数据都会形成一个自我强化的改进循环。
要使人工智能真正成为科学的合作伙伴,科学家必须利用它产出可验证的结果,并将数据、方法、代码和输出公开,接受公众审查。这就要求研究人员、科研机构、学术期刊和资助机构共同促进开源模型、标准化工具和即用型数据的开发。
利用人工智能加速科学发展将依赖于公共和私人资金的共同投入。美国每年在研发领域的总投资高达万亿美元,这一数额往往被低估。尽管联邦政府在推动基础研究、支持研究型教育以及促成长期高风险项目方面发挥着不可或缺的作用,但超过70%的资金支持来自私营部门。战略性的公私合作可以充分利用私营部门的资源和创新能力,从而提升政府的基础性作用。现在正是试点新型合作模式的良机,例如联合投资计算基础设施、构建数据共享框架,以及开展专注于开发人工智能赋能的新发现方法的合作项目。
这种方法的价值不仅限于科学领域,更可惠及整个经济。研发目前占美国国内生产总值的3.5%,是一股强大的经济引擎,其收益远远超过成本。人工智能通过赋能各学科、各机构的研究人员,加速科学和工程发展,从而提高研究效率和影响力,促进创新,推动经济增长,并改善人们的生活。这正是这一全新发现时代的最终愿景。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-4 08:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社