||
如今,人工智能(AI)在各行各业都展现出不可忽视的影响力。从药物设计到蛋白质结构预测,AI不仅能加速实验进程,也在推动科研创新。然而,一个全新的问题随之而来:AI是否会取代人类,主导科学研究?
近日,英特尔,东京科学大学,上海蓝晶微生物技术有限公司和中国药科大学等团队联合在hLife发表了题为“Artificial intelligence serves as a research aide in biology but never eclipses humanity as a successor”的文章(图1),按工作模式类比,将现有AI分为“工具”、“镜子”与“助手”这三种角色来展开分析。通过探索不同模式的边界,文章讨论了未来“人机协作”中潜在的新挑战和新机会。
图1 论文标题及作者信息
🪜AI作为一种“工具”:加速药物研发与合成生物学领域设计
一个典型案例是虚拟筛选——从分子海洋中“淘金”:
在小分子药物研发中,研发人员首先通过多种不同分子生成器(Molecular Generator)快速生成数量达亿级、符合化学规则的分子结构(图2A),然后借助多层分类器筛选出符合各种化学属性要求的高潜力候选分子(图2B)。然而,将筛选过程完全交由AI主导,存在“假阳性”的风险。为解决这一问题,近年来的研究尝试引入可解释AI(XAI)技术,通过打分评估关键特征(如官能团,图2C)对预测结果的重要性,从而为预测结果提供人类可读的解释或证据。
另一个案例是合成生物学的“生产管线”辅助设计:
在合成生物学领域,研究者使用AI模型“调优”DNA序列,推动细菌、病毒等遗传系统的功能创新(图2D)。例如,基于变分自编码器(VAE)模型可设计蓝藻特异性启动子,显著提升目标基因的表达效率。此外,自动化推荐工具(ART)已成功优化生物燃料、氨基酸等产物的合成路径,进一步彰显了AI在复杂生物系统中的强大潜力。
挑战:数据匮乏下的“巧妇难为”
受限于实验数据量小、分布不均(长尾)等问题,工具AI的训练面临瓶颈。研究者尝试通过两种方式缓解该类问题:1. 自监督学习,通过“完形填空”(Masked Language Modeling)或对比学习,挖掘数据隐含规律;2. 少样本学习,利用上下文学习(ICL)快速适应新任务。但研究普遍指出,AI无法绕过原始数据的获取过程,人类实验仍是科学验证的核心环节。
🪞AI作为一面“镜子”:模拟生命系统的“预测引擎”
通过模拟生物分子稳定状态,AlphaFold系列模型AlphaFold2/3(AF2/AF3)实现了从蛋白质到全生物分子的结构推演。通过多序列比对(MSA)和超图注意力网络,AF2实现了蛋白质三维结构的高精度预测(图2E)。AF3则进一步引入“扩散模型”,通过模拟分子热力学平衡过程,优化结构收敛,其原理与AI生成图像(如Stable Diffusion)异曲同工(图2A, 2E, 2I均为该类模型生成结果示例)。
逆向设计结构模型,从结构反推序列。有研究提出一个关键问题:能否将AF2从序列到结构的预测过程逆转过来,以实现从头设计目标,即给定结构,返回对应序列?实验表明,结合马尔可夫链-蒙特卡洛(MCMC)算法(图2F),AI可初步实现这一目标,但成功率仍有限。而ProteinMPNN模型(图2G)通过图神经网络,可实现超稳定环肽(图2H)或功能化荧光蛋白的定向设计,为合成生物学开辟新路径。
挑战:人类验证不可替代
尽管ProteinMPNN的实验成功率约20%,但AI预测的非经典结构(如GPCR等结合口袋结构)时仍存误差。研究强调,人类科学家仍需作为“最终质检员”,以确保设计的可行性。
🧗AI作为一位“助手”:从多轮问答到自适应推理
大语言模型(LLM)正逐渐成为生物研究等领域知识的“导航仪”。基于DeepSeekMoE的检索增强生成(RAG)系统(图2J),AI可实现跨文献的复杂语义搜索。类似的开源方案可以参考: Dify,RAGFlow,OPEA,EAP等。此外,通过“多专家混合(MoE)”架构与强化学习(RL)机制,模型能在不忘记其它学科知识的基础上,跨学科分析生物学AI难题(如药物靶点预测),效果显著优于传统AI(图2K),类似开源方案可参考: DeepSeek-R1,Qwen3,Llama4等。
挑战:如何实现对变化环境的持续自适应
最近的一篇研究提出了Transformer2框架(图2L),其灵感源自大脑神经的可塑性。该模型通过动态调整参数矩阵,实现在线环境适配,在低算力下完成多模态任务(如跨物种基因分析)。这一突破为构建“可持续学习”的AI系统提供了生物启发范式。
图2 AI分为“工具”、“镜子”与“助手”这三种角色
未来展望:构建人机共生的科研生态
当前AI已具备工具性、镜像性与辅助性功能,但其“偶然幻觉”与“效率平衡”的矛盾仍需解决。未来的研究应更多聚焦于以下方向:
少数据、有依据的算法优化,发展自监督学习、上下文学习与可解释AI(XAI);
以人为中心的人机协作范式,将AI纳入“人类主导的验证闭环”,而非完全自动化;
与人类环境可持续互动的增量AI,确保AI微调的可追溯、可持续在线学习。
总之,AI是生物研究的加速器,而非终结者。唯有将AI的算力与人类的创造力深度融合,才能真正突破生命科学的边界。
作者简介
杨威 人工智能架构师
第一作者
机构:英特尔
研究方向:多模态大语言模型
孙奇 博士研究生
第一作者
机构:东京科学大学
研究方向:元学习
张益豪 运营发展总监
第一作者
机构:上海蓝晶微生物科技有限公司
研究方向:合成生物学
程从超 数据中心首席架构师
通讯作者
机构:英特尔
研究方向:大数据与人工智能
孙宇 特聘研究员
通讯作者
机构:中国药科大学智能药学交叉研究院
研究方向:人工智能与药物设计
引用格式:Yang W, Sun Q, Zhang Y, et al. Artificial intelligence serves as a research aide in biology but never eclipses humanity as a successor. hLife 2025;
https://doi.org/10.1016/j.hlife.2025.05.009.
期刊简介
hLife 由高福院士、董晨院士和Jules A. Hoffmann教授(2011诺奖获得者)领衔,是中国科学院微生物研究所主办,中国生物工程学会,浙江大学陈廷骅大健康学院,西湖大学医学院,上海市免疫治疗创新研究院和广州霍夫曼免疫研究所联合支持,与国际出版商爱思唯尔合作的健康科学领域综合性英文期刊。
hLife 聚焦健康科学领域的前沿进展,旨在促进基础研究与临床应用的融合发展。期刊发表与医学相关各研究领域最新成果,学科领域包括(但不限于)病原生物学、流行病学、生理学、免疫学、结构生物学、疾病监测、肿瘤、药物、疫苗和健康政策等。
hLife是一本金色开放获取期刊,月刊出版;2022年成功入选“中国科技期刊卓越行动计划高起点新刊”;2023年11月正式创刊;2024年5月被DOAJ收录;2024年8月被Scopus收录。
2026年前hLife接收的稿件免收文章处理费(APC)。
期刊网址:
https://www.sciencedirect.com/journal/hlife
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-7-8 12:04
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社