|

图1 论文标题及作者信息
团队首先训练了一个基于Transformer的模型(LW),训练数据来自公开数据库的3605条AVPs和258,875条非抗病毒肽(non-AVPs)。由于数据极度不平衡,研究团队对交叉熵损失函数进行了改进,引入样本比例权重,避免模型因为样本数量不均衡产生的预测偏倚,同时以数据平衡模型(DB)作为对照。结果显示,相较于对照组和已有模型,LW在预测精确度上具有明显优势,精度达到0.87 ± 0.04。为了更高效地寻找新的抗病毒肽,研究团队进一步在不同物种的参考蛋白组中进行AVPs的高通量预测。结果发现,病毒组数据集是最丰富的潜在AVPs来源,有着最高预测比例的AVPs(2.24%)。基于这一发现,团队进一步整合了全球范围内的病毒组研究数据,这些数据来源于多个独立的研究项目,包括中国陆地环境、狩猎活动相关的动物以及小型哺乳动物类群的病毒组序列,同时也涵盖其他脊椎动物、无脊椎动物类群的相关数据。利用LW模型挖掘潜在的AVPs,并结合生物学相关性分析筛选与病毒丰度显著负相关的候选序列,这种策略不仅降低了假阳性,也大大缩小了实验验证范围。该研究最终获得27条候选抗病毒肽(cAVPs)。随后对27条cAVPs的实验验证中,有24条能够显著抑制三种呼吸道病毒中的至少一种。进一步机制研究显示,这些活性最强的肽主要通过破坏病毒包膜发挥作用,从而有效抑制病毒感染。综上所述,本研究展示了人工智能在抗病毒肽发现领域的巨大潜力,不仅大幅提高了AVPs挖掘的效率和准确性,也为未来广谱抗病毒药物的研发提供了全新的思路和技术路线。随着更多病毒组数据的不断积累,这种基于语言模型的策略有望支持更系统、更快速的抗病毒分子探索,为应对未来可能出现的未知病毒威胁提供强有力的技术储备。
✦ +
+
作者简介
王洁婧 硕士
第一作者
机构:中国科学院微生物研究所
研究方向:机器学习在微生物方面的应用
邓涛 研究员
通讯作者
机构:中国科学院微生物研究所
研究方向:流感病毒复制机制及抗病毒策略研发
赵欣 研究员
通讯作者
机构:中国科学院微生物研究所
研究方向:病毒入侵阻断及抗病毒免疫研究
王军 研究员
通讯作者
机构:中国科学院微生物研究所
研究方向:微生物组学和人工智能在微生物研究中的应用
引用格式:Wang J, Li D, Shi Y, et al. Language model–driven discovery of antiviral peptides. hLife 2025. https://doi.org/10.1016/j.hlife.2026.11.004.
期刊简介
hLife 由高福院士、董晨院士和Jules A. Hoffmann教授(2011诺奖获得者)领衔,是中国科学院微生物研究所主办,中国生物工程学会,浙江大学陈廷骅大健康学院,西湖大学医学院,上海市免疫治疗创新研究院和广州霍夫曼免疫研究所联合支持,与国际出版商爱思唯尔合作的健康科学领域综合性英文期刊。
hLife 聚焦健康科学领域的前沿进展,旨在促进基础研究与临床应用的融合发展。期刊发表与医学相关各研究领域最新成果,学科领域包括(但不限于)病原生物学、流行病学、生理学、免疫学、结构生物学、疾病监测、肿瘤、药物、疫苗和健康政策等。
hLife是一本金色开放获取期刊,月刊出版;2022年成功入选“中国科技期刊卓越行动计划高起点新刊”;2023年11月正式创刊;2024年5月被DOAJ收录;2024年8月被Scopus收录;2024年10月入选“首都科技期刊卓越行动计划——重点英文科技期刊支持项目”;2025年6月入选北京市科委“2025年度支持高水平国际科技期刊建设-强刊提升”项目;2025年8月入选中国科学引文数据库(CSCD)核心库;2025年10月被收录为“中国科技核心期刊”(CSTPCD);2025年11月首次入选《中国英文科技期刊海外媒体传播影响力报告》并获评生物医学领域与临床医学领域Top10。
hLife实行高标准与高效率并重的同行评审机制:
投稿至给出“是否送审”决定⏰1天
投稿至给出“首轮审稿”决定⏰28天
投稿至给出“是否录用”决定⏰61天
2026年前hLife接收的稿件免收文章处理费(APC)。
https://www.sciencedirect.com/journal/hlife
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-2-11 21:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社