||
基于全球八大权威药典收录的1037个药用物种的细胞核基因组、细胞器基因组等多维数据,成都中医药大学陈士林团队联合多家单位,通过自主开发的人工智能算法,结合转录组、小RNA测序、肽质谱等多组学技术,实现了对药用物种中天然多样性成分的识别与功能注释。
导 读
天然成分不仅是物种适应环境和共进化的产物,更是药物研发的宝库。通过融合多组学与人工智能技术,创建了全球首个草药基因编码的天然多样性成分库(Gene-encoded Natural Diverse Components (GNDC) Repository)(图1),突破了传统天然产物数据库以次级代谢物为主的局限,拓展了药物发现的化学空间,实现了基因组信息、成分信息与功能信息的深度整合。
基于分子生物学中心法则,天然成分可分为基因直接编码成分(如小RNA和小肽)和基因间接编码成分(包括次级代谢物和碳水化合物)(图2)。按照这一分类体系创建的全球首个草药基因编码天然多样性成分库GNDC,收录了超过2.34亿个基因直接或间接编码的天然多样性成分,包括232万个次生代谢产物、22,977万条多肽、238万个小RNA和26万个碳水化合物。
本文注释了全球八大药典收录物种的次生代谢产物、多肽、小RNA和碳水化合物等天然多样性成分,并基于NCBI分类数据库构建系统发育树展示其分布特征,揭示了天然成分在生物分类学上的多样性规律,为理解不同进化谱系中天然成分的分布模式提供了重要依据(图3)。与现有天然多样性成分数据库相比,GNDC在数据规模、注释深度和功能解析方面均具有显著优势,有效弥补了现有天然产物数据库在药效功能预测与机制注释方面的不足。
GNDC数据库由四大专业子库构成:HerbalMDB收录232万种次级代谢产物,提供结构检索、生物活性预测及表达谱分析功能;HerbalPDB整合2.3亿条多肽数据,支持基于基因组、转录组和肽组证据的功能肽筛选与表征;HerbalRDB包含238万个小RNA分子,实现miRNA靶基因预测及跨数据库关联分析;HerbalCDB系统收录26万种碳水化合物,配备糖链结构解析与功能注释工具。GNDC数据库的建立将推动药物研发范式从“经验驱动”向“大数据驱动”转型,为创新药物发现提供全新的数字化研究平台。
总结与展望
基于本草基因组学研究体系和药用植物多组学数据的积累,成都中医药大学本草基因组学团队开发了全球首个亿级规模的草药基因编码天然多样性成分库(GNDC)。通过自主开发的人工智能算法,结合转录组测序、小RNA测序、肽质谱等多组学技术实现了对天然多样性成分的识别、分类与功能注释。GNDC收录了超过2.34亿个基因直接或间接编码的天然多样性成分,弥补了现有天然产物数据库在数据类型与功能解析方面的不足。GNDC通过深度融合多组学数据与人工智能技术,为新药研发、合成生物学及中药现代化等领域提供强有力的工具和平台,推动天然产物研究从传统经验模式向数据驱动模式转型,为传统药物研究带来颠覆性变革。
责任编辑
杨 莹 国家生物信息中心
赵柏林 西安交通大学
本文内容来自Cell Press合作期刊The Innovation第6卷第12期以Article发表的“Artificial intelligence-curated repository of gene-encoded natural diverse components from herbal medicines” (投稿: 2025-04-10;接收: 2025-06-23;在线刊出: 2025-06-25)。
DOI:10.1016/j.xinn.2025.101011
引用格式:Chen W., Yu Z., Leng L., et al. (2025). Artificial intelligence-curated repository of gene-encoded natural diverse components from herbal medicines. The Innovation 6:101011.
原文链接:https://www.sciencedirect.com/science/article/pii/S2666675825002140
扫二维码|查看原文
作者简介
成都中医药大学本草基因组学研究院陈伟教授、余志银副研究员,为该文的共同第一作者,成都中医药大学本草基因组学研究院宋驰教授为通讯作者。
陈 伟,成都中医药大学二级教授,博士研究生导师。主要从事人工智能和药物发现与设计等相关领域的研究,在The Innovation,Nucleic Acids Research等期刊发表学术论文180余篇,连续入选科睿唯安“全球高被引科学家”、爱思唯尔“中国高被引学者”。
宋 驰,本草基因组学研究院执行院长,教授,博士研究生导师。主要研究方向为药用物种基因组及资源鉴定研究、基于高通量测序技术的大数据研究,在Nature Genetics、Nature Biotechnology、Nature Communications、Nature Plants等国际期刊上发表多篇高影响力论文。
往期推荐
基于医疗大数据和人工智能的糖尿病前期健康风险管理 |
中国的科学健康:数据与人工智能驱动的健康模式创新与实践 |
医学数据的计算建模:从数据收集到知识发现 |
科学网—[转载]干细胞人造胰岛实现83%胰岛素独立:1型糖尿病治疗的新希望与临床转化挑战 | Innovation Medicine
科学网—[转载]《创新信息学》即将创刊 | The Innovation Informatics is coming
科学网—[转载]空天过渡区,神秘太空的探索—物理、化学过程和数值模拟 | The Innovation
科学网—[转载]打通天然矿物空气碳捕集的“任督二脉” | The Innovation Materials
科学网—[转载]木质素缩合新机制助力多样生物基双酚化合物合成 | The Innovation
科学网—[转载]医学人工智能2025:探索无尽的前沿 | The Innovation Medicine
科学网—[转载]DeepSeek:成本革命让大模型不再是少数人的游戏 | The Innovation
科学网—[转载]“拉索”利用宇宙线每日诊脉日地空间磁场 | The Innovation
科学网—[转载]危化品 or 能源,氢能监管走向何方 | The Innovation Energy
科学网—[转载]月球大量开采水的新方法 | The Innovation
科学网—[转载]The Innovation | 2023 Impact Factor = 33.2
科学网—[转载]面向动力电池系统热安全的阻燃型多功能复合相变材料的防护机理研究 | The Innovation Materials
科学网—[转载]智能可穿戴血压监测将何去何从?| The Innovation Materials
科学网—[转载]星地激光通信的工程应用:搭建星地信息高速公路 | The Innovation
科学网—[转载]The Innovation入选中国科学院分区表1区
科学网—[转载]强厄尔尼诺爆发助推2023-2024年全球表面温度破纪录及其衍生气候危机 | Innov. Geoscience
科学网—[转载]从古老生物被膜样品中挖掘微生物资源 | The Innovation Geoscience
科学网—[转载]泛血管医学时代,好医生的胜任力评价将走向何方? | The Innovation
科学网—[转载]语言模型助力科学研究的第N种可能:解析现实世界中的配送路线优化问题 | The Innovation
科学网—[转载]大语言模型助力遗传病分子诊断 | The Innovation
科学网—[转载]解析催化剂表面再构机制来调控催化性能 | The Innovation Materials
科学网—[转载]践行生态文明建设的重要路径:发展基于生态系统质量管理的新型生态经济 | The Innovation
科学网—[转载]新冠紧急状态结束,挑战仍在继续 | The Innovation Medicine
科学网—[转载]多功能量子点点亮与重塑巨噬细胞 | The Innovation
科学网—[转载]不平等城市高温负担阻碍气候公义及可持续发展目标 | The Innovation
科学网—[转载]基于对环芳烷的双极性近紫外圆偏振发光材料 | The Innovation Materials
科学网—[转载] RXR—核内外双重调控肿瘤发生的关键因子 | The Innovation Life
科学网—[转载]容错拓扑量子计算的原理性验证 | The Innovation
科学网—[转载]将社会神经科学融入自主驾驶人机交互行为理解 | The Innovation
科学网—[转载]黑洞燃料的直接观测 | The Innovation
科学网—[转载]从地底到深空:核天体物理实验帮助解开古老恒星中元素产生之谜 | The Innovation
科学网—[转载]智能无人集群威胁将至,如何防御和对抗?| The Innovation
The Innovation 简介
扫二维码 | 关注期刊官微
The Innovation是一本由青年科学家与Cell Press于2020年共同创办的综合性英文学术期刊:向科学界展示鼓舞人心的跨学科发现,鼓励研究人员专注于科学的本质和自由探索的初心。作者来自全球61个国家;已被164个国家作者引用;每期1/5-1/3通讯作者来自海外。目前有200位编委会成员,来自22个国家;50%编委来自海外(含39位各国院士);领域覆盖全部自然科学。The Innovation已被DOAJ,ADS,Scopus,PubMed,ESCI,INSPEC,EI,中国科学院分区表(1区TOP)等收录。2024年CiteScore为53.4;2024年影响因子为25.7(5 year lmpact Factor=40.2)。2023年6月25-28日,四本姊妹刊(The Innovation Life、The Innovation Geoscience、The Innovation Materials、The Innovation Medicine)联袂创刊;2024年2月26日,第五本姊妹刊The Innovation Energy出版创刊号。这五本姊妹刊已被Google Scholar, CAS, Scopus等数据库收录。秉承“好文章,多宣传”理念,The Innovation刊群在海内外各平台推广作者文章。
期刊官网:
期刊投稿(Submission):
www.editorialmanager.com/the-innovation
商务合作(Marketing):
marketing@the-innovation.org
The Innovation 姊妹刊
The Innovation
期刊标识
See the unseen & change the unchanged
创新是一扇门,我们探索未知;
创新是一道光,我们脑洞大开;
创新是一本书,我们期待惊喜;
创新是一个“1”,我们一路同行。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-9-2 03:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社