zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

科学已悄然进入第五代:人工科学智能时代

已有 340 次阅读 2025-7-14 14:47 |个人分类:科普|系统分类:科普集锦

科学已悄然进入第五代:人工科学智能时代 

2024年,人工智能(AI)首次获得了诺贝尔奖。DeepMindAlphaFold破解了生物学中最难的难题之一:蛋白质折叠,预测一系列氨基酸链如何扭曲并决定其功能的复杂3D形状的挑战。几十年来,科学家一直在为这个问题挣扎。这对于医学和药物发现至关重要,但由于可能的蛋白质结构呈现天文数量,似乎无法解决。然后AI提供了答案。 

毫无疑问,改变游戏规则。但这也提出了一个问题:这对科学和科学家意味着什么?传统的科学研究是否过时?我们是否正在接近一个未来,算法是发现的主要驱动因素,将人类降级到场外? 

在整个历史上,每项突破性技术都重新定义了发现的方式,标志着科学的四个不同时代(图1)。第一个是经验时代,依靠直接观察,因为哥白尼通过观察天空挑战了以地球为中心的宇宙观点。第二个是理论时代,引入了数学来预测自然,就像数百年来牛顿运动方程一样。第三个始于1950年代的计算时代,利用计算机来模拟复杂系统,从而导致了KohnPople的量子化学诺贝尔奖。第四个是我们21世纪的数据驱动时代,使用机器学习来从广泛的数据集中提取模式,并通过从蛋白质数据库中训练AlphaFold求解蛋白质结构。 

如今,我们站在第五个科学时代(人工科学智能时代)的家门口,诸如GoogleLila SciencesSakana之类的公司正在揭幕AI科学家,不仅可以帮助研究,而且可以提出发现,产生假设,并根据自身需求进行测试(图1)。因此,为什么不让AI从这里进行表演一番? 

image.png 

1 科学的第五代:人工科学智能。在整个历史上,科学通过不同的时代发展:经验、理论、计算和数据驱动。今天,它进入了第五代:人工科学智能 

在某些领域,也许我们可以。在化学中,有机合成(从基本构建基块中组装出复杂的药物分子过程)现在是由可解释的AI模型指导的,这些模型可帮助科学家计划每个步骤。在材料科学中,生成AI可以设计具有量身定制的机械、电子和磁性特性的新型无机化合物,并以最小的人类调整加速创新。这些是实验反馈相对可处理的领域,模拟成熟,并且数据丰富和结构化。简而言之,这些领域为自主AI探索提供了理想条件。 

但是在许多其他领域,让AI进行今天的演出就像自动驾驶汽车带着一半地图行驶在一条土路,那里没有GPSAI可能具有马力,但仍然需要人类将其引导到专门的科学数据陷阱中。没有比在生物医学成像中更清晰的地方,在生物医学成像中,高度策划的数据集与传统的大型视觉模型的训练相同。 

首先,按照AI标准,生物医学成像数据集通常很小,这是有充分理由的:收集它们需要技术设备和训练有素的专业人员。标记他们需要大量的时间和专家投入。严格的隐私法规通常会限制访问权限。MedPix是一家领先的医学成像数据库,仅包含59,000张图像,而Allen Cell Feature Explorer是人类干细胞的高分辨率3D图像的最大公开数据源之一,仅约32,000张图像。这比AI所需的要少一千倍。然而,这证实科学家要介入的地方。 

科学家正在重新定义AI以更少做更多的事情,从而帮助算法在图像中找到意义,即使数据稀缺。一种聪明的方法涉及使用数学见解来重新设计神经网络的核心构建块。当你剥离层或参数时,传统的模型就会崩溃,但这些新的架构保持强大——即使只有一个层和两个卷积滤波器——正是因为它们是为小数据而构建的。而且,科学家不仅会弯曲模型的设计以适合数据缺乏场景,还可以重新想象数据生态系统为模型充电。他们决定要收集哪些数据,如何收集数据以及如何巧妙地编织现有但分散的专门数据集,以训练AI模型和完成各种任务,包括脑肿瘤分类或糖尿病性视网膜病变分级。 

但是科学数据不仅稀缺,而且通常具有强噪声。冷冻电子显微镜是一种诺贝尔奖获奖技术,使我们能够看到无形的-最细微的尺度上的分子-产生了令人难以置信的模糊图像,其中重要细节比噪声弱100倍。这就像试图在戴别人的眼镜时在人群中认出一个朋友一样。这与清晰和高分辨率的图像(例如街道场景、面孔或日常物体)形成鲜明对比。 

然而,科学家甚至从最强噪声背景的图像中提取有意义的技术。在冷冻电子显微镜中,它们可以重建隐藏在噪声中的分子的3D形状。例如,在COVID-19大流行期间提供了SARS-COV-2的第一张高分辨率图像。今天,他们将这种硬核专业知识与AI力量相结合。 

一个突破是将强大抗噪声模块与基础模型相结合,使AI能够解决臭名昭著的冷冻电子显微镜图像处理步骤。至关重要的是,这是可能的,因为科学家还将其领域专业知识应用于通过清洗、注释和汇总529个经过验证的冷冻电子显微镜数据集以构建高质量数据集,进而让AI进行学习。 

显然,AI为科学带来了巨大机会,这可能是我们在武器库中拥有的最强大工具。但是,人工科学智能的第五个时代还是需要人类科学家。在许多方面,革命发现的未来在于这种协同作用:人类的专业知识指导AIAI增强了人类的专业知识。好像我们已经雇用了最有成就、最疯狂的实习生;一个以超人速度工作的人,永不入睡,热切地吞噬大量数据。它们具有杰出的潜力,但是如果没有适当的指导,他们就更有可能让实验室着火,而不是推动科学前进。 

我们不希望AI能够神奇地处理有限、嘈杂和专业的数据,而需要专家来根据生物学和医学等领域的现实来量身定制算法,并根据AI技术的新要求量身定制数据。要进入第五代科学时代,我们需要为研究人员提供AI专业知识,具有领域知识的AI专家以及具有跨学科计划的大学。蓬勃发展的实验室将是那些领域专家和AI专家在同步工作的实验室。下一次科学革命将来自可以明智地转向AI的团队,知道何时信任它,何时调整其路线以及何时将其驱逐到未知的领域。 

参考文献

[1] Miolane N. The fifth era of science: Artificial scientific intelligence. PLoS Biol. 2025 Jun 10;23(6):e3003230. doi: 10.1371/journal.pbio.3003230. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://wap.sciencenet.cn/blog-571917-1493636.html

上一篇:癌症蛋白质组的性别差异
收藏 IP: 39.128.48.*| 热度|

2 杨正瓴 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-7-15 06:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部