孙学军
人工智能能构建虚拟细胞吗? 精选
2025-7-1 10:58
阅读:3515

人工智能能构建虚拟细胞吗?科学家们正竞相建模生命的最小单位 

图片2.png

多个研究团队希望开发出能够预测细胞行为的人工智能模型。

虚拟细胞模型或有助于预测肿瘤细胞(如图)对实验药物的反应。图片来源:Steve Gschmeissner/Science Photo Library

倘若斯蒂芬·奎克(Stephen Quake)的设想得以实现,未来生物学家们手持移液管的时间将大幅减少。“我们的目标,”他说,“是打造这样的计算工具——让细胞生物学从90%依赖实验、10%依赖计算,转变为与之相反的模式。”

奎克是位于加利福尼亚州雷德伍德城的陈·扎克伯格倡议(CZI)的科学主管,他是众多致力于创建虚拟细胞的研究人员之一。这些虚拟细胞是一种人工智能模型,能够生成如今需要数周实验才能得出的见解——例如肿瘤细胞对某种特定药物会产生怎样的反应。

“这将成为理解疾病中异常情况的强大工具,”奎克表示,他设想科学家们将主要通过实验来验证虚拟细胞所做出的预测。

尽管创建虚拟细胞的努力尚处于初期阶段,但这一想法已在全球的学术实验室和工业界实验室引发了浓厚兴趣。作为一家开发开放数据集和工具的非营利组织,CZI计划在未来十年投入数亿美元用于创建虚拟细胞。伦敦的谷歌深度思维(Google DeepMind)也有一个虚拟细胞项目,其首席执行官德米斯·哈萨比斯(Demis Hassabis)在今年早些时候曾提及此事。

“这是一项极其艰巨的任务,”扬·埃伦伯格(Jan Ellenberg)说,他是瑞典索尔纳国家研究机构“生命科学实验室”的分子生物学家。他正联合领导该实验室自己的虚拟细胞模型——“阿尔法细胞”(Alpha Cell),该模型将于2026年推出。“现在可行且需要做的,是开展首批开创性项目,以证明这在原则上是可行的。”

但一些科学家认为,尽管开发虚拟细胞是生物学的一个重要长期目标,当前对其的追捧更多是炒作,缺乏实质性成果,也没有清晰的成功路径。

“它主要被用作一种号召和融资手段,而且确实奏效了,”加利福尼亚州斯坦福大学的计算生物学家安舒尔·昆达杰(Anshul Kundaje)说,“投资者正在这个领域投入巨额资金。”

机器中的“漏洞”

几十年来,生物学家一直在利用计算机模拟细胞行为。2012年,科学家们创建了第一个完整细胞的计算模型,模拟了生殖道支原体(Mycoplasma genitalium)的内部运作,这种细菌仅有525个基因1。

但加利福尼亚州帕洛阿尔托的Arc研究所的计算生物学家西尔瓦娜·科内曼(Silvana Konermann)表示,这些早期努力以及其他类似尝试“往往试图真正构建一个完整的细胞机制模型”。

相比之下,当前开发虚拟细胞的热潮则借助了人工智能的进步——当输入海量数据时,人工智能能够对数据形成复杂的表征,例如在大型语言模型中对文本的处理。“构建从数据中学习的模型具有革命性意义,”奎克说。

早期的虚拟细胞成果主要聚焦于一类数据:来自单个细胞中所有信使RNA分子测序实验的数据,这些数据相当于基因活动的目录,也是细胞当前状态的快照。

这些数据构成了“图谱”的基础,这些图谱描绘了人类和其他生物中不同细胞类型,揭示了此前未被充分认识的细胞多样性。研究人员如今正大量生成“单细胞测序”数据集,为其虚拟细胞提供动力。CZI计划发布来自10亿个细胞的测序数据(这将扩展一个已包含超过1亿个细胞数据的数据库);2月,Arc研究所发布了来自1亿个癌细胞的测序数据,这些细胞接受了数百种药物的处理。

Arc研究所的系统生物学家哈尼·古达尔齐(Hani Goodarzi)表示,单细胞测序数据之所以具有吸引力,是因为它可以以较低成本生成,且规模足以让大型语言模型开始展现出复杂能力——数据点可达数千亿个。

竞争性的“细胞构建”

研究人员已经开始利用这些数据开发单细胞人工智能模型。Arc研究所本周公布了一个名为“State”的模型,这是其首个虚拟细胞模型。该研究所还发起了一项奖金为17.5万美元的虚拟细胞竞赛,挑战研究人员利用此类模型预测人类干细胞对基因改变的反应。

但其他研究人员表示,这些模型目前的能力和预测性还不足以得出可推广到其训练数据之外的结论。“它们的表现糟糕透顶,”昆达杰说,他指出有人尝试用新数据集对一些单细胞模型进行基准测试,但结果不佳2˒3。

许多科学家认为,虚拟细胞需要整合其他形式的数据,例如光学显微镜和电子显微镜图像,这些图像能展示不同细胞成分如何相互作用,以及细胞如何随时间变化。“我们需要超越单细胞测序数据,”埃伦伯格说。

开发虚拟细胞的部分挑战在于,不同的人对这一概念的理解各不相同。“我认为虚拟细胞目前还没有一个清晰的定义,”领导CZI“十亿细胞项目”的乔纳·库尔(Jonah Cool)说。

马萨诸塞州波士顿哈佛医学院的细胞生物学家蒂姆·米切森(Tim Mitchison)在参加CZI的一个研讨会时就明显感受到了这一点,该研讨会旨在规划构建虚拟细胞的路径,但他表示与会者之间几乎没有达成共识。“我对其前景要乐观得多,”米切森说。尽管如此,他认为在不久的将来,针对特定细胞类型(如心肌细胞或肠道类器官)或特定功能(如基因调控)的真正有用的人工智能模型是可以实现的。

奎克承认,他所设想的“将细胞生物学家从实验室工作台上解放出来”这一目标,还需要一些时间来适应。幸运的是,人们有足够的时间去调整。“他们还没准备好,”他说,“但这些模型也还没准备好为生物学家服务。”

转载本文请联系原作者获取授权,同时请注明本文来自孙学军科学网博客。

链接地址:https://wap.sciencenet.cn/blog-41174-1491616.html?mobile=1

收藏

分享到:

当前推荐数:3
推荐人:
推荐到博客首页
网友评论3 条评论
确定删除指定的回复吗?
确定删除本博文吗?