孙学军
AI设计的蛋白质,有用才有用
2024-10-16 14:51
阅读:278

八月中旬的一个周六早晨,亚历克斯·中村(Alex Naka)在他女友的厨房里开始了他所描述的“一个小黑客马拉松”。他依靠笔记本电脑、一些咖啡,以及一度大约80个基于云的人工智能(AI)处理器,生成了一大批计算机工程蛋白质,这些蛋白质旨在阻断某些肿瘤中发生突变的细胞受体。

中村——在工作日是加利福尼亚州阿拉米达一家医疗技术公司的蛋白质工程师——将他最有希望的十个创造物输入了一个新启动的蛋白质设计比赛,并看着它们攀升至排行榜顶端。

 

这场比赛由瑞士洛桑的生物技术初创公司Adaptyv Bio举办,是过去一年左右涌现的至少五场比赛之一。大多数参加比赛的人正在使用诸如AlphaFold和受聊天机器人启发的“蛋白质语言模型”等AI工具,这些工具在流行度和能力上都呈爆炸式增长。今年诺贝尔化学奖授予了其中一些工具背后的三位研究人员,以表彰他们的努力。这些荣誉部分来自于希望新创建的蛋白质可以作为更有效的药物、工业酶或实验室试剂。

但是,科学家表示,设计师蛋白质的热潮主要引发了混乱。人们制造它们的速度比在实验室中制造和测试的速度要快,这使得很难判断哪些方法真正有效。

过去,竞赛推动了关键的科学进步,特别是对于蛋白质结构预测领域。这一批最新的比赛通过降低进入门槛,吸引了来自世界各地的人投入到相关的蛋白质设计领域。它还可以加快验证和标准制定的步伐,也许有助于培养社区。“这将推动该领域向前发展,更快地测试方法,”西班牙巴塞罗那基因组调控中心的计算生物学家Noelia Ferruz Capapey说。

但科学家们表示,这些比赛将不得不克服一些障碍,例如确定要解决哪些问题和如何客观地选择获奖者。找到正确的公式很重要。“如果执行不当,这些比赛可能会对一个领域造成损害,”德国慕尼黑工业大学的计算生物学家Burkhard Rost说。

按设计竞争

蛋白质设计比赛部分受到了一项有30年历史的比赛的启发,这项比赛帮助启动了生物AI的革命。自1994年以来,临界评估结构预测(CASP)一直挑战科学家们根据氨基酸序列预测蛋白质的3D形状。比赛的胜利者——由马里兰州罗克维尔的计算生物学家John Moult和加州大学戴维斯分校的计算生物学家Krzysztof Fidelis创立——通过与未发表的结构模型进行比较来确定。

2018年,总部位于伦敦的DeepMind(现为Google DeepMind)凭借其首个蛋白质结构预测工具AlphaFold赢得了CASP。其在2020年的下一个版本AlphaFold 2表现如此出色,以至于Moult宣布预测简单蛋白质结构的问题基本上解决了。此后,比赛将其焦点转移到其他新兴挑战上,如预测复杂中多个相互作用蛋白质的结构。

 

现在,许多人希望这些比赛能像CASP一样推动蛋白质设计领域的发展。“如果没有CASP,就不会有AlphaFold,”Rost说。“我们需要这些比赛来正确完成工作并激励人们。”

六月份,Rost和他的几位同事赢得了Align to Innovate举办的蛋白质工程锦标赛,这是一个国际性的开放科学非营利组织。活动包括两部分。首先,参与者试图预测不同酶变体的特性。这一轮中表现最好的团队随后重新设计了一种分解淀粉的酶,最佳设计由实验室实验决定。现在正在筹备2025年的锦标赛。

四月份宣布获胜者的冬季蛋白质设计游戏大赛由加拿大基奇纳的生物技术公司Liberum Bio和主要由学术科学家组成的合作组织Rosetta Commons举办,后者维护着蛋白质建模工具。比赛的任务是重新设计一种现有蛋白质——一种广泛用于蛋白质纯化的植物病毒酶——以提高分子的效率。

另外两个比赛要求参与者提出全新的蛋白质。Adaptyv的比赛寻找能够附着于许多癌症中过度活跃的生长激素受体EGFR的蛋白质。90名参赛者提交了700多种设计。

而在Bits to Binders比赛中,研究人员正在争夺创造可以在T细胞癌症治疗中使用的小蛋白质。由德克萨斯大学奥斯汀分校的一个研究生领导的BioML Society举办,吸引了来自42个国家的64支队伍——包括尼日利亚、哥伦比亚、伊朗和印度。目前约有18,000种设计正在测试中,结果将在2025年初公布。“我们对参与度感到相当惊讶,”共同组织者、该校生物化学博士生Clayton Kosonocky说。

欢迎新人

Adaptyv的首席执行官兼联合创始人Julian Englert表示,其比赛中的许多参与者从事蛋白质工程和设计工作。然而,比赛也收到了没有生物学专业经验的人的有希望的投稿。一位来自伊朗的参赛者因为无法接触到更强大的系统,所以使用游戏电脑做出了他的预测。

 

恩格尔特表示,那些非知名研究人员提交的高质量作品让他想起了苹果、微软和其他科技巨头在车库里捣鼓的起源。“他们需要花费两年的时间学习和加入实验室才能达到可以开始研究的阶段。在这里,他们可以在一个周末内完成。”他想象着未来,自由职业的蛋白质设计师为了公司、学术实验室和寻求定制分子的其他机构设置的奖金而竞争。

比赛还可以通过其他方式节省时间。慕尼黑工业大学的机器学习科学家迈克尔·海因辛格是与罗斯特一起赢得比赛的团队的一部分,他表示,从比赛组织者那里快速获得实验结果是一个很大的动力。“否则我们就必须花时间写资助申请,”他说。“对我来说,奖励就是节省时间。”

就实际奖励而言,Align to Innovate锦标赛并没有提供任何奖项,但其他一些比赛则提供了奖品。Bits to Binders的获胜者将获得由进行实验的生物技术公司(位于明尼苏达州伊根的LEAH实验室)制作的3D打印奖杯和他们的一些商品。还将有合作的机会。

Adaptyv公司销售由蛋白质设计师创造的分子的自动化实验室测试,提供了一些免费实验和自己的一些宣传品。Rosetta Winter Games的获胜者分享了5000美元奖金。

但最引人注目的是最近启动的Evolved 2024比赛,其中第一名团队将带回价值25,000美元的亚马逊网络服务信用额度,以及其他公司(包括OpenAI)价值数千美元的信用额度。它的赞助商包括纽约市的风险资本公司Lux Capital,该公司已在科技公司投资了超过15亿美元,以及同样位于纽约市的生物AI初创公司EvolutionaryScale,该公司吸引了1.42亿美元的投资。

超越大额现金奖

选择谁将收获这些奖励并不总是直截了当的。Evolved 2024比赛更像是一个黑客松,在其中各队致力于解决预测药物效能和安全性等宽泛问题——将由一组专家主观评判。但即便是对于那些目标更明确的蛋白质设计比赛,“确定谁是赢家并非易事”,Align to Innovate的创始人、生物学工程师埃丽卡·德本尼迪蒂斯说。她组织的锦标赛根据设计的活性、稳定性以及它们能否(甚至是否)被制造出来来评估设计。“当你设计一种蛋白质时,它可能会以多种方式失败,”她说。

如果比赛要在蛋白质设计领域取得进展,科学家们表示,它们需要解决该领域正在面临的挑战。与结构预测不同,蛋白质设计的任务到任务可能有不同的标准。制作特定类型的酶的方法可能不适用于其他蛋白质,如疫苗成分。

罗斯特警告说,如果比赛使领域走向歧途——例如,通过过于狭窄地评判设计——可能会适得其反。威斯康星大学麦迪逊分校的计算生物学家安东尼·吉特尔表示,如果参赛者对他们的方法保持沉默,研究人员也可能无法充分利用蛋白质设计比赛的全部好处。“如果团队不交流他们的方法,就没有太多机会了解什么有效,什么无效。”

到目前为止,这似乎还没有发生。大多数比赛鼓励甚至要求参与者描述他们的方法。吉特尔说,比赛还有助于汇集被吸引到蛋白质设计领域的一些不同领域——从开创蛋白质工程方法的生物化学实验室到在自然语言处理中磨练技能的机器学习科学家。“组织比赛的人,要想对领域产生最大影响,应该认真思考如何创建一个社区。”

9月底宣布Adaptyv比赛结果时,中岛感到失望。尽管他的十个参赛作品看起来都很有实力,但在实验室中没有一个设计起作用。在被测试的147个设计中,只有5个实际上与目标分子结合。还有50多个甚至无法制造。

这实际上还不错:过去设计EGFR结合剂的努力成功率要低得多。“这是蛋白质工程中的常态——你必须准备好经常失败,”中岛说。获胜者是瑞士联邦理工学院(EPFL)洛桑的结构生物学家马丁·帕塞萨和伦纳特·尼克尔,他们发布了一篇预印本描述了他们的方法,并使其代码开源(M. Pacesa et al. Preprint at bioRxiv https://doi.org/nmfm; 2024)。Adaptyv现在已经启动了基于第一次比赛的第二次比赛。

中岛希望他能更早开始准备他的参赛作品。他形容自己的黑客松为“第二类乐趣”——当时很痛苦,但回顾起来很愉快。通过比赛,他与志同道合的科学家建立了联系,包括吉特尔。“感觉像是降低了进入门槛,让许多新人参与蛋白质设计,”他说。“我将来肯定会参加类似的活动。”

转载本文请联系原作者获取授权,同时请注明本文来自孙学军科学网博客。

链接地址:https://wap.sciencenet.cn/blog-41174-1455579.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?