|
以下内容从诺贝尔奖官方网站翻译整理:
https://www.nobelprize.org/prizes/chemistry/2024/popular-information/
2024 年诺贝尔化学奖
2024诺贝尔化学奖授予:
David Baker,1962年出生。目前为美国华盛顿大学教授。贡献为:计算蛋白质设计。分享1/2的奖金。
Demis Hassabis,1976年出生。目前为谷歌DeepMind CEO。贡献为:蛋白质结构预测。分享1/4奖金。
John M. Jumper,1985年出生。目前为谷歌DeepMind资深科学家。贡献为:蛋白质结构预测。分享1/4奖金。
长期以来,化学家一直梦想着完全理解和掌握生命的化学工具——蛋白质。这个梦想现在已经触手可及。Demis Hassabis 和 John M. Jumper 成功地利用人工智能预测了几乎所有已知蛋白质的结构。David Baker 已经学会了如何掌握生命的组成部分并创造全新的蛋白质。他们的发现潜力是巨大的。
3位获奖者通过计算和人工智能揭示了蛋白质的秘密
生命中旺盛的化学反应是如何实现的?这个问题的答案就是蛋白质的存在,蛋白质可谓是出色的化学工具。它们通常由 20 种氨基酸构成,这些氨基酸能够以无穷无尽的方式组合。使用 DNA 中存储的信息作为蓝图,氨基酸在我们的细胞中连接在一起形成长串。
然后蛋白质的神奇作用发生了:氨基酸链扭曲和折叠成一个独特的——有时是唯一的——三维结构(图 1)。这种结构赋予了蛋白质功能。有些会成为化学构件,可以产生肌肉、角或羽毛,而另一些可能会变成激素或抗体。它们中的许多形成酶,以惊人的精度驱动生命的化学反应。位于细胞表面的蛋白质也很重要,它们充当细胞与其周围环境之间的通信渠道。
生命的化学组成——这 20 种氨基酸所包含的潜力怎么强调都不为过。2024 年诺贝尔化学奖旨在将他们理解和掌握在一个全新的层面上。一半的奖金颁给了 Demis Hassabis 和 John Jumper,他们利用人工智能成功解决了化学家们 50 多年来一直在努力解决的问题:根据氨基酸序列预测蛋白质的三维结构。这使他们能够预测几乎所有 2 亿种已知蛋白质的结构。另一半奖金颁发给 David Baker,他开发了计算机化的方法,实现了许多人认为不可能的事情:创造以前不存在的蛋白质,在许多情况下,这些蛋白质具有全新的功能。
2024 年诺贝尔化学奖表彰了两项不同的发现,但正如您将看到的,它们密切相关。要了解今年的获奖者所克服的挑战,我们必须回顾现代生物化学的曙光。
蛋白质的第一张颗粒状图片
自 19 世纪以来,化学家就知道蛋白质对生命过程很重要,但直到 1950 年代,化学工具才足够精确,研究人员才开始更详细地探索蛋白质。剑桥大学的研究人员约翰·肯德鲁(John Kendrew )和马克斯·佩鲁茨(Max Perutz)取得了突破性的发现,他们成功地使用了一种称为 X 射线晶体学的方法,展示了第一个蛋白质的三维模型。为了表彰这一发现,他们于 1962 年被授予诺贝尔化学奖。
随后,研究人员主要使用 X 射线晶体学——通常是付出了巨大的努力——成功地制作了大约 200,000 种不同蛋白质的图像,这为 2024 年诺贝尔化学奖奠定了基础。
一个谜语:蛋白质如何找到其独特的结构?
美国科学家克里斯蒂安·安芬森 (Christian Anfinsen) 又有一项早期发现。使用各种化学技巧,他设法使现有的蛋白质展开,然后再次折叠起来。有趣的观察结果是,蛋白质每次都呈现出完全相同的形状。1961 年,他得出结论,蛋白质的三维结构完全由蛋白质中氨基酸的序列决定。这使他于 1972 年获得诺贝尔化学奖。
然而,Anfinsen 的逻辑包含一个悖论,另一位美国人 Cyrus Levinthal 在 1969 年指出了这一点。他计算出,即使一种蛋白质只由 100 个氨基酸组成,理论上蛋白质也可以假设至少10 47不同的三维结构。如果氨基酸链是随机折叠的,那么找到正确的蛋白质结构所需的时间将比宇宙的年龄还要长。在细胞中,这只需几毫秒。那么,氨基酸链实际上是如何折叠的呢?
Anfinsen 的发现和 Levinthal 的悖论暗示折叠是一个预定的过程。而且重要的是有关蛋白质折叠方式的所有信息都必须存在于氨基酸序列中。
迎接生物化学的巨大挑战
上述见解导致了另一个决定性的假设——如果化学家知道蛋白质的氨基酸序列,他们应该能够预测蛋白质的三维结构。这是一个令人兴奋的想法。如果他们成功了,他们将不再需要使用繁琐的 X 射线晶体学,并且可以节省大量时间。他们还将能够为 X 射线晶体学不适用的所有蛋白质生成结构。
这些合乎逻辑的结论为生物化学的巨大挑战——预测问题——带来了挑战。为了鼓励该领域的快速发展,研究人员于 1994 年启动了一个名为蛋白质结构预测关键评估 (CASP) 的项目,该项目发展成为一项竞赛。每隔一年,来自世界各地的研究人员就可以获得刚刚确定结构的蛋白质中的氨基酸序列。然而,这些结构对参与者保密。挑战在于根据已知的氨基酸序列预测蛋白质结构。
CASP 吸引了许多研究人员,但事实证明,解决预测问题非常困难。研究人员在比赛中输入的预测与实际结构之间的对应关系几乎没有任何改善。突破仅在 2018 年才发生,当时一位国际象棋大师、神经科学专家和人工智能先驱进入了该领域。
棋盘游戏大师参加蛋白质奥运会
让我们快速了解一下 Demis Hassabis 的背景:他 4 岁开始下棋,13 岁时达到大师水平。十几岁时,他开始了程序员和成功的游戏开发人员的职业生涯。他开始探索人工智能并涉足神经科学,在那里他取得了几项革命性的发现。他利用自己对大脑的了解为 AI 开发了更好的神经网络。2010 年,他与他人共同创立了 DeepMind,这是一家为流行的棋盘游戏开发精湛的 AI 模型的公司。该公司于 2014 年出售给 Google,两年后,DeepMind 实现了当时许多人认为是 AI 圣杯的目标:击败了世界上最古老的棋盘游戏之一的冠军玩家,从而引起了全球的关注。【注:2016年,阿尔法Go围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜】
然而,对于 Hassabis 来说,阿尔法Go围棋不是目标,而是开发更好的 AI 模型的手段。在这次胜利之后,他的团队已经准备好解决对人类更重要的问题,因此在 2018 年,他报名参加了第 13 届 CASP 比赛。
Demis Hassabis 的 AI 模型出乎意料的胜利
前几年,研究人员预测 CASP 的蛋白质结构最多只能达到 40% 的准确率。借助他们的 AI 模型 AlphaFold,Hassabis 的团队实现了近 60% 的迁移率。他们赢了,出色的结果让许多人感到惊讶—— 这是意想不到的进步,但解决方案仍然不够好。为了成功,与目标结构相比,预测的准确率必须达到 90%。
Figure 2. How does AlphaFold2 work? © Johan Jarnestad/The Royal Swedish Academy of Sciences
Hassabis 和他的团队继续开发 AlphaFold – 但是,无论他们多么努力,算法从未完全奏效。残酷的事实是,他们已经走到了死胡同。团队很累,但一位相对较新的员工对如何改进 AI 模型有决定性的想法:John Jumper。
John Jumper 接受了生物化学重大挑战的挑战
John Jumper 对宇宙的迷恋使他开始学习物理和数学。然而,在 2008 年,当他开始在一家使用超级计算机模拟蛋白质及其动力学的公司工作时,他意识到物理学知识可以帮助解决医学问题。
2011 年,Jumper 带着对蛋白质新获得的兴趣开始攻读理论物理学博士学位。为了节省计算机容量(大学里供不应求的东西),他开始开发更简单、更巧妙的方法来模拟蛋白质动力学。很快,他也接受了生物化学的巨大挑战。2017 年,他刚刚完成博士学位,当时他听说 Google DeepMind 已经开始非常秘密地预测蛋白质结构。他给他们发了一份工作申请。他在蛋白质模拟方面的经验意味着他对如何改进 AlphaFold 有创造性的想法,因此,在团队开始涉足后,他得到了晋升。Jumper 和 Hassabis 共同领导了从根本上改革 AI 模型的工作。
使用改革后的 AI 模型取得惊人的结果
新版本 AlphaFold2 由 Jumper 的蛋白质知识助力。该团队还开始使用 AI 最近取得巨大突破背后的创新:称为 transformer 的神经网络,能够比以前更灵活的方式在大量数据中找到模式,并有效地确定应该关注什么以实现特定目标。
该团队利用数据库中所有已知蛋白质结构和氨基酸序列的大量信息训练 AlphaFold2(图 2),新的 AI 架构开始及时为第 14 届 CASP 竞赛提供良好的结果。
2020 年,当 CASP 的组织者评估结果时,他们明白生物化学 50 年的挑战已经结束。在大多数情况下,AlphaFold2 的性能几乎与 X 射线晶体学一样好,这令人震惊。当 CASP 的创始人之一 John Moult 于 2020 年 12 月 4 日结束比赛时,他问道——现在怎么办?
我们再回到那个话题。现在我们要回到过去,看看 CASP 的另一位参与者。让我们介绍 2024 年诺贝尔化学奖的另一半,它涉及从头开始创造新蛋白质的艺术。
一本关于细胞的教科书让 David Baker 改变了方向
当大卫·贝克开始在哈佛大学学习时,他选择了哲学和社会科学。然而,在一门进化生物学课程中,他遇到了现在经典的教科书《细胞分子生物学》的第一版。这导致他改变了自己的人生方向。他开始探索细胞生物学,最终他对蛋白质结构着迷。1993 年,当他开始在西雅图的华盛顿大学担任小组负责人时,他接受了生物化学的巨大挑战。通过巧妙的实验,他开始探索蛋白质是如何折叠的。这为他在 1990 年代末开始开发可以预测蛋白质结构的计算机软件 Rosetta 提供了见解。
贝克于 1998 年使用 Rosetta 在 CASP 比赛中首次亮相,与其他参与者相比,它做得非常好。这一成功带来了一个新想法—— David Baker 的团队可以反向使用该软件。他们应该能够输入所需的蛋白质结构并获得对其氨基酸序列的建议,这将使他们能够创造全新的蛋白质,而不是在 Rosetta 中输入氨基酸序列并得到蛋白质结构。
Baker 成为蛋白质构建者
蛋白质设计领域——研究人员创造具有新功能的定制蛋白质——在 1990 年代末开始起飞。在许多情况下,研究人员调整了现有的蛋白质,以便它们可以做一些事情,例如分解有害物质或充当化学制造行业的工具。
然而,天然蛋白质的范围是有限的。为了增加获得具有全新功能的蛋白质的潜力,Baker 的研究小组希望从头开始创建它们。正如贝克所说,“如果你想建造一架飞机,你不能从改装一只鸟开始;相反,你了解空气动力学的第一原理,并根据这些原理制造飞行器。
一种独特的蛋白质重见天日
构建全新蛋白质的领域称为从头设计。研究小组绘制了一种具有全新结构的蛋白质,然后让 Rosetta 计算哪种类型的氨基酸序列可以产生所需的蛋白质。为此,Rosetta 搜索了所有已知蛋白质结构的数据库,并寻找与所需结构相似的蛋白质短片段。然后,利用蛋白质能量图景的基本知识,Rosetta 优化了这些片段并提出了一个氨基酸序列。
为了研究该软件的成功程度,Baker 的研究小组在产生所需蛋白质的细菌中引入了拟议氨基酸序列的基因。然后,他们使用 X 射线晶体学确定了蛋白质结构。
事实证明,Rosetta真的可以构建蛋白质。研究人员开发的蛋白质 Top7 几乎与他们设计的结构完全相同。
来自 Baker 实验室的壮观作品
Top7 对于从事蛋白质设计的研究人员来说是一个晴天霹雳。Top7 的独特结构在自然界中并不存在。此外,该蛋白质具有 93 个氨基酸,比以前使用从头设计生产的任何蛋白质都大。
Baker于 2003 年发表了他的发现。这是只能用非凡发展来形容的第一步;在 Baker 的实验室中创造的许多壮观的蛋白质中,可以看到图 4 中的一些。他还发布了 Rosetta 的代码,因此全球研究社区继续开发该软件,寻找新的应用领域。
曾经需要数年才能完成的工作现在只需几分钟
当 Demis Hassabis 和 John Jumper 证实 AlphaFold2 确实有效时,他们计算了所有人类蛋白质的结构。然后,他们预测了研究人员在绘制地球生物体地图时迄今为止发现的几乎所有 2 亿种蛋白质的结构。
Google DeepMind 还公开了 AlphaFold2 的代码,任何人都可以访问它。AI 模型已成为研究人员的金矿。截至 2024 年 10 月,AlphaFold2 已被来自 190 个国家/地区的超过 200 万人使用。以前,获得蛋白质结构通常需要数年时间(如果有的话)。现在,只需几分钟即可完成。AI 模型并不完美,但它可以估计它产生的结构的正确性,因此研究人员知道预测的可靠性。图 5 显示了 AlphaFold2 如何帮助研究人员的众多例子中的几个。
在 2020 年 CASP 竞赛之后,当 David Baker 意识到基于 transformer 的 AI 模型的潜力时,他在 Rosetta 中添加了一个模型,这也促进了蛋白质的从头设计。近年来,Baker 的实验室创造了一个又一个令人难以置信的蛋白质(图 4)。
令人眼花缭乱的发展,造福人类
蛋白质作为化学工具的惊人多功能性反映在生命的广泛多样性上。我们现在可以如此轻松地可视化这些小分子机器的结构,这令人难以置信;它使我们能够更好地了解生命的运作方式,包括为什么会发展出一些疾病、抗生素耐药性是如何发生的或为什么某些微生物可以分解塑料。
创造具有新功能的蛋白质的能力同样令人震惊。这可以带来新的纳米材料、靶向药物、疫苗的更快开发、最少的传感器和更环保的化学工业——仅举几例,这些应用对人类来说是最大的。
欢迎到核心期刊《化学教育》官网浏览投稿:
http://www.hxjy.chemsoc.org.cn
核心期刊《化学教育》订阅办法
国家级全国中文核心期刊
权威、客观、全面、实用
《化学教育》是由中国科学技术协会主管,中国化学会、北京师范大学共同主办的国家级全国中文核心期刊。被北京大学《中文核心期刊要目总览》2008版、2011版、2014版、2017版、2020版、2023版连续收录;美国化学文摘(CA)收录源期刊。
《化学教育》为半月刊,面向初中、高中、大学本科、研究生等所有层次的化学教育研究与实践,促进各个层次化学课程与教学的衔接和贯通。全年共计24期,每期定价36元,全年共计864元/套。
订阅方式1:请到当地就近邮局的报刊订阅窗口办理,邮发代号为2-106。
订阅方式2:微信订阅,请扫描下方的二维码,选择“规格日期”,点击“立即购买”,填写“收获地址”“发票信息”等,提交订单付费即可。所有服务由“中国邮政”负责,请注意保留订单号等订阅信息。
扫码订阅
有化学课程的地方,就应该有《化学教育》期刊!
温馨提醒
(1)若留家庭地址,请保证居住小区有自己的信箱且正常使用,以便邮政投递;
(2)若留单位地址,请务必告知贵单位的信件收发室工作人员:订阅了《化学教育》期刊,请协助接收、保管并及时通知您取阅。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 14:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社