Leeye的个人博客分享 http://blog.sciencenet.cn/u/Leeye

博文

人工智能系统的评价标准和蛋白质结构预测 精选

已有 5932 次阅读 2023-10-31 10:49 |系统分类:观点评述

 人工智能系统是指能够执行为解决某个特定问题,并且在完成任务时呈现出一定类似智能行为特征的计算机系统。例如,AlphaGo是一个能够下围棋并战胜人类顶尖棋手的人工智能系统,AlphaFold是一个能够预测蛋白质结构并达到实验水平的人工智能系统。

那么,如何评价一个人工智能系统的性能和可信度呢?我们需要什么样的评价标准来衡量一个人工智能系统的优劣呢?这些问题并不容易回答,因为不同的人工智能系统可能有不同的目标、方法、数据和应用领域。因此,我们需要根据不同的情境和需求来制定合适的评价标准,并且考虑多方面的因素,如功能、性能、安全、可靠、可解释、可复现、可比较等。

在本文中,我们将以蛋白质结构预测为例,来探讨一下人工智能系统的评价标准和挑战。蛋白质结构预测是指根据蛋白质的氨基酸序列来推断其三维空间结构的过程。蛋白质结构预测对于理解生命现象、揭示分子机制、设计新药物等具有重要意义。然而,蛋白质结构预测也是一个非常困难的问题,因为蛋白质结构受到多种因素的影响,而且存在着巨大的搜索空间和计算复杂度。

蛋白质结构预测的评价标准                       

为了评价一个蛋白质结构预测系统的性能,我们需要定义一些评价指标来衡量其预测结果与真实结构之间的相似度或差异度。常见的评价指标有以下几种:

  • RMSD(Root Mean Square Deviation):均方根偏差,表示两个结构之间所有原子位置的平均距离差。RMSD越小,表示两个结构越接近。

  • TM-score(Template Modeling score):模板建模分数,表示两个结构之间最优超级定位后的原子位置匹配程度。TM-score考虑了蛋白质结构的全局拓扑特征和局部细节特征,并且对于不同大小的蛋白质具有一致性。TM-score越大,表示两个结构越相似。

  • GDT-TS(Global Distance Test Total Score):全局距离测试总分数,表示两个结构之间在不同距离阈值下原子位置匹配的比例。GDT-TS综合了不同精度水平下的匹配程度,并且对于不同大小的蛋白质具有一致性。GDT-TS越大,表示两个结构越相似。

除了上述的评价指标,还有一些其他的评价指标,如Q-score、CAD-score、MaxSub等,它们各有各的优缺点和适用范围。在实际应用中,通常需要综合多个评价指标来评价一个蛋白质结构预测系统的性能。

蛋白质结构预测的挑战                            

尽管人工智能系统在蛋白质结构预测方面取得了令人瞩目的进展,但是仍然存在着一些挑战和问题,如:

数据质量和可用性:蛋白质结构预测系统通常需要大量的数据来训练和测试,但是实验获得的蛋白质结构数据是有限的、不完整的、不均匀的、存在误差的,而且有些数据是保密的或者尚未公开的。因此,如何获取高质量、高覆盖、高可信的数据是一个关键问题。

方法复杂性和可解释性:蛋白质结构预测系统通常采用复杂的算法和模型来处理高维度、非线性、动态变化的数据,但是这些算法和模型往往是黑箱式的、难以理解的、缺乏透明度的。因此,如何提高蛋白质结构预测系统的可解释性和可理解性是一个重要问题。

结果可靠性和可复现性:蛋白质结构预测系统输出的结果可能受到多种因素的影响,如数据噪声、模型参数、随机种子、计算环境等,而且可能存在不确定性、不稳定性、不一致性等。因此,如何保证蛋白质结构预测系统输出的结果是可靠的、可复现的、可比较的是一个关键问题。

 蛋白质结构预测技术评估大赛(CASP)       

为了促进蛋白质结构预测技术的发展和交流,自1994年起每两年举办一次国际蛋白质结构预测技术评估大赛(CASP)。CASP竞赛选择已经通过实验手段完成结构解析,但尚未公布结构的蛋白质或蛋白质部分结构域作为目标,让各国的研究团队运用自己的计算手段预测目标蛋白的结构,并根据上述评价指标对预测结果进行评估和排名。CASP竞赛已经成为国际上著名的人工智能系统在生物学领域应用的评估平台。

2023年度的第十四届CASP竞赛(CASP14)中,由DeepMind开发的AlphaFold2以惊人的表现夺得了冠军。AlphaFold2使用了深度学习和图神经网络等先进技术,能够在几天甚至几分钟内预测出以前要花费数十年才能得到的具有高置信度的蛋白质结构。AlphaFold2在TM-score指标上达到了0.9以上(满分为1),在GDT-TS指标上达到了92.4%(满分为100%),远远超过了其他参赛团队。

那么,AlphaFold2是如何做到这一切的呢?它是否真正地“解决”了蛋白质结构预测问题呢?它是否可以被认为是预测蛋白质结构工作的唯一行为主体呢?这些问题并不容易回答,因为涉及到人工智能系统的评价标准和限制。下面,我们将从以下几个方面来探讨这些问题:

AlphaFold2的工作原理:AlphaFold2是基于深度学习和图神经网络的端到端的蛋白质结构预测系统。它主要包括两个模块:一个是用于预测蛋白质序列之间和序列内部的相互作用强度的注意力模型;另一个是用于根据相互作用强度生成三维坐标的图神经网络模型。AlphaFold2利用大量的实验数据和计算数据来训练这两个模块,使其能够从氨基酸序列直接推断出蛋白质结构。

AlphaFold2的评价方法:AlphaFold2参加了CASP14竞赛,按照CASP组织者给出的评价标准和方法进行了评价。CASP组织者选择了一些未公开结构的蛋白质作为目标,让参赛者提交他们的预测结果,并在实验结构公布后进行比较和打分。CASP组织者使用了多种评价指标,如RMSD、TM-score、GDT-TS等,来衡量预测结果与真实结构之间的相似度或差异度,并根据不同类别和难度对参赛者进行排名。

AlphaFold2的评价结果:AlphaFold2在CASP14竞赛中表现出色,超越了所有其他参赛者,在所有类别和难度下都取得了最高或接近最高的分数。AlphaFold2在TM-score指标上达到了0.9以上(满分为1),在GDT-TS指标上达到了92.4%(满分为100%),这些分数已经接近或达到了实验水平,意味着AlphaFold2预测出的蛋白质结构与真实结构几乎没有区别。AlphaFold2的评价结果被认为是人工智能系统在蛋白质结构预测领域的一个重大突破,也是生物学和医学领域的一个里程碑。

AlphaFold2的评价问题:尽管AlphaFold2在CASP14竞赛中取得了令人惊叹的成绩,但是也有一些问题和挑战需要注意。首先,AlphaFold2的工作原理和细节并没有完全公开,只有一篇简短的论文和一些博客文章介绍了其大致的思路和方法,这给其他研究者复现和验证其结果带来了困难。其次,AlphaFold2的评价方法和结果并不完全客观和公正,因为CASP组织者选择的目标蛋白质可能存在一定的偏差和局限性,而且评价指标也可能存在一定的不足和误差。最后,AlphaFold2的评价结果并不意味着它已经“解决”了蛋白质结构预测问题,因为蛋白质结构预测问题本身是一个非常复杂和多样化的问题,涉及到不同类型、不同尺度、不同环境、不同功能的蛋白质结构,而AlphaFold2可能还不能完全覆盖和适应这些情况。

我们可以说,AlphaFold2是一个非常先进和强大的人工智能系统,在蛋白质结构预测方面取得了令人瞩目的成就。但是,我们也不能忽视它的评价标准和限制,也不能过分夸大它的能力和作用。我们应该客观地看待它的优势和不足,理性地分析它的原理和可信度。

 

 

 




https://wap.sciencenet.cn/blog-3244891-1407865.html

上一篇:如何衡量复杂化学系统的信息丰富程度?
下一篇:化学机器视觉技术在电镀工业领域的应用
收藏 IP: 111.21.211.*| 热度|

4 郑永军 宁利中 李升伟 孙颉

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-2 15:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部