徐志建
[转载]2025年(1):F-CPI:AI驱动的氟取代化合物的活性预测模型
2025-3-22 10:13
阅读:446

F)是药物分子结构中的常见组成元素。在2022年最畅销的10种小分子药物中,有5种含有F。在DrugBank收录的2761种上市小分子药物中,共有297种含F药物(约11%)。因此,F取代是先导化合物结构优化的一种常见策略。但药物中的F既难形成氢键,也难形成典型的卤键,F取代对化合物-蛋白质相互作用(CPI)的影响仍然是一个谜,往往只能根据经验进行猜测,难以用计算模拟方法准确判断在分子的何处引入F会提高活性。

近日,研究人员基于深度学习方法对F取代后化合物与蛋白质相互作用进行了研究,结合蛋白质与化合物多个模态的信息,提出了一个F取代活性预测专用模型F-CPI(图1)。较过往的机器学习算法以及主流的CPI模型相比,展现出了较高的优越性和泛用性。F-CPI用于SARS-CoV-2 3CLpro先导化合物的结构优化,F取代使分子水平抑制活性提高了100多倍(IC50: 0.23µM vs. 28.19µM)。该研究成果以题为“F-CPI: A multimodal deep learning approach for predicting compound bioactivity changes induced by fluorine substitution”的文章发表于Journal of Medicinal Chemistry,为引入F原子进行结构优化提供了有效的工具。

clip_image002.png

1. F取代化合物-蛋白质相互作用任务概览

 

工作介绍

在这项研究中,构建了一个包含111168F取代和原始化合物的数据集。并基于此数据集开发了一个多模态深度学习模型F-CPI(图2)。该模型结合了化合物和蛋白质多个模态的信息,包括序列信息,分子指纹,蛋白质接触图信息,位置特异性矩阵(PSSM)信息等。

clip_image003.pngclip_image004.png

2. F-CPI的模型结构

 

与传统的机器学习(表1)和基于深度学习的CPI任务模型(表2)相比,F-CPI在准确率、精确率和召回率(~90%~79%~45%)上均实现了显著提升,优于随机森林(~87%~59%~23%)和GraphDTA~86%~58%~40%)等模型。

 

表1. 传统机器学习和F-CPI性能比较

Methods

ACC(%)

PRE(%)

RECALL(%)

SVM

86.39

45.59

26.74

RF

87.39

59.31

22.75

SVM(p-emb)

87.17

53.87

38.44

RF(p-emb)

87.30

58.33

22.68

gF-CPI (GCN)

85.08

43.75

34.54

gF-CPI (GAT)

86.29

49.43

41.83

sF-CPI

86.99

55.62

20.77

sF-CPI (&emb)

88.00

67.10

22.83

mF-CPI

89.33

66.52

43.15

p-emb代表预训练嵌入,&emb代表预训练和序列嵌入的结合。

 

表2. IC50数据集上不同深度学习模型的性能比较

Methods

ACC(%)

PRE(%)

RECALL(%)

MSE

DeepDTA

83.21

43.46

29.21

0.46

GraphDTA (GIN)

85.94

57.43

34.58

0.36

GraphDTA (GAT)

84.4

48.44

16.24

0.45

GraphDTA   (GAT&GCN)

86.29

58.10

40.09

0.36

GraphDTA (GCN)

86.75

62.34

35.77

0.37

mF-CPI

89.65

79.16

44.71

0.42

 

为了探索该模型在实际应用中的潜力,研究人员进行了一系列湿实验,以检验该模型在先导化合物结构优化方面的能力。选择SARS-CoV-2 3CLpro作为靶蛋白,经计算后,选择了三对化合物进行合成和活性测试,其中(a)(b)为正样本预测验证,(c)为负样本预测验证(图3)。结果表明,三对化合物最终的活性表现都与模型预测相符。令人印象深刻的是,其中一个化合物只引入一个F原子,活性就提高了两个数量级(IC50:0.23µMvs. 28.19µM)。从所得结果来看,F-CPI有望为含F药物的发现和设计提供新思路。

clip_image006.png

3.三对化合物F取代前后的活性变化

 

该论文第一作者为华东师范大学张倩副研究员、硕士研究生尹闻海、沈阳药科大学联合培养硕士研究生陈昕尧,通讯作者为中国科学院上海药物研究所徐志建研究员和烟台新药创制山东省实验室蒋翔锐研究员。该工作还得到中国科学院上海药物研究所朱维良研究员、沈敬山研究员和华东师范大学周爱民教授、张桂戌教授等的大力支持。该项研究工作得到了国家自然科学基金、中国科学院先导B项目、科技部重点研发项目和中国科学院上海药物研究所自主部署项目的资助。

 

原文链接:https://doi.org/10.1021/acs.jmedchem.4c02668

转载自:https://mp.weixin.qq.com/s/lKntZGqh9Fl7hwhdaVJO9w

转载本文请联系原作者获取授权,同时请注明本文来自徐志建科学网博客。

链接地址:https://wap.sciencenet.cn/blog-2877557-1478765.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?