一、概述
目前,最常用于表征疾病原因、药物作用机制的知识体系,主要由人类专家手工编辑形成的信号通路构成。DeepoMe(深度甲基)开发的DamoPa (Foundation Model for Medicine based on Pre-training),是希望用数据驱动的方式,在大规模数据集中计算得到与人类衰老、疾病病因与机制、药物作用相关的模型,形成预训练模型库。在应用中,基于本地数据(小规模数据集、甚至单个体的生物学测量),应用预训练模型,产生基于本地数据的副本,进而在本地数据上测试该模型与表型的相关性。或者生成基于内源性代谢物、营养素、药物的干预方案。这里节选了部分内容。关注DeepoMe深度甲基公众号,输入“白皮书”可以获取DamoPa技术白皮书全文。
二、技术架构
…(细节请参考技术白皮书原文)
三、应用场景
应用场景分为几个板块:营养需求分析与营养干预方案生成;药物重定位与天然产物药物开发;中医证候表征与计算。为了演示功能,本报告使用两个新冠感染的全基因组DNA甲基化数据集。其中“数据1”包括473个Covid-19阳性和101个阴性个体,全血样本采用illumina 850k芯片获得的数据,阳性病例按照WHO标准分为重症组(Severe) 和轻症组(Mild)。“数据2”包括164个阳性个体、296个阴性患者和65个其他呼吸道感染样本,全血样本采用illumina 850k芯片获得的数据。病例分为4个阶段:(1)从急诊室出院(家庭护理);(2)住院治疗;(3)ICU;(4)死亡。本演示是科学研究用途。
1 营养需求与干预方案生成
…
2 药物研发
2.1 “老药新用”
对已获批药物进行了SEMO分析,发现与新冠严重程度最相关的前四个SEMO特征与抗凝药肝素(Heparin)、消炎和广谱抗病毒药物吲哚美辛(Indomethacin)有关,如下图所示。
图11 发现与疾病严重程度相关的药物
计算在前200个与表型最相关的SEMO特征中出现的PPI和药物的频次,如下图所示。频次越高的药物能调控的PPI越多。
图12 各类药物在新冠严重程度相关的SEMO网络中的重要性排序
2.2 天然产物活性成分筛选
如下图所示,对天然产物成分进行SEMO分析,发现与新冠严重程度最相关的前四个SEMO特征分别是:CSF2-Parthenolide (小白菊内酯),CSF2-Andrographolide (穿心莲内酯),TLR2-Parthenolide和LCK-Leurosidine。Parthenolide (小白菊内酯)是热带菊的主要活性成分,通过抑制IL-6的产生具有抗炎作用,以及对SARS-CoV-2类蛋白酶的抑制活性。
图13 发现与疾病严重程度相关的天然产物化合物
Andrographolide(穿心莲内酯)是广泛用于中药的穿心莲的主要活性化合物,具有抗炎作用,具有减少细胞因子风暴的潜力。提示这些化学物质可以通过调节CSF2和TLR2蛋白网络以调节细胞因子产生来影响病毒反应。
对高频出现的天然产物化合物进行排序,Parthenolide(小白菊内酯)位列第二,Andrographolide(穿心莲内酯)位列第三。如下图所示。
图14 天然产物化合物在新冠严重程度相关性网络中的重要性排序
排名第4的是Ursodeoxycholic (熊去氧胆酸),是一种天然胆汁酸,最近因其调节ACE2途径而被报道对减少SARS-CoV-2感染有效、在预防方面也有潜在价值。本分析发现,CD4.n与Ursodeoxycholic acid熊去氧胆酸组成的SEMO特征、CD69.n与Ursodeoxycholic acid熊去氧胆酸组合形成的SEMO特征,在重症和轻症病例之间具有显着差异效应,其中T检验的P值分别为1.1E-17和4.3E-17。提示熊去氧胆酸可能靶向CD4+和CD69+细胞。
在疾病的不同阶段,天然产物化合物的重要性可能不一样。通过数据2的分析,从绿茶中提取的EGCG是第一阶段(新发感染)中排名第五的化合物,如下图所示。
图15 天然产物化合物在第一阶段(新发感染)中的重要性排序
熊去氧胆酸Ursodeoxycholic在第二阶段(转住院治疗)中排名第二,如下图所示。
图16 天然产物化合物在第二阶段(转住院治疗)中的重要性排序
3 中医证候量化表征与计算
...
参考资料:
DamoPa模型:因果涌现,48例样本也可以发现生物标志物,中医的DNA甲基化特征优势明显
转载本文请联系原作者获取授权,同时请注明本文来自熊江辉科学网博客。
链接地址:https://wap.sciencenet.cn/blog-508476-1385637.html?mobile=1
收藏