PTMBio的个人博客分享 http://blog.sciencenet.cn/u/PTMBio

博文

AI助力临床大样本蛋白组分析!西湖大学郭天南团队新研究辨别甲状腺结节良恶性

已有 2617 次阅读 2020-5-29 16:18 |系统分类:科研笔记

甲状腺结节(thyroid nodule),是指在甲状腺内细胞增生后出现的团块。它可由多种因素引起,在当代人群中较为高发,其患病率高达18.6%(2013年统计数据)。与多数结节一样,甲状腺结节有良恶性之分,良性的甲状腺结节(如滤泡腺瘤)约占90%,对日常工作生活不会有影响,而恶性的甲状腺结节(如滤泡癌)需要尽早进行医治。目前恶性结节治疗的主要手段为切除甲状腺,由于现有的甲状腺结节良恶性诊断手法,存在过度治疗或过度诊断的现象,致使结节携带者的生活质量受到极大的影响。即使基于基因的甲状腺结节良恶性诊断试剂盒已投入到临床应用,但由于甲状腺结节恶性程度低等原因,基因水平上的改变并不明显,存在较大误诊的可能性。

近日,西湖大学生命科学学院郭天南组、工学院李子青组等合作研究团队,运用蛋白质组学技术系统分析了近千例甲状腺结节病人组织样本的蛋白质组差异,结合人工智能机器学习,鉴定到可区分甲状腺结节良恶性的蛋白质分子标记物的组合,临床应用准确率达到了90%,将有望克服当前甲状腺结节良恶性诊断的难题。相关研究成果已于近日以Protein Classifier for Thyroid Nodules Learned from Rapidly Acquired Proteotypes为题在预印版平台medRxiv上线。

1、甲状腺结节的大样本蛋白质组学分析

蛋白质组学广泛运用于疾病标志物鉴定,为了克服甲状腺结节良恶性诊断的难题,研究人员首先对新加坡国立肿瘤中心提供的578个患者1725份甲状腺组织石蜡切片(FFPE)样本(样本策略),进行了基于数据非依赖(DIA)的蛋白质组学分析(质谱策略),研究鉴定到共3,779个蛋白。

图1、甲状腺结节的大样本蛋白质组学分析

2、蛋白质组数据挖掘,鉴定蛋白标志物组合

甲状腺结节根据良恶性程度不同,包括正常甲状腺组织(N),多结节性甲状腺肿(MNG),滤泡性甲状腺肿腺瘤(FA)、滤泡癌(FTC)和乳头状癌(PTC)。研究发现测得的蛋白质图谱能够合理地反映样本的临床表型。不同组织中蛋白质的种类随恶性程度的增加而增加,表明肿瘤细胞释放更多的蛋白质。乳头状癌(PTC)组织的蛋白质组与其他组织存在较大差异,但部分甲状腺结节在分子水平上差别微小,如滤泡腺瘤(FA,良性)与滤泡癌(FTC,恶性)的蛋白质组高度接近,区分两者依然较为困难。

图2、甲状腺结节整体蛋白质组分析

因此,研究团队进一步使用机器学习中的人工神经网络技术,即一种“模仿”人脑,由大量的节点(类似人脑中的“神经元”)相互联接构成的运算模型,对良性与恶性结节的蛋白组数据进行了分析,筛选到包含14个关键性蛋白的蛋白标志物组合,能够对良性与恶性甲状腺结节进行有效区分。

图3、结合机器学习筛选蛋白标志物组合

3、蛋白生物标志物组合的验证

研究人员进一步在独立的患者队列中验证这个蛋白标志物组合模型。对来自288例病理学FFPE组织(包括144例良性和144例恶性组织样本)的回顾性试验集分析,发现具备良好的敏感性(90%)和准确性(91%)。考虑到最终目标是将此分析应用于术前FNA活检,研究人员将其再度扩展到从独立临床中心获得的64个细针穿刺组织样本(n=62名患者)的单独前瞻性队列,同样表现出良好的敏感性(87%)和准确性(89%),证明了该模型在临床应用上的潜力。

图4、蛋白生物标志物组合的验证

值得一提的是,研究人员发现尽管区分甲状腺良恶性结节的准确性很高,但算法的主要局限性仍在于区分滤泡性甲状腺肿腺瘤(FA)和滤泡癌(FTC)。事实上,蛋白质组学分析发现这两者之间有明显的重叠,甚至可能代表同一个疾病的连续不同阶段。这提示我们对良性类型在出现明显的包膜或血管侵犯之前进行前体病变诊断的重要性,可能能够阻止疾病的恶化和转移。

综上所述,现有的甲状腺结节良恶性诊断手法,存在过度治疗或过度诊断的现象。研究人员队对931例甲状腺结节组织样品(包括发现组n=579,回顾性阵列n=288,前瞻性阵列n=64),进行了系统的蛋白质组学分析,结合神经网络机器学习鉴定到包含14个关键性蛋白的蛋白标志物组合,能够对良性与恶性甲状腺结节进行有效区分。研究是目前最系统的临床组织样品蛋白质组学研究之一,证明了基于蛋白质组学结合神经网络的疾病分类方法在临床肿的应用潜力,也为其他疾病的大阵列临床组织样本的分析提供了新的思路。

参考文献

Yaoting Sun, et al., 2020, Protein Classifier for Thyroid Nodules Learned from Rapidly Acquired Proteotypes. MedRxiv

本文景杰学术团队原创解读,欢迎转发到朋友圈。如有转载、投稿、等其他合作需求,请文章下方留言,或添加微信ptm-market咨询。




https://wap.sciencenet.cn/blog-3404471-1235530.html

上一篇:Nature:蛋白质组学研究揭示新冠治疗靶标,可显著抑制病毒复制!
下一篇:专访高友鹤教授:为什么尿液是疾病早期标志物的来源?
收藏 IP: 101.71.253.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 03:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部