||
组学数据集架起肿瘤生物学与患者护理之间的桥梁
导语
肿瘤样本的大规模组学数据生成和分析正变得越来越容易。随着技术的不断进步,如何利用这些数据帮助临床患者呢?
组学技术(基因组学、蛋白质组学等)的快速发展揭示了肿瘤的分子复杂性,推动了精准肿瘤学的发展。尽管取得了这些突破,但如何将大型组学数据转化为临床相关应用仍然是一个主要障碍。已经出现了三种关键方法:利用大规模数据识别治疗靶点;完善分子分型以指导个性化治疗;整合预测模型以优化临床决策。这些方法共同为将组学发现应用于个性化干预提供了潜在解决方案,架起了肿瘤生物学与患者护理之间的桥梁。
大规模组学数据的整合已经使肿瘤学领域发现了高度选择性的治疗靶点。一个显著的例子是 CLDN18.2,一种参与紧密连接的蛋白质。在 2008 年的一项开创性研究中,通过 NCBI 数据库的人类表达序列标签文件,CLDN18.2 被发现,揭示其在多种上皮肿瘤中的异常激活,包括胃癌、胰腺癌和食管癌。它在正常组织中的表达受限,而在肿瘤中持续存在,使其成为抗体治疗的理想候选者。
基于此发现,研发出了靶向 CLDN18.2 的单克隆抗体 zolbetuximab,现被推荐为高 CLDN18.2 表达胃癌的一线治疗方案。此外,靶向 CLDN18.2 的其他治疗策略,如双特异性抗体、抗体-药物偶联物和嵌合抗原受体 T 细胞疗法,目前正处于研究阶段。这表明组学指导的靶点发现如何推动理性药物开发,并带来新的治疗选择。尽管组学指导的靶点这一发现前景广阔,但肿瘤异质性仍然是一个主要挑战,它既包括肿瘤内细胞的多样性,也包括肿瘤进展过程中发生的动态变化。幸运的是,空间技术和液体活检方法(如循环肿瘤 DNA(ctDNA)分析)的进步为解决异质性问题提供了有希望的途径。
将组学数据整合用于分子分型,旨在揭示肿瘤异质性,已被用于识别精准治疗的分子驱动因素。早期研究,如 PAM50 分类器的研究,利用转录组谱学将乳腺癌分类为内在亚型。近来,研究已超越广泛的乳腺癌分类,借助先进的多组学技术进一步细化已建立的临床和分子类别中的亚型。一个引人注目的例子是在三阴性乳腺癌(TNBC)中进行的系列研究,其中建立了最大的多组学 TNBC 数据库,以便研究人员能够系统地描述 TNBC 的基因组和转录组景观,以寻找潜在的治疗靶点。确定了四种不同的分子亚型,每种亚型都有独特的治疗脆弱性。随后的 FUTURE 试验和 FUTURE-SUPER 试验表明,根据这种分子分型调整治疗显著改善了转移性 TNBC 患者的临床结果。近期在利用多组学方法进行分子分型方面的努力也被应用于其他类型的乳腺癌,并随后进行了临床试验。这些基于多组学的进展显著提高了我们对肿瘤异质性的理解,使我们能够开发出更精确和个性化的治疗策略。然而,并非所有已识别的分型都必然对应可行动的目标或可用的治疗药物。此外,随着日益复杂的多种模态数据集的整合变得越来越普遍,多组学分类的整合策略和可解释性面临着越来越多的挑战。尽管如此,计算建模、机器学习和系统生物学的持续进步正稳步提高我们从这些数据丰富的平台中提取临床可行动见解的能力。
预测建模已被用于开发针对特定临床问题的多基因特征,例如确定强化化疗的必要性。该领域的里程碑是 2008 年引入的 21 -基因检测,该检测根据患者复发风险对雌激素受体阳性乳腺癌患者进行分层。近年来,预测模型发展迅速。一个例子是同源重组缺陷(HRD)评分,这是一个基于基因组分析的指标,用于识别 DNA 修复能力受损的肿瘤,并指示对铂类化合物和 PARP 抑制剂等 DNA 损伤剂的潜在敏感性。它整合了与 HRD 引起的“基因组疤痕”相关的三个指标,即杂合性丢失、端粒等位基因不平衡和大规模状态转换。通过分析卵巢癌和乳腺癌组织样本的大规模基因组数据,建立了一个阈值来定义 HRD 缺陷型肿瘤。后续研究已成功将 HRD 评分应用于卵巢癌的临床决策。进一步遵循这一原则,III 期 PAOLA-1 试验表明患者可从中受益。如果他们的 HRD 评分高于阈值,即使没有 BRCA 突变,也可以从治疗中获益,这证明了其价值超越了传统的单一基因状态。
随着新技术的兴起,研究者们期待这一领域持续创新。正如之前所提到的,肿瘤异质性是靶点发现中的一个关键问题。单细胞组学技术使我们在细胞水平上实现了高分辨率分析,而空间组学技术则通过保留基因表达的时空背景,增加了额外维度。两者结合,提供了更全面的肿瘤异质性视图,揭示了在传统方法中常被忽略的特征。纵向液体活检分析可能提供一种强大的策略,以非侵入性的方式实时监测肿瘤的动态演变。
随着组学数据变得越来越复杂,人工智能(AI)被用于促进其分析,从而提高解读和临床决策。例如,最近一项研究利用基于 AI 的虚拟筛选技术,发现了一种名为 bemcentinib 的新型分子,用于治疗帕金森病。这类“AI 助力科学”的研究为癌症研究提供了一个宝贵的范例。特别是考虑到癌症领域有大量的大型公共数据库可供使用,AI 提供了强大的工具,可以从这些复杂且异构的数据集中提取可操作的靶点。
值得注意的是,一些关键挑战仍然存在,尤其是在这些工具的应用方面。高通量测序等技术通常成本高昂,需要先进的设备和专业的人员,使得它们在治疗患者时不太容易获得,特别是在资源较少的地区。这些检测对样本量和处理方法也有要求,在某些情况下可能难以满足。此外,疾病的动态监测是一个重要问题,特别是对于癌症,需要更多非侵入性的检测方法。ctDNA 分析、放射基因组学和基于人工智能的预测工具等新兴技术正在通过提供更易获得、实时和更友好的患者解决方案,帮助降低组学临床应用的门槛。
组学技术通过实现靶点发现、分子亚型的精炼以及为临床决策提供预测模型,极大地推动了癌症研究的发展。尽管取得了这些成功,肿瘤异质性、数据复杂性和实施障碍等挑战依然存在。将多组学方法与空间分析和人工智能相结合,有望弥合这些差距,实现更精确、适应性和可及性的癌症护理。持续创新对于充分发挥组学驱动的精准肿瘤学的临床潜力至关重要。
参考文献
[1] Huang J-T, Dai L-J, Ma D, Shao Z-M (2025) Omics datasets can bridge the gap between tumor biology and patient care. PLoS Biol 23(7): e3003279. https://doi.org/10.1371/journal.pbio.3003279
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-8-28 15:24
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社