zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

单细胞转录组图谱中推断肿瘤微环境生态系统

已有 330 次阅读 2025-5-12 13:13 |个人分类:科普|系统分类:科普集锦

单细胞转录组图谱中推断肿瘤微环境生态系统 

表达谱分析技术的最新进展显著加快了我们以单细胞和空间分辨率量化细胞表型的能力。单细胞转录组(scRNA-seq)能够以单细胞分辨率进行全转录组基因表达测量,并导致了与患者预后和治疗反应相关的细胞类型和转录状态的多项发现。空间表达谱分析技术以(亚)细胞分辨率量化基因或蛋白质表达,同时技术保留了每次测量的空间位置,这导致了多项研究将肿瘤空间结构与患者结局联系起来。值得注意的是,人们对使用这些技术重新鉴定细胞类型给予了极大的关注,并指出组织内能形成多细胞群落(或生态系统)。该生态系统形成了多细胞网络,其在组织中的存在与临床结果有关,如一系列病理学的治疗反应。重要的是,我们对导致靶点发现的组织动力学的理解大多来自对肿瘤微环境内细胞共现的推理。 

然而,对导致细胞生态系统的单个肿瘤内细胞状态共现的可靠量化仍然具有挑战性。特别是,在特定临床场景中稳健地识别重复的共存细胞状态或基因程序的能力依赖于拥有足够的独立样本,特别是对于罕见或短暂的细胞状态。空间蛋白质技术具有足够的成本效益来分析所需数量的组织样本,但只能同时定量40-60个标记,限制了推断颗粒细胞状态和信号通路的能力。另一方面,空间转录组技术可以同时测量mRNA物种中的100种,甚至整个转录组,但目前太昂贵了,无法大规模分析,并且存在分辨率或RNA污染问题。相比之下,scRNA-seq可以量化单细胞全转录组表达测量,量化的细胞状态丰度在很大程度上反映了组织成分。虽然scRNA-seq名义上与空间转录组学技术一样,但过去十年中,社区通过人类细胞图谱和人类肿瘤分析网络等倡议的推动产生了前所未有的数据量,仅到2024年年中,就有超过12个肿瘤图谱。这导致了直接从大型多队列scRNA-seq 癌症图谱中量化细胞状态共现和细胞生态系统的诱人可能性。然而,这是否会导致可重复的、临床相关的见解在很大程度上仍然未知。 

为了帮助回答这个问题,Yu等人最近专注于胰腺导管腺癌(PDAC),因为多个独立的原发性肿瘤scRNA-seq数据集的可用性研究与其复杂的微环境相结合,其特征是难以靶向。对PDAC肿瘤微环境的已有研究强调了所有谱系中不同的细胞异质性。此外,PDAC肿瘤的单细胞分析突出了先前未被充分认识的个体肿瘤细胞本身的异质性,基底样/经典和后来的杂交亚型被证明在单个肿瘤内共存。尽管如此,很少有研究试图明确量化单个肿瘤内颗粒细胞状态的共现。Oh等人从四项研究中筛选了PDAC单细胞转录组数据,使用聚类和相互作用组分析推断细胞类型共现,但由于样本相对较少,不包括验证或高度颗粒细胞状态。相比之下,Luca等人构建了一个机器学习框架EcoTyper,从大量RNA-seq数据中发现实体肿瘤中的多细胞群落,该框架在患者水平上具有很好的能力,但可能缺乏从头发现颗粒细胞状态的能力。因此,一个悬而未决的问题是,颗粒PDAC细胞的状态是否可以在患者队列中得到强有力的推断和验证,以及细胞状态共生是否提供了对肿瘤免疫动力学的见解。 

在这项工作中,Yu等人提出了一个综合平台,从图谱规模的scRNA-seq(图1A)中分析在PDAC肿瘤微环境中可以重复推断细胞状态共生和多细胞生态系统的程度。作者们整理了8个独立的数据集,包括>150个样本和>500000个细胞,以创建一个独特的数据集级水平发现-验证-设置。通过这样做,可以独立验证肿瘤微环境中已知和从头开始的颗粒细胞亚型的存在,以及它们在细胞类型内和跨细胞类型共同发生并形成细胞生态系统的能力。作者们绘制了8种细胞类型的50种细胞类型特异性基因程序,并证实了已知亚型的存在,如耗尽的细胞毒性T细胞,同时发现了新的细胞变异,如多种可重复的炎性癌症相关成纤维细胞(CAF)亚型。接下来,作者们评估了这些颗粒细胞状态程序在细胞类型内和细胞类型之间的共现程度,发现在主要细胞类型之间一致的共现。随后,从图谱规模的scRNA-seq中形式化了一个用于量化多细胞生态系统的概率模型,并发现它们在数据集中具有可重复性。有趣的是,通过将这些生态系统映射到空间转录组学数据,作者们证明,尽管是从非空间数据中学习到的,但这些生态系统代表了单个肿瘤内真正的空间变异。最后,将100个经过验证的基因程序和生态系统映射到两个批量数据集,发现某些生态系统与患者预后以及特定的KRAS突变有关。 

image.png

1 直接从scRNA-seq图谱学习多细胞生态系统。A.概述用于识别PDAC肿瘤微环境中特定基因程序的共现和生态系统的发现验证平台。B.发现(顶部)和验证(底部)数据集的UMAP表示,按队列(左)和注释的细胞类型(右)着色。C.发现组(顶部)和验证组(底部)样本(成行)的细胞类型组成概述。D.从发现组中提取的候选基因程序的概述,在发现和验证之间验证的基因程序的数量,以及在合并每种细胞类型中的冗余程序后整合的基因程序。E-F.热图显示了来自上皮细胞(E)和成纤维细胞(F)的选定基因程序中排名靠前的基因的权重 

参考文献

[1] Chengxin Yu, Michael J Geuenich, Sabrina Ge, Gun-Ho Jang, Tan Tiak Ju, Amy Zhang, Grainne M O’Kane, Faiyaz Notta, Kieran R Campbell. Inferring tumour microenvironment ecosystems from scRNA-seq atlases. bioRxiv 2024.08.21.608956; doi: https://doi.org/10.1101/2024.08.21.608956 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://wap.sciencenet.cn/blog-571917-1485366.html

上一篇:基因调控网络推理的机器学习方法
收藏 IP: 39.128.48.*| 热度|

1 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-5-13 13:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部