单核转录组与单细胞转录组比较:以人类膀胱组织分析为例
单细胞测序技术已经彻底改变了我们在健康和疾病中探究生物学的能力,使我们能够绘制器官系统内部和跨器官系统的细胞类型多样性和表达特征。虽然迄今为止大多数研究都使用了单核转录组(snRNA-seq)进行组织的分子定位,但越来越多的研究正在探索单核转录组分析。他们这样做的原因是单核转录组的优势,这些优势包括分析组织的能力,从而提高统计能力,以及大量捕获稀有细胞类型的潜力。
以往研究表明,单核转录组有助于捕获细胞,如胶质细胞和特化上皮细胞。这种细胞类型的低产量归因于它们脆弱的细胞结构,它们可能无法在单细胞解离过程中存活。同时,单核转录组的细胞核分离对于这类细胞类型更为可行。为了确定单核转录组分析是否能对组织的细胞组成产生更可靠的定量,一些研究已经完成了对单细胞转录组(scRNA-seq)和单核转录组细胞类型捕获的从头到尾比较。目前,对人体肾、脑、肺、乳腺和PBMC进行了比较研究。研究结果好坏参半,肾脏研究报告足细胞滞留显著增加,而乳腺研究报告细胞类型鉴定存在挑战。通过这些研究,一个令人关注的问题出现了:非编码RNA在差异表达基因中的富集和规范标记的减少。因此,在单核研究中,特别是在疾病研究或研究新生物学时,细胞类型鉴定可能是一项挑战。因此,为了确定哪种数据类型最适合人体解剖的分子谱,完成大多数(如果不是全部的话)器官和组织类型的比较研究是必不可少的。
稳健数据收集对于确保生成的参考数据集对研究界来说是明智、有意义和实用的必不可少资源。泌尿生殖系统发育分子解剖学项目(Genitourinary Development Molecular Anatomy Project,GUDMAP)目前的资助周期旨在构建人类和模式生物下尿路(lower urinary tract,LUT)的分子解剖学参考。为了实现该项目的目标,Santo等人最近开始比较单细胞转录组和单核转录组捕捉和表征LUT细胞类型的能力(图1)。作者们聚焦人类膀胱,鉴于其复杂的细胞组成和区域解剖多样性。文章假设,虽然对于特定的细胞类型,单核转录组可以提供更好的富集,但单细胞转录组可以为细胞类型鉴定和功能注释提供更多的区分性基因集。为了验证该假设,作者们收集、测序和计算整合了来自四个主要膀胱区域(膀胱顶、颈部、输尿管口和输尿管膀胱连接处的成对标本的单细胞和单核样本,并基于差异表达基因和富集的生物过程比较了每种细胞类型的单细胞和单核亚群。
图1 人类膀胱细胞的单细胞和单核谱转录组
结论与讨论
本篇文章中,作者们描述了来自人类膀胱组织的单细胞转录组和单核转录组数据的联合分析。获得了来自膀胱顶、颈部、输尿管口和输尿管膀胱连接处解剖区域的组织,并从来自单个供体的每个区域的配对样本中生成了单细胞转录组和单核转录组数据。为了正确集成这两种数据类型,利用已建立的Seurat工作流完成了广泛的质量控制过滤和批次校正。在细胞类型鉴定后,进一步评估了哪种细胞类型单核富集比单细胞更好。对于由单细胞和单核混合组成的每个细胞群,分别完成了单细胞和单核亚群的基因集富集分析,以了解每种细胞类型的单细胞和单核基因集突出了哪些生物过程。在此过程中,通过数据驱动的方法证明了单核转录组数据的预期挑战;仅基于top标记基因和富集的生物过程来破译细胞类型的困难。虽然在本研究中,单细胞转录组和单核转录组的联合分析促进了细胞鉴定,但单独使用单核数据的研究,特别是那些以发现新生细胞类型为特征的研究,面临着破译非编码RNA主导的聚类标记和模糊的面向细胞核本体条目的额外挑战。
迄今为止,很少有研究完成了单细胞转录组和单核转录组数据的直接比较,而且没有研究使用来自人类膀胱组织的成对样本进行比较。先前的研究表明,使用单核转录组将有助于捕获和询问历史上难以使用单细胞方案捕获的细胞类型。例如,在单细胞转录组的组织分离过程中,胶质细胞、肾足细胞、肺泡上皮细胞和成纤维细胞等细胞难以大量分离。无法分离这些细胞类型对这些细胞类型是疾病病理的主要驱动因素的研究具有负面影响,例如肺纤维化中的肺泡上皮细胞和成纤维细胞。正在进行的研究旨在确定哪些器官和解剖区域的哪些细胞类型可以通过单核转录组测序进行最佳量化。Borrman等人和Wang等人展示了单核技术如何能够大量收集胶质细胞,以鉴定与中风和胶质母细胞瘤复发中少突胶质细胞和星形胶质细胞对缺血性损伤的反应相关的细胞和分子特征。作者们认为,胶质细胞形态阻碍了单细胞方法对其进行分离。同样,足细胞以其独特而脆弱的形态而闻名,在单细胞研究中往往代表性不足。在最近的一项研究中,Wu等人报道了单核转录组处理的样品中足细胞保留率增加了20倍。与肺上皮、成纤维细胞和神经胶质细胞一样,足细胞定量对评估肾脏疾病病理至关重要。
单核转录组的优势并不局限于对稀有细胞类型的富集。单核技术可以很容易地应用于冷冻保存的样本,使研究人员能够利用广泛的存储生物标本收集,因此已成为一些大型分析联盟的支柱,如肾脏精密医学联盟(Kidney Precision Medicine consortium,KPMP)。此外,已经发现单核转录组可以显著降低细胞中解离诱导的转录应激反应,这可能会混淆病理状态或具有不同线粒体特征的细胞结果。单核转录组还有助于减少巨噬细胞转录谱中的噪声,巨噬细胞由于其吞噬功能,在通过单细胞转录组定量时可能包含其他细胞类型的转录组。尽管有这些好处,非编码RNA的富集也不容忽视。当使用大规模单核转录组数据集时,通过先前的单细胞转录组研究了解疾病中细胞类型的背景是很重要的,这样非编码RNA的富集就不会影响细胞类型的鉴定。正如Kumar等人所指出的,这种非编码RNA富集与常见上皮细胞类型的典型标记富集相混淆。管理非编码RNA富集的方法包括在样品整合和批次校正之前过滤掉非编码RNA,以便在聚类中使用的高度可变基因仅用于蛋白质编码,或者整合和共同分析单细胞转录组和单核转录组数据集。
在本研究中,单细胞转录组和单核转录组数据集的联合分析使我们能够轻松地识别细胞类型,并证明单核数据用于人类膀胱组织的优点和缺点。在尿路上皮、免疫和间质区室中,作者们发现几种细胞类型显示出显著的单核富集。在尿路上皮室中,中间的尿路上皮细胞表现出明显的单核富集。尽管有这种富集,但基于top标记和基因本体,中间尿路上皮以及基底和伞细胞单核亚群难以识别。同时,通过单细胞转录组鉴定的尿路上皮细胞类型显示出显著的典型标记和上皮过程富集。在免疫室中,巨噬细胞和肥大细胞有明显的单核富集。有趣的是,来自单核和单细胞免疫亚群的top差异表达基因和基因本体条目具有可比性。利用单核和单细胞差异表达基因和生物过程可以鉴定免疫细胞类型。
单核细胞和单细胞数据差异最大的是间质室。虽然一些细胞类型表现出显著的单核富集,包括一些成纤维细胞、平滑肌细胞和淋巴内皮细胞,但top标记基因表达和本体分析不足以用于细胞类型鉴定。例如,这些细胞类型的典型标记在单核差异表达基因集合中显著减少。此外,富集的生物过程要么对细胞类型识别过于模糊(例如平滑肌细胞的解剖结构和系统发育),要么指示了不正确的细胞类型(例如肌内成纤维细胞的平滑肌收缩)。当通过单细胞分析研究这些相同的细胞类型时,典型标记在每个聚类的前10个差异表达基因中都很丰富,本体条目是相关的(例如平滑肌细胞的肌肉收缩和肌肉结构发育),并且基于基因表达数据的细胞类型之间的总体分离在热图中是清晰的。在间质室中,单核数据的最大优势是收集了相当大的Schwann细胞群。先前的研究报道,当分析下尿路时,很少有神经元细胞类型的富集,可能是由于这些细胞的形态。
当在独立分析中进一步比较单核和单细胞数据时,单核转录组的额外好处变得明显。当单核数据单独分析时,观察到细胞类型亚群的分辨率增加,包括额外的成纤维细胞和血管平滑肌细胞群。作者们还观察到在每个基质细胞类型的top差异表达基因中存在非编码RNA富集。这些观察结果与独立的单细胞分析形成鲜明对比。尽管样本量有限,但不可忽视的是,使用非编码RNA富集的单核数据可能有助于从人类膀胱中获得生物学见解,而单一单细胞数据会忽略这一点。在NIH-CZI CELLxGENE发现细胞可视化工具上可以获得所有处理数据的交互式可视化,其中包含细胞和数据类型注释。
局限性
在这项工作中,作者们只有来自一个人类捐赠者的8个样本。为了确保全面分析健康参考数据集和疾病状态下的细胞类型多样性,有必要在更大样本量上分析配对的单细胞转录组和单核转录组数据。然而,作者们的样本来自四个主要膀胱区域,并对单核和单细胞数据进行配对采样,提供了平衡和解剖多样性的器官采样。此外,该研究缺乏对研究结果的空间转录组学验证。尽管如此,本研究中用于细胞类型鉴定的所有标准标记都参考了先前在肾脏、膀胱、输尿管和下尿路其他区域的研究。目前的基因本体数据库主要基于编码基因,因此对非编码RNA有缺陷。然而,本文章的单核研究为增加非编码RNA和生物过程关联的现有知识库提供了独特机会。总之,该研究结果有助于建立一个样本制备、数据收集和分析的框架,用于两性和整个生命周期的人类膀胱组织,以生成LUT细胞图谱(GUDMAP项目的一部分)。
参考文献
[1] Santo, B., Fink, E.E., Krylova, A.E., Lin, Y.-C., Eltemamy, M., Wee, A., Wessely, O., Lee, B.H., Ting, A.H., Exploring the Utility of snRNA-seq in Profiling Human Bladder Tissue: A Comprehensive Comparison with scRNA-seq, ISCIENCE (2025), doi: https://doi.org/10.1016/ j.isci.2024.111628.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1469026.html?mobile=1
收藏