||
整合单细胞和bulk转录组数据的人体组织基因表达图谱资源
组学技术的快速发展使大规模项目能够绘制所有主要人体组织和器官的基因表达。人类细胞图谱(www.humancellatlas.org)等项目和Tabula Sapiens旨在使用单细胞测序系统地介绍每种细胞类型,而专门的计划,例如Allen脑图谱,都使用单细胞和空间转录组来专注于特定组织。这些项目提供了对健康组织的全基因组转录组测量,从而促进了大多数人体组织和器官中细胞类型特异性基因表达的探索。
但是,单细胞分析带来了一些挑战。这包括某些组织的细胞生成问题,尤其是大脑,以及由于每个单细胞的测序读数相对较少而引起的基因覆盖率。为了克服这些困难,以往的组织“合并”策略可以增加单细胞分析的深度和广度。该分析结合了从单个细胞簇的数据,以使所有蛋白质编码基因的表达归一化,从而将细胞类型和管家基因定义为单个细胞类型的水平。高分辨率抗体的分析进一步增强了这种方法,从而为HPA中单细胞类型图谱提供了完整组织样本的单细胞可视化表示。
作为单细胞转录组学的互补,bulk RNA测序仍然是一种功能强大的工具,在人类基因组的所有蛋白质编码基因上提供了广泛的覆盖范围,因此还可以探索低丰度的基因。在公开可用的bulk转录组学工作中,值得注意的是基因型-组织表达(GTEX)项目和人类蛋白质图谱(HPA)。这些全面的项目已经描绘了两个主要基因类别:管家基因(不可或缺的通用细胞功能),以及组织特异性基因(负责独特的组织依赖性功能)。对组织特异性基因的探究阐明了不同组织内部展开的不同生物学过程,从而为组织发育、功能和疾病靶标提供了关键见解。
但是,尽管具有优点,但bulk转录组学还是有很大的缺点。它在组织样本中提供了无数细胞的平均基因表达,因此缺乏检测同一组织内不同细胞类型之间基因表达变化的分辨率。这忽略了对特定细胞类型表达的基因,因为它们的信号可以被合并的表达数据稀释或掩盖,尤其是当这些细胞类型(例如免疫细胞和成纤维细胞)在各种组织中无处不在。
最近,Shi等人提出了涉及主要人体组织和器官的蛋白质编码基因的单细胞全基因组资源(图1),并由bulk转录组学补充。使用组织合并策略对31个组织进行了全身细胞分类学分析,从而根据其细胞类型特异性对基因进行精确分类。还进行了对应组织的比较bulk转录组分析,以验证数据并系统地比较细胞和组织特异性转录本。所有分析结果都添加到了人类蛋白质图谱(www.proteinatlas.org)更新版本中。在每种细胞类型中表达的基因都可以在交互式UMAP图和条形图中探索,并与相应的人类组织中的免疫组织化学染色有关。此外,这些数据均可通过HPA下载,该数据可作为包括AI的高级单细胞数据分析的输入,以模拟人体不同组织和器官的单个细胞中的表达。
图1单细胞类型的转录图谱。A气泡图显示了15个细胞类型组中31个组织的细胞百分比。 B tSNE图显示了518个细胞类型簇的伪bulk转录组表达谱的相似性。 C聚类树图显示了81个单细胞类型的转录组水平相似性,其中分支之间的距离由Spearman的相关性决定
参考文献
[1] Shi M, Méar L, Karlsson M, Álvez MB, Digre A, Schutten R, Katona B, Vuu J, Lindström E, Hikmet F, Jin H, Yuan M, Li X, Yang H, Song X, Sjöstedt E, Edfors F, Oksvold P, von Feilitzen K, Zwahlen M, Forsberg M, Johansson F, Mulder J, Hökfelt T, Luo Y, Butler L, Zhong W, Mardinoglu A, Sivertsson Å, Ponten F, Fagerberg L, Lindskog C, Uhlén M, Zhang C. A resource for whole-body gene expression map of human tissues based on integration of single cell and bulk transcriptomics. Genome Biol. 2025 Jun 3;26(1):152. doi: 10.1186/s13059-025-03616-4.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-7-2 06:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社