||
scTWAS Atlas:单细胞全转录组关联研究知识库
全转录组关联研究(Transcriptome-wide association study,TWAS)已经成为一种有效的基因优先排序方法,通过整合eQTL数据和全基因组关联研究(genome-wide association study,GWAS)数据,促进了性状相关基因的鉴定。 它解决了通过直接利用遗传变异和基因表达以及相关基因和性状之间的调控关系来解释非编码区GWAS变异的挑战。近年来,TWAS已被广泛应用于识别与各种疾病或性状相关的众多重要基因,包括人体各器官系统的复杂疾病、生理测量等。基于这些数据和信息,已经开发了几个有用的数据库来存储和整合TWAS数据和知识,如面向数据的TWAS-hub(http://www.twas-hub.org/)和webTWAS,分别包含75,591和235,064个基因-性状关联,以及面向知识的TWAS Atlas,从文献中收集了401,266个高质量的TWAS关联,并提供了变异基因-性状关系的交互式知识图谱。Li等人对23种主要癌症类型进行了选择性聚腺苷化(APA) TWAS结果,以鉴定APA介导的肿瘤易感基因,并将这些数据整合到公共数据库中心TCGD中。
尽管TWAS被广泛使用,但其分析主要集中在bulk组织水平,即在整个组织中平均转录组数据。这种方法忽略了不同细胞类型之间基因表达的可变性,可能导致基因调控表达预测的准确性降低和疾病关联的模糊。因此,scTWAS正在被开发以揭示基因表达与细胞水平性状之间的关系。scTWAS有可能预测单个细胞类型水平上的基因表达,并计算每种细胞类型的关联,从而提供细胞类型特异性的TWAS关联。建立scTWAS分析的表达预测模型有几种方法。最常见的程序包括使用配对的基因型和单细胞转录组数据训练细胞类型特异性表达预测模型。另一种方法是利用单细胞表达定量性状位点(sc-eQTL)汇总统计来构建表达预测模型,这可以整合大规模的sc-eQTL汇总统计数据,提高模型的有效性。此外,另一种方法是在模型训练之前对bulk表达数据进行反卷积,这种方法依赖于先进的反卷积技术,可以使用丰富的转录组数据。
最近的scTWAS研究发现了外周血、乳腺和脑组织中特定细胞类型中调节的各种性状和基因之间的联系。scTWAS研究的优势在于鉴定在特定或次要细胞类型中具有非关联效应的基因,提高我们对细胞类型特异性基因调控对性状的理解。例如,Song等人在上皮细胞中发现了乳腺癌相关基因,而上皮细胞被认为是乳腺组织中次要的细胞类型。此外,通过训练细胞类型感知表达预测模型,scTWAS可以揭示隐藏在bulk水平TWAS结果中的不同细胞类型的潜在相反功能效应。此外,scTWAS表明某些细胞类型和细胞类型特异性靶基因在生物过程中特别重要,这有助于精准的药物开发。例如,Zeng等人在神经元和其他细胞类型中发现了新的抑郁相关基因,扩大了对抑郁病理的理解,超越了传统的兴奋性神经元研究。
尽管单细胞转录组关联研究的出现和潜在的发展,必须建立一个数据库平台来存储,整合和分析这些数据。为了应对这一挑战,Mai等人开发了scTWAS Atlas(图1,https://ngdc.cncb.ac.cn/sctwas/),这是一个集成了文献管理和数据分析的scTWAS数据库。基于sc-eQTL汇总统计数据的出现,scTWAS Atlas建立了使用sc-eQTL和GWAS汇总统计数据进行scTWAS分析的标准化流水线。scTWAS Atlas具有用户友好的设计,目前包含广泛的数据资源,包括2,765,211个关联,涵盖34个性状、30种细胞类型、9种细胞状态和16,470个基因。它提供了五个不同的探索模块:浏览、搜索、可视化、分析和下载。这些功能旨在满足研究人员的不同需求,从数据探索到假设生成和验证,确保舒适高效的用户体验。
图1 scTWAS Atlas设计框架。scTWAS Atlas收集了来自出版物管理和统一分析管道的关联。它提供了浏览、搜索、可视化和分析scTWAS关联数据的多个功能模块
虽然scTWAS Atlas当前版本中收集的数据是有限的,并且一些scTWAS研究的分辨率在scRNA- seq水平上并不标准。随着scTWAS研究的进展,scTWAS Atlas将扩展到涵盖更广泛的跨不同组织、细胞类型和细胞状态的高分辨率scTWAS关联。这种扩展将使研究人员能够发现以前隐藏的关联,并展示细胞类型特异性遗传变异如何影响各种生物学背景下的表型。此外,实施先进的scTWAS方法,如EXPRESSO和其他创新方法,将显著提高识别细胞类型特异性TWAS关联的准确性。 此外,scTWAS Atlas未来将提供补充的分析功能,包括TWAS基因的共表达网络分析,以深入研究多个TWAS基因在细胞类型中的相互作用和联合效应。共定位分析的引入将通过检查与基因表达和性状相关的遗传位点之间的重叠来验证TWAS的关联,从而确认观察到的TWAS关联的生物学相关性,并消除潜在的混杂因素。此外,scTWAS Atlas还将开发一个在线工具,供用户上传他们的统计数据和实施scTWAS分析,提高scTWAS Atlas的用户体验和实用性。
参考文献
[1] Mai J, Qian Q, Gao H, Fan Z, Zeng J, Xiao J. scTWAS Atlas: an integrative knowledgebase of single-cell transcriptome-wide association studies. Nucleic Acids Res. 2024 Oct 18:gkae931. doi: 10.1093/nar/gkae931.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-4 10:48
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社