zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

scMayoMap:单细胞RNA测序数据的细胞类型注释工具

已有 847 次阅读 2024-2-16 09:16 |个人分类:科普|系统分类:科普集锦

scMayoMap:单细胞RNA测序数据的细胞类型注释工具

在多细胞物种中,组织由不同的细胞类型构成,支持高度特定的功能。单细胞测序(scRNA-seq)技术的发展增强了我们了解这些单个细胞分子谱的能力,使我们能够研究发育、衰老、健康和疾病背景下复杂组织的异质细胞组成。在scRNA-seq数据分析中,细胞类型标注是一个关键步骤,可以在有足够知识的情况下手工完成,但费时费力。为了实现自动细胞注释,已经开发了计算工具来注释细胞或细胞簇。细胞注释方法,如SingleCellNetSingleRscmapAzimuth,基于预注释的scRNA-seq数据集作为参考或训练数据集,为单个细胞分配细胞身份。然而,精确的注释参考数据并不总是可用的。其他工具,如SCINACellAssign,根据已知的标记基因分配细胞类型,但它们可能容易受到所使用标记的偏差的影响。此外,也有一些基于深度学习的,如scDHAscBalance,但也需要参考数据。

在某些情况下,注释工具附带单细胞标记数据库。例如,scCATCH结合CellMarkerMouse Cell Atlas (MCA)CancerSEACD Marker Handbook等数据库建立了参考数据库“CellMatch”SCSA整合了CellMarkerCancerSEA的数据库。其中一些数据库(MCA)来源于scRNA-seq数据的差异表达分析。其他专家管理的数据库(例如,PanglaoDB)是从数千篇已发表的研究中手动管理的。标注的准确性很大程度上取决于标记基因数据库的信息量和全面性。到目前为止,现有的数据库还没有广泛覆盖组织类型和细胞类型,具有良好的特异性。这些障碍对于刚进入scRNA-seq领域或对相关组织和细胞类型的背景知识有限的研究人员来说是具有挑战性的。 

为了获得更好的细胞类型标注结果,Yang等人整合并改进了现有的scRNA-seq标注数据库,创建了一个名为scMayoMapDatabase(图1)的新数据库。同时,开发了一个新的注释工具,scMayoMap(图2https://github.com/chloelulu/scMayoMap)。与它自己的数据库一起,scMayoMap提供简单、快速和准确的单细胞类型注释,而不需要提供单细胞类型标记或预注释的单细胞参考数据集。 

image.png

1 scMayoMapDatabase摘要。A scMayoMapDatabase包含28种组织和340种细胞类型,适用于人和小鼠。每个组织中细胞类型的数量用括号标记。B scMayoMapDatabase与其他公共数据库的比较。左面板显示细胞类型信息,右面板显示每个数据库中的组织信息 

image.png

2 scMayoMap工作流。scMayoMap是在下游进行预处理、聚类、聚类标记识别。它将集群标记基因列表作为输入,并以图和映射的基因列表的形式返回细胞类型预测结果 

参考文献

[1] Yang L, Ng YE, Sun H, Li Y, Chini LCS, LeBrasseur NK, Chen J, Zhang X. Single-cell Mayo Map (scMayoMap): an easy-to-use tool for cell type annotation in single-cell RNA-sequencing data analysis. BMC Biol. 2023 Oct 20;21(1):223. doi: 10.1186/s12915-023-01728-6.    

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

 

image.png

 



https://wap.sciencenet.cn/blog-571917-1421820.html

上一篇:scGeneRAI:可解释人工智能的单细胞基因调控网络预测
下一篇:STIGMA:单细胞组织特异性基因优先排序
收藏 IP: 39.128.54.*| 热度|

1 孙颉

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-3 02:06

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部