zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

单细胞RNA测序数据可视化工具比较

已有 1539 次阅读 2023-3-20 22:00 |个人分类:科普|系统分类:科普集锦

单细胞RNA测序数据可视化工具比较

在短短十余年时间里,由于测序协议的出现,每个单细胞测序实验中表征的细胞数量从约1000个细胞增加到数百万个细胞。同时,许多计算方法也被开发出来用于分析和量化单细胞测序数据。典型的单细胞测序分析管道从原始读取开始,对其进行处理以创建一个表达矩阵,其中包含每个细胞中每个基因的表达值。进一步进行细胞聚类和簇特异性标记基因鉴定,并且注释细胞类型。然后使用非线性嵌入方法对结果进行可视化,例如tSNEUMAP。可视化通常在二维(2D)空间中,每个细胞获得一对X-Y坐标以定义其在可视化图上的位置。最后,通过突出显示细胞元数据(给定实验中关于细胞的信息,例如批量、供体等)或跨细胞类型的特定基因表达,用于评估获得的细胞类型。这种评估只能以交互的方式进行。然而,当结果以报告形式共享或以论文格式(静态2D图像)发布时,只能看到与单个基因和单个细胞元数据相对应的分析快照。最近,以交互方式分析和可视化数据的能力吸引了很多人的注意。网络技术的进步导致了多种工具的发展,通过网络界面共享分析结果。

本次介绍的文献《Comparison of visualization tools for single-cell RNAseq data》试图概述一些目前可用的工具,以帮助研究人员选择数据可视化的方法。在单细胞测序可视化的广阔领域中,首先考虑了13个流行的交互式分析和可视化工具,并概述了它们的特性。然后,选择能够提供网络共享功能的工具,并通过它们在不同大小数据集(5000200万个细胞)上的性能来相互基准。另外,作者们还评估了这些工具的用户体验特性。最后,由于所有工具都有不同的输入要求,作者们开发了一个Rsceasyhttps://github.com/cellgeni/sceasy),用于灵活地将一种数据格式转换为另一种格式(这也是这个工具包的重要特性)。

13种流行的单细胞测序分析和可视化工具有ASAPBioTuring Single Cell Browser (Bbrowser)cellxgeneGranatumiSEEloom-viewerLoupe Cell BrowserSCopescSVAscVISingle Cell ExplorerSPRINGUCSC Cell Browser。图1从云和web支持、容器化、支持的输入格式和开发人员活动方面比较了这些可视化工具。 

image.png

1 可视化工具及其功能概述 

单细胞测序数据的大小和容量在过去十年中呈指数级增长,这为科学发现和理解开辟了新的途径。科学家们需要将他们的数据传达给合作者和同事,以便快速和容易地进行探索。理想情况下,应该从数据接收者那里消除计算资源和生物信息学技能的负担。 

单细胞交互分析和可视化工具已被研究界广泛采用。它们使数据导入、公共数据访问和分析对用户来说更加容易,并加速了科学的发展。此外, 由于最近网络技术的进步,现在有一些工具(1中那些具有Web共享功能的工具)允许用户在网络上托管和共享他们的单细胞测序数据可视化。这使得以用户友好的方式与他人共享分析结果成为可能,从而实现更快的科学开发。单细胞测序数据的高复杂性和维数只能通过全面的、交互式的和用户友好的工具来显示,这些工具可以通过网络提供可共享的可视化。

单细胞测序技术仍在快速发展中,预计数据集大小(每个数据集的细胞数量)在未来几年将进一步增长。相对于细胞计数,工具必须适合线性或次线性内存使用量的这种增长。为了保持竞争力,其他工具将不得不进行调整和优化。优化的一种方法是添加与HDF5格式的集成。一种更简单的方法是以随机方式选择一小部分细胞,对数据进行低采样。大多数工具都支持此功能。当进行低采样时,重要的是要确保稀有细胞群没有被移除。其中一种方法是几何素描—一种在保留罕见细胞状态的同时对大量单细胞测序数据集进行子采样的方法。 

此外,通过使用3D图而不是2D或使用虚拟现实来丰富可视化。三维可以分辨二维中看不到的细胞类型。虚拟现实可以在同一个VR空间中支持多个嵌入,从而可以直接进行比较。 

文献《Comparison of visualization tools for single-cell RNAseq data》代表了一个快速发展领域的快照,工具将会赶上或退出竞争,新的工具也将会出现。设计人员和开发人员不仅需要考虑可视化的效率和可伸缩性,还需要考虑可以丰富数据可视化并提供更科学见解的附加功能。一个例子是将数据集与公共单细胞测序数据进行用户友好的集成。这已经在商业产品中发生了,例如,Bbrowser为选定的细胞群提供了基于公开可用数据的细胞类型建议。它还提供了从与所选细胞相似的公共数据中搜索特定细胞的能力。值得注意的是,命令行工具具有完全相同或类似的功能。然而,将这一功能放在一个交互式的用户友好界面中,可以在整个研究界共享和探索结果,进而促进科学进步。 

参考文献

[1] Cakir B, Prete M, Huang N, van Dongen S, Pir P, Kiselev VY. Comparison of visualization tools for single-cell RNAseq data. NAR Genom Bioinform. 2020;2(3):lqaa052. doi: 10.1093/nargab/lqaa052. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

 

image.png




https://wap.sciencenet.cn/blog-571917-1381215.html

上一篇:AgeAnno:人类衰老单细胞注释知识库
下一篇:单细胞数据融合方法:SCALEX
收藏 IP: 39.128.55.*| 热度|

1 李升伟

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 07:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部