zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

单细胞数据预处理和质控分析工具:popsicleR

已有 1215 次阅读 2023-4-7 09:51 |个人分类:科普|系统分类:科普集锦

单细胞数据预处理和质控分析工具:popsicleR 

不断增长的高维和复杂单细胞数据,迫切需要先进的计算专业知识,以有效地注释这些数据。与批量实验相比,由于单细胞数据集的固有异质性(实验协议和生物学背景方面有很大差异),其分析进一步复杂化。另外,软件工具之间有限的交互性和缺乏一致定义的标准程序,严重阻碍了通用处理方法的适用性,从而限制了分析任务的有效性和结果的可重复性。尽管付出了巨大努力,仍然迫切需要开发计算工具,交互式地指导用户进行数据处理分析。在单细胞测序数据(scRNA-seq)分析中,一个关键步骤是输入数据预处理和质量控制。因为在这个阶段,来自低质量细胞的信号、技术可能影响后续下游分析的变异被识别和删除。scRNA-seq数据的预处理和质量控制是一个费力的过程,需要结合不同的计算策略,并手动定义从特定质控度量指标的量化中派生的合适参数集。但考虑到scRNA-seq数据的异质性,在定义scRNA-seq数据预处理和质量控制的金标准方面尚未达成共识,这无疑增加了选择最优分析工作流的难度。 

基于以上现状,本次介绍了一个实用RpopsicleR(图1https://github.com/bicciatolab/popsicleR)。popsicleR整合了目前广泛使用的技术方法,并且可以交互式地执行scRNA-seq数据分析的所有主流预处理和质控步骤。该软件包由七个主要功能组成,能够进行质量控制度量探索、低质量细胞过滤、数据规范化、去除技术和生物学偏差,以及一些探索性分析(如差异表达基因的检测、细胞聚类和细胞注释)。popsicleR接受来自10X GenomicsCell Ranger文件或由任何微流控、微井板或基于液滴的scRNA-seq技术生成的特征条形码计数矩阵作为输入。在分析的每个步骤中,popsicleR交互式地指导用户,并能保存各种图,以及评估过滤和回归参数对细胞群识别和分类的影响。为了测试和说明popsicleR工具包的实用功能,案例数据使用人类早期肺腺癌样本的14,972个细胞的转录谱。具体分析结果可以参考文献[1],这里不赘述。

image.png

1 popsicleR工作流程 

参考文献

[1] Grandi F, Caroli J, Romano O, Marchionni M, Forcato M, Bicciato S. popsicleR: A R Package for Pre-processing and Quality Control Analysis of Single Cell RNA-seq Data. J Mol Biol. 2022; 434(11):167560. doi: 10.1016/j.jmb.2022.167560. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

 image.png




https://wap.sciencenet.cn/blog-571917-1383267.html

上一篇:生物网络融合方法:BIONIC
下一篇:分子组织生物学的空间组成
收藏 IP: 39.128.55.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 03:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部