张俊鹏
一份单细胞数据分析教程
2022-1-18 15:44
阅读:2371

写在前面

单细胞测序让我们能够在前所未有的精度水平下研究基因表达,该技术同时衍生了众多单细胞数据分析方法。目前单细胞数据分析方法繁多,如何从这些方法中挑选适用于用户自己的单细胞数据分析方法,成为了大家的关注点。基于此,本次推荐一份单细胞数据分析教程《Current best practices in single-cell RNA-seq analysis: a tutorial》(图1),虽然它发表于2019年,但是思路仍然值得借鉴。

 

image.png

1 单细胞数据分析教程论文

 

01

内容

本教程详细的介绍了典型单细胞数据分析的步骤,这些步骤包括数据预处理(质控、归一化、数据矫正、特征选择和降维)、细胞和基因水平的下游分析。基于独立比较研究,推荐每个步骤的最优方法,并且以工作流程的形式整合最优推荐方法。为了帮助用户理解这波操作,作者还提供了一个案例分析(图2 https://www.github.com/theislab/single-cell-tutorial)。

 

image.png

2 案例分析

 

02

典型单细胞数据分析流程

假设你手头上有一些单细胞测序数据,你想分析这份数据并且想从中得到一些信息。如图3所示,你可以参考这个典型的分析流程。该份流程主要就是数据预处理(质控、归一化、数据矫正、特征选择和降维)和下游分析(聚类分析、伪轨迹分析、差异表达分析、基因动力学、亚稳态分析、成分分析等)。你想做哪个,对应查看教程的方法和建议即可。

 

image.png

3典型单细胞数据分析流程

 

这里特别强调一下下游分析,该教程将下游分析主要分为细胞和基因水平。细胞水平的下游分析,研究对象主要是单细胞。围绕单细胞开展聚类分析、伪轨迹分析、成分分析、亚稳态分析、聚类注释和基因表达动力学。基因水平的下游分析,研究对象主要是基因。围绕基因开展差异表达分析、基因集分析和基因调控网络构建。对于细胞水平的下游分析,该教程忽略了细胞之间的通讯分析。另外,对于基因水平的下游分析,该教程忽略了基因模块分析。

image.png

4 细胞和基因水平的下游分析

 

后话

该教程可以作为典型单细胞数据分析的参考资料,哪里不懂查阅哪里。如果你要非典型单细胞数据分析,这个就要自己花更多的时间和精力才行。

 

参考文献与链接:

[1] Luecken MD, Theis FJ. Current best practices in single-cell RNA-seq analysis: a tutorial. Mol Syst Biol. 2019;15(6):e8746. doi:10.15252/msb.20188746

[2] https://www.github.com/theislab/single-cell-tutorial

 

更多背景知识如下:

1. 因果推理综述推荐一篇

2. 生物学家的机器学习指南

3. 基础模型的机遇与风险

 

号外,为了便于交流,我们为miRNA介导的ceRNA研究在Frontiers in Molecular Biosciences杂志( 2020_IF = 5.246)整了个专刊,主题为“Computational Identification of ceRNA Regulation”。投稿链接:https://www.frontiersin.org/research-topics/24340/

image.png

image.png


文献下载链接:

Current best practices in single-cell RNA-seq analysis-a tutorial.pdf


转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。

链接地址:https://wap.sciencenet.cn/blog-571917-1321588.html?mobile=1

收藏

分享到:

当前推荐数:2
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?