||
scDown:单细胞数据下游分析流程
根据罕见病组织(NORD)数据库,超过 10,000 种罕见疾病影响着超过 3000 万美国人。由于这些疾病具有复杂且异质的细胞群体,因此往往缺乏有效的治疗方法。例如,肌萎缩侧索硬化症、间质性肺病和胶质母细胞瘤等罕见疾病涉及其细胞环境中各种细胞类型的复杂相互作用。随着单细胞 RNA 测序(scRNA-seq)技术的进步和测序成本的降低,scRNA-seq 已成为分析单细胞分辨率基因表达的最广泛使用的方法之一。这项技术越来越多地应用于以了解疾病病因,包括罕见遗传疾病。标准的 scRNA-seq 分析流程包括质量控制、读取与参考基因组的比对、归一化、降维、细胞聚类、细胞类型注释以及条件间的差异表达分析。然而,有意义的生物学见解通常需要进一步的下游分析,包括细胞比例差异分析以确定特定细胞类型在条件间是否存在差异丰度;伪时间分析以模拟细胞分化和发育过程;RNA 速度分析以根据剪接和非剪接转录本比例预测未来的细胞状态;以及细胞间通讯分析以推断细胞间信号网络。大多数项目需要多种分析才能完全解析生物学复杂性。
尽管针对这些分析存在多种工具,但执行它们需要用户安装、学习和整合多个软件包。为解决这一局限性,Sun等人开发了 scDown,这是一个 R 软件包 (图1,https://github.com/BCH-RC/scDown),它将四种广泛使用的下游分析方法集成到一个自动化的工作流程中。scDown 兼容在 Seurat 和 Scanpy 中分析的单细胞数据集,使研究人员能够在不同单细胞分析框架之间无缝切换。该软件包使用户能够在无需广泛的编程专业知识的情况下执行多种下游分析,使其成为单细胞研究社区的重要资源。此外,scDown 集成了多种先进工具,包括 scProportionTest,该工具用于量化两个生物学条件下每个聚类中细胞比例的相对差异;CellChat,该工具通过配体-受体相互作用推断和可视化复杂的细胞间通讯网络,从而提供对不同细胞类型、组织和疾病条件下细胞间相互作用的更深入见解;Monocle3 ,该工具通过在二维空间(UMAP 或 t-SNE)中识别基因表达变化来构建细胞轨迹和伪时间分析,使研究人员能够研究细胞分化和发育等动态生物学过程;以及 scVelo,该工具能够进行 RNA 流速分析,以预测细胞状态转换和未来状态,并用于可视化、轨迹推断和概率图抽象(PAGA),以探索 scRNA-seq 数据中的谱系关系、细胞分化和动态转换。通过自动化复杂的多步骤分析,并只需少量代码,scDown 显著减少了实验生物学家、临床医生和早期职业研究人员进行深入单细胞 RNA 测序分析所需的时间和精力。此外,它既兼容 Seurat 也兼容 Scanpy,促进了具有不同软件偏好的研究团队之间的合作,而不会影响可重复性或分析严谨性。
图1 scDown 流程图。scDown 流程整合了 scRNA-seq 数据的多种下游分析。它包括使用 Symphony 进行自动细胞类型注释、使用 scProportionTest 进行细胞比例比较、通过 CellChat 进行细胞间通讯分析、使用 Monocle3 进行轨迹推断以及使用 scVelo 进行 RNA 速度分析
参考文献
[1] Sun L, Ma Q, Cai C, Labaf M, Jain A, Dias C, Rockowitz S, Sliz P. scDown: A Pipeline for Single-Cell RNA-Seq Downstream Analysis. Int J Mol Sci. 2025 May 30;26(11):5297. doi: 10.3390/ijms26115297.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-8-6 13:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社