张俊鹏
cellSight:使用单细胞数据刻画细胞动力学
2025-6-17 21:13
阅读:459

cellSight:使用单细胞数据刻画细胞动力学 

高通量单细胞技术的出现已经产生了前所未有的生物学数据量,在处理、分析和解释细胞异质性和动力学方面引起了重大计算挑战。单细胞基因组学领域强调了对能够处理复杂数据分析的复杂计算工具的需求,尤其是在理解细胞异质性及其时间动力学方面。最近在单细胞方法中的技术进步进一步扩大了计算需求,该方法可以在单个实验中生成数千到数百万个单个细胞的数据。 

单细胞分析的计算复杂性超出了数据量,当前的分析管道必须应对多个挑战,包括批处理效应、降维、特征选择和细胞类型识别。传统的计算方法通常依赖于手动质量控制(QC)步骤和差异表达分析,这些分析在计算上是密集的,容易发生可重复性问题和人为错误。这些挑战由于单细胞数据的高维特性而变得更加复杂,其中每个细胞的特征是成千上万个基因的表达水平。 

为了应对这些计算挑战,最近Chatterjee等人介绍了cellSight(图1https://github.com/omicsEye/cellSight),这是一种创新的自动化计算框架,专门设计用于处理单细胞数据分析的复杂性和规模。cellSight集成了用于数据处理、可视化和解释的最新计算方法。cellSight体系结构的核心是其可靠的QC管道与统计建模和差异表达分析相结合,考虑了通用的线性和广义线性模型,强调了间隔数据中零通胀的作用。该结果用于管道中,分析稳态期间的细胞通讯网络。 

image.png

1 用于转录分析的单细胞分析管道。(A)单核RNA表达热图在单个细胞之间显示基因表达模式。(B)质量控制基于主要组件,以区分可行的细胞和不可靠的数据点。(C)通过典型相关分析(CCA),合并参考和查询数据集以识别常见的单细胞人群的数据集集成。(D)高维聚类可视化显示了带有注释的标签(例如,内皮细胞和成纤维细胞)在上一步中产生的不同细胞类型群体。(E)下游分析以及通过箱型图和热图可视化的疾病状态的重要性。(FcellSight工作流程:数据归一化和集成、聚类注释、差异表达、(Tweedieverse)、轨迹分析(MonoCle3)、通路分析(OmePath)和细胞相互作用(CellChat 

cellSight代表了计算生物学的重大进步,提供了一种自动化的端到端解决方案,该解决方案涉及单细胞分析中的关键计算瓶颈。该框架结合了处理大规模数据集的并行处理能力和优化算法,同时保持统计严格和生物学相关性。通过使复杂的计算任务自动化,cellSight不仅提高了单细胞分析的效率,而且还提高了可重复性并减少了计算空间。 

为了验证该计算框架,作者们将cellSight应用于两个不同的数据集:小鼠皮肤损伤模型和皮肤老化研究。cellSight自动化管道成功地重现了皮肤老化研究中的发现,同时对小鼠损伤模型中愈合过程中成纤维细胞的作用产生了新的见解。这些结果证明了cellSight计算方法在处理不同生物学环境中的鲁棒性和多功能性,同时保持计算效率。 

参考文献

[1] Ranojoy Chatterjee, Chiraag Gohel, Brett A Shook, Ali Rahnavard. cellSight: Characterizing dynamics of cells using single-cell RNA-sequencing. bioRxiv 2025.05.16.654572; doi: https://doi.org/10.1101/2025.05.16.654572 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 

转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。

链接地址:https://wap.sciencenet.cn/blog-571917-1490196.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?