zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

TACIT:空间多组学细胞类型和状态反卷积

已有 633 次阅读 2025-7-28 15:09 |个人分类:科普|系统分类:科普集锦

TACIT:空间多组学细胞类型和状态反卷积 

空间生物学的重点是对天然环境中细胞类型及其相关细胞状态的空间分布和关系的准确理解。通过快速扩展和成熟的单细胞和空间多组学技术,包括转录组学和蛋白质组学的既定方法以及空间表观基因组学、代谢组学,B细胞和T细胞受体测量,可以加深细胞相互作用和生物通路的理解。识别新的细胞类型可以用作靶标以改善疾病治疗和精准诊断。 

当前的空间生物学时代通过单细胞和亚细胞分辨率和多组学技术表征,即使是单个组织上的模态,也可以使用更先进的尺度和多模态工具。在支持多重成像数据分析的多步生物信息学工作流程中,识别细胞类型及其细胞状态仍然耗时和信噪比影响。空间生物学领域的下一个创新应考虑规模和标准化,进而测定物种、器官和疾病的模式解决这些问题。 

scRNA-seq分析中常用的传统无监督聚类方法是通过基于整个面板标记物谱的整体相似性来划分细胞。它们的效果在很大程度上取决于区分细胞群体的丰富标记物,这是单核测序数据中常见的特征。但是,在处理预定义的标记面板和细胞类型时,会产生一个重大挑战。这个稀疏的标记集通常只有一种方式,缺乏将嵌入式特征空间中预期细胞种群分开的能力,这为无监督聚类带来了强大的障碍,即无法检测所有细胞类型,尤其是稀有细胞类型。即使具有广泛的参数调整与多步聚类结合在一起以识别感兴趣的细胞群体,所需的结果仍然难以捉摸。深度学习算法越来越多地用于空间组学的细胞类型识别,但是它们需要全面而多样化的训练数据,以提高其准确性和适用性,以及处理空间多组学的复杂性。 

为了应对这些挑战,Huynh等人开发了TACIT(从多重成像数据中基于阈值分配细胞类型,图1https://github.com/huynhkl953/TACIT),这是一种基于细胞标记物表达曲线分配细胞类型的无监督算法。 TACIT使用多步机器学习方法将细胞分组为种群,最大程度地基于空间转录组学和蛋白质组学数据来最大化预定义的细胞类型特异性知识。使用来自人和小鼠的大脑,肠道和腺体组织的五个数据集进行了针对专家注释和可用算法的验证,TACIT在准确性和可扩展性方面的表现优于现有的三种无监督方法。它还整合了细胞类型和状态,以揭示不同免疫介导的外分泌病中的新细胞关联。此外,在进行的同一样本的空间转录组学和蛋白质组学实验中,发现TACITRNA和蛋白质细胞类型一致性达到了81%的置信度。因此,进一步证明了通过多模式分析来支持TACIT转化和临床研究。 

image.png

1 TACIT一般工作流程。多重成像同时采用空间蛋白质组学(顶部)和空间转录组学(底部)。分割(b顶)后,生成一个CellXFeature矩阵(c)。层次细胞类型结构(b底部)是根据面板设计,专家知识和scRNA-seq标记匹配制定的,从而产生了CellTypeXMarker矩阵(c)。细胞由基于社区的Louvain算法组织成微量群体(MCS),平均占人群的0.1-0.5%(d顶部)。然后,这些矩阵用于计算跨细胞(D底部)的所有细胞类型的细胞类型相关性(CTR)分数。如果多个(e)符合一个阈值或混合,则建立最佳阈值以分类细胞。阈值推导扩展到所有MC的有序中位数CTR分数的分段回归,以识别断点(fg),定义低相关组(LRG高相关性组(HRGh)。确定的CTR阈值最大程度地减少了478 MC中的分类误差,从而区分了LRGHRGij)。阈值以上的细胞在UMAP上以红色突出显示,而下面的细胞为灰色(k)。在确定了所有CTR的阈值之后,仅符合一个阈值的细胞被归类为干净细胞,而符合多个阈值的细胞被归类为混合细胞l)。具有所有功能的UMAP在两种不同的细胞类型(m-左上)之间没有明显的分离;但是,当仅在UMAP嵌入中使用相关特征(m-右上)时,就会出现清晰的隔离。混合身份通过分析其K-nearest邻居(m-底部)内的细胞类型模式来解决。通过热图进行验证,将平均标记和细胞类型值与CellTypeXMarker矩阵(n)以及计算每种细胞类型(n)的富集分数进行验证。 UMAP图说明了与细胞类型注释(o最高右)和细胞类型簇(o底部左侧)的连接,结合细胞类型和状态分析(o底部)的空间分布 

参考文献

[1] Huynh KLA, Tyc KM, Matuck BF, Easter QT, Pratapa A, Kumar NV, Pérez P, Kulchar RJ, Pranzatelli TJF, de Souza D, Weaver TM, Qu X, Soares Junior LAV, Dolhnokoff M, Kleiner DE, Hewitt SM, da Silva LFF, Rocha VG, Warner BM, Byrd KM, Liu J. Deconvolution of cell types and states in spatial multiomics utilizing TACIT. Nat Commun. 2025 Apr 21;16(1):3747. doi: 10.1038/s41467-025-58874-4. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://wap.sciencenet.cn/blog-571917-1495543.html

上一篇:转录组数据大规模基础模型
下一篇:单细胞组学时代的细胞本体
收藏 IP: 39.128.48.*| 热度|

1 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-8-2 16:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部