GLACIER:解码空间细胞拓扑的因果驱动因素
多细胞生物依赖于在多个空间尺度上展开的精确协调的细胞间相互作用,包括直接、短程相互作用和间接、远程通信。例如,细胞通过释放配体分子直接相互交流,配体分子与相邻细胞上的受体结合,引发即时的信号变化。更广泛地说,转录因子(TF)可以启动跨细胞邻域级联的调控程序,并导致组织更大结构域中基因表达程序的协调变化。了解这些空间编码的细胞相互作用对于解码许多基本生物学过程至关重要,包括组织发育、免疫反应、伤口愈合和癌症发展。
空间转录组学(ST)的最新进展为表征组织中细胞与细胞的相互作用提供了前所未有的潜力。与传统单细胞RNA测序(scRNA-seq)不同,它在测量前会解离细胞并丢失空间信息,ST技术可以测量基因表达和组织切片中单个细胞的空间位置。然而,从当前的ST数据集推断细胞相互作用存在两个关键挑战。首先,ST数据中的转录计数非常稀疏,很难可靠地估计基因表达中的短程局部相关性。例如,Slide-SeqV2和Stereo-seq等全转录组技术测量每个细胞少于500个唯一分子标识符(UMI)的中位数。其次,更根本的是,了解细胞如何在长尺度上进行交流需要了解组织的全局几何形状和沿其的空间轴。
目前从ST数据推断细胞或调控相互作用的计算方法并没有利用全局组织。几乎所有的方法都通过细胞-细胞邻接图表示这些局部关系,隐含地假设:相邻细胞之间的一致相互作用沿着这种邻接图的边寻找相关的TF基因或配体受体表达。然而,这种过于简单的观点未能捕捉到细胞间信号如何在由组织结构决定的特定方向上传播。例如,内皮细胞沿着组织细胞骨架定义的路径进行交流,而Notch信号通路在发育过程中沿着特定的空间轴双向运作。因此,准确推断细胞相互作用需要整合全局组织结构的样本,以了解基因表达变异的方向性。
GASTON通过从ST数据中学习组织的“地形图”来满足这一需求。该图由一个称为“等深度”的空间坐标定义,该坐标在整个组织切片中全局变化,并测量基因表达最大变化的方向。它允许通过将组织结构化为层次框架来推断定向细胞间的作用。这种方法有助于区分局部相互作用和由全局组织拓扑决定的更广泛的调控信号。在小鼠小脑中,GASTON成功地揭示了离散的细胞结构域(层)和基因活性的连续梯度,提供了该组织中空间基因表达的第一个全面图谱。然而,GASTON模型分别独立地模拟了基因在等深度坐标上的变异,并没有解释基因-基因相互作用,因此从ST数据中推断细胞通讯和调控关系的挑战仍然存在。
最近,Shankar等人介绍了空间格兰杰因果关系,这是一种从ST数据中学习细胞间相互作用的全新方法。关键的见解是,GASTON的等深度捕获的组织组织创建了信息流的自然方向,可以表示为有向无环图(DAG)。虽然经典的格兰杰因果关系要求数据遵循线性时间序列,但最近的进展使格兰杰因果关系能够对由DAG表示的偏序进行推断。在此基础上,Shankar等人提出了GLACIER(Granger-Led Analysis of Cellular Isodepth and Expression Regulation)方法(图1,https://github.com/rohitsinghlab/glacier),它将 GASTON的全局空间坐标与Velorama基于DAG的非线性Granger因果关系相结合,以确定沿空间轴传播的 TF基因和配体-受体关系。GLACIER系统地捕获了调控信息如何通过组织结构流动,从而实现了细胞信号相互作用的定向推断。应用于小鼠小脑的Slide-SeqV2数据,GLACIER识别出层内的双向转录程序,揭示少突胶质细胞主要在一个方向上调控神经元的连接。在颗粒层和浦肯野-伯格曼层之间的边界处,GLACIER报告的调控活动与单独观察到的任何一层都不同,这表明层间通信是通过专门的机制而不是简单的梯度进行的。这些发现表明,将空间组织与因果推理相结合可以揭示组织结构和细胞通信的基本原理。
图1 (A)GLACIER的输入是来自二维组织切片的空间转录组学(ST)数据,由测量细胞的空间位置和基因表达矩阵组成。(B)GLACIER首先学习由等深坐标定义的组织切片的地形图,并使用地形图形成空间DAG。GLACIER然后执行有向无环图(DAG)结构的格兰杰因果推理。(C)GLACIER的输出是细胞相互作用:转录因子(TF)对靶基因具有格兰杰因果关系,配体基因对受体基因具有格兰杰因果效应
参考文献
[1] Prannav Shankar, Huan Liang, Uthsav Chitra, Rohit Singh. Decoding the causal drivers of spatial cellular topology. bioRxiv 2025.03.19.644241; doi: https://doi.org/10.1101/2025.03.19.644241
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1481329.html?mobile=1
收藏