SigXTalk:细胞通讯诱发的串扰识别
细胞中的调控通路几乎单独起作用,串扰通常存在于多个通路之间。这样的串扰可能共享上游细胞通讯(CCC)信号,中间调控子(例如转录因子)和下游靶基因。通路之间的串扰可以用作信号转导的有用功能。例如,共享受体TGFBR1和TGFBR2可以激活Hippo信号传导和TGF-β信号传导,并且这些通路之间的激活和抑制是通过磷酸化或复杂调控机制进行的。不同的有丝分裂原激活的蛋白激酶(MAPK)通路可能使用常见的激酶蛋白(例如酵母中的Ste11或Ste7)。 Pax2在果蝇眼中的表达同时受到Notch和EGFR通路的调节,它们都无法单独激活共享靶基因。由于存在共享信号成分(SSC),因此在没有其自身信号的情况下,另一个通路的CCC信号可以激活一个通路,或者可能通过信号泄漏激活其他靶基因。因此,靶基因的表达模式受串扰的强烈影响(图1a),这通常会整合或重新分配来自CCC的信号。根据共享分子的规定,存在不同类型的串扰模块(图1b)。
细胞通讯的重建是分析串扰通路的第一步,并且已经开发了多种计算方法来使用单细胞RNA测序(scRNA-seq)数据进行CCC推断。例如,CellChat、Connectome和CellPhoneDB利用了给定的配体-受体受体(LR)相互作用数据库和基因表达数据,以估计通过给定LR对从发送细胞到接收细胞中CCC的概率或强度。辅助分子和亚基结构的信息整合,旨在提高CCC推断的准确性和可靠性。使用空间转录组学,可以通过考虑发送细胞和接收细胞之间的距离来改善CCC推理。例如,Giotto和SpaTalk假设CCC仅存在于发送细胞及其邻居之间,而SpaOTsc和COMMOT采用最佳transport方法来推断一定距离内单个细胞之间的CCC。
为了将CCC的下游基因纳入推理,已经开发出了几种方法来通过分析基因调控网络(GRN)来构建从发送细胞中的配体中的更全面的调控景观,以构建接收细胞中基因的靶基因。但是,CellCall和scSeqComm包括转录因子的活性,并将CCC连接到细胞内通路,但没有表征调控通路到个体靶基因。GRN推理方法,例如GRNBoost2、SCENIC、LEAP、GRISLI、Scribe和GENELink,使用统计,拟时序或深度学习技术预测了一组基因(尤其是TF及其相应靶基因)内的所有可能调控关系。NicheNet和CytoTalk等方法使用统计方法来识别活化的LR对,并测量其对接收细胞中靶基因的影响。StMLnet、Misty和HoloNet通过限制在一定空间距离内的信号分子的相互作用,将scRNA-seq数据与空间转录组学进一步整合,以改善LR-TG关系的预测。
但是,现有方法仅限于根据用户的特定选择来测量CCC信号和靶基因之间的直接和成对相互作用,而缺乏对多个CCC信号和多个靶基因之间细胞内信号转导的系统分析。最重要的是,当前方法不包含可能导致多个信号通路调控因子的潜在串扰。虽然某些方法,例如BPLN、XTALK和MUXTALK,使用了给定的细胞信号通路数据库,并采用了基于网络算法和统计检验来识别通路之间的重要串扰,但这些方法不包括单细胞表达数据,无法提供细胞特异性串扰。
给定scRNA-seq数据集,是否可以识别多个CCC信号通路的共享调控因子或靶标?当它们之间存在串扰时,如何量化接收细胞中通路的调控强度?当目标基因受多个通路调控时,这些通路对靶基因表达的相对贡献是什么?当CCC信号通过不同的通路调控多个靶基因时,如何分配给每个目标基因的调控效应?这些问题可以用作“忠诚问题”和“特异性问题”(图1c)。Hou等人介绍了通路忠诚度和特异性的概念,这些概念衡量了CCC信号和靶基因之间的“选择性”:通路的忠诚度反映了其通过不打算为其提供的CCC信号来防止其激活靶标的能力,而特异性则表明该通路可以避免使用其自身CCC信号激活非靶标的能力。以前,使用简单的数学模型,已经探索了各种机制来分析信号特异性和忠诚度。例如,诸如阻止通路和空间隔室之间的潜在串扰之类的绝缘机制已被证明可以保持高水平的忠诚度和多种通路的特异性。
为了利用单细胞基因表达数据,Hou等人最近开发了SigXTalk(图1,https://github.com/LithiumHou/SigXTalk),这是一种使用忠诚度和特异性概念在多个CCC通路之间分析串扰的计算方法。通过对基因相互作用的先验知识,SigXTalk采用了专门的超图学习框架来识别串扰通路,并使用基于树的机器学习方法进一步衡量其忠诚度和特异性。基准和对各种单细胞基因表达数据集的应用表明,SigXTalk在系统分析CCC信号与通过串扰连接的靶基因之间关系的能力和可靠性。
图1 SigXTalk概述。a受体接收来自发送细胞的细胞通信(CCC)信号,从而触发一系列细胞内调控通路。如果这些通路具有共同信号、SSC或靶基因,则具有串扰。b 根据路径共享信号、SSC或靶基因,确定并分类串扰模块。c提出了忠诚问题和特异性问题,以研究信号和靶标的调控选择性;d识别活性调控通路的工作流程。进行CCC分析以识别活化受体作为信号。然后,采用了一个超图表示学习框架来生成基因的低维特征并测量通路的激活概率。e串扰通路的识别和定量。通路调控强度是通过使用激活通路拟合SSC目标对的激活评分来估计的,并且使用其所属的串扰模块中通路的PR比例来计算忠诚度和特异性值
参考文献
[1] Jiawen Hou, Wei Zhao, Qing Nie. Dissecting crosstalk induced by cell-cell communication using single-cell transcriptomic data. bioRxiv 2025.05.31.657197; doi: https://doi.org/10.1101/2025.05.31.657197
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1491381.html?mobile=1
收藏