DigNet:使用扩散生成模型从单细胞数据中识别基因调控网络
细胞转录状态由基因调控网络(gene regulatory network,GRN)控制,该网络由众多转录因子及其靶基因组成。GRN与其他调控元件协调,以动态和特定的方式调节细胞表型、身份和功能。这些复杂的调控结构对于揭示精确的基因表达路径以及为阐明多细胞生物的生理过程或疾病机制提供重要见解至关重要。目前,单细胞 RNA 测序(scRNA-seq) 技术提供了更精确的方法来分析高分辨率转录状态并描述不同细胞类型之间的差异。鉴于细胞异质性的重要性,人们自然而然地预期转录状态的变化将与细胞状态依赖性基因调控相互作用的变化相对应,而这不能表示为静态网络。由于单细胞分辨率下组织微环境的特异性和动态性、技术噪声和其他来源的影响,转录组基因表达水平可能与转录因子(transcription factor,TF)调控部分耦合,这对探索复杂的细胞景观构成了重大挑战。
从转录组数据推断基因调控是计算生物学中的关键挑战,它旨在揭示基因相互作用所固有的细胞动力学。在过去的几十年里,出现了许多从基因表达谱推断 GRN 的计算方法。这些方法包括基于相关性的网络、高斯图模型、基于树的集成管道、动态贝叶斯模型和基于深度学习的算法。尽管这些现有方法在从转录组数据推断 GRN 方面取得了一些进展,但它们主要集中在对单个基因与其多个邻居之间的调控关系进行建模。虽然这种方法可以捕捉到局部邻域的影响,但它在同时建模大量基因之间相互关联和共存的调控关系方面面临挑战。因此,衍生的网络主要由孤立的基因相互作用构建,缺乏对复杂调控机制的系统理解。这些限制破坏了在特定环境下从 scRNA-seq 数据重建 GRN 的准确性,并阻碍了现有方法解读复杂网络结构的能力。GRN架构(无论是全局还是局部)在复杂的生物系统中都至关重要,它可以揭示基本节点(例如高度连通的 TF)、关键调控模块,并阐明 GRN 如何适应细胞间变化和环境刺激。虽然先进的算法可以识别一些线性或非线性的调控关系,但它们主要集中在单个基因对的耦合上,很少考虑多个基因复杂的调控相互作用。
为了应对这些挑战,Wang等人引入了 DigNet(图1,https://github.com/zpliulab/DigNet),这是一种深度生成模型,能够从基因表达谱数据中直接得出负责转录状态的细胞特异性GRN。DigNet 的灵感来自蓬勃发展的生成技术。传统的生成模型通常在易于理解的欧几里得空间中进行,但很难准确捕捉基因之间复杂的调控关系。因此,DigNet 采用扩散模型框架,利用 scRNA-seq 数据将 GRN 结构嵌入到具有更广泛适用性的非欧几里得空间中,从而生成具有独特结构特征的稀疏网络架构。为了降低在非欧几里得空间中嵌入 GRN 的复杂性和增强模型的可解释性,DigNet 进一步使用仅包含二进制(“开”和“关”)状态的二进制离散表示对网络进行建模。这有效地确保了拓扑网络结构和底层生物特征的保留。
图1 DigNet 概述。它生成细胞特异性基因调控网络并从单细胞基因表达谱中提取差异网络结构。(A) 人类组织 scRNA-seq 数据的数据预处理。(B)DigNet 中跨时间的网络扩散去噪。(C)通过贝叶斯推理转换编码器导出的邻接矩阵,以预测后续时间的基因调控网络。(D)利用转换器根据当前时间信息对 scRNA-seq 数据的 GRN 进行编码。(C)和(D)中的程序在每个时间步重复 逐步对网络结构进行去噪。(E)纠正网络链接(删除 不正确的调控相互作用)并整合多个扩散生成的网络以产生最终的细胞特异性网络。(F)一旦使用 DigNet 从 scRNA-seq 数据中获得生成的网络结构,就可以执行多个下游分析来识别驱动细胞异质性的关键网络特征或指示癌症状态的生物标志物特征
DigNet 是一种生成模型,它同时深入研究基因之间复杂的调控关系。它强调 GRN 中的全局架构信息,并从 scRNA-seq 数据中生成相应的网络结构。作为一种高度适应性和灵活性工具,DigNet 仅需要单细胞基因表达谱即可从随机起点迭代生成 GRN。提取的GRN结构允许我们进行不同的下游分析,如不同的调控模块、通路和关键因子。涵盖最先进的 GRN 推理算法的全面基准评估强调了所提出的 DigNet 网络生成算法的稳健性和精确性。为了证明 DigNet的多功能性,作者们将其应用于揭示人类乳腺癌免疫反应的复杂调控景观。DigNet构建了免疫细胞特异性 GRN,并确定了乳腺癌样本和正常对照之间的差异网络。通过重新发现已知的关键调控关系并优先考虑以前未知的候选基因调控,DigNet 以差异性网络形式揭示了细胞功能差异,并证明了其在探索基于网络的生物标志物中的实用性。这些新的差异调控关系和相互作用因子为改进乳腺癌免疫反应的潜在机制提供了新视角,并为发现新的治疗靶点铺平了道路。
参考文献
[1] Wang C, Liu Z. Diffusion-based generation of gene regulatory network from scRNA-seq data with DigNet. Genome Res. 2024 Dec 18:gr.279551.124. doi: 10.1101/gr.279551.124.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1470143.html?mobile=1
收藏