||
动态基因网络中模拟生物干预效应
真核细胞在其基础状态下的功能及其对环境变化的反应是一种动态现象,涉及多个参与者以多种水平的调节级联激活。细胞外信号后多个基因的顺序激活(转录反应)是这种反应的关键步骤。其中一些基因是转录因子,它们级联激活其他基因,特别是编码蛋白质的基因,这些蛋白质是适应初始信号的细胞反应的效应器。基因之间的这些不同相互作用可以用基因调控网络(GRN)来表示。
高通量测序技术(RNA-seq)的最新发展使得在细胞激活后的不同时间识别和量化这些相互作用网络中的各种参与者(信使RNA)成为可能。然后,这些测序数据(数据集)可用于推断底层动态基因相互作用网络的数学模型。从基因表达数据重建基因调控网络是一个困难且具有挑战的问题。提出了多种方法,这些方法可能会对推断网络的边缘给出不同的解释。这些方法可以分为三大类:(i)数据驱动方法,不模拟基因表达,只从相关或互信息等统计量来表示基因之间的相互作用;(ii)为基因表达指定参数分布的定量方法;(iii)机理方法,这是定量方法的特殊情况,其中模型定量地表示小子集基因(通常是基因对)之间相互作用的影响。
机理模型可能对生物相互作用有不同程度的描述,从现象学的、通常是间接的相互作用到基于基因调控的生物学理解的化学直接相互作用(例如因果网络)。高斯图模型及其变体是定量但非机械模型的典型例子。在高斯图模型中,基因网络中的边是无向的,该模型的特征是N个基因的平均表达式(µi)1≤i≤N的向量及其协方差矩阵(σij)1≤i,j≤N,如图1(a)所示。机理模型的范围可以从基于惩罚线性回归的简单模型到基于常微分方程的复杂模型或分段确定性模型。用于基因网络重建的其他标准机械模型类别是布尔网络和贝叶斯网络。在机理模型中,基因网络通常使用如图2(a)所示的有向图来表示。另一类流行的基因网络模型基于随机森林,但它们通常很难被解释为定量模型,因为它们只给出了基因之间相互作用的现象学表示。
图1 高斯图模型的示意图和基因1改变(敲除)的预测。每个节点对应一个从1到4标记的基因。(a)无变化:基因i的平均表达为µi,基因表达的协方差矩阵为(σij)1≤i,j≤4。(b)基因1敲除后:µ1和σ11设为0;预测问题相当于确定均值和协方差(µ′i)2≤i≤4和(σ′ij)2≤i,j≤4的新值
图2 机理模型的示意图和基因1改变(敲除)的预测。每个节点对应一个从1到4标记的基因。(a)不变:箭头表示一个基因对另一个基因的直接影响;它们编码了一个定量关系(此处未显示)。(b)基因1敲除后:预测的问题在于确定箭头及其编码的定量关系是如何被修改的
某些情况会改变基因的结构或表达。例如,在病理情况下,基因可能发生改变(突变、缺失……)并导致其表达丧失,导致细胞功能障碍和炎症性疾病或癌症的发展。在实验情况下,可以改变(抑制、减少或增加)参与相互作用网络的特定基因的表达,以便更好地表征其在细胞功能中的作用。这种实验性改变可以靶向特定基因的结构以调控(减少或增加)其表达,或者直接靶向抑制信使RNA(mRNA)的表达。这些方法为人类治疗应用带来了前景。
CRISPR/CAS9方法现在是改变基因结构最广泛使用的方法之一。这种方法源于某些细菌中发现的天然抗病毒防御机制。在病毒(噬菌体)感染后,这些细菌在其基因组中保留了这种病毒序列(CRISPR序列)的片段。在再次感染这种病毒后,病毒DNA被细菌CRISPR RNA(crRNA)识别。然后,这种crRNA与反式激活CRISPR RNA(tacrRNA)结合,并招募CAS9内切酶,这是一种切割病毒序列的酶,诱导其降解和消除病毒。基于这一机制,有可能合成靶基因特异性gRNA并将其与CAS9内切酶结合。在将这种分子引入真核细胞后,gRNA将内切酶导向靶基因以诱导其切割。在DNA修复机制中,引入了改变该基因序列的突变,从而可以特异性抑制该基因的表达。
一些方法直接针对GRN中特定基因的表达(mRNA)。这些方法也源于基因表达调控的生理机制和基于microRNA(miRNA)RNA干扰的天然细胞防御机制。当病毒RNA存在于细胞中时,细胞miRNA特异性地识别这些mRNA的序列。然后,miRNA与这些病毒RNA结合,募集RISC/AGO2分子复合物并诱导其降解。siRNA基因沉默方法使用相同的原理。在设计出针对要沉默的基因序列的20-24个核苷酸的合成siRNA后,将这种siRNA实验性地引入细胞。然后,这种siRNA与靶基因的mRNA转录物结合,招募RISC复合物,并利用细胞机制诱导靶RNA分子的降解。基于同样的原理,也可以使用shRNA沉默方法。在这种情况下,编码前shRNA的质粒被引入细胞,后者在细胞质中成熟为siRNA。然后,这种siRNA招募RISC复合物来降解其特定的靶RNA。
其他实验方法可用于增加细胞中特定基因的表达。例如,使用载体将重组DNA(基因序列)引入细胞以诱导该基因表达并使用细胞机制在该细胞中产生感兴趣的蛋白质的技术已在实验室中使用多年,适用于真核细胞。
因此,预测细胞对网络中基因改变的反应是至关重要的,以便更好地了解这些改变引起的病理发展,以及在生命(癌症)或遗传(先天性疾病)中获得的病理发展。基因改变模型也可用于实验设计,例如确定靶基因以获得某种生物效应或区分几种可能的基因网络。当遗传变异实验的数据可用时,这种变异的模型也可用于验证或改进初始模型和/或变异模型的统计估计。
基因改变的建模研究使用了各种各样的方法和模型,这些方法和模型都属于机理模型的框架(布尔网络、贝叶斯网络、线性回归模型、基于ODE的模型)。一些模型是静态的,或关注网络的稳态,或假设不同时间的数据是独立的。其他研究仅考虑了动力学模型中初始状态的改变。最先进的模型是那些考虑动态模型并考虑模型结构随时间变化的模型。
最近,Champagnat最近将动态基因网络定义为构建基因改变动力学模型的一般方法,这些模型适用于定量和机制设置,并且不限于初始条件的简单变化。设定了三个目标:i)了解基因改变如何改变细胞行为,ii)实验设计,iii)回答估计或验证等统计问题。在所谓的条件方法中,将改变定义为随机初始模型在特定事件下的概率延续。因此,例如,通过将其表达归零来考虑基因的总敲除。特别是,这种遗传改变将高斯图模型转化为另一个高斯模型,其平均值和基因表达之间的相关性可以明确计算出来,见图1(b)。在机理方法中,改变的形式是修改模型的参数,例如,基因的完全敲除会修改基因网络,如图2(b)所示。他们在第2节描述了条件和机理方法。他们从没有基因改变的数据集推断出的初始模型中预测基因改变的影响。在第3.1节中,首次将建模应用于最相关的改造实验的设计(根据一定的标准)。当基因变异数据集可用时,它用于估计描述变异的模型参数和/或改进初始模型参数的估计(第3.2节)。然后,在三类标准基因网络模型的框架内详细描述了这些方法:第4.1节中的一个定量但非机理模型示例:高斯图形模型。第4.2节中的两个机理模型示例:第4.2.1节中的贝叶斯网络,以及第4.2.2节中的惩罚线性回归模型。
参考文献
[1] Champagnat N, Loubaton R, Vallat L, et al. Modelling the effects of biological intervention in a dynamical gene network. arXiv preprint arXiv:2505.04266, 2025. https://doi.org/10.48550/arXiv.2505.04266
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-6-24 11:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社