||
CAR-NET:整合转录组数据和先验信息推断ncRNA调控网络
非编码RNA(ncRNA),包括长非编码RNA(lncRNA)、微小RNA(miRNA)、小核RNA(snRNA)等,是在多个水平上控制基因表达的关键调控因子。与蛋白质编码基因相比,ncRNA通常研究不足。揭示ncRNA如何调控其靶基因以及它们产生的复杂调控网络,可以更深入地了解ncRNA对生命的调控机制及其在发育过程和疾病中的作用。基因调控网络(GRN)已被广泛用于模拟基因与其调控因子之间的复杂相互作用。然而,目前对GRN的研究主要集中在转录因子和基因之间的相互作用上,很少有方法专门用于模拟ncRNA基因调控关系和相关网络,这使得系统生物学中不可或缺的组成部分变得神秘。
研究人员通常将数据驱动的方法应用于转录组数据,以推断大规模的GRN。此外,使用现有文献或先验数据库中的知识来推断GRN。构建一个在转录组范围内涉及ncRNA调控因子及其调控基因的ncRNA调控网络(NRN)在几个方面具有挑战性:首先,转录组范围的ncRNA和基因表达数据都是高维的(每个约10-100k节点),具有大量潜在的连接(约数十亿个可能的边)。直接应用大多数现有的GRN方法在计算上是不可行的。其次,ncRNA的表达具有高度可变性和上下文依赖性(例如细胞类型、组织和条件特异性),因此ncRNA和基因之间的调控关系也可能在不同条件下发生变化,这很难随着网络大小的增加而确定。第三,除了转录组数据外,GRN在历史上一直是从数据库中存储的实验验证转录因子活性和调控事件中推断出来的,由于相关数据库稀缺,这对ncRNA基因调控相互作用具有挑战性。近年来,关于ncRNA基因相互作用(基于实验确定或碱基配对预测)和疾病相关ncRNA(来自人类或动物研究)的公开数据库的增长,为从转录组数据和先验数据库中识别ncRNA调控网络创造了前所未有的机会。这些方法需要优先考虑生物相关和可靠的ncRNA和ncRNA-基因交互作用,否则这些相互作用将因仅使用转录组数据的能力不足而错过。
最近,Ke等人提出了一个分析框架,即非编码RNA调控网络的构建和分析(图1,CAR-NET,https://github.com/kehongjie/CAR-NET),从转录组数据和经过实验验证的ncRNA-基因相互作用和疾病相关ncRNA数据库中推断ncRNA调控网络。该框架的核心是一种新颖且计算效率高的两阶段贝叶斯网络(BN)结构学习方法,该方法可以从转录组范围内的ncRNA和基因表达数据中推断大规模的NRN,同时结合先验知识。作者还对推断的网络进行差异网络、子网络和通路分析。该框架灵活,允许从bulk或单细胞RNA-seq(scRNA-seq)技术输入转录组数据,并根据用户的兴趣纳入新的关于ncRNA-基因-疾病相互作用的数据库。CAR-NET专门用于在转录组范围内推断ncRNA-基因调控关系,并结合有用的后续生物学驱动分析,以产生新的假设,供未来研究测试。CAR-NET将帮助ncRNA生物学领域的生物医学研究人员:1)将转录组范围内的ncRNA和基因表达数据从bulk或单细胞RNA-seq缩小到最关键的ncRNA及其与网络水平基因的相互作用;2)了解网络中这些ncRNA-基因相互作用在不同条件下(如临床阶段和细胞类型)是如何动态变化的;3)评估他们自己的数据发现与大量公开的、经过实验验证的ncRNA-基因相互作用数据库的一致性。
图1 CAR-NET流程图。(A) 一种构建ncRNA调控网络的两阶段贝叶斯网络结构学习方法。(B)已识别网络的下游分析,包括差异网络、子网络和通路分析
CAR-NET使用模拟数据和三个真实数据示例以展示其实用性,包括大脑发育中的lncRNA调控、肾细胞癌早期和晚期之间的miRNA差异调控,以及使用单细胞数据在不同细胞系中不同类型ncRNA的基因调控。为了让研究人员能够轻松应用CAR-NET,作者们还开发了一个用户友好的R-shiny应用程序(https://github.com/kehongjie/CAR-NET)通过交互式图形用户界面(GUI)实现简化的工作流程。
参考文献
[1] Hongjie Ke, Zhenyao Ye, Li Feng, Zhangchi Xu, Rong Pan, Eric Li, Jianfei Qi, Shuo Chen, Menglu Liang, Tianzhou Ma. Inferring non-coding RNA regulatory network from transcriptomic data and curated databases. bioRxiv, 2025.04.10.648218; doi: https://doi.org/10.1101/2025.04.10.648218
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-5-9 10:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社