zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

CAR-NET:整合转录组数据和先验信息推断ncRNA调控网络

已有 280 次阅读 2025-5-8 10:49 |个人分类:科普|系统分类:科普集锦

CAR-NET:整合转录组数据和先验信息推断ncRNA调控网络 

非编码RNAncRNA),包括长非编码RNAlncRNA)、微小RNAmiRNA)、小核RNAsnRNA)等,是在多个水平上控制基因表达的关键调控因子。与蛋白质编码基因相比,ncRNA通常研究不足。揭示ncRNA如何调控其靶基因以及它们产生的复杂调控网络,可以更深入地了解ncRNA对生命的调控机制及其在发育过程和疾病中的作用。基因调控网络(GRN)已被广泛用于模拟基因与其调控因子之间的复杂相互作用。然而,目前对GRN的研究主要集中在转录因子和基因之间的相互作用上,很少有方法专门用于模拟ncRNA基因调控关系和相关网络,这使得系统生物学中不可或缺的组成部分变得神秘。 

研究人员通常将数据驱动的方法应用于转录组数据,以推断大规模的GRN。此外,使用现有文献或先验数据库中的知识来推断GRN。构建一个在转录组范围内涉及ncRNA调控因子及其调控基因的ncRNA调控网络(NRN)在几个方面具有挑战性:首先,转录组范围的ncRNA和基因表达数据都是高维的(每个约10-100k节点),具有大量潜在的连接(约数十亿个可能的边)。直接应用大多数现有的GRN方法在计算上是不可行的。其次,ncRNA的表达具有高度可变性和上下文依赖性(例如细胞类型、组织和条件特异性),因此ncRNA和基因之间的调控关系也可能在不同条件下发生变化,这很难随着网络大小的增加而确定。第三,除了转录组数据外,GRN在历史上一直是从数据库中存储的实验验证转录因子活性和调控事件中推断出来的,由于相关数据库稀缺,这对ncRNA基因调控相互作用具有挑战性。近年来,关于ncRNA基因相互作用(基于实验确定或碱基配对预测)和疾病相关ncRNA(来自人类或动物研究)的公开数据库的增长,为从转录组数据和先验数据库中识别ncRNA调控网络创造了前所未有的机会。这些方法需要优先考虑生物相关和可靠的ncRNAncRNA-基因交互作用,否则这些相互作用将因仅使用转录组数据的能力不足而错过。 

最近,Ke等人提出了一个分析框架,即非编码RNA调控网络的构建和分析(图1CAR-NEThttps://github.com/kehongjie/CAR-NET),从转录组数据和经过实验验证的ncRNA-基因相互作用和疾病相关ncRNA数据库中推断ncRNA调控网络。该框架的核心是一种新颖且计算效率高的两阶段贝叶斯网络(BN)结构学习方法,该方法可以从转录组范围内的ncRNA和基因表达数据中推断大规模的NRN,同时结合先验知识。作者还对推断的网络进行差异网络、子网络和通路分析。该框架灵活,允许从bulk或单细胞RNA-seqscRNA-seq)技术输入转录组数据,并根据用户的兴趣纳入新的关于ncRNA-基因-疾病相互作用的数据库。CAR-NET专门用于在转录组范围内推断ncRNA-基因调控关系,并结合有用的后续生物学驱动分析,以产生新的假设,供未来研究测试。CAR-NET将帮助ncRNA生物学领域的生物医学研究人员:1)将转录组范围内的ncRNA和基因表达数据从bulk或单细胞RNA-seq缩小到最关键的ncRNA及其与网络水平基因的相互作用;2)了解网络中这些ncRNA-基因相互作用在不同条件下(如临床阶段和细胞类型)是如何动态变化的;3)评估他们自己的数据发现与大量公开的、经过实验验证的ncRNA-基因相互作用数据库的一致性。 

image.png 

1 CAR-NET流程图。(A 一种构建ncRNA调控网络的两阶段贝叶斯网络结构学习方法。(B)已识别网络的下游分析,包括差异网络、子网络和通路分析 

CAR-NET使用模拟数据和三个真实数据示例以展示其实用性,包括大脑发育中的lncRNA调控、肾细胞癌早期和晚期之间的miRNA差异调控,以及使用单细胞数据在不同细胞系中不同类型ncRNA的基因调控。为了让研究人员能够轻松应用CAR-NET,作者们还开发了一个用户友好的R-shiny应用程序(https://github.com/kehongjie/CAR-NET)通过交互式图形用户界面(GUI)实现简化的工作流程。 

参考文献

[1] Hongjie Ke, Zhenyao Ye, Li Feng, Zhangchi Xu, Rong Pan, Eric Li, Jianfei Qi, Shuo Chen, Menglu Liang, Tianzhou Ma. Inferring non-coding RNA regulatory network from transcriptomic data and curated databases. bioRxiv, 2025.04.10.648218; doi: https://doi.org/10.1101/2025.04.10.648218 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://wap.sciencenet.cn/blog-571917-1484900.html

上一篇:miRTalk:细胞外囊泡衍生的miRNA介导细胞间通讯推断
下一篇:scContrast:基于对比学习的单细胞基因表达数据编码方法
收藏 IP: 39.128.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-5-9 13:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部