RegNetwork 2025:人类和小鼠基因调控网络整合数据库
基因调控网络(GRN)提供了一个全面的框架,用于解析转录因子(TF)、微 RNA(miRNA)、长链非编码 RNA(lncRNA)、环状 RNA(circRNA)、基因和其他调控因子之间复杂的相互作用,这些因子在各种生物过程和疾病中至关重要。因此,研究人员已广泛致力于从转录组数据中推断调控网络(GRN),例如 DigNet 和 scNAE。不可避免地,这些工作借助来自数据库和文献的 GRN 先验知识作为基础信息来指导模型。此外,高通量组学技术的进步促进了大量基因表达和分子相互作用数据的快速涌现,导致数据规模呈指数级增长。为了有效利用这些多样化的数据集,研究人员已经开发了多个数据库用于存储和管理。
当前的 GRN 数据库,记录了“转录因子-靶标”、“蛋白质-蛋白质”相互作用以及“RNA-靶标”相互作用等相互作用,为理解特定的调控关系提供了宝贵的见解。然而,这些数据库通常专注于单一类型的调控相互作用,缺乏多层级和多维度的整合,因此无法完全涵盖 GRN的复杂性。此外,这些资源的分散以及缺乏统一的置信度评分系统,为研究人员构建全面可靠的调控网络带来了重大挑战。因此,迫切需要开发一个整合多种类型调控关系并量化各种证据来源的 GRN 数据库。
为应对这些挑战,研究人员最初开发了 RegNetwork,通过整合公共数据源中的调控关系,并通过 DNA 序列中的结合基序对齐来预测 TF和基因之间的潜在调控联系。最近,RegNetwork 2025版本(图1,http://www.zpliulab.cn/RegNetwork/home)将 miRNA 纳入 GRN 框架,并界定了 TF、miRNAs和基因之间的调控相互作用,这些相互作用已在科学研究中得到广泛应用。
图1 RegNetwork 2025 概述。这项工作整合了人类和小鼠的转录和转录后调控关系,数据来源包括 RegNetwork v1.0、31 个公开数据库以及超过 20,000 篇已发表的论文。所有数据都经过统一的注释和评分,以建立公开可用的数据库服务
在过去十年中,RegNetwork团队一直致力于构建一个全面而精确的先验 GRN 数据库。在此更新中,RegNetwork 2025全面修订了 TF、miRNA 和基因之间的调控关系,并纳入了两种额外的调控因子类别:lncRNA 和 circRNA。虽然 lncRNAs和 circRNAs不编码蛋白质,但它们在基因调控中发挥着关键作用。LncRNA,> 200 个核苷酸,通常通过与 DNA、RNA 或蛋白质相互作用,参与转录调控、染色质修饰和多种细胞过程。环状 RNA(circRNA)具有由外显子反式剪接形成的闭环结构,在 miRNA 海绵吸附、蛋白质结合和翻译调控中发挥重要作用。此次更新不仅增强了 RegNetwork 中 GRN 数据的全面性,数据量还大幅增加,涵盖数百万条记录(涵盖人类和小鼠数据)。为量化不同数据源对调控关系可靠性的影响,作者们设计了一个评分系统。利用该评分系统,构建了一个以实验证据为基础的核心数据集。此外,RegNetwork网站使用户能够高效、精确地搜索和导航数据库中的调控关系。
参考文献
[1] Li B, Wang C, Wang Y, Li P, Liu ZP. RegNetwork 2025: an integrative data repository for gene regulatory networks in human and mouse. Nucleic Acids Res. 2025 Aug 13:gkaf779. doi: 10.1093/nar/gkaf779.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1500863.html?mobile=1
收藏