OmniPath:多组学分析的集成知识库
高通量、单细胞和空间组学技术有助于理解生物过程,但在解释分子机制和在疾病中的失调仍然是一个挑战。在分析方法中,利用先验知识大大扩展了可提取的信息和可测试假设的范围。特别是通过使用先验知识对关键过程的活性估计—通路、转录因子、激酶、受体或配体-受体的活性——生物学可解释性大大增强,潜在的因果驱动因素可以更容易地被识别,同时数据的维度降低,进而提高了统计效力。此外,通过多种网络推理方法整合这些估计结果可以用于推导特定上下文的机制。因此,先前知识数据库已成为多组学数据分析的必要资源。
将先验知识用于分析流程本身就是一个挑战:它分散在许多数据库中,而且不清楚当前应用中哪些是最适合的。此外,每项都需要不同且常常需要投入大量精力来使用这些工具。优秀的原始研究和综合研究数据库各有侧重。然而,这些数据库往往受到限制。
各种注意事项,例如缺乏领域知识,分析所需的覆盖范围和工作流,特别是文献整理的工作流,以及因果关系交互和易用性与分析工具的集成。这一挑战促使了 OmniPath数据库(图1,https://omnipathdb.org/)的开发,一个结合了越来越多的多样化、经过编辑和互补的数据库资源。当首次发布时,它仅涵盖因果信号相互作用,并且多年来它扩展到包含转录因子-靶标和酶-翻译后修饰关系、分子功能与定位、细胞间通讯、蛋白质复合物,以及各种其他类型的分子知识。OmniPath数据库具有一个交互式网页,扩展了网页 API 的功能(包括来源详情和许可证支持), 实现了更高性能的服务器,并为 Python 和 R 客户端软件包添加了许多便捷工具。
图1 OmniPath 数据库内容。A) 资源在数据库类别中的分布,树状图显示其数据库领域和子类别中各个资源的相对大小。每个单元格的大小是与记录数量成正比。B) 每个数据库域中的资源数量,按维护情况和许可证类别分类。C) 按数据库领域和维护许可证类别划分的记录百分比。D) 按数据库和维护状态划分的文献参考数量。E) 数据库内部资源重叠情况: 1、2、3、4 或 5 个资源中出现的条目百分比
参考文献
[1] Denes Turei, Jonathan Schaul, Nicolas Palacio-Escat, Balazs Bohar, Yunfan Bai, Francesco Ceccarelli, Elif Cevrim, Macabe Daley, Melih Darcan, Daniel Dimitrov, Tunca Dogan, Daniel Domingo-Fernandez, Aurelien Dugourd, Attila Gabor, Lejla Gul, Benjamin A Hall, Charles Tapley Hoyt, Olga Ivanova, Michal Klein, Toby Lawrence, Diego Mananes, Dezso Modos, Sophia Muller-Dott, Marton L Olbei, Christina Schmidt, Bunyamin Sen, Fabian J Theis, Atabey Unlu, Erva Ulusoy, Alberto Valdeolivas, Tamas Korcsmaros, Julio Saez-Rodriguez. OmniPath: integrated knowledgebase for multi-omics analysis. bioRxiv 2025.09.11.675512; doi: https://doi.org/10.1101/2025.09.11.675512
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1505201.html?mobile=1
收藏