张俊鹏
NeKo:从先验知识自动构建网络
2025-10-13 09:29
阅读:1296

NeKo:从先验知识自动构建网络 

许多生物过程,如细胞内信号传导,可以表示和研究为相互作用分子实体的网络。网络可以提供各种生物水平之间动态相互作用的结构化表示,并有助于深入理解调控细胞功能和决策的潜在机制。 

网络可以定制以描绘不同详细程度的生物过程,从广泛和抽象的概述到高度详细的分子过程表示。网络构建可以应用两种方法:数据驱动方法和知识驱动方法。数据驱动方法基于高通量实验数据,如基因表达或磷酸化蛋白质组学,以推断支撑细胞功能的调控相互作用网络。另一方面,知识驱动网络构建涉及科学文献的全面审查和大量手动操作,从收集已知相互作用的数据库中整理信息,例如 SIGNOR Reactome。虽然数据驱动方法适应各种数据类型,并且特别适用于大规模分析,但它们仍然高度敏感于数据质量,并且由于噪声和高维数据复杂性,可能导致潜在的过拟合或不准确性。另一方面,知识驱动方法能提供更全面的网络,因为它们从许多不同的来源收集信息,但由于它们基于当前生物学知识的范围,可能会存在偏差或不完整性。 

为了解决这些局限性,在网络构建过程中通常会结合数据驱动和知识驱动的方法。为了实现这种结合,已经开发出多种工具和策略来整合组学数据和先验知识,包括 SignalingProfilerCARNIVAL Augusta。然而,即使在混合方法中,仍然需要大量的人工整理,这项任务仍然非常繁琐且费时费力。在人工整理步骤中,通常会查询大量不同的数据库,每个数据库根据不同的标准、生物焦点和方法收集相互作用。为了促进这些知识来源的整合,已经开发出 OmniPath Pathway Commons等工具来收集和整合来自各种资源的相互作用,使用户可以方便地获取整合后的知识。然而,通过实施类似于策展人从通用的相互作用综合目录中构建特定问题网络的策略,这个过程可以进一步自动化。 

最近,Ruscone等人介绍了一个 Python 工具NeKo(图1https://github.com/sysbio-curie/Neko),通过一系列灵活的策略从各种数据库中提取、分组和合并分子相互作用,自动构建生物网络。给定一个感兴趣的分子实体列表(称为种子)(例如,一组差异表达的基因或蛋白质)和预先定义的相互作用来源(例如公共数据库或专有数据库),NeKo 使用户能够选择多种策略连接种子节点。NeKo 能够考虑或忽略交互的方向性和因果关系。最终网络可以直接用于进一步分析,或由用户在导出前进行修改(例如删除节点、边或路径),NeKo 提供多种格式进行导出。 

image.png

1 使用 NeKo 构建网络的典型工作流程示例。首先,交互关系和定义了感兴趣的中心节点。然后,NeKo 将根据用户定义的算法连接这些中心节点。生成的网络可以通过添加注释或使用 Gene Ontology 术语连接表型进行操作。最后,最终的网络可以以多种格式进行可视化和导出 

参考文献

[1] Ruscone M, Tsirvouli E, Checcoli A, Turei D, Barillot E, Saez-Rodriguez J, et al. (2025) NeKo: A tool for automatic network construction from prior knowledge. PLoS Comput Biol 21(9): e1013300. https://doi.org/10.1371/journal.pcbi.1013300 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

image.png

 

转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。

链接地址:https://wap.sciencenet.cn/blog-571917-1505709.html?mobile=1

收藏

当前推荐数:2
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?