张俊鹏
MNMO:多组学数据多层网络中发掘驱动基因
2025-4-17 19:53
阅读:532

MNMO:多组学数据多层网络中发掘驱动基因

使肿瘤细胞具有选择性生存优势的驱动突变已被公认为癌症的病因。随着测序技术的发展,一些大型癌症项目积累了大量癌症基因组数据,如癌症基因组图谱(TCGA)和国际癌症基因组协会(ICGC)。通过利用海量数据,可以进行研究以识别包含驱动突变的驱动基因。

早期识别驱动基因的方法主要基于基因突变的频率。他们将单个基因的突变率与背景突变率进行了比较,从而挑选出大量癌症患者中不是偶然突变的基因。随着测序技术的发展,越来越多的其他组学数据被采用来提高鉴定性能。基因间的相互作用使人们对基因突变的机制有了新的认识。生物网络内的遗传畸变可能导致网络结构变化,这可能会促使细胞达到新的表型状态,并导致癌症的发展。基于这些发现,提出了一组基于网络的方法。一些研究将突变基因映射到基因-基因相互作用网络,并通过提取显著突变的子网络来识别驱动基因。一些人从二分图中进行鉴定,假设候选驱动基因倾向于影响大量差异表达的基因。

由于高通量实验的限制,噪声在生物网络中是不可避免的,即存在大量的假阳性相互作用。因此,人们试图将不同类型的组学数据与之整合,以减轻对网络的过度依赖。EntroRank通过将亚细胞定位和变异频率互斥整合到网络中来识别驱动基因。2022年,提出了一种基于图卷积网络的半监督学习方法,该方法使用每个基因的三个特征向量。2023年,提出了一种基于基因-miRNA网络的图卷积网络模型,通过聚集其相邻miRNA节点的特征来学习基因特征表示。2024年,IMI-Driver整合了多级网络嵌入和机器学习来预测驱动基因。HWC根据多个特征之间的联系,应用了一种分层弱共识模型来融合多个特征。

此外,热扩散技术也被广泛应用于基于网络的方法中,试图恢复一些缺失的相互作用,或平滑整个网络中的突变频率。NetICS进行了一个每个样本的双向网络扩散过程,以捕捉相互作用的方向性。Subdyquency应用随机游走过程来整合亚细胞定位、变异频率及其与其他失调基因相互作用的信息。mND通过使用网络扩散在多层的基础上量化了基因相关性。MinNetRank基于网络扩散进行了单组学数据分析,并使用最小策略整合基因突变和差异表达数据,用于癌症基因发现。2023年,通过整合基因表达数据和基因相互作用网络,提出了一种基于两阶段随机游走和重启的基因发现算法。2024年,PCoDG采用超图随机行走来检测癌症驱动基因,这些基因协同驱动个体患者的癌症进展。

如上所述,在驱动基因直接调控下游失调基因表达的认知下,采用了二分图。然而,调控通路通常是多种多样的,即下游失调的基因可能通过一些介质由驱动基因间接调节。在最近的意向研究中,直接和间接法规都被考虑在内。Deng等人首先通过创建一个多层异构网络来设计方法MNMO(图1,一种基于多组分数据的多层网络模型,https://github.com/Zheng-D/MNMO),该网络由四个子网络组成,分别由miRNA和三种具有不同特征的基因构成。在MNMO方法中,设计了一种量化潜在驱动基因控制能力的方法。通过引入新的重新加权过程构建有向子网络,并进行网络扩散以平滑功能相似基因之间的突变频率差异。然后,根据四种网络分数,提出了MNMO方法的四个扩展版本。与六种最先进的方法相比,MNMO方法和四种扩展版本可以获得相对更好的识别性能。

image.png 

1 MNMO方法的工作流程。第一步:构建多层异构网络。第二步:计算三种分数(控制能力分数、变异分数、网络分数)。步骤3:计算综合得分

参考文献

[1] Deng Z, Wu J, Chen X, Li G, Liu J, Hu Z, Li R, Deng W. MNMO: Discover driver genes from a Multi-Omics data based multi-layer network. Bioinformatics. 2025 Mar 27:btaf134. doi: 10.1093/bioinformatics/btaf134.  

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 

转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。

链接地址:https://wap.sciencenet.cn/blog-571917-1482413.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?