张俊鹏
超越以基因为中心差异表达的基因组规模表达的多模态生物信息学分析
2026-5-16 21:31
阅读:177

超越以基因为中心差异表达的基因组规模表达的多模态生物信息学分析 

基因表达受到内部和环境因素复杂相互作用的影响。这些多重决定因素共同塑造了基因调控反应和表型结果,为实验设计和数据分析及解释带来了巨大挑战。 

基于组学的分析方法能够全面研究基因调控机制的多模态特性。在研究设计方面,传统的病例对照制度是最受欢迎的,但通常不足以全面捕捉生物复杂性。此外,高级研究设计如时间序列、多因素扰动和整合多组学方法越来越多地被用于揭示无法通过成对比较解析的动态调控机制。聚焦于转录组学,作为由于高通量测序技术的广泛采用而成为基因表达调控谱分析中最常见的模态之一,差异表达(DE)分析长期以来一直是并继续是识别表达模式发生显著变化的基因的主要生物信息学策略。尽管 DE 分析中的统计检验和多重检验校正策略有详尽记载,但分析方法的次优选择可能导致假阳性检测差异表达基因,从而导致误读和增加验证成本。 

基因表达的逐个基因分析作为差异表达经常无法捕捉生物网络和通路中基因的协同和协调行为。为了克服这一局限性,系统级方法,包括基因共表达网络(GCN)和基因调控网络(GRN)的推理已被引入。GCN 是研究不同条件下协同基因表达模式的有效框架。然而,仅有的共表达网络无法捕捉转录因子(TF)及其靶基因的相互作用和方向。相反,静态 GRN 经常无法表示特定上下文的基因表达调控。最近,新的机器学习(ML)方法已被引入用于 GCN GRN 的推理以及深入分析,包括识别非线性关系。其他研究也描述了多模态组学数据的整合,例如染色质可及性数据和蛋白质组学,以执行特定上下文的预测,包括转录因子活性(TFA)、基因与其调控元件之间的调控关系、从多模态数据整合中推断 GRN以及高阶网络分析。生物数据的规模、维度和变异性持续为选择合适的数据整合和推理方法带来挑战,凸显了重新调查适合特定研究问题的前沿工具的必要性。 

最近的综述中,NuanpiromCharoensawan回顾了基因表达分析研究设计的基本概念,这些概念可以超越传统的病例对照设计和以基因为中心的研究(参见概述图 1)。然后,他们概述了现有方法的优缺点,并评估了传统的以基因为中心的差异表达分析是否适用于不同类型的实验设计。接着,描述了系统级策略的概念和更新,包括 GCN GRN 的推断。最后,描述了新兴的多模态分析,包括单细胞和空间组学,并讨论了多组学和人工智能驱动方法的整合如何为在特定环境和动态方式下解析基因表达调控提供前所未有的机会。 

image.png

1 1 本综述中所述的全基因组基因表达分析概述,涵盖从(A–D)以基因为中心的差异表达到(E–H)系统级分析的分析策略,包括(E)从基因表达数据推断基因调控网络和(F)整合多组学数据,以及(G)单细胞和(H)空间分辨率的基因组规模基因表达分析的最新视角 

参考文献

[1] Nuanpirom J, Charoensawan V. Multimodal bioinformatic analyses of genome-scale expression beyond gene-centric differential expression. Brief Bioinform. 2026 Mar 1;27(2):bbag152. https://doi.org/10.1093/bib/bbag152 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

42. CircTarget:多种细胞类型circRNA调控综合数据库

43. GreenCells:植物lncRNA单细胞分析资源

44. RM2Target 2.0RNA修饰的写入者、擦除者和读取者靶基因数据库

45. SDMap:空间药物扰动图谱数据库

image.png

 

转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。

链接地址:https://wap.sciencenet.cn/blog-571917-1535120.html?mobile=1

收藏

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?