zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

UKB-MDRMF:基于biobank数据的多疾病风险和多发病率框架

已有 354 次阅读 2025-5-17 10:40 |个人分类:科普|系统分类:科普集锦

UKB-MDRMF:基于biobank数据的多疾病风险和多发病率框架 

生物医学队列数据的持续增加为临床诊断和疾病分析中的稳健和全面建模提供了重要机会。然而,许多研究仍然侧重于预测或评估特定疾病或广泛疾病类别的风险,这限制了对风险因素和疾病间相关性的探索。此外,探索过程往往是分散的,缺乏整合多个任务的标准化框架,导致数据利用率低和资源浪费。数据预处理和模型实施的时间和成本限制给医疗保健专业人员带来了障碍。 

个人的健康状况受到各种因素的影响,如人口统计、生活方式、环境和遗传。利用这些丰富的信息可以带来更准确的预测和更深入的分析。虽然已经开发了许多使用多模态数据预测和评估单一类型疾病的方法,但疾病的覆盖范围仍然不足。在大规模生物医学数据集中,缺乏将多维健康信息与各种疾病类型相结合的研究。一些方法可以同时对大量疾病建模,但疾病风险因素众多,疾病之间的联系复杂,这给全面探索这些关系带来了很大的挑战。现有的构建健康信息模型的方法可能缺乏从数据预处理到分析和建模阶段的全面考虑,而且它们往往缺乏进一步的分析和应用扩展。 

最近,Jiang等人整合了来自英国biobank数据的丰富多模态数据,包括基本信息、生活方式、测量、环境因素、遗传学和成像数据。引入了UKB-MDRMF(图1https://github.com/kannyjyk/UKB-MDRMF),这是一个多疾病风险和多发病率框架,旨在对1560种疾病进行个体多疾病预测和健康风险评估。UKB-MDRMF是一种大规模应用的综合生物医学预测和风险评估模型。这种综合模型优于单类疾病风险评估,有效地揭示了多种风险因素和疾病之间的潜在联系,为健康风险因素和多发病机制提供了更广阔的视角。此外,UKB-MDRMF简化了从数据输入到模型构建的整个过程,提高了在各种下游任务中使用UKB-MDRMF框架的灵活性和便利性。UKB-MDRMF的交互式平台可以访问https://luminite.shinyapps.io/ukb-mdrmf/ 

image.png

1 UKB-MDRMF管道。该管道利用了来自英国biobank数据的输入数据,包括六类:基础、生活方式、测量、环境、遗传和成像数据。在字段选择、数据清理和缺失数据预处理之后,会生成预测器。反应变量来源于住院患者、自我报告和初级保健数据,在转换为Phecodes之前,最初标准化为ICD-10代码。在对自变量和因变量进行时间比对后,数据用于构建UKB-MDRMF框架,包括疾病预测和风险评估模型。这些模型促进了多种应用,包括为多种疾病建立基线条件、分析重大风险因素、探索多发病率和评估生存风险 

参考文献

[1] Jiang Y, Zhao B, Wang X, Tang B, Peng H, Luo Z, Shen Y, Wang Z, Jiang Z, Wang J, Ye J, Wang X, Zhu H. UKB-MDRMF: a multi-disease risk and multimorbidity framework based on UK biobank data. Nat Commun. 2025 Apr 22;16(1):3767. doi: 10.1038/s41467-025-58724-3. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://wap.sciencenet.cn/blog-571917-1486035.html

上一篇:HCDT 2.0:高置信度药物靶点数据库
收藏 IP: 39.128.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-5-18 11:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部