hubEnsembles:R集成方法
对未来结果的预测对规划和决策至关重要,但对未来做出可靠的预测是一项挑战。克服这一挑战的一种方法是将多个独立模型的预测结合起来。这些组合方法(也称为聚合或集合)已被反复证明可以产生更准确的预测,并且比单个模型更加一致。由于明显的性能优势,多模型集成在各个领域都很常见,包括天气、气候和经济学。最近,多模型集成已用于改进传染病暴发的预测。
在快速发展的爆发预测领域,有许多生成集成的方法被提出。通常,这些方法至少在以下两种方式中的一种有所不同:(1)用于组合或“平均”预测的函数,以及(2)在执行组合时如何对预测进行加权。没有一种方法是普遍的“最好的”。因为已有的理论原因,预测的简单平均数在一系列设置中效果惊人地好。然而,更复杂的方法也被证明在某些情况下有好处。在这里,Shandross等人介绍了一款hubEnsembles工具R包(https://github.com/hubverse-org/hubEnsembles,图1),它为从多个模型生成集成预测提供了一个灵活的框架。hubEnsembles支持多种类型的预测,包括点估计和不同类型的概率预测。在整个过程中,作者们将使用术语“预测”来指代可能组合的任何类型的模型输出,包括预测、场景预测或参数估计。
图1 hubEnsembles界面与安装
hubEnsembles软件包是“hubverse”开源软件和数据工具集合的一部分。hubverse项目促进了协作建模练习的开发和管理(2024年传染病建模中心联盟)。更广泛的hub计划是由协作中心的演示收益所驱动的,包括多模型集成的性能优势以及跨此类中心标准化的愿望。文献《hubEnsembles: Ensembling Methods in R》将特别关注hubEnsembles中包含的功能。作者们提供了实现方法的概述,包括数学定义和属性以及实现细节,使用简单示例的基本功能演示,以及使用真实流感预测进行更深入的分析,从而激发对各种方法的讨论和比较。
如果想了解和入门集成模型,hubEnsembles工具包学习将会是一个很好的选择。
参考文献
[1] Shandross L, Howerton E, Contamin L, et al. hubEnsembles: Ensembling Methods in R. Preprint. medRxiv. 2024;2024.06.24.24309416.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1443574.html?mobile=1
收藏