|
国际期刊《Frontiers in Marine Science》刊登了课题组题目为“使用季节性和趋势性分解算法提升机器学习预测中国黄河入海径流的能力(Using a seasonal and trend decomposition algorithm to improve machine learning prediction of inflow from the Yellow River, China, into the sea)”的研究论文,论文共同第一作者为硕士研究生王硕和杨柯,通讯作者为彭辉副教授。
黄河是渤海最大的入海河流,准确预测其入海量对维持渤海生态平衡和保护海洋资源至关重要。本研究基于STL(seasonal and trend decomposition using loess)算法和机器学习模型(light gradient boosting machine, LightGBM)的集成模型来提高黄河入海径流的预测精度,并探讨不同STL预处理方法对模型性能及数据泄露的影响。研究利用历史径流数据,结合STL分解得到的趋势项、季节项和残差项,构建了不同滑动窗口(6、8、12天)和预测期(1-7天)的预测模型,并设置两种预处理场景S1和S2(Scenario 1:全局分解;Scenario 2:逐样本分解)以评估数据泄漏对模型预测性能的影响。结果表明,STL-LightGBM在预测精度上显著优于单一LightGBM模型,并且通过STL预处理还有效缓解了预测精度随预测期延长而降低的问题。以滑动窗口为8天为例,预测未来1-7天的平均NSE (Nash–sutcliffe efficiency)达到0.720,其中7天预测期的NSE(0.549)较LightGBM(0.444)高了0.105。通过两种预处理方法分析数据泄露的影响,发现S1因对整个测试集进行STL预处理,可能会导致未来信息的泄露,从而高估模型的性能;而S2通过对测试集的每个样本对单独进行STL预处理,有效避免了未来数据泄漏,能更准确地反映模型的实际预测能力。研究还进一步揭示了STL分解在提取时间序列趋势和季节性特征中的核心作用,即季节项反映年际周期的变化情况,趋势项捕捉长期的水文波动,而残差项可以分离随机噪声。这三者的结合有效地提高了模型对复杂径流模式的解析能力。研究结果可为水资源管理和近海环境管理提供了新的方法和思路,同时为流域管理和海洋生态保护提供了高精度的预测工具。
Wang, S., Yang, K., Peng, H., 2025. Using a seasonal and trend decomposition algorithm to improve machine learning prediction of inflow from the Yellow River, China, into the sea. Front. Mar. Sci. 12, 1540912.
文章链接:https://doi.org/10.3389/fmars.2025.1540912
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-5-22 11:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社