|
水文学是人类管理水资源的基础性学问,Copula熵(Copula Entropy:CE)在水文学领域得到了非常广泛的应用。它被用来研究各种水文学问题,包括金沙江洪水、黄河流域和西亚干旱、京沪水文观测、重大水利工程、黄河水沙关系分析、湖泊流域划分、南美河流水文模拟、欧美气候变化等,研究对象涉及黄河、长江、淮河、达布蒂河(印度)、雅瓜里比河(巴西)、查克托哈奇河(美国)、太湖、鄱阳湖、洪泽湖、骆马湖、南水北调工程、三峡工程等。CE提供了理解和利用水文系统非线性的数学工具,让更多水资源真正有效地造福社会。
图1. Copula熵世界范围水文学应用地图.
洪水是主要自然灾害之一,洪水预报是降低洪水损失和管理洪水资源的重要手段。基于降水数据的降水量-径流量模型可以用来预报一段时间后的洪水。但是,水系统具有复杂性和非线性的特点,导致建立这样的模型时选择正确的模型输入十分困难。陈璐等[1,2,3]提出利用CE的方法来选择输入并建立神经网络预报模型。相比于传统的方法,基于CE的方法可以建立高维模型且对单个变量的边缘分布不做假设,同时由CE来估计降水量和径流量的数量关系的误差更小。陈璐等将方法应用于建立金沙江流域的洪水预报模型,结果显示利用CE选择输入的神经网络模型取得了最好的预测效果。Li等[4]基于CE和机器学习方法研究了长江上游的月径流预报问题。他们利用130个全球环流指数、7个气象因子和高场和寸滩两个水文站的月径流量数据,采用CE等3种变量选择方法和5种机器学习模型进行组合构建预测模型。结果表明,CE和LSTM组合在高场站获得了最优预测性能,而随机森林和CE组合在寸滩站获得了满意性能。Mo等[5]提出了一种长期径流预报模型框架,结合了CE、LSTM和GARCH三种方法,其中CE用于筛选与径流有关的预报因子。与传统方法相比,CE更适合因子间具有交互关联的复杂情况。他们将方法应用于洪泽湖和骆马湖的径流预报研究,结果表明,与传统方法相比,该框架中的CE方法不仅成功辨别了因子间的交互效应,同时还量化了每个预报期内各个因子的贡献度,从而选出了与预报有关的关键驱动因子,最终该方法框架得到了较对比方法更准确、更稳定且更可靠的预报结果。
干旱是另一类重要的水文事件和影响重大的自然灾害之一。频发的干旱严重影响着我国的经济社会安全,特别是黄河流域的干旱威胁尤其严重,迫切需要开展流域干旱驱动和预测的研究。温云亮等[6]利用CE理论分析了河南省1951--2014年逐月气象数据,发现在众多驱动因子中,降水量、气温、水气压和相对湿度对该地区干旱发生的影响最大。Huang和Zhang[7]利用CE方法分析了兰州地区1957--2010年的气象数据,以构建该地区的干旱预测模型,发现该地区的风速、气温、水气压和相对湿度是与干旱最相关的气象因子。 黄春艳[8]研究了黄河流域的气象、水文和干旱之间的关系,探讨了干旱的驱动机制,给出了气象干旱和水文干旱的概念,并提出利用CE方法探究二者之间的动态非线性响应关系,通过分析黄河流域不同区域水文站的气象和水文干旱指数,得到了水文干旱对气象干旱的滞后效应时间,为应对干旱事件提供了参考。Ni等[9]利用MI和CE之间的等价关系,提出了基于MI的藤Copula结构选择方法,并应用于黄河流域干旱识别中特征变量建模问题和多水文站流量相关结构建模问题中。Kanthavel等[10]利用CE和藤copula等理论工具,提出了一种综合干旱指数,整合了标准化降雨指数、干旱监测指数、标准化土壤湿度指数和标准化径流干旱指数等四种指数,可以更好地同时反映相关水文气象变量和不同类型的干旱。CE理论被用来衡量新指数与原始指数之间的相关性。他们将该指数应用于印度中部的达布蒂(Tapti)河流域的单月和四个月尺度的干旱研究中,验证了该指数的有效性,并揭示了该地区干旱的时空分布特点。Mohammadi等[11]利用基于copula和CE理论的三种相关性度量估计方法,在伊朗三座城市(扎黑丹、恩泽利和马什哈德)1950--2017年的水文观测数据的基础上,分析了三地的干旱变量(干旱强度、时长和时间间隔)之间的依赖关系。
水文气象观测网络是获取水文信息的基础设施。如何设计并优化网络站点是一个综合性的科学和工程问题。一个基本的设计原则是观测站点之间尽量统计独立,这样才能最大程度的获取水文系统的信息。MI是衡量统计独立性的主要工具,但是其计算是一个难题。Xu等[12,13]提出了一个基于CE的多目标优化的水文观测网络设计方法,包括两步:1)基于CE的信息传输将观测站点分组;2)对每个分组选择最优的站点组合。基于CE的计算方法不仅能够处理水文变量的非高斯性,同时在计算性能上也更可靠、更有效率。作者将方法应用于黄河流域伊洛河水文观测网络和上海雨量观测网络的设计。结果显示,CE的方法计算精度更高,且可以应用于高维的多变量估计情况。同样基于最少重叠信息的原则,Li等[14,15]提出了一个由两个子目标构成的网络优化目标,其中一个子目标基于CE而设计,用于衡量冗余信息量。作者将此方法分别应用于汾河径流观测网、北京市区以及太湖盆地的雨量观测网的设计和优化,结果表明了方法可靠且有效。徐鹏程等[16,17]提出利用藤Copula来构建站点关系网络,再基于估计的藤Copula来计算站点间的CE值,在此基础上提出了结合CE和克里金指标的站点优化目标,利用滑动窗口法选择优化站点。他们基于淮河流域1992-2018年的日降水量观测数据,利用该方法对该流域43个雨量观测站点网络进行了优化,结果表明该方法得到的网络能够较传统类似方法得到的网络更有效地获取降水相关信息。杨惜岁[18]提出一个结合联合熵比、冗余度比和NSE效率系数的站网优化准则,并基于CE理论提出了新的MI计算方法,提高了计算的准确性。他将方法应用于美国查克托哈奇(Choctawhatchee)河流域的14个水文站点,进行站点优化研究,最终得到了只包含5个站点的网络,提高了站网的监测效率。
分析河流的干流和支流之间的相关性对水利工程设计、洪水预防和风险防控十分重要。三峡大坝作为长江上游河段的大型水利工程,其一个重要功能就是洪水控制,研究该河段的主要河流相关性对工程设计和安全运行具有重要参考价值。Chen和Guo[19]提出利用CE来计算河流相关性的强度,他们将方法应用于包含了5条主要干支流的长江上游河段,基于干支流1951-2007年间的洪水记录数据计算河流间的相关性。他们发现河流之间总的相关性并不高,这与该地区的气候特征相符;相关关系最强的是岷江和沱江,这是由于二者距离最近,且属于同一降水区域;金沙江和岷江、沱江之间具有一定的相关性,对三峡大坝的洪水控制构成了一定的威胁;金沙江、嘉陵江、岷江和沱江对长江盆地的洪水发生具有显著影响。
不同河流和区域的洪水事件叠加易于形成复合洪水事件,但不同洪水过程之间的空间关系很难利用现有相关性分析方法来准确地描述和评估。Wang和Shen[20]提出了一个整合藤copula和相关性评估的方法框架,其中利用了CE理论从藤Copula来估计MI、CMI和R统计量等相关性强度。他们将方法用于评估长江上游已鉴别的102个复合洪水事件中两种极端径流序列变量(洪峰流量和洪水流量)之间的关系。结果表明,该框架的多维R藤copula模型能够更好地描绘复杂多样的水文相关关系,特别是藤结构表示了支流洪水汇入干流的顺序和水文站之间的空间位置关系;该框架估计的三种相关性强度比传统的相关性强度更好地反映了复杂时空水文系统的复合洪水事件中的非线性关系。
黄河水沙调控关系到黄河治理的策略制定,科学认知评估黄河的水沙通量变化特征是基础性的科学问题,对研判黄河泥沙情势具有重要意义。特别是近几十年来,受气候变化和人类活动的叠加影响,黄河水沙含量发生了显著变化,需要准确估计径流量和输沙量的分布变化情况。Copula函数是分析这种分布的基本数学工具,但此类问题往往观测样本较少,难以准确估计Copula函数的参数。Qian等[21]提出了一种基于CE和全相关(Total Correlation)关系的Copula参数估计方法,用于解决在样本较少的情况下的Copula参数估计问题。他们将方法应用于黄河西柳沟河流域1960-2016年间年度径流量和输沙量的数据的分析,该流域在1999年前后水沙关系发生了显著变化,但数据较少。分析结果发现,对于1999年前后的两个时段,新方法均得到比两种传统方法更准确的Copula参数估计,对数据的拟合更好。
流域分区是水文学研究的重要方法,根据水文相似性特征划分流域内相似性区域,可解决无水文观测地区的水文计算等难点问题。径流响应是重要的流域水文特征,根据流域水文站点观测之间的相似性做流域分区是一种基本的研究路径。传统的流域分区方法基于相关性评价,往往难以反映水文系统内在的复杂关系。刘磊等[22]提出采用基于CE的R统计量来衡量节点间的径流相似性,再在此基础上利用社团检测算法对流域进行分区。他们将方法应用于鄱阳湖水系,利用该流域的水文站观测对流域进行了分区,并将方法与传统的K均值聚类方法进行了对比。结果表明,该方法能够有效捕捉流域内湖库对径流的调节作用,从而得到较传统方法更合理的流域分区。
多站点径流生成是随机水文学的主要问题之一,生成的流量信息对任何水资源管理都是必不可少的。在径流数据记录有限的情况下,生成多站点径流数据十分必要,需要设计相应的数据生成模型。Porto等[23]提出了结合广义线性模型(GLM)和Copula函数的多站点年度径流生成模型,前者表示时序结构,后者为多站点的空间相关性建模。在评价模型性能时,作者采用了包括CE在内的多个统计描述性指标,其中CE用来衡量非线性的全关联。作者将该模型用于生成巴西的雅瓜里比(Jaguaribe)-大都市水库系统的多站径流时序数据,结果显示模型表现出了优于当前最好水平的性能,特别是在衡量多站相关性的CE指标上,较其他模型更接近于历史观测数据。
南水北调工程是当今世界最大的水利工程,承担着从长江的汉江流域丹江口水库向北方地区城市调水的战略任务。准确的入库径流预报是科学合理的供水调度的前提条件,能够使工程更充分高效地利用自然界的水资源。但传统方法构建的预报模型很难满足调水预报精度的要求,原因在于传统分析方法不能处理水文系统的非线性特性,导致了构建的入库径流预报模型不合理从而预测性能不高。黄朝君等[24]构建了丹江口水库的月入库径流预报模型,利用CE选择了一组气象水文因子作为模型的输入,得到的模型具有明显优于传统模型的预报性能。模型成功的原因在于采用CE选择的预报因子与中长期入库径流密切相关,印证了印度洋偶极子事件和南海副高活动与汉江流域夏季强降水之间的内在联系,符合自然界水文系统的运行规律。
气候变化是气候学研究的课题之一,它不仅体现在水文气候变量幅度上的变化,也体现在变量的季节和周期变化的分布上。这种变化会对降水和气温的强度和频率造成影响,导致极端天气(如洪水、干旱和热浪等)的增加。降水和气温的相关性会加剧联合极端天气的发生和强度。研究气候变化对降水和气温相关结构的影响是一个重要的问题。Hao和Singh[25]利用CE度量工具研究了气候变化对这种相关结构的影响。研究采用了美国德克萨斯州达拉斯市沃斯堡(Fort Worth)在1948-2010年间的每日降水和气温数据,以每5年为期计算温度和降水之间的负CE值作为相关结构强度,发现该地区的温度和降水之间的相关结构强度(负CE值)从1948-1980年间的0.18下降到了1948-2005年间的0.06,说明了气候变化对该地区水文气候变量之间关系造成了影响。
气候评估是科学应对气候变化的基础性工作,其目标是监测和分析全球和地区气候及其变化,特别关注于变化趋势和极端气候风险等。气候分类是指根据相似气候特征将地区分类,最常见的K\"oppen分类法采用的气候特征是温度模式和季节性降水。Condino[26]提出了一种基于Jensen-Shannon距离的动态分类算法,其中基于JS距离的分类准则采用了基于CE理论的表示方法并进行估计。他将方法应用于欧洲气候评估问题,根据1951-2008年间欧洲气象观测站每日温度和降水数据对欧洲25座主要城市的气候进行分类。结果表明,其提出的算法成功区分了分别属于欧洲南部和北部气候带的城市群,当进一步考虑南北气候过渡带时,算法也对欧洲中部城市给出了与实际气候情况相符的合理的分类结果。
图2. Copula熵国内水文学应用地图.
本博文摘自此篇关于Copula熵理论和应用的综述论文。
Lu Chen, Vijay P. Singh, and Shenglian Guo. Measure of correlation between river flows using the copula-entropy method. Journal of Hydrologic Engineering, 18(12):1591–1606, 2013.
Lu Chen, Vijay P. Singh, Shenglian Guo, Jianzhong Zhou, and Lei Ye. Copula entropy coupled with artificial neural network for rainfall–runoff simulation. Stochastic Environmental Research and Risk Assessment, 28(7):1755–1767, 2014.
Lu Chen and Vijay P. Singh. Flood forecasting and error simulation using copula entropy method. In Priyanka Sharma and Deepesh Machiwal, editors, Advances in Streamflow Forecasting, pages 331–368. Elsevier, 2021.
Xiao Li, Liping Zhang, Sidong Zeng, Zhenyu Tang, Lina Liu, Qin Zhang, Zhengyang Tang, and Xiaojun Hua. Predicting monthly runoff of the upper Yangtze river based on multiple machine learning models. Sustainability, 14(18):11149, 2022.
Ran Mo, Bin Xu, Ping-An Zhong, Yuanheng Dong, Han Wang, Hao Yue, Jian Zhu, Huili Wang, Guoqing Wang, and Jianyun Zhang. Long-term probabilistic streamflow forecast model with “inputs–structure–parameters” hierarchical optimization framework. Journal of Hydrology, page 129736, 2023.
温云亮, 李艳玲, 黄春艳, and 张泽中. 基于 Copula 熵理论的干旱驱动因子选择. 华北水利水电大学学报 (自然科学版), 40(4):51–56, 2019.
C.Y. Huang and Y.P. Zhang. Prediction based on copula entropy and general regression neural network. Applied Ecology and Environmental Research, 17(6):14415–14424, 2019.
黄春艳. 黄河流域的干旱驱动及评估预测研究. 博士学位论文, 西安理工大学, 2021.
Lingling Ni, Dong Wang, Jianfeng Wu, Yuankun Wang, Yuwei Tao, Jianyun Zhang, Jiufu Liu, and Fei Xie. Vine copula selection using mutual information for hydrological dependence modeling. Environmental Research, 186:109604, 2020.
P. Kanthavel, C.K. Saxena, and R.K. Singh. Integrated Drought Index based on Vine Copula Modelling. International Journal of Climatology, 2022.
M. Mohammadi, M. Emadi, and M. Amini. Bivariate dependency analysis using Jeffrey and Hellinger divergence measures based on copula density estimation by improved probit transformation. Journal of Statistical Sciences, 15(1):233–254, 2021.
Pengcheng Xu, Dong Wang, Vijay P. Singh, Yuankun Wang, Jichun Wu, Lachun Wang, Xinqing Zou, Yuanfang Chen, Xi Chen, Jiufu Liu, Ying Zou, and Ruimin He. A two-phase copula entropy-based multiobjective optimization approach to hydrometeorological gauge network design. Journal of Hydrology, 555:228–241, 2017.
王栋, 徐鹏程, 王远坤, and 吴吉春. 一种基于 Copula 熵的水文站网优化模型的优化方法, 2019. CN106897530B.
Heshu Li, Dong Wang, Vijay P. Singh, Yuankun Wang, Jianfeng Wu, Jichun Wu, Ruimin He, Ying Zou, Jiufu Liu, and Jianyun Zhang. Developing a dual entropy-transinformation criterion for hydrometric network optimization based on information theory and copulas. Environmental Research, 180:108813, 2020.
Heshu Li, Dong Wang, Vijay P. Singh, Yuankun Wang, Jianfeng Wu, and Jichun Wu. Developing an entropy and copula-based approach for precipitation monitoring network expansion. Journal of Hydrology, 598:126366, 2021.
徐鹏程, 仇建春, 李帆, 刘赛艳, and 蒋新跃. 基于高维 Copula 熵和克里金的站网优化方法, 2022. CN114595556A.
徐鹏程, 李帆, 张昌盛, and 仇建春. 基于 C-Vine Copula 熵多目标优化模型的水文气象站网优化研究. 中国农村水利水电, 2:16–21, 2022.
杨惜岁. 多目标准则下流域水文站网的优化与评价. 硕士学位论文, 武汉理工大学, 2019.
Lu Chen and Shenglian Guo. Copulas and its application in hydrology and water resources. Springer, 2019.
Xu Wang and Yong-Ming Shen. A framework of dependence modeling and evaluation system for compound flood events. Water Resources Research, 59(8):e2023WR034718, 2023.
Longxia Qian, Yong Zhao, Jianhong Yang, Hanlin Li, Hongrui Wang, and ChengZu Bai. A new estimation method for copula parameters for multivariate hydrological frequency analysis with small sample sizes. Water Resources Management, 36(4):1141–1157, March 2022.
刘磊, 高超, 王志刚, 王晓艳, 章四龙, and 陈娜. 基于非线性相关性和复杂网络的径流相似性分区. 水科学进展, 33(3):442–451, 2022.
Victor Costa Porto, Francisco de Assis de Souza Filho, Taís Maria Nunes Carvalho, Ticiana Marinho de Carvalho Studart, and Maria Manuela Portela. A GLM copula approach for multisite annual streamflow generation. Journal of Hydrology, 598:126226, 2021.
黄朝君, 贾建伟, 秦赫, and 王栋. 基于 Copula 熵-随机森林的中长期径流预报研究. 人民长江, 52(11):81–85, 2021.
Zengchao Hao and Vijay P. Singh. Integrating entropy and copula theories for hydrologic modeling and analysis. Entropy, 17(4):2253–2280, 2015.
Francesca Condino. La divergenza di Jensen-Shannon nell’algoritmo di clustering dinamico per dati descritti da distribuzioni multivariate. PhD thesis, Università degli Studi di Napoli Federico II, 2009.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-3 02:59
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社