|
本文继续介绍Copula熵(Copula Entropy:CE)在地球物理学、材料学、认知神经学、通讯工程和金融学等学科的实际应用,包括南京信息工程大学的土地干旱度分类、中南大学的高纯金属制备、莫斯科大学的特化神经元鉴别、西安电子科技大学的6G通信技术研究和清华大学的P2P借贷个人信用风险评估等。
地球物理学
土地干旱度是土地表面水分和能量动态交互过程的属性,传统的干旱度度量大多使用气候条件变量的长期均值来进行计算,难以反映短期的地表水分-能量交互。蒸散是表征短期地表的水汽-能量交互过程的关键变量,包括土地和植物表面的水分散发,传统上根据土壤湿度和能量供应将其分成水分驱动、能量驱动和过渡型三种概念框架。研究表明,蒸散-土壤湿度关系也受其他因素影响,如云层、风速和植被等,考虑这些因素如何影响蒸散为开发新的土地干旱度分类框架提供了可能性。Shan 等 [1] 通过考虑土地-大气的短期耦合效应,提出了一种新的刻画土地干旱度的方法。该方法利用基于 CE 的条件互信息分别计算蒸散与土壤湿度和太阳辐射的因果关系强度,再利用这两种因果关系的差值将土地干旱度分为 6 种类型,分别对应到三种蒸散概念框架。他基于 1990 至2020 年间夏季中国大陆的气温、露点温度、土壤湿度、潜在热流、敏感热流、蒸散和地表太阳辐射等逐小时记录数据,利用该方法得到了土地干旱度空间分布图,并与联合国环境规划署的干旱度指数进行了对比,发现该方法计算得到的条件互信息分布图与水分和能量的地理分布相符,由此得到的干旱度分布能够更精确地捕捉短期地表过程,因此提供了一种短期土地-大气交互过程的有价值的补充信息。该方法加深了对气候干旱特征的理解,提供了一种对极端热浪和骤发干旱等短期气候变化具有敏感度的表征工具方法。
材料学
高纯金属材料是具有很高纯度的特殊材料,具有高电导率和稳定性、良好的光学性能等物理特性,是制造各种精密科学仪器和高科技产品的必备材料。制备高纯金属需要精密的工艺来保证高纯度,但传统工艺方法普遍存在制备纯度低的问题。真空蒸馏法则可以绿色高效地提纯金属,但其工艺参数需要手动调节,依赖于人的经验。田庆华等 [2] 提出了一种真空蒸馏制备高纯金属的优化方法,利用 CE 等机器学习技术筛选出能够保证高纯度和低杂质的工艺参数集合,建立以纯度和杂质含量为目标变量的预测模型,再基于此模型利用参数寻优方法得到最佳工艺参数,用于高纯金属制备。他利用该方法进行了真空蒸馏制备高纯金属硒和碲的工艺参数优化实验,基于 CE 等特征选择方法发现蒸馏温度、保温时间、冷凝温度和真空度对制备纯度具有重要性,保温时间、蒸馏温度、升温速度和冷凝温度对杂质含量具有重要性。经过不断的迭代循环实验,该方法所得工艺参数能够获得良好的制备效果,可以根据不同产品需求对工艺参数进行自动控制优化。
认知神经学
神经元特化(neuron specification)是指其具有执行特定功能的属性,可以通过研究外部环境刺激和神经响应信号之间的关系来鉴别。互信息作为一种非线性关联关系度量,是研究此问题理想的工具。Pospelov 等 [3] 利用基于CE理论的 GCMI 方法计算钙荧光信号和环境变量、动物行为之间的相关性强度,对小鼠大脑海马的CA1 区记录的钙信号进行了分析,揭示了与动物外部环境相关的特化神经元,如位置神经元,以及与其行为活动相关的特化神经元,如在跑、直立和静止时活动的神经元。研究也发现了一些对离散变量进行响应的神经元,如动物的场地位置(中央,靠墙和角落)和其速度(休息、慢和快)。他在四组实验中一共检测到 472 个神经元的 781 种特化。
通信工程
第 6 代(6G)通信网络技术的研发需要面对的主要挑战之一就是要达到更高的数据传输率,以满足更极致的体验、3D 视觉、工业智能等场景需求。传统的通信理论没有考虑传输信息中的语义信息,而 6G 技术可以利用基于 AI 的语义通信来达到更高的网络传输性能。傅宇舟等 [4] 提出了一种面向 6G 网络的基于语义通信的端到端服务框架,将语义通信与 AI 的语义分析能力相融合,利用基于 Transformer 的编解码器来压缩语义信息。其中,语义编码器的损失函数由基于欧式距离的语义损失函数和基于 CE 的信息量损失函数组成。他们利用图像数据验证了该服务框架,使用 ImageNet-1K 数据集训练框架,再使用VOC2012 数据集进行仿真验证。结果表明,与传统通信方案相比,该服务框架在目标检测和图像语义重建上均取得了最优性能,且取得了与全语义特征传输方案相近的性能,有望成为 6G 网络的技术内容。
金融学
P2P (Peer-to-Peer)借贷是一种通过互联网进行集资和放贷的金融模式,该类金融模式的信用风险主要是由借贷人未能履行还款义务造成的,对集资债权人的资金安全构成了巨大风险。因此,如何准确地评估借贷方的信用风险是一个重要问题,通过借贷数据构建个人信用风险模型是一个主要的解决方法。彭翊庭 [5] 提出利用 CE 度量风险变量和个人数据高维特征之间的非线性相关性,用以选择个人信用风险预测模型的输入特征。他利用美国 P2P 借贷平台Lending Club 的贷款数据展开实证研究,对比了 CE 和皮尔逊相关系数两种常用特征选择方法,发现 CE 选择的非线性特征在 XGBoost 模型上获得了更好的预测结果。
更多Copula熵的多学科实际应用,请见我们发表在ChinaXiv上的综述论文。
参考文献
Yufeng Shan, Jiangfeng Wei, and Beilei Zan. Improving estimates of land–atmosphere coupling through a novel framework of land aridity classification. Geophysical Research Letters, 51(2):e2023GL106598, 2024.
田庆华, 崔璇, 许志鹏, and 郭学益. 一种真空蒸馏制备高纯金属的优化方法及优化系统, 2024. CN117577229A.
NA Pospelov, VP Sotskov, VV Plusnin, OS Rogozhnikova, KA Toropova, OI Ivashkina, and KV Anokhin. Searching for cognitive specializations of neurons using mutual information framework. Genes & Cells, 18(4):878–881, 2023.
傅宇舟, 程文驰, 陈小军, and 李赞. 面向 6G 网络的基于语义通信的端到端服务框架. 移动通信, 47(6):35–40, 2023.
彭翊庭. 个人信用风险评估模型比较——基于 Copula 熵的特征选择. 硕士学位论文, 清华大学, 2022.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-3 03:05
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社