Ouariel
基于Koopman特征核的工业时频因果时延推理网络
2025-9-30 15:36
阅读:1443

引用本文

 

翁若昊, 郝矿荣, 陈磊, 丁贺, 刘肖燕. 基于Koopman特征核的工业时频因果时延推理网络. 自动化学报, 2025, 51(8): 18291841 doi: 10.16383/j.aas.c240810

Weng Ruo-Hao, Hao Kuang-Rong, Chen Lei, Ding He, Liu Xiao-Yan. Koopman feature kernel-based time-frequency causal and delay inference network for industrial systems. Acta Automatica Sinica, 2025, 51(8): 18291841 doi: 10.16383/j.aas.c240810

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c240810

 

关键词

 

因果推理,工业系统,再生核希尔伯特空间,状态空间模型

 

摘要

 

因果推理在复杂工业系统中对产能分析和产出优化具有重要意义. 然而, 现有方法难以有效处理这种高度非线性和时延的复杂因果关系. 为此, 提出一种基于Koopman特征核的时频因果与时延推理网络, 用于复杂工业过程的因果分析与时延识别. 该方法结合Koopman特征变换与再生核理论设计核回归层, 在保留时间信息的基础上, 将数据映射到高维再生核希尔伯特空间以提取时不变的非线性关系. 同时, 通过证明非线性格兰杰因果关系在时频域上的一致性, 进而在时域上融入频域特征以提取时间维度的全局信息并捕获变量间的时延关系. 此外, 针对长时延问题, 设计基于状态空间模型的时延发现网络. 实验结果表明, 该方法在三个公共数据集上表现优异, 并在聚酯纤维酯化过程的实际应用中进一步验证了其有效性.

 

文章导读

 

在复杂工业系统中, 洞察变量间的因果关系有助于分析产能并优化产品质量. 由于工业生产流程的复杂性, 对工业生产过程建立准确的机理模型比较困难[1]. 随着工业化进程加速, 现代工业广泛应用控制系统和传感器满足生产需求[2]. 这些数据蕴含大量生产规律, 使通过数据挖掘以低成本完成因果分析成为可能[3]. 因此, 数据驱动的因果推理方法备受关注, 而准确发现变量间的因果关系及其时间延迟成为关键问题[4]. 现有因果推理方法主要针对静态数据和动态时间序列数据, 分为基于约束、结构因果模型、评分及格兰杰因果的方法[5−6].

 

基于约束的方法, 如偏相关系数(Partial correlation, PC)[7]算法和快速因果推理(Fast causal inference, FCI)[8]算法针对静态问题通过条件独立性验证来建立因果图. 针对时间序列问题, Runge等提出的偏相关与瞬时条件独立性算法(Partial correlation and momentary conditional independence, PCMCI)[9]PCMCI+[10]添加瞬时独立性验证, Assaad[11]则提出贪婪因果熵. 这类方法能处理因果不充分数据, 但在强非线性数据或高维条件集情况下计算成本较高, 且准确性下降. 基于结构因果模型的方法, Shimizu[12]提出静态线性因果发现方法, Hyvärinen[13−14]则利用结构自回归模型(Structural vector autoregression, SVAR)将其扩展至时间序列, 捕获瞬时和延迟因果关系. 此类方法解释性强, 适合干预分析, 但对结构假设和未观测变量较为敏感. 基于评分的方法通过对图结构评分选择最优拟合模型, Zheng[15]提出一种通过迹指数与增广拉格朗日方法实现的非组合优化结构学习(Non-combinatorial optimization via trace exponential and augmented Lagrangian for structure learning, NOTEARS), 将因果学习转化为连续优化问题. Pamfil[16]Sun[17]分别引入结构自回归模型和卷积神经网络以捕获线性和非线性关系. 然而, Kaiser[18]的研究表明, NOTEARS方法面对量纲量时, 并不能识别出真正的因果关系. 格兰杰因果方法[19]通过测试一个序列对另一个序列预测能力的提升判断因果关系. 神经网络扩展了发现非线性格兰杰因果关系的能力, Nauta[20]提出基于注意力机制的时间卷积网络, Liang[21] 则提出交叉协方差注意力机制. 近期, 格兰杰因果开始与主流的深度神经网络结合, 依托于神经网络强大的学习能力学习非线性因果关系[22].

 

工业系统中的因果推理面临两个主要挑战: 一是变量关系的强非线性以及噪声和混杂变量的干扰; 二是显著的时延性. 复杂工业系统通常包含多个相互作用的子系统和因素, 这些因素之间的关系往往是非线性的, 并且受到环境变化、操作条件和系统耦合效应的干扰, 导致系统行为表现出强非线性和混杂变量的复杂性. 时延一方面来源于物料传递的时间, 另一方面是大部分质量变量通常需通过线下检测获得, 导致过程变量与质量变量之间存在显著延迟. 此外, 大多数现有方法依赖严格假设(如因果完备性和无混杂变量), 在处理非线性和长时延问题时存在困难, 难以直接应用于工业系统.

 

针对上述问题, 本文提出一种基于Koopman特征核的时频因果与时延推理网络(Koopman feature kernel-based time-frequency causal and delay inference network, KTFCDN), 包含因果与时延发现两个部分. 其中, 因果发现部分包含三个核心模块: 格兰杰因果发现层、频域特征提取模块和Koopman特征核回归层. 首先, 在时域上融入频域特征捕获时间序列的全局信息, 从而学习变量间的长时延关系; 其次, 利用具有时间不变性的Koopman特征核, 将数据映射至高维再生核希尔伯特空间(Recovery kernel Hilbert space, RKHS), 在保留时域信息的同时提取非线性关系, 显著提升对非线性时延因果关系的建模能力; 最后, 通过结合长短期记忆网络(Long short-term memory, LSTM)的权重矩阵与稀疏化约束, 基于格兰杰因果理论提取非线性变量间的因果关系. 此外, 为解决时延发现问题, 设计一个基于状态空间模型的时延发现模块. 该模块通过编码器和解码器结构实现, 编码器利用卷积神经网络(Convolutional neural network, CNN)和稀疏化约束自适应学习每个时间步的预测权重, 解码器使用状态空间模型, 增强对长时间窗口内时延的识别能力.

 

综上, 本文的贡献如下:

 

1)提出基于Koopman特征核的时频因果与时延推理网络(KTFCDN), 旨在揭示复杂系统中存在强非线性和时延效应的变量因果关系. 设计因果发现模块, 引入Koopman特征核以有效提取时不变的高维非线性特征, 并通过证明非线性格兰杰因果关系在时频域中的一致性, 进而结合频域特征以捕获时域上的全局特征.

 

2)构建基于状态空间模型的时延发现模块, 用于发现因果变量对之间的时间延迟关系. 通过引入状态空间模型以及对编码器的稀疏化约束, 使网络具备发现长期时间延迟关系的能力.

 

3)基于提出的KTFCDN, 通过因果与所设计的时延距离评价指标, 在三个公共数据集上验证了该模型的性能. 将其应用于实际聚酯纤维酯化过程中得到其因果图与对应时延, 并以此为指导, 显著提升预测精度.

1  $ i$KTFCDN结构

2  不同的$ \gamma $值对应的各数据集因果发现F1分数

3  因果邻接矩阵 (1列提供了真实因果的可视化, 其余列提供了由因果发现方法发现的因果图, 错误的因果关系用红色的方框标注)

 

本文提出一种新的因果发现方法: 针对工业过程中时间序列数据具有强非线性、时延的特点, 提出具有时间不变性的Koopman特征核, 通过基于再生核理论建立核回归层, 在不丢失时间信息的基础上建立变量之间的强非线性关系. 同时, 在证明了非线性格兰杰因果关系在时频域上的一致性后, 通过融入频域信息来获得时域上的全局特征, 进一步增强模型建立时延关系的能力. 并且考虑可能存在的较长时延, 基于捕获时间上长期依赖能力更强的状态空间模型, 提出时延发现网络来具体发现时延.

 

然而, 本文方法依然有一定的局限性. 由于使用结构化的因果解耦网络, 在一些非常复杂的工业系统, 如果拥有非常大量的变量, 可能会非常耗时. 另外, 时延发现网络高度依赖因果发现的准确性, 如果因果发现出现错误, 那么网络往往无法发现一个准确的时延关系. 本文提出的方法为今后克服这些限制提供了可能性.

 

作者简介

 

翁若昊

东华大学信息科学与技术学院硕士研究生. 主要研究方向为因果推理, 工业过程时序建模和机器学习. E-mail: 2232138@mail.dhu.edu.cn

 

郝矿荣

博士, 东华大学信息科学与技术学院教授. 1995年获得法国巴黎国家路桥学校数学与计算机科学专业博士学位. 主要研究方向为神经网络, 图像处理, 智能控制, 流程工业的数字化与智能化. 本文通信作者. E-mail: krhao@dhu.edu.cn

 

陈磊

博士, 东华大学信息科学与技术学院副教授. 主要研究方向为过程控制, 系统辨识, 工业大数据分析. E-mail: leichen@dhu.edu.cn

 

丁贺

东华大学信息科学与技术学院博士研究生. 2020年获得东华大学自动化专业学士学位. 主要研究方向为不变表征学习与工业过程的时序预测. E-mail: 2211866@mail.dhu.edu.cn

 

刘肖燕

博士, 东华大学信息科学与技术学院高级实验师. 主要研究方向为智能仿真与优化. E-mail: liuxy@dhu.edu.cn

转载本文请联系原作者获取授权,同时请注明本文来自Ouariel科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3291369-1504213.html?mobile=1

收藏

当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?