科学网-基于慢特征分析的分布式动态工业过程运行状态评价-欧彦的博文

基于慢特征分析的分布式动态工业过程运行状态评价

2024-5-17 13:21

阅读：426

引用本文

钟林生, 常玉清, 王福利, 高世红. 基于慢特征分析的分布式动态工业过程运行状态评价. 自动化学报, 2024, 50(4): 745−757 doi: 10.16383/j.aas.c230154

Zhong Lin-Sheng, Chang Yu-Qing, Wang Fu-Li, Gao Shi-Hong. Distributed operating performance assessment of dynamic industrial processes based on slow feature analysis. Acta Automatica Sinica, 2024, 50(4): 745−757 doi: 10.16383/j.aas.c230154

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c230154

关键词

分布式模型，运行状态评价，慢特征分析，动态时间规整，K-medoids聚类

摘要

现代工业过程通常具有规模大、流程长和工序多的特点, 导致传统的集中式建模方法会淹没过程的局部变化信息, 从而无法及时识别早期的非优运行状态. 此外, 闭环控制的广泛应用使得过程变量普遍存在时序相关性. 针对以上问题, 提出一种基于慢特征分析(Slow feature analysis, SFA)的分布式动态工业过程运行状态评价方法. 首先, 结合动态时间规整(Dynamic time warping, DTW)和K-medoids聚类算法对过程进行分解; 然后, 对每一变量子块建立相应的动态慢特征分析(Dynamic slow feature analysis, DSFA)模型; 最后, 利用贝叶斯推理获得全局的综合评价指标. 通过在数值案例和金湿法冶金过程的仿真应用, 验证了该方法的有效性.

文章导读

随着科技水平的快速发展, 企业对生产过程的精细化管理提出了更高要求. 如何在保证生产安全和产品质量的前提下进一步提高综合经济指标, 成为企业在当今激烈竞争的市场环境中存活的关键. 为实现上述目标, 企业不仅要求生产过程处于正常的状态, 还渴望追求过程运行在优状态[1]. 在企业投产初期, 工程师会利用过程知识和优化技术, 使得过程处于优运行状态. 但是, 由于外部扰动、过程参数的漂移和现场人员的不当操作等原因, 过程会逐渐偏离最初设定的优运行区域[2]. 如果不能及时地检测出过程运行性能的退化, 轻则降低企业的经济效益, 重则演化为故障, 威胁企业生产人员的安全. 为了应对以上问题, 过程运行状态评价和过程监测技术应运而生. 运行状态评价是评估工业过程运行状态优劣等级的方法, 其隶属于广义上的过程监测范畴, 但在实现目标方面又有显著不同[3]. 具体而言, 与传统过程监测技术仅将过程划分为正常与故障两种状态相比, 运行状态评价方法进一步将正常运行的生产过程细分为多个性能等级(例如优和非优). 运行状态评价可以看作是能够满足更高企业要求的扩展型过程监测方法. 因此, 研究及时、准确和全面的工业过程运行状态评价方法, 对保障企业生产安全和提高企业综合经济指标, 具有重要的理论价值和实际意义.

在过去的20年中, 运行状态评价获得了学术界和工业界的广泛关注. 为了处理工业过程的多模态特性, Ye等[4]采用高斯混合模型识别过程所处的模态, 并开发了一种将优性评价指标划分为不同等级的分类方法. 考虑到并非所有过程变量都会显著地影响过程的运行状态, Fan等[5]首先采用皮尔逊相关系数选出与评价指标高度相关的变量, 然后利用最小二乘支持向量机模型实现过程运行状态的划分. 针对新过程训练数据不足问题, Zou等[6]采用交叉域特征迁移算法, 将旧过程的通用信息迁移到新过程中, 从而提高新过程的评价模型的精度. 为了同时评价过程稳定模态和过渡模态的运行状态, Liu等[7]基于综合经济指标制定评价策略, 对稳定模态通过高斯过程回归预测综合经济指标, 对过渡模态采用历史数据库中相似过渡模态的综合经济指标的加权平均值作为当前过渡模态的评价指标. 为了更好地处理过程数据中存在的不确定性信息, Wang等[8]结合特征选择、即时学习和概率主成分回归, 建立评价指标的预测模型, 并通过概率模糊推理将多个评价指标转换为最终的评价结果. 虽然文献[1-8]对过程运行状态评价进行了广泛探索并取得了巨大成就, 但是上述研究成果普遍基于静态模型, 忽略了过程的动态特性. 当过程数据中包含动态信息时, 直接将静态模型应用到动态数据是一种线性静态近似, 并不能准确地揭示变量之间的关系[9]. 在广泛应用闭环控制的工业过程中, 变量的时序相关性是普遍存在的[3]. 为挖掘过程数据的动态特性, 学者们相继提出了典型变量分析、动态独立成分分析、动态主成分分析(Dynamic principal analysis, DPCA)和动态慢特征分析(Dynamic slow feature analysis, DSFA)等方法[9-12]. Sedghi等[13]采用动态主成分回归技术预测过渡模态的综合经济指标, 改善了文献[7]的运行状态评价性能. Zou等[14]将典型变量分析和慢特征分析(Slow feature analysis, SFA)进行分层组合, 提取过程更深层次的特征, 从而更加细致地刻画运行状态的等级. 虽然上述方法[9-14]对一般的动态过程很有效, 但是它们都是集中式模型, 在应用于规模较大的工业过程时, 很可能会因为忽略了过程的局部信息而降低模型评价非优状态的灵敏性. 需要注意的是, 上述基于分类[4-6]或回归技术[7-8, 13]运行状态评价方法的应用前提是能获得足够多优状态和非优状态的训练数据. 但在实际生产过程中, 任意一个或多个变量发生不同程度的偏移都有可能导致过程处于非优状态. 由于经济和技术条件限制, 在企业投产初期, 几乎不可能获得所有非优状态的完整数据集. 针对非优状态模式多样但可获得的非优状态数据量相对较少的情况, 用于表示优运行区域的闭合决策边界往往会比表示优与非优状态的分隔决策边界更具可靠性. 以多元统计分析技术[15]和一类分类技术[16]为代表的数据描述方法为上述情况提供了很好的解决方案.

针对现代工业过程规模大、流程长和工序多的特点[17], 分布式模型得到了越来越多学者们的关注. 分布式建模策略是经过过程分解、子模型建立和子模型结果融合而得到, 因而更适用于规模较大的工业过程[18]. Liu等[19]提出一种基于全潜结构投影模型的分布式运行状态评价方法. 为了应对工业过程大数据问题, Zhu等[20]基于MapReduce框架, 设计一种分布式并行主成分分析方法. 考虑到字典学习能够有效减少高维数据的计算和存储负担, Huang等[21]提出一种基于字典学习的分布式过程监测方法. 然而, 上述方法[18-21]均根据过程拓扑或机理知识实现过程的分解, 有可能无法将过程变量划分为概念上有意义的重叠或不相交的子块[22]. 此外, 当面对大规模和高复杂度的工业过程时, 很难保证过程知识的完备性. 为了解决这个问题, 近年来涌现出一些数据驱动的过程分解方法[23], 即根据过程变量的统计特性将其划分为多个子块. Ge等[24]根据主成分的不同投影方向构造子块, 将原始特征空间自动地划分为若干个子特征空间. 为了处理过程的非线性, Jiang等[25]利用互信息将相似性高的变量划分为同一子块, 并对每一子块建立核主成分分析模型, 从而有效地挖掘出过程数据中的非线性信息和局部信息. 显然, 以上过程分解方法[18-21, 24-25]并未充分利用过程的动态信息. 为了解决该问题, Tong等[22]基于皮尔逊相关系数, 提出一种动态特征选择方法, 但其子块个数等于过程变量数, 这在一定程度上过度强调过程的局部信息, 很可能会导致模型的误报率升高. Zhong等[26]在文献[22]基础上, 采用最小冗余最大相关性(Minimal redundancy maximal relevance, mRMR)实现过程的分解, 但mRMR本质上是一种非线性特征选择方法, 并不能充分利用过程数据的动态信息.

以上分析表明, 充分利用动态信息的过程分解方法还需要进一步研究. 此外, 过程分解方法需要与相应的子模型的建模原理密切相关, 才有可能显著地提高分布式评价模型的性能. 以此为动机, 本文提出一种分布式动态过程运行状态评价方法. 首先, 结合动态时间规整(Dynamic time warping, DT-W)[27]和K-medoids聚类算法[28], 实现过程子块的划分; 然后, 针对每一变量子块建立相应的DSFA模型; 最后, 利用贝叶斯推理获得全局的综合评价指标, 从而实现大规模工业过程的运行状态评价. 为方便后续阐述, 将本文方法命名为分布式动态慢特征分析(Distributed dynamic slow feature analysis, DDSFA). 本文工作的主要贡献如下: 1)结合动态时间规整和K-medoids聚类算法对过程进行分解, 将波形相近的过程变量划分到相同的子块, 提高了DSFA算法对过程动/静态信息的表征能力; 2)与传统动态模型为所有变量选择单一时滞系数不同的是, 本文设计一种新颖的时滞系数确定方法, 使得不同子块可以具有不同的时滞系数, 增加了子模型的多样性.

图 1 基于DDSFA的运行状态评价流程图

图 2 数值仿真算例中, 案例1的运行状态评价结果

图 3 数值仿真算例中, 案例2的运行状态评价结果

为充分挖掘大规模工业过程的动态信息和局部信息, 本文提出一种基于慢特征分析的分布式动态工业过程运行状态评价方法. 首先, 结合DTW和K-medoids聚类算法实现过程变量子块的划分, 一是减少了对过程机理知识的依赖, 二是充分利用了过程数据的动/静态信息; 然后, 在建立子模型阶段, 与传统动态建模方法对所有过程变量选择单一的时滞系数不同的是, 本文设计一种新颖的时滞系数确定方法, 在降低模型的计算复杂度的同时, 增加了子模型的多样性; 最后, 利用贝叶斯推理融合子块的评价结果, 简化了触发非优运行状态报警的最终决策. 将本文方法应用于数值仿真案例和金湿法冶金过程, 仿真对比结果表明, 该方法具有一定的优越性. 然而, 本文方法主要面向线性动态工业过程, 如何将其扩展到非线性动态过程或非平稳过程, 值得进一步研究.

作者简介

钟林生

东北大学信息科学与工程学院博士研究生. 主要研究方向为复杂工业过程运行状态评价, 机器学习. E-mail: zhonglinsheng_neu@163.com

常玉清

东北大学信息科学与工程学院教授. 主要研究方向为复杂工业过程运行状态评价, 故障诊断. 本文通信作者. E-mail: changyuqing@ise.neu.edu.cn

王福利

东北大学信息科学与工程学院教授. 主要研究方向为复杂工业过程智能控制, 故障诊断和运行状态评价. E-mail: wangfuli@ise.neu.edu.cn

高世红

山西大学自动化与软件学院讲师. 主要研究方向为航天器姿态控制, 有限时间控制和预设性能控制. E-mail: gaoshihong@sxu.edu.cn

转载本文请联系原作者获取授权，同时请注明本文来自欧彦科学网博客。

链接地址：https://wap.sciencenet.cn/blog-3291369-1434496.html?mobile=1

分享到:

当前推荐数：0

推荐到博客首页

网友评论0 条评论

该博文允许注册用户评论请点击登录