IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于虚拟样本生成技术的多组分机械信号建模

已有 718 次阅读 2023-10-23 11:28 |系统分类:博客资讯

引用本文

 

汤健, 乔俊飞, 柴天佑, 刘卓, 吴志伟. 基于虚拟样本生成技术的多组分机械信号建模. 自动化学报, 2018, 44(9): 1569-1589. doi: 10.16383/j.aas.2017.c170204

TANG Jian, QIAO Jun-Fei, CHAI Tian-You, LIU Zhuo, WU Zhi-Wei. Modeling Multiple Components Mechanical Signals by Means of Virtual Sample Generation Technique. ACTA AUTOMATICA SINICA, 2018, 44(9): 1569-1589. doi: 10.16383/j.aas.2017.c170204

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c170204

 

关键词

 

多组分机械信号,高维谱数据,难以检测过程参数,数据驱动建模,虚拟样本生成 

 

摘要

 

采用具有多组分、非平稳、非线性等特性的机械振动/振声信号构建数据驱动软测量模型,是目前工业界测量高能耗旋转机械设备内部难以检测过程参数的常用手段.针对机械信号产生机理的复杂性导致模型解释性弱,以及工业过程连续不间断运行和机械设备旋转封闭的特殊性导致获取完备训练样本的经济性差和周期性长等问题,本文提出一种基于虚拟样本生成(Virtual sample generationVSG)技术的多组分机械信号建模方法.首先,将机械信号自适应分解为具有不同时间尺度的平稳子信号并变换为多尺度谱数据;接着,采用适合于小样本高维数据建模的改进选择性集成核偏最小二乘(Selective ensemble kernel partial least squaresSENKPLS)算法构建面向真实训练样本的基于可行性的规划(Feasibility-based programmingFBP)模型,提出一种综合先验知识和FBP模型等手段面向高维谱数据的VSG技术,用以弥补真实训练样本的短缺问题;然后,基于互信息(Mutual informationMI)对由真实和虚拟训练样本组成的混合建模数据进行自适应特征选择;最后,基于约简的混合训练样本采用SENKPLS构建软测量模型.以近红外谱数据和磨矿过程实验球磨机的筒体振动/振声信号验证所提VSG技术和面向多组分机械信号建模方法的合理性和有效性.

 

文章导读

 

工业过程的优化运行控制[1]需要准确检测与生产过程的质量、产量、能耗等指标密切相关的难以检测的过程参数[2-3], 如磨矿过程广泛使用的大型机械设备球磨机内部的料球比、磨矿浓度、充填率等[4-5].这些过程参数的实时准确检测一直是工业界亟待解决的难题[6].由于流程工业过程的综合复杂特性, 以及机械设备连续旋转和封闭运行的特点, 其内部过程参数难以通过直接检测方式和建立机理模型计算得到[7].虽然运行专家可以依据多源信息和多年工作经验对所熟悉的机械设备内部的过程参数进行较为准确的估计, 但专家经验的差异性和精力的有限性难以保证工业过程长期运行在优化状态.基于这些设备工作中产生的机械振动和振声信号构建数据驱动软测量模型, 是目前该领域重点关注的热点和难点问题[8].下文分别从多组分机械信号建模、建模样本非完备和本文研究动机等3方面予以描述.

 

0.1   多组分机械信号建模

 

机械振动和振声信号通常具有较强的多组分、非线性和非平稳等特性.基于这些信号进行难以检测过程参数软测量的首要难点问题是:如何从机械信号中提取模型的输入特征.这通常包括信号处理和维数约简两个子问题.通常, 机械信号中蕴含的有价值信息被隐含在宽带随机噪声中[9].以磨矿过程的关键设备球磨机为例, 磨机负荷参数与磨机筒体振动和振声信号的功率谱密度(Power spectral density, PSD)密切相关[10].研究表明, 快速傅里叶变换(Fast Fourier transform, FFT)并不适合于具有非平稳特性的振动信号的处理[11].离散小波变换(Discrete wavelet transform, DWT)、连续小波变换(Continuous wavelet transform, CWT)、小波包变换等时频分析方法已经被广泛应用于基于机械振动信号的故障诊断[12-15], 但这些方法不能自适应分解这些多组分机械信号, 如面对任何一个具体实际应用问题需要为CWT选择合适的母小波.经验模态分解(Empirical mode decomposition, EMD)技术突破上述局限, 通过自适应分解获取具有不同时间尺度和物理含义的内禀模态函数(Intrinsic mode function, IMF)[16], 广泛用于处理多组分机械信号[17-19].文献[20-21]采用EMD对磨矿过程的球磨机筒体振动信号进行处理, 分解得到系列具有不同物理含义和不同时间尺度的子信号.研究表明, EMD算法存在频谱分辨率低、虚假组分易造成模态混叠、低能量成分不可分等问题.集成EMD (Ensemble EMD, EEMD)技术克服了EMD的模态混合问题[22], 但仍存在蕴含有价值信息的子信号数量有限及其时频特征难以选择等问题.

 

因机械振动和振声的频域特征明显, 将其进行时频变换是通常采用的处理手段之一.文献[23]提出:将机械信号直接变换至频域的数据称为单尺度频谱, 而将经多组分信号技术分解得到的不同时间尺度子信号变换至频域的数据称为多尺度频谱.显然, 当频率分辨率较高(1 Hz), /多尺度频谱的维数均高达数千维并且谱特征间具有较强的共线性.因此, 维数约简成为基于机械信号构建软测量模型需要面对的又一问题[24].常用的基于遗传算法(Genetic algorithm, GA)的频谱数据特征选择算法存在运行时间长和效率低等问题[25].针对机械振动频谱, 文献[26]提出基于互信息(Mutual information, MI)和潜结构模型的IMF及其多类谱特征的自适应选择方法.研究表明, MI能有效描述输入和输出数据间的映射关系, 并且更易于理解[27]; 但存在寻优耗时等问题.

 

我们认为, 构建基于机械频谱特征的难以检测过程参数软测量模型应尽可能地模拟运行专家选择多维度有价值信息进行过程参数认知的机制.通常, 机械振动/振声信号的多源多尺度频谱是由具有不同物理含义和时间尺度的子信号经时频变换获得.基于这些谱数据构建选择性集成(Selective ensemble, SEN)软测量模型的过程在本质上是选择性的信息融合过程[6].文献[21, 23]基于这样的思路, 构建了基于分支定界(Branch and bound, BB)优化算法和自适应加权融合(Adaptive weighted fusion, AWF)算法的SEN核潜结构映射或核偏最小二乘(Kernel partial least squares, KPLS)算法的软测量模型.从集成学习理论的视角出发, 这些方法均属于"操纵输入特征"的集成构造策略进行模型构建, 所优化选择的是"有价值的多源信息".工业实际中, 运行专家识别难以检测过程参数不仅需要选择有价值的多源信息进行融合, 还需要利用自身积累的历史经验, 即也要选择有价值样本进行认知.基于遗传算法的选择性集成(GA-based selective ensemble, GASEN)[28].采用"操纵训练样本"策略构造集成、采用误差反向传播神经网络(Back propagation neural networks, BPNN)构建候选子模型、采用GA优选集成子模型和简单加权平均组合集成子模型; 针对BPNN训练时间长、容易过拟合和GASEN难以采用高维小样本数据直接建模等缺点, 文献[26]提出了基于"操纵训练样本"集成构造策略的改进选择性集成核偏最小二乘(Selective ensemble kernel partial least squares, SENKPLS)算法; 文献[29]提出了采用双层GA优化改进SENKPLS的建模参数; 文献[30]提出基于稀疏非线性特征的KPLS.显然, 我们需要合适的软测量策略模拟运行专家融合多维度信息的认知机制.

 

0.2   建模样本非完备

 

在实际工业应用过程中, 难以检测过程参数建模经常遇到的更为棘手的难点是:如何获得能够覆盖多种工况和充足完备的建模样本.研究表明, 充足完备的建模样本对于构建有效的学习模型非常重要.通常, 流程工业中难以检测过程参数的建模样本仅能在实验设计阶段或工业过程停产重新运行的起始阶段获得; 否则, 需要以牺牲企业的经济效益或较长周期的时间等待为代价.如何基于短缺、非完备样本构建鲁棒的面向工业应用的数据驱动模型, 一直以来都是个开放性的难题.

 

为提高模型的泛化性能, 图像识别领域首次提出了基于先验知识从给定小规模真实训练样本产生虚拟训练样本的方法[31-33], 即虚拟样本产生(Virtual sample generation, VSG)技术.目前的已有研究包括:利用BPNN和巨型趋势分散技术[34]、利用运行专家知识[35]、利用噪声构造[36]、利用原始样本分布函数[37].对面向高维小样本数据的分类问题, 文献[38]提出了基于分组的VSG用于脱氧核糖核酸(Deoxyribonucleic acid, DNA)微阵列数据建模.上述研究中的VSG多面向分类问题[37, 39].本文主要关注如何利用VSG辅助构建基于多源多尺度谱数据的软测量模型, 即面向回归问题的VSG.

 

针对回归建模问题, 文献[40]提出基于多层感知器网络的VSG技术, 即虚拟样本输入通过选择真实样本输入附近的点产生, 虚拟样本输出通过平均多层感知器网络的不同输出数据获得; 文献[41]提出用分散神经网络(Decentralized neural networks, DNN)产生虚拟样本和建模小数据集, 表明DNNBPNN具有更强的预测性能; 文献[42-44]提出基于遗传算法(GA)、粒子群优化(Particle swarm optimization, PSO)算法以及蒙特卡洛与PSO相结合的VSG; 文献[45]提出一种的产生通用结构数据的采样方法; 但上述这些方法多采用传统的单模型产生虚拟样本.针对具有复杂分布的建模数据或高维小样本数据, 传统的单模型难以有效解决模式识别或回归建模等问题.文献[46]提出的VSG难以直接面对高维谱数据建模.

 

针对真实数据与虚拟数据混合利用问题, 文献[47]提出将基于原始数据的特定小数据和虚拟的人工数据相结合, 然后对机器学习模型进行更新的策略; 文献[48]提出平行学习的概念, 并将其作为机器学习研究方向的一个新型理论框架, 在该框架中提出通过混合人工数据和原始数据进行基于计算实验的预测学习和集成学习.可见, VSG结合具体的工业背景进行研究具有重要的理论和现实意义.

 

0.3   本文研究动机

 

综上可知, 面对基于多组分机械振动/振声信号的流程工业难以检测过程参数的软测量问题, 有以下问题需要解决: 1)如何将蕴含着丰富难以检测过程参数信息的多组分机械振动/振声信号自适应地分解为具有不同物理含义的不同组成成分, 为构建寓意明确的软测量模型和探究旋转机械设备内部的工作机理与振动产生机理奠定基础; 2)如何基于确定性的先验知识和非充足完备的真实训练样本提出适合于高维谱数据的VSG技术; 3)针对基于多组分机械信号, 在利用VSG构建虚拟样本输出时需要解决:如何依据不同时间尺度子信号的谱特征所构建的集成子模型对软测量模型预测输出的贡献率, 对集成子模型的虚拟样本输出进行加权组合以获得统一的虚拟样本输出; 4)如何选择有价值子信号及其高维频域特征, 以及如何选择性融合多源多尺度谱特征和多工况样本, 以便更有效地模拟工业现场运行专家的认知机制.因此, 基于多组分机械信号的软测量建模可以归结为一类针对多源多尺度高维谱数据的小样本建模问题.

 

针对上述需要解决的问题, 综合之前的研究成果, 本文首先提出了一种面向多源多尺度高维谱数据的VSG技术用以解决建模样本的短缺非完备问题; 再以混合训练样本结合MI自适应特征选择技术获取多源输入特征, 并基于改进的SENKPLS算法从操纵训练样本集成构造视角构建软测量模型; 最后采用近红外谱(Near infrared spectrum, NIR)数据和磨矿过程实验球磨机筒体振动与振声信号构建的软测量模型验证本文所提出的VSG技术和面向多组分机械信号建模方法的合理性和有效性.

 1  基于VSG的多组分机械信号建模策略

 2  虚拟样本产生(VSG)模块的结构

 3  NIR真实训练样本输入和输出

 

本文针对流程工业中与产品质量、产量以及效率等经济指标密切相关的关键机械设备内部参数难以准确直接检测, 只能依据这些设备产生的具有多组分、非平稳、非线性等特性的振动/振声信号进行间接测量, 但建模样本却较为稀缺难以充足完备获取等问题, 提出一种基于虚拟样本生成技术(VSG)的多组分机械信号建模方法.采用近红外谱数据和磨矿过程实验球磨机筒体振动和振声信号构建的软测量模型验证了所提VSG技术和面向多组分机械信号建模方法的合理性和有效性.

 

该文的主要贡献是:首次提出基于VSG结合多组分信号自适应分解的多组分机械信号软测量建模策略, 使得所提方法能够贴合工业实际, 其中所包含的面向小样本高维谱数据的VSG技术具有较好的普适性; 综合利用了多组分信号自适应分解、基于互信息的特征选择、基于遗传算法的核潜在模型选择性集成建模等技术, 可以有效地结合特征选择和样本选择策略构建软测量模型, 能够有效模拟工业现场运行专家的认知机制; 对构建物理阐释明确的软测量模型和有效结合复杂工业过程机械设备的虚拟人工系统进行难以检测过程参数软测量具有重要的借鉴意义.

 

作者简介

 

乔俊飞

北京工业大学教授.主要研究方向为智能控制, 神经网络分析与设计.E-mail:junfeq@bjut.edu.cn

 

柴天佑  

中国工程院院士, 东北大学教授.IEEE Fellow, IFAC Fellow, 欧亚科学院院士.主要研究方向为自适应控制, 智能解耦控制, 流程工业综合自动化理论、方法与技术.E-mail:tychai@mail.neu.edu.cn

 

刘卓  

博士, 东北大学流程工业综合自动化国家重点实验室讲师.主要研究方向为复杂工业过程建模.E-mail:liuzhuo@ise.neu.edu.cn

 

吴志伟  

博士, 东北大学讲师.主要研究方向为复杂工业过程的智能优化控制.E-mail:wuzhiwei2006@163.com

 

汤健  

北京工业大学教授.主要研究方向为复杂工业过程智能控制与建模, 数据驱动软测量.本文通信作者.E-mail:freeflytang@bjut.edu.cn



https://wap.sciencenet.cn/blog-3291369-1406901.html

上一篇:行人再识别技术综述
下一篇:一种大气湍流环境下的运动目标自适应检测方法
收藏 IP: 117.114.9.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-17 02:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部