博文

基于深层卷积随机配置网络的电熔镁炉工况识别方法研究

已有 564 次阅读 2024-4-3 16:36 |系统分类:博客资讯

引用本文

李帷韬, 童倩倩, 王殿辉, 吴高昌. 基于深层卷积随机配置网络的电熔镁炉工况识别方法研究. 自动化学报, 2024, 50(3): 527−543 doi: 10.16383/j.aas.c230272

Li Wei-Tao, Tong Qian-Qian, Wang Dian-Hui, Wu Gao-Chang. Research on fused magnesium furnace working condition recognition method based on deep convolutional stochastic configuration networks. Acta Automatica Sinica, 2024, 50(3): 527−543 doi: 10.16383/j.aas.c230272

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c230272

关键词

电熔镁炉，深层卷积随机配置网络，高斯差分卷积核，类激活映射图，可解释性

摘要

为解决电熔镁炉工况识别模型泛化能力和可解释性弱的缺陷, 提出一种基于深层卷积随机配置网络(Deep convolutional stochastic configuration networks, DCSCN)的可解释性电熔镁炉异常工况识别方法. 首先, 基于监督学习机制生成具有物理含义的高斯差分卷积核, 采用增量式方法构建深层卷积神经网络(Deep convolutional neural network, DCNN), 确保识别误差逐级收敛, 避免反向传播算法迭代寻优卷积核参数的过程. 定义通道特征图独立系数获取电熔镁炉特征类激活映射图的可视化结果, 定义可解释性可信度评测指标, 自适应调节深层卷积随机配置网络层级, 对不可信样本进行再认知以获取最优工况识别结果. 实验结果表明, 所提方法较其他方法具有更优的识别精度和可解释性.

文章导读

氧化镁作为电熔镁砂(又称电熔镁)的主要成分, 是一种碱性耐火原材料, 广泛应用于航空航天、核子熔炉、电子电器等领域. 作为全球最大的电熔镁生产国和供应国, 我国菱镁矿石普遍存在品位低、成份波动大、矿物组成复杂等特性, 需要采用特有的三相交流电极电熔镁炉进行熔炼. 电熔镁炉的冶炼过程是边进料边冶炼, 由机器将原料倒入电熔镁炉, 通过炉内高温电弧对原料进行加热生成氧化镁晶体[1−2]. 由于氧化镁的熔点高达2850 ℃, 整个生产过程电能消耗极高, 单台电熔镁炉的日均耗电量在40000 kWh左右, 占生产成本的60%以上, 属于典型的重大耗能设备.

为了保证电熔镁的品质, 需要对生产过程进行监控, 防止冶炼过程中可能出现的异常工况, 包括欠烧、过热和异常排气等. 欠烧工况是由于原料中含有杂质和复杂矿物导致电熔镁炉中原料燃烧不充分而产生的异常工况, 此时炉壁局部被烧红、发亮; 过热工况时炉口火焰较亮, 可能会产生镁烟尘和氧化镁等不良物质; 异常排气工况时炉口会有高温熔体喷射, 此时电流变化剧烈. 出现这些异常工况时, 需要及时发现并处理, 否则会导致能耗浪费, 镁资源利用率和镁砂品位降低, 镁炉烧穿, 原料泄漏威胁操作人员的安全. 目前镁炉异常工况的诊断很大程度上还需要依靠人工决策. 由于炉口存在燃烧的火焰无法直接观测内部熔池, 操作人员需要克服炉壁周围冷却管道形成的不确定位置/浓度高亮度水雾干扰, 围绕炉壁感知随着原料间断加入形成的熔池高度变速率增长多模态工况, 凭借经验反复推敲比对评估当前工况, 利用电流控制系统使三相电极电流跟踪熔炼电流设定值[3−4]. 然而, 每个巡检人员负责多台熔炉, 受制于人员多角度多方位反复观测的经验、责任心和劳动强度等主观因素以及复杂烧制环境中高温、噪音、灰尘、水雾和炉壁固有白斑等客观因素的影响, 知识无法解释和积累传承, 容易导致漏检或误检而造成电熔镁炉烧穿等不可逆损失, 难以满足实时巡检的运维需求.

近年来, 随着人工智能技术的不断发展, 借助机器学习、深度学习对电熔镁炉工况进行异常诊断受到广泛关注. 这些方法通过对镁炉生产数据进行采集和处理, 提取各种特征参数, 利用算法对异常工况进行自动诊断. 例如文献[5−6] 提出了一种基于贝叶斯网络的镁炉异常工况诊断方法, 引入迁移学习解决异常工况数据量少的问题. 文献[7]采用半监督学习对无标签电流数据进行自动标注, 对在半监督学习框架下构造的分类器进行训练. 文献[8]将卷积神经网络(Convolutional neural network, CNN)与长短期记忆网络(Long short-term memory, LSTM)相结合, 分别提取电熔镁炉的空间特征和时序特征, 以识别欠烧工况. 文献[9]采用深度卷积生成对抗网络进行数据增强, 利用卷积神经网络提取RGB图像和红外热成像的特征. 文献[10]使用卷积网络、多层双向长短期记忆网络(Bi-directional long short-term memory, Bi-LSTM)和堆叠自动编码器分别提取电熔镁炉工况的图像、声音、电流特征, 将不同特征进行融合后训练工况分类器. 文献[11]使用YOLO目标检测算法检测关键目标区域, 基于AlexNet模型进行镁炉工况分类.

深层卷积神经网络(Deep convolutional neural network, DCNN)是一种人工神经网络, DCNN通常由多个卷积层、激活函数、池化层和全连接层组成, 形成深度的网络结构. 深度结构有利于网络学习更抽象和高级的特征, 使用多个卷积层和池化层用于逐层提取图像特征, 提高了网络的表达能力. 具体而言, 卷积层使用卷积核来捕获图像的局部特征, 而池化层则通过降采样操作减少特征图的维度, 保留重要的信息. 虽然深度学习在图像领域已被广泛使用, 但是依然存在一些亟待解决的难题. 深层神经网络的黑盒特性本质上是由于其内部神经元学习到的特征与人类所理解的语义概念之间存在不一致性所导致的. 深度学习的可解释性是指模型的决策过程可以被清晰地理解和解释, 是人们理解模型程度和对决策信任程度的重要指标. 目前, 深度学习模型的可解释性具有不同层面的呈现方式, 包括特征可视化[12]、分析可视化[13]、局部和全局可解释性[12]、具有解释性的网络结构设计[14]等. 其中, 具有解释性的网络结构可以使用户理解模型, 不仅能观察模型的预测结果, 还能了解模型产生决策的原因, 在模型出错时可以自行修复模型[15]. 传统的网络构建方法通常是基于人类的先验知识和经验进行迭代试错, 寻找最佳的超参数, 时间消耗巨大. 近年来, 研究者提出了一些自动的网络结构搜索方法. 文献[16]通过构建计算图共享子图间的参数进行训练, 寻找最优神经网络架构. 文献[17]使用RNN生成网络的描述并采用强化学习训练RNN. 文献[18]使用组稀疏性正则器自动确定网络每层节点个数. 然而, 这些方法搜索空间巨大、计算效率不高且需要提前确定网络层级. 另外, 采用反向传播梯度下降方法训练神经网络存在权重初始化、局部最小值以及学习性能对学习率设置敏感等问题[19], 同样制约了深度学习模型的性能. 因此, 亟待研究一种具有可解释性网络结构的快速有效自动构建方法.

为了解决神经网络训练时间长、易陷入局部最小、与学习能力密切相关的隐含层节点个数难以确定等问题, 随机学习算法应运而生. 该算法随机分配输入权重和偏移并通过最小二乘法计算输出权重. 与随机向量函数连接网络(Random vector functional link networks, RVFL)[20]相比, 随机配置网络(Stochastic configuration networks, SCNs)[21]基于增量式随机算法, 采用不等式约束神经元随机参数的分配并自适应地选择随机参数的范围, 基于监督机制确保所构建随机学习器的万局逼近能力. 文献[22]提出二维随机配置网络(Two dimension stochastic configuration network, 2DSCN), 可以直接处理二维数据, 较SCNs在图像数据建模方面的泛化性能有所提高. 文献[23]提出一种深度随机配置网络(Deep stochastic configuration network, DeepSCN), 网络中每一层的隐含节点都与输出相连, 使网络可以学习到更丰富的特征表征. 为解决非稳态数据流的持续学习问题, 文献[24]提出一种深度堆叠随机配置网络(Deep stack stochastic configuration network, DSSCN), 网络结构可以自主加深和减浅. 然而, 虽然SCNs构建了可学习的神经元网络, 但是对于图像特征的提取能力较弱, 无法很好地表征感兴趣的图像信息.

电熔镁炉运行环境的特殊性导致了识别模型的泛化能力问题. 高亮度水雾、炉壁白斑、强光等干扰因素对图像质量造成了极大影响, 使得已经训练良好的模型在测试集上的表现出现较大下降, 产生了泛化能力弱的现象. 解决这一问题需要寻找适用于电熔镁炉环境的处理方法, 以确保模型能够在多样化的工况下保持准确性. 因此, 本文引入具有物理含义的高斯差分卷积核, 有助于区分由水雾、白斑、强光等因素导致的图像纹理信息缺失, 使模型能够较为准确地区分镁炉图像的水雾和白斑. 并且本文使用随机配置方法构建深层卷积网络, 其网络结构在增量学习过程中确定, 每增加一个卷积核/卷积层, 网络误差逐渐收敛, 使得网络结构更加紧致, 冗余卷积核更少, 更加利于模型的泛化性能. 同时, 传统模型架构固定(卷积层数和卷积次数固定), 设计缺乏明确意义, 卷积核没有物理含义, 会出现卷积核冗余导致网络结构复杂等现象, 这限制了模型在实际应用中的可靠性和可信度. 而本文采用的深层卷积随机配置网络(Deep convolutional stochastic configuration networks, DCSCN)架构, 从单层网络单个卷积开始构建, 直至满足预设误差限, 构建过程中网络误差逐渐收敛且无需反复训练, 使得网络更加可信. 这种网络结构紧致且具有高度的可信度, 使得本文模型在实际应用中更具有可信度.

综上所述, 本文针对电熔镁炉运行环境的特殊性导致识别模型的泛化能力差问题以及可解释性弱的缺陷, 借鉴SCNs的增量学习方法, 提出一种基于深层卷积随机配置网络的可解释性电熔镁炉异常工况识别方法, 主要工作包括:

1)为了避免传统增量式网络的不足, 本文首次采用随机配置方法构建深层卷积神经网络, 从单层网络单个卷积核开始递增, 直至满足停止迭代条件, 避免了反向传播算法迭代寻优卷积核参数的过程. 具有物理含义的高斯差分卷积核参数通过与数据相关的参数选择策略自动配置, 确保识别误差逐级收敛. 给出了深层卷积神经网络全局收敛能力的证明, 以保证网络的收敛性.

2)为了避免高精度的超分辨算法需要较多训练样本及计算量大, 本文采用双线性插值方法将DCSCN构建的特征图集合上采样至输入图像大小, 与原始图像进行叠加后, 重新输入至当前随机配置卷积层级条件下的DCSCN, 以获得多模态工况隶属于不同类别的得分. 定义通道特征图独立系数, 获取不同通道特征独立得分, 将类别得分、通道特征独立得分与对应通道特征图进行线性组合, 得到类激活映射图, 叠加至原始图像可获得当前层级条件下的电熔镁炉特征可视化结果. 定义可解释性可信度评测指标, 自适应调节DCSCN的层级, 以获取最优工况识别结果.

3)对9000幅电熔镁炉工况数据进行实验验证, 结果表明, 本文方法在测试集上的识别精度为92.31%, 较其他方法具有更高的准确率和可解释性.

图 1 基于深层卷积随机配置网络的可解释电熔镁炉工况识别模型结构图

图 2 深层卷积随机配置网络结构图

图 3 基于特征图独立性得分的类激活映射示意图

针对现有电熔镁炉异常工况识别方法泛化能力差、可解释性弱等问题, 本文提出异常工况可解释性识别模型, 创新点如下:

1)基于监督学习机制采用增量式随机配置策略, 生成具有物理含义的高斯差分卷积核构建深层卷积网络, 确保识别误差逐级收敛, 具有网络结构透明和可解释性的特点.

2)采用类激活映射方法对模型进行可解释性分析, 标识需关注的镁炉特征区域, 定义可解释性可信度评测指标, 自适应调节网络层级对不可信样本进行再认知, 以获取最优工况识别结果.

3)本文方法的电熔镁炉异常工况漏诊率为5.24%, 误诊率为2.45%, 精度为92.31%, 较其他识别方法更优.

未来将采用块增量技术, 进一步提升深层卷积随机配置网络的建模速度和精度.

作者简介

李帷韬

合肥工业大学电气与自动化工程学院副教授. 主要研究方向为深度学习, 图像处理和智能认知. E-mail: wtli@hfut.edu.cn

童倩倩

合肥工业大学电气与自动化工程学院硕士研究生. 主要研究方向为智能认知. E-mail: 2021110400@mail.hfut.edu.cn

王殿辉

中国矿业大学人工智能研究院教授. 主要研究方向为工业大数据建模与分析, 随机配置学习理论及工业应用. 本文通信作者. E-mail: dh.wang@deepscn.com

吴高昌

东北大学流程工业综合自动化国家重点实验室副教授. 主要研究方向为智能计算成像, 深度学习和异常工况智能感知与预测. E-mail: wugc@mail.neu.edu.cn

转载本文请联系原作者获取授权，同时请注明本文来自欧彦科学网博客。
链接地址：https://wap.sciencenet.cn/blog-3291369-1428081.html

上一篇：基于数据驱动的冗余机器人末端执行器位姿控制方案
下一篇：面向复杂物流配送场景的车辆路径规划多任务辅助进化算法

收藏 IP: 117.114.9.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

欧彦

扫一扫，分享此博文

全部作者的精选博文

• 2023年度自动化领域国家自然科学基金申请与资助情况

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于深层卷积随机配置网络的电熔镁炉工况识别方法研究

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于深层卷积随机配置网络的电熔镁炉工况识别方法研究

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)