Ouariel
双向建模增强TKAN和全局注意力机制融合的滚动轴承剩余寿命预测
2025-10-3 16:15
阅读:937

引用本文

 

姜蕾, 郑建飞, 胡昌华, 赵瑞星, 韩其辉, 杨立浩. 双向建模增强TKAN和全局注意力机制融合的滚动轴承剩余寿命预测. 自动化学报, 2025, 51(8): 18571868 doi: 10.16383/j.aas.c250064

Jiang Lei, Zheng Jian-Fei, Hu Chang-Hua, Zhao Rui-Xing, Han Qi-Hui, Yang Li-Hao. Bidirectional modeling-enhanced TKAN and global attention mechanism fusion for rolling bearing remaining useful life prediction. Acta Automatica Sinica, 2025, 51(8): 18571868 doi: 10.16383/j.aas.c250064

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c250064

 

关键词

 

剩余使用寿命预测,滚动轴承,时序科尔莫戈洛夫−阿诺尔德网络,双向建模,全局注意力机制

 

摘要

 

滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键. 针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题, 提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺尔德注意力网络(Bi-TKAN-Att). 该模型兼具了时序科尔莫戈洛夫−阿诺尔德网络的强时序建模能力和全局注意力机制的关键特征提取能力, 采用双向建模的方式捕捉前后向信息, 最终实现了具有长期依赖多维退化特征的滚动轴承RUL预测. 所提方法在滚动轴承数据集上进行实验验证, 结果表明Bi-TKAN-Att模型在捕获滚动轴承退化特性和提升RUL预测精度方面具有显著优势, 并通过消融实验证明了模型各组件的合理性和有效性, 为滚动轴承的寿命预测提供了全新可行的解决方案.

 

文章导读

 

作为旋转机械的核心支撑部件, 滚动轴承被广泛应用于风力发电机、航空发动机和内燃机等各类旋转机械设备中[1]. 滚动轴承在复杂多变的工作环境中, 容易因磨损、腐蚀和变形等问题发生故障, 影响机械设备的精度、寿命和可靠性. 通过精确的状态监测, 可以有效减少故障、提升生产效率. 因此, 对滚动轴承的剩余使用寿命(Remaining useful life, RUL)进行精准预测是确保其所在设备或系统安全可靠运行的关键, 也是对滚动轴承进行科学健康管理的前提.

 

滚动轴承RUL预测方法主要分为两类: 基于模型的方法[2]和数据驱动的方法[3]. 基于模型的预测方法通过利用已有知识与系统工作状态建立物理模型, 对机械设备的RUL进行预测[4], 例如Paris-Erdogan模型和指数退化模型[5]. 然而, 随着机械结构的日益复杂, 在不同运行条件下为特定滚动轴承构建精确的机理模型变得极为困难, 导致预测结果因适应性较差而不够准确[6]. 数据驱动的预测方法无需构建特定模型, 从而在预测任务中逐渐展现出显著优势. 尤其是基于深度学习的数据驱动方法, 由于可以避免对物理失效机制的研究或机械退化过程模型的构建, 能够自适应地建立监测数据与RUL之间的非线性映射关系, 已广泛应用于RUL预测. 因此, 基于深度学习的RUL预测方法逐渐成为研究的热点[7-8].

 

常用于RUL任务中的深度学习方法包括卷积神经网络(Convolutional neural network, CNN)[9]、循环神经网络(Recurrent neural network, RNN)[10]、长短期记忆网络(Long short term memory, LSTM)[11]、门控循环单元(Gated recurrent unit, GRU)[12]、时间卷积网络(Temporal convolutional network, TCN)[13]. RUL预测的多数场景中, 时间序列是最常见的监测数据形式, CNN虽然在提取局部特征方面具有显著优势, 但在处理时间序列数据时, 其对长距离依赖关系的捕捉能力较为有限. 这对需要解析长期趋势和模式的RUL预测任务造成了一定限制, 进而影响预测精度的进一步提升. 为克服这些缺陷, RNN及其变种通过引入循环机制与记忆单元, 使之更适合处理各种时间序列任务. Zhou[14]提出一种改进型的增强记忆GRU网络, 该网络针对RNN预测模型易遗忘历史趋势信息的问题, 通过重复利用前一时刻的状态信息来提高预测性能. Zhao[15]提出一种融合CNNLSTMRUL预测模型. 该模型利用CNN自动提取矩阵参数中的局部特征和空间信息, 避免了手动特征提取的复杂性, 并通过LSTM学习与剩余使用寿命相关的全局依赖关系, 有效提高了预测精度. 然而, 在滚动轴承的RUL预测任务中, 轴承的退化过程通常涉及复杂的长期依赖关系, 仅使用单向网络容易导致信息丢失, 不能充分考虑过去和未来的信息.

 

为解决上述问题, 康守强等[16]引入双向长短时记忆网络(Bi-directional long short-term memory, Bi-LSTM)实现滚动轴承的RUL预测, 获得了更准确的预测结果. 夏然等[17]提出一种融合健康因子筛选与混合神经网络的锂离子电池剩余寿命预测方法. 该方法通过随机森林算法评估并筛选多种健康因子, 利用遗传算法优化的广义回归神经网络模型进行容量估计, 并构建Bi-LSTM与非线性自回归混合模型进行残差修正和寿命预测, 显著提高了预测的精度与稳定性. 双向建模的引入在一定程度上推动了RUL预测精度的提升. 然而, 上述研究均基于传统的多层感知机(Multilayer perceptron, MLP)架构, 存在模型灵活性不足的问题. 当面对复杂的非线性关系和时间序列中各元素之间长期依赖性的全局学习问题时, 传统的时间序列预测模型采用固定激活函数, 尽管部分模型使用了可变激活函数, 但这些激活函数的选择依然是有限制的, 无法完全自适应学习, 限制了模型的拟合能力, 从而影响滚动轴承RUL预测的精度.

 

近期出现的科尔莫戈洛夫阿诺尔德网络(Kolmogorov-Arnold networks, KAN)是一种受科尔莫戈洛夫阿诺尔德表示定理启发的神经网络架构. KAN将传统MLP中的权重矩阵替换为可学习的单变量函数, 从而将固定激活函数替换为可变激活函数. KAN在多项科学建模任务中, 达到了更优的精度[18]. KAN基础上, Genet[19]增加一个外部记忆模块, 得到循环科尔莫戈洛夫阿诺尔德网络(Recurrent Kolmogorov-Arnold network, RKAN), 之后进一步增加了门控机制, 提出一种更适合时间序列预测的网络, 即时序科尔莫戈洛夫阿诺尔德网络(Temporal Kolmogorov-Arnold networks, TKAN). TKAN为单向网络, 双向结构网络具有更全面的上下文感知能力, 在一定程度上可以缓解单向模型对长期依赖关系捕捉不良的问题. 为进一步增强长期依赖特征的全局捕捉能力, 注意力机制逐渐受到关注. He[20]提出一种基于改进深度脉冲残差神经网络的预测方法, 用于轨道RUL的估计. 该方法通过把多通道振动数据直接作为输入, 利用分离式脉冲卷积编码模块将时间序列数据自适应地转换为脉冲信号, 同时结合注意力机制对脉冲特征图进行重新标定, 并通过改进的脉冲残差连接减轻梯度消失和爆炸问题, 从而提高了复杂时空关系的建模能力与预测性能.

 

综上所述, 本文提出一种融合双向TKAN和注意力机制的滚动轴承RUL预测方法——双向时序科尔莫戈洛夫阿诺尔德注意力网络(Bidirectional temporal Kolmogorov-Arnold attention networks, Bi-TKAN-Att). 该方法使用具有时间依赖性更新机制的TKAN作为单向网络, 利用其具有可学习激活函数的特殊架构, 显著提升了预测模型的建模能力, 双向建模的引入明显增强了网络对长时间序列的处理能力, 通过进一步融入全局注意力机制增强模型对于局部关键特征的捕获能力, 长短期特征得到了综合表达, 实现了滚动轴承RUL的精准预测.

1  TKAN结构图

2  Bi-TKAN结构图

3  注意力机制结构图

 

针对滚动轴承RUL预测中多维特征长期依赖关系难以有效建模的问题, 提出一种基于Bi-TKAN-Att的多特征时序滚动轴承RUL预测方法. 主要结论如下:

 

1) 基于TKAN提出一种新的双向时间建模框架, 可有效捕获时间序列的前向和后向依赖关系, 同时引入全局注意力机制, 对输入数据中关键时间步的特征信息进行自适应聚焦, 动态分配权重, 有效抑制了冗余信息对预测结果的干扰, 进一步提高了预测的精度和稳定性.

 

2) 在公开的滚动轴承数据集上, 通过退化特征提取和随机森林筛选方法, 建立了多特征输入的模型训练框架. 消融实验验证了双向时间建模和注意力机制对模型性能提升的关键作用, 显示了二者结合对多阶段退化特性建模的有效性.

 

3) 对比实验进一步将所提RUL预测方法与其他文献中的方法进行比较, 结果表明Bi-TKAN-Att模型在R2RMSEMAE性能指标上显著优于其他深度学习方法.

 

尽管本文提出的Bi-TKAN-Att方法在公开数据集上表现出色, 但在工程实际中, 进一步考虑滚动轴承所经历的复杂多变条件对RUL预测结果的影响, 提升其在工业场景中的泛化能力, 是未来研究需要重点关注的方向.

转载本文请联系原作者获取授权,同时请注明本文来自Ouariel科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3291369-1504550.html?mobile=1

收藏

下一篇
当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?