论文简介
【编辑荐语】
本期将给大家分享《控制理论与应用》第42卷第2期论文"基于扩展状态观测器的量化无模型自适应迭代学习控制(Extended state observer-based quantitative model-free adaptive iterative learning control)". 如您对本期相关内容有好的理解与建议, 欢迎评论区留言.
该研究针对非线性非仿射系统在网络量化环境下的控制难题, 提出了基于扩展状态观测器的无模型自适应迭代学习控制方法. 论文创新地将迭代动态线性化技术与量化控制相结合, 构建了无需精确模型的迭代线性数据模型(iLDM), 通过量化参数自适应律同步优化未知参数与控制增益, 突破了传统固定增益策略的局限性. 特别设计的迭代扩展状态观测器沿迭代轴实时估计非重复不确定性, 有效补偿了系统非线性、未建模动态及扰动的影响.
本文特色突出体现在三个方面:
1. 方法论创新: 本文首次提出沿迭代轴的偏格式动态线性化方法, 将非线性非仿射系统转化为等价线性模型, 结合量化误差描述与参数自适应更新, 解决了重置误差和模型不确定性问题;
2. 结构优化:本文构建了包含多批次控制输入信息的增强型迭代控制器,相比传统相邻批次更新策略,显著提升了轨迹跟踪精度;
3. 鲁棒性提升: 本文通过扩展状态观测器将非重复不确定性转化为可估计的扩展状态, 避免了复杂参数估计, 增强了系统对未知扰动的抑制能力.
本文的理论分析严格证明了闭环系统的有界收敛性, 仿真实验验证了该方法在量化约束和强不确定性下的有效性. 其完全数据驱动的特性为橡胶混炼、石油化工等复杂工业过程提供了重要参考价值, 对网络化控制系统的发展具有积极推动作用.
【论文介绍】
基于扩展状态观测器的量化无模型自适应迭代学习控制
Extended state observer-based quantitative model-free adaptive iterative learning control
郭晓临, 刘洋, 林娜, 池荣虎†
单位机构: 青岛科技大学 自动化与电子工程学院
引用: 郭晓临, 刘洋, 林娜, 等. 基于扩展状态观测器的量化无模型自适应迭代学习控制. 控制理论与应用, 2025, 42(2): 253 – 262
DOI编号: 10.7641/CTA.2023.21011
全文链接: https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA221011&flag=1
摘要
针对非线性非仿射离散时间系统, 本文提出了基于扩展状态观测器的量化无模型自适应迭代学习控制策略. 通过引入迭代动态线性化方法, 处理系统非线性和非仿射结构不确定性, 提出了基于偏格式的迭代线性数据模型(iLDM). 给出误差量化描述, 设计了基于量化数据的学习控制律和参数迭代自适应律, 其中后者不仅可以估计iLDM的不确定参数, 而且能够调节控制律的学习增益, 增强了控制方案的鲁棒能力. 同时, 设计迭代域中的扩展状态观测器, 对参数估计、未建模动态和外界扰动等多非重复不确定性进行估计和补偿. 理论分析和仿真研究均证明了所提出方法的有效性.
引言
网络化控制系统需要大量的数据传输, 对网络带宽性能要求较高, 这给系统的控制提出了一定的难题. 幸运的是, 量化控制方法能够消除冗余数据, 减轻网络负担, 在一定程度上解决网络带宽受限的问题, 引起了学者们的极大兴趣.
线性系统量化控制的研究可追溯到20世纪60年代, 并已取得了丰富的成果. 例如, 针对通信信道有限的情况, 文献[3]研究了不确定系统的多速率状态空间控制方法. 考虑测量信号和控制信号均需量化的情况, 文献[4]提出了一类基于双量化器的控制策略. 结合扇区有界准则, 文献[5]研究了量化系统的二次稳定性问题. 然而, 上述量化控制方法主要针对线性系统, 当被控系统具有强非线性, 难以线性化时, 基于线性模型的控制方法将难以保证较好的控制性能, 因而非线性系统的量化问题引起了广泛关注. 文献[6]讨论了量化控制的可达性问题, 在控制输入量化下, 给出了非线性系统的可达集结构. 在数据传输速率约束条件下, 文献[7]研究了非线性系统的输出反馈镇定问题, 提出了基于观测器的反馈控制器. 为了避免文献[7]中观测器量化误差对系统的影响, 文献[8]将观测器设计在编码之前, 提高了控制性能.
在实际应用中, 存在一类在有限时间区间上执行重复任务的系统, 如轨道列车运行系统、机械臂系统等. 而迭代学习控制(iterative learning control, ILC)是处理此类系统的有效方法, 主要是通过利用以前几次操作中获得的控制知识更新当前控制输入, 实现对期望轨迹的精确跟踪.
最近, 文献[11]初步研究了线性系统的量化ILC问题, 给出了系统的收敛性条件. 文献[12]提出了基于事件触发的量化ILC策略, 解决了带宽受限问题. 针对具有执行器故障的非线性仿射系统, 文献[13]提出了容错量化ILC方法, 避免了由执行器故障引起的性能下降和系统振荡. 文献[14]提出了基于编解码机制的量化ILC 方法, 克服了随机数据丢失对系统的影响. 然而, 上述工作多采用固定学习增益的比例型ILC控制律, 当系统发生较大变化或出现较大的外界扰动时, 会导致上述方法的控制性能较差, 甚至会使系统不稳定. 另一方面, 以上工作中, 控制器的设计和分析依赖于系统的模型信息, 如精确线性模型、参数化模型和非线性仿射模型等, 导致了相应的控制策略在实际应用中变得困难.
许多实际工业过程的被控对象, 如橡胶混炼系统和石油化工系统等, 具有强非线性、强耦合性和高度不确定等特性, 这将导致精确的机理建模过程难以实现. 尽管在一定的假设条件下, 系统的模型得以建立, 但却过于复杂, 不适合控制器的设计和分析. 因此, 如何设计不依赖模型信息的量化ILC方法受到了越来越多学者的关注.
为了克服传统方法对模型的依赖性, 文献[17]利用动态线性化技术, 提出了基于对数量化器的数据驱动量化ILC方法, 控制系统的设计和分析均不依赖系统的模型信息. 在文献[18]中, 作者提出了一种可利用额外控制输入信息的量化ILC方法, 增强了系统的控制性能. 针对存在数据丢包的被控系统, 文献[19]建立了预测模型, 估计系统输出, 并提出了量化补偿的数据驱动ILC方法. 然而, 上述结果均依赖于系统严格重复的假设, 尚未考虑系统非重复不确定性对量化ILC控制性能的影响.
由于外界扰动、重置误差、测量噪声、内部参数变化等影响, 实际应用中的非重复不确定性广泛存在. 针对存在固定初始偏移的线性重复系统, 文献[20]提出了带有反馈辅助项的比例微分型ILC算法, 并分析了其在p范数意义下的收敛性. 为了解决任意初态下 的跟踪问题, 文献[21]提出了基于滤波误差的自适应迭代学习控制方法, 利用修正滤波误差信号, 设计了学习控制器. 文献[22]构建了一种双增益ILC策略, 有效处理了重置误差对仿射重复系统造成的影响. 针对非线性非仿射系统, 文献[23]提出了基于迭代扩展状态观测器(extended state observer, ESO)的数据驱动最优ILC方案, 通过利用迭代ESO对系统的非重复不确定性进行估计, 解决了非重复不确定性的影响. 然而, 现有针对非重复不确定性的ILC方法没有考虑量化数据对控制性能的影响. 换句话说, 如何在数据驱动框架下, 设计可处理非重复不确定性的量化ILC方法尚未有研究.
基于上述分析, 本文综合考虑了量化输出、非重复不确定性问题, 在数据驱动框架下, 利用更多以前批次的控制信息, 提出了一种基于ESO的量化无模型自适应迭代学习控制(ESO-based quantitative model-free adaptive iterative learning control, ESO-QMFAILC)方法. 针对一类未知的非线性非仿射重复运行系统, 提出了一种沿迭代轴的偏格式动态线性化方法, 建立了迭代操作之间系统动态行为的迭代线性数据模型(iterative linear data model, iLDM). 然后, 将iLDM中的非线性余项作为扩展状态, 并设计沿迭代方向运行的ESO算法对其进行迭代估计. 所提出的ESO-QMFAILC方法包括: 基于量化误差数据的学习控制律、基于量化输出数据的参数迭代自适应估计律, 以及基于量化输出数据的迭代ESO算法. 量化的参数迭代更新算法可以实时更新iLDM中的未知参数, 不断完善所提出的iLDM模型, 从而提高控制系统的鲁棒性. 量化的迭代ESO可以利用量化数据估计系统的未知非重复不确定性, 进一步增强控制性能.
本文的创新性总结如下: 1) 设计了沿迭代轴的偏格式迭代动态线性化方法, 利用参数迭代自适应控制技术, 消除了传统量化ILC控制方法中相同初始条件的假设, 解决了实际应用中普遍存在的重置误差问题; 2) 在文献[17]中, 控制信号的更新仅考虑了相邻两个批次的信息. 然而, 所提方法通过引入更多的控制输入信息, 构建了具有增强输入信息的ILC控制器, 实现了更精确的轨迹跟踪; 3) 现有动态线性化结果均将系统非线性、非重复不确定性压缩为线性数据模型中的未知参数, 这导致参数估计过于复杂. 因此, 本文将系统非重复不确定性设计为扩展状态, 并构建迭代ESO对其进行估计, 简化估计过程, 增强系统抑制非重复不确定性的能力. 另外, 本文所提出的控制算法属于一种数据驱动控制方法, 其理论分析过程和仿真研究仅利用了系统的I/O数据, 而未涉及任何系统模型信息.
论文具体结构安排如下: 第2节建立了系统的iLDM; 第3节给出了ESO-QMFAILC的设计过程; 第4节证明了所提方法的有界收敛性; 第5节通过仿真验证了所提方法的有效性; 第6节总结全文工作.
结论
本文针对一类非线性非仿射系统, 提出了一种基于ESO的量化无模型自适应迭代学习控制方法. 利用延迭代轴的动态线性化方法, 将系统转化为等价的iLDM. 所设计的基于量化数据的参数迭代自适应律, 不仅可以估计iLDM中的不确定性参数, 而且能够调节 控制律的学习增益. 利用迭代扩展状态观测器对多非重复不确定性进行估计与补偿. 通过理论分析与仿真实验对所提方法的有效性进行了验.
作者团队介绍
青岛科技大学池荣虎教授团队聚焦复杂系统智能控制与数据驱动方法, 围绕非线性系统、网络控制、多智能体协同等方向开展前沿研究, 创新性提出动态线性化技术、迭代学习控制与扩展状态观测器融合方法, 解决了工业过程中模型不确定性、网络量化约束等关键问题. 其研究成果广泛应用于橡胶混炼、石油化工、智能建筑暖通空调等领域. 池荣虎教授作为团队带头人, 主持国家自然科学基金、山东省重点研发项目等 10 余项课题, 获北京市科学技术奖、山东高校优秀科研成果一等奖等荣誉, 并担任中国自动化学会数据驱动控制委员会副秘书长, 推动学科交叉与产学研合作. 团队以“理论创新+工程应用”为特色, 为工业自动化与智能系统发展提供了重要技术支撑.
作者简介
郭晓临 硕士研究生, 研究方向为无模型自适应控制、学习控制;刘 洋 教授, 硕士生导师, 目前研究方向为多车辆系统队列控制、预设性能控制、智能控制等;林 娜 副教授, 硕士生导师, 目前研究方向为学习控制、自适应控制等;池荣虎 教授, 博士生导师, 目前研究方向为数据驱动控制、自适应控制等.期刊介绍
《控制理论与应用》(Control Theory & Applications)是经国家科学技术部批准, 教育部主管, 由华南理工大学和中国科学院数学与系统科学研究院联合主办的全国性一级学术刊物, 1984年创刊, 月刊, 国内外公开发行. 《控制理论与应用》是中国科学引文数据库首批统计源期刊之一,中文核心期刊,入选中国精品科技期刊顶尖学术论文F5000项目,中国科协自动化学科领域高质量科技期刊目录以及中国科协百篇优秀科技论文遴选计划,2021年入选广东省高质量科技期刊建设项目,2022-2024年连续获得基金委资助(科技活动专项).
【收录】
目前被美国《工程索引》(Ei Compendex)、SCOUPS、CSCD、美国的《化学文摘》(CA)、英国《科学文摘》(Inspec)、德国《数学文摘》、俄罗斯《文摘杂志》(AJ)、《日本科学技术振兴机构中国文献数据库》等国内外检索系统收录.
【联系我们】
编辑部地址: 广州市五山路华南理工大学《控制理论与应用》
编辑部邮编: 510640
电话: 020-87111464
E-mail: aukzllyy@scut.edu.cn
官网:https://jcta.ijournals.cn/cta_cn/ch/index.aspx
欢迎扫码关注控制理论与应用公众号
【2024-2025年期刊合集】
2024年第41卷第7期(“秦化淑教授90寿诞—复杂系统控制理论及其应用”专刊)
2024年第41卷第6期(“数据与模型融合的智能调度优化”专刊)
2024年第41卷第3期(“人工智能驱动的过程工业自动化与智能化”专刊)
转载本文请联系原作者获取授权,同时请注明本文来自苗焕玲科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3633987-1486525.html?mobile=1
收藏