IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

输入增益未知非参数不确定系统的准最优学习控制

已有 1253 次阅读 2023-4-19 16:24 |系统分类:博客资讯

引用本文

 

严求真, 柳向斌, 朱胜, 蔡建平. 输入增益未知非参数不确定系统的准最优学习控制. 自动化学报, 2020, 46(5): 1051-1060. doi: 10.16383/j.aas.c170503

YAN Qiu-Zhen, LIU Xiang-Bin, ZHU Sheng, CAI Jian-Ping. Suboptimal Learning Control for Nonparametric Systems With Uncertain Input Gains. ACTA AUTOMATICA SINICA, 2020, 46(5): 1051-1060. doi: 10.16383/j.aas.c170503

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c170503

 

关键词

 

准最优非线性控制,迭代学习控制,初值问题,误差跟踪学习控制,非参数不确定系统 

 

摘要

 

为解决一类非参数不确定系统在任意初态且输入增益未知情形下的轨迹跟踪问题, 提出准最优误差跟踪学习控制方法.该方法综合准最优控制和迭代学习控制两种技术设计控制器, 在构造期望误差轨迹的基础上, 根据控制Lyapunov函数及Sontag公式给出标称系统的优化控制, 以鲁棒方法和学习方法相结合的策略处理非参数不确定性.闭环系统经过足够次迭代运行后, 经由实现系统误差对期望误差轨迹在整个作业区间上的精确跟踪, 获得系统状态对参考信号在预设的部分作业区间上的精确跟踪.仿真结果表明所设计学习系统在收敛速度方面快于非优化设计.

 

文章导读

 

在实际工业系统中, 大量地存在着在有限作业区间上的重复运行的系统或设备, 诸如机械臂、磁盘驱动器、间歇化工过程、伺服电机、逆变电路等.这些受控对象的精确模型不易获得, 含有多种复杂的不确定性.对于此类重复作业系统, 迭代学习控制(Iterative learning control, ILC)是一种有效的控制技术[1-5], 它利用前次或前几次的系统误差信息修正相应的学习量, 得到本次迭代运行的控制输入, 经过一定次数的迭代后, 可获得系统状态对参考信号在整个作业区间或预设的部分作业区间上的精确跟踪[6-10].

 

迄今, 多数迭代学习控制理论算法要求系统在每次迭代运行开始前精确复位, 使得系统误差初值为零.但在实际工业系统中, 初始误差很难完全避免, 因此, 研究并提出任意初态条件下适用的迭代学习控制方法, 是将迭代学习控制技术应用于工业实际的现实需要.到目前为止, 涉及迭代学习控制初值问题解决方案的相关文献中, 多数为基于压缩映射原理的迭代学习控制(Contraction mapping iterative learning control, CM ILC)方面的结果[11-15].文献[11]提出适用于误差初值在固有邻域内变化情形的多模解决方案.文献[12]研究线性时不变系统在初始误差均值为零情形下的学习控制算法, 利用平均值算子设计学习律.此外, 典型的解决方案还有脉冲补偿[13-14]、初始修正[15-16].近年来, 基于Lyapunov方法设计迭代/重复学习控制器成为学习控制领域的研究热点[1, 17-18], 学者们着手探讨在该设计方法中适用的初值问题解决方案.文献[19]构造时变边界层处理非零初始误差.文献[20-22]采用误差跟踪方法为初始误差非零的不确定系统设计自适应学习控制器.始于CM ILC设计的初始修正方法, 在应用Lyapunov方法设计学习控制器时, 也是一种有效的初值问题解决方案[23-26].此外, 在参考信号光滑闭合场合, 对齐条件(Alignment condition)可被视作一种初值问题解决方案[27].

 

为了获得较快的误差收敛速度, 学者们考虑采用优化学习方法设计控制律[28-30].当受控系统为非线性不确定系统时, 实现自适应学习控制方法和标准最优控制(Standard optimal control)方法的结合使用是一项困难的工作, 这是因为, 在标准最优控制设计过程中, 需要求解哈密尔顿-雅可比-贝尔曼(HJB)方程, 但对一般的非线性系统而言, 求解HJB方程是一件困难的工作[31].鉴于上述困难, 准最优学习控制成为退而求其次的一种可选方案.文献[30]针对MIMO参数不确定系统, 提出基于Sontag公式的准最优学习控制设计.文献[31]针对同含参数不确定性与非参数不确定性的一类SISO非线性系统, 分别给出了相应的准最优迭代学习与准最优重复学习控制设计方案.上述准最优学习控制方面的结果或是假设系统初始误差为零, 或是要求系统满足对齐条件.迄今, 尚无文献讨论任意系统初态情形下的准最优迭代学习控制方法.鉴于实际系统的初始误差不可完全避免, 有必要探讨初始误差非零情形下的准最优迭代学习控制方法研究.

 

实际工业控制系统的输入增益往往是不可知或不完全可知的, 其中含有复杂的不确定性.基于Lyapunov方法设计自适应学习控制器, 所考虑受控系统的输入增益常为以下三者之一: 1)未知固定常数[32]; 2)未知时变参数(不随迭代次数变化)[17]; 3)关于状态(或状态与时间)的未知函数(结构不可知, 无法参数化)[27].具体实施设计时, 可以采用自适应学习方法估计情形1)2)中的未知输入增益; 情形3)中的增益无法直接估计, 常需假设其下界可知, 并采用鲁棒方法与学习方法相结合的策略进行处理.在已有的准最优学习控制文献结果[33-34], 根据Sontag公式进行控制器设计时均假设系统的输入增益完全已知, 对应于情形1) ~)的设计方法在此场景下无法直接套用.到目前为止, 有关输入增益未知系统的准最优学习控制方法研究, 尚属空白.

 

综上所述, 已有的准最优迭代学习控制算法要求输入增益已知, 且迭代初始误差为零(或是要求系统满足对齐条件), 初始误差非零或输入增益未知情形下的准最优学习控制, 均属有待开展的研究课题.实际工业控制系统不仅在运行时存在非零初始误差, 且其输入增益往往为不可知或不完全可知, 因此, 有必要研究输入增益未知且初始误差非零情形下的准最优学习控制方法.在此情形下, 设计准最优学习控制器需要克服的障碍有两个:首先, 基于sontag公式[35-36]的优化设计要求输入增益完全可知, 但此时面临的情形是受控系统的输入增益不可知或不完全可知; 其次, 由于系统误差初值非零, 故无法直接选用系统误差构造控制Lyapunov函数(Control Lyapunov function, CLF), 需要采用合适的初值问题解决方案克服这一由于系统误差非零所带来的困难.

 

本文研究非参数不确定系统[27, 34, 37]的准最优误差跟踪学习控制问题, 针对一类输入增益未知且系统初态任意变化的非参数不确定系统, 提出准最优误差跟踪学习控制设计方案, 以解决该类系统在非零初始误差及输入增益未知情形下的轨迹跟踪问题.本文的主要工作及创新点为: 1)Sontag公式应用于误差跟踪学习控制方法设计, 提出在任意系统初态下适用的准最优误差跟踪学习控制方法; 2)研究了输入增益函数中含有不确定项情形下的准最优迭代学习控制算法, 给出相应的鲁棒学习控制方法, 并实现与准最优误差跟踪学习控制方法的结合.本文给出的算法适用于任意初态及输入增益未知情形, 相比已有的同类结果, 适用范围更广.

 1  x1及其期望轨迹x1,d

 2  x2及其期望轨迹x2,d

 3  误差e1

 

本文考虑一类输入增益未知系统的优化学习控制问题, 提出一套准最优误差跟踪学习控制方案.该方案采用准最优控制与鲁棒学习相结合的策略设计控制器, 控制算法既不需要假设系统误差初值为零, 也不需要输入增益已知, 因而, 适用范围较现有准最优学习控制方法广.本文的设计方案借助实现误差对期望误差轨迹的全区间精确跟踪, 获取系统状态对参考信号在部分作业区间上的精确跟踪.构造合适的期望误差轨迹是实现本文所提优化学习控制算法的基础.

 

作者简介

 

柳向斌

博士, 北京交通大学大学电子信息工程学院副教授.主要研究方向为自适应控制. E-mail: xbliu@bjtu.edu.cn

 

朱胜

博士, 浙江大学城市学院讲师.主要研究方向为自适应学习控制.E-mail:zhus@zucc.edu.cn

 

蔡建平

博士, 浙江水利水电学院电气工程学院教授.主要研究方向为自适应控制. E-mail: caijp@zjweu.edu.cn

 

严求真 

博士, 浙江水利水电学院信息工程学院讲师.主要研究方向为迭代学习控制与重复控制.本文通信作者. E-mail: zjyqz@126.com



https://wap.sciencenet.cn/blog-3291369-1384862.html

上一篇:基于生态演化的通用智能系统结构模型研究
下一篇:“分数阶广义系统容许性的充分必要条件”一文评论
收藏 IP: 117.114.9.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 18:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部