CTACTT的个人博客分享 http://blog.sciencenet.cn/u/CTACTT

博文

东南大学王庆领教授团队在多智能体系统优化领域取得重要进展

已有 289 次阅读 2025-5-19 09:10 |个人分类:论文推荐|系统分类:博客资讯

论文简介

【编辑荐语】

本文将给大家分享《控制理论与应用》第42卷第3期论文"受扰多智能体系统有限时间分布式时变优化(Finite-time distributed time-varying optimization of disturbed multi-agent systems)". 如您对本文相关内容有好的理解与建议, 欢迎评论区留言.

该研究聚焦受扰多智能体系统有限时间分布式时变优化问题, 具有重要的理论意义与实际应用价值. 论文针对现有分布式时变优化算法多为渐近优化且对通信图要求严格的局限, 在任意强连通有向图下展开研究. 首先基于有限时间稳定性理论和数值图论, 该论文提出了一类新的有限时间分布式优化算法, 可在受扰多智能体系统中实现分布式时变优化; 随后将算法扩展, 解决了具有有向切换拓扑的受扰多智能体系统有限时间分布式时变优化问题. 所提两种算法均能抑制系统干扰, 且无需使用 Hessian 信息及梯度对时间的偏导信息, 降低了计算复杂度. 其创新点在于提出适用于固定/切换有向图的有限时间分布式时变优化算法, 突破了现有研究在图结构和代价函数固定性上的限制, 为多智能体系统在复杂通信环境下的高效优化提供了新方案. 最后通过仿真实例验证了理论结果的正确性, 对多智能体系统分布式优化领域的发展具有积极推动作用.

【论文介绍】

受扰多智能体系统有限时间分布式时变优化

Finite-time distributed time-varying optimization of disturbed multi-agent systems

朱文博,  张师峥,  王庆领(通讯作者)

单位机构: 东南大学 自动化学院

引用: 朱文博, 张师峥, 王庆领. 受扰多智能体系统有限时间分布式时变优化. 控制理论与应用, 2025, 42(3): 433 – 441

DOI编号: 10.7641/CTA.2023.30060

全文链接: https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA230060&flag=1

【摘要】

多智能体系统有限时间分布式优化, 即设计分布式控制算法使得多智能体系统能够在有限时间内达到一致, 且使得系统中的代价函数的加和最小. 其中, 每一个智能体只能够获取到本地代价函数的信息. 在一些常见的应用场景中, 代价函数的值不仅取决于智能体自身的状态, 同时也与时间有关. 因此, 分布式时变优化算法在实际多智能体系统中具有更好的可用性. 现有的多智能体系统分布式时变优化算法大多为渐近优化算法, 且要求系统具有无向图或者有向平衡图, 在算法实际部署中存在一定的局限性. 因此, 本文在任意强连通有向图下研究了受扰多智能体系统有限时间分布式时变优化问题. 首先, 本文基于有限时间稳定性理论和数值图论提出了一类新的有限时间分布式优化算法, 该算法可以在具有任意强连通有向图的受扰多智能体系统中实现分布式时变优化. 随后, 文章还将新提出的分布式优化算法进行了扩展, 用以解决具有有向切换拓扑的受扰多智能体系统有限时间分布式时变优化问题. 提出的两种分布式算法均可以对多智能体系统中的干扰进行抑制, 且不需要使用Hessian信息以及梯度对时间的偏导信息. 最后, 通过仿真实例验证了理论结果的正确性.

引言

在过去的几十年内, 多智能体系统分布式优化因其广泛的应用场景和部署领域而广受关注. 例如, 智能电网、智慧交通和传感器网络等. 分布式优化的目标就是通过设计分布式控制算法, 使得所有智能体的状态能够达到一致, 且系统中的代价函数的和最小. 在多智能体系统中, 每一个智能体均对应一个本地代价函数.

在上述背景下, 很多研究者针对多智能体系统分布式优化问题进行了一系列研究. 例如, 文献[5]和文献[6]通过离散时间优化算法实现了多智能体系统分布式优化. 此外, 考虑到现有多智能体系统模型大多采用连续时间微分方程进行表述, 因此, 多智能体系统分布式优化问题可以通过连续时间分布式优化算法来解决. 例如, 文献[7]提出了一种基于代价函数梯度的连续时间优化算法. 文献[8]则通过使用代价函数的Hessian信息实现分布式优化. 此外, 由于多智能体系统在实际部署中通常会受到干扰或者遭受到网络攻击, 因此针对含有干扰或者信息攻击的多智能 体系统分布式优化[9–10]同样受到了人们的关注. 值得注意的是, 以上分布式优化方法都是渐近收敛的, 即当时间趋向于无穷时可以实现分布式优化. 然而, 在实际应用场景中, 人们通常希望能够在有限时间内实现分布式优化.

近年来, 多智能体系统有限时间分布式优化算法因其较快的收敛速度而受到了广泛的研究. 例如, 文献[11–14]在固定图下解决了具有固定代价函数的多智能体系统有限时间分布式优化问题. 此外, 由于多智能体之间的通信信道在实际场景中可能会受到一些干扰, 例如电磁干扰, 当干扰超过信道的抗干扰阈值后, 通信信道可能会出现断连, 而当干扰减弱后, 通信信道又会重新连接. 上述现象会导致多智能体系统的通信拓扑切换. 为了适应这一现象, 文献[15–16]针对具有切换拓扑的多智能体系统有限时间分布式优化进行了研究. 上述研究成果[11, 16]均考虑了具有固定代价函数的多智能体系统有限时间分布式优化. 然而在实际场景中也会遇到智能体具有时变代价函数的情况. 因此, 为了提高优化算法的通用性, 多智能体系统有限时间分布式时变优化同样获得了广泛的关注. 此外, 文献[19]进一步研究了多智能体系统的代价函数和通信拓扑都是时变的场景. 综上可知, 许多现存的有限时间分布式优化算法可以在具有固定通信图和固定代价函数的多智能体系统中实现分布式优化. 此外, 一些研究者也针对具有切换图和固定代价函数的多智能系统, 以及具有固定图和时变代价函数的多智能体系统中的有限时间分布式优化进行了研究. 但是, 针对具有切换图和时变代价函数的多智能系统有限时间分布式优化问题仍然值得探索.

1747616847877.jpg

受上述讨论的启发, 本文研究了受扰多智能体系统有限时间分布式时变优化问题. 首先, 本文利用有限时间稳定性理论和图论构建了一个辅助系统, 并基于该辅助系统提出了一种新的有限时间分布式优化算法, 该算法可以在具有任意强连通有向图的受扰多智能体系统中实现分布式时变优化. 随后, 文章将新提出的分布式优化算法进行了扩展, 用以解决具有有向切换拓扑的受扰多智能体系统中的有限时间分布式时变优化问题. 新提出的两种分布式算法均可以对系统中的干扰进行抑制, 且不需要使用Hessian信息和梯度对时间的偏导信息. 本文主要创新点如下:

1) 本文提出了两类新的具有干扰抑制功能的有限时间分布式时变优化算法, 算法分别适用于具有任意强连通固定/切换有向图的多智能体系统. 此外, 新提出的分布式算法均不需要使用Hessian信息和梯度对时间的偏导数信息, 从而降低计算的复杂度.

2) 本文在有向图下研究了受扰多智能体系统有限时间分布式时变优化问题. 与文献[5, 10]相比, 新提出的算法可以在有限时间内实现分布式优化. 不同于文献[11, 18], 新提出的算法可以在具有任意强连通有向切换图的多智能体系统中实现分布式时变优化. 此外, 相较于文献[17, 19], 本文提出的有限时间分布式优化算法不需要使用于Hessian信息和梯度对时间的偏导数信息.

本文其余部分结构安排如下: 第2节给出了符号说明、图论和基础知识; 在第3节中, 文章首先提出了一 种新的适用于固定有向图的有限时间分布式时变优化算法, 然后, 将算法进行了扩展, 解决了具有有向切换图的多智能体系统有限时间分布式时变优化问题; 第4节给出了仿真实验结果, 证实了所提出的分布式优化算法的有效性; 第5节为本文的结论.

结论

本文在有向图下研究了受扰多智能体系统有限时间分布式时变优化问题. 首先, 基于有限时间稳定性理论和图论提出了一种适用于固定有向图的有限时间分布式时变优化算法; 然后, 本文对新提出的算法进行了扩展, 用以解决具有有向切换拓扑的受扰多智能体系统有限时间分布式时变优化问题. 两种新提出的分布式算法均可以对多智能体系统中的干扰进行抑制. 此外, 新提出的算法不需要使用Hessian信息和梯度对时间的偏导数信息, 这降低了计算的复杂度; 最后, 通过仿真实验对新提出的两种分布式时变优化算法进行了验证, 实验结果也证明了算法的有效性.

作者团队介绍

东南大学王庆领教授团队聚焦多智能体系统分布式控制与优化、机器人控制、智能博弈与强化学习等前沿领域, 在复杂动态系统协同控制、抗干扰优化算法及智能决策等方向开展系统性研究. 团队依托东南大学自动化学院, 结合人工智能与控制科学优势, 提出了基于有限时间稳定性理论的分布式优化算法, 突破了传统算法对通信图结构的严格限制, 可在任意强连通有向图及切换拓扑下实现高效协同.

近年来主持国家自然科学基金、科技创新2030重大项目子课题、江苏省自然科学基金等科研项目10余项; 入选江苏省高层次人才培养计划(第七期“333工程”)和东南大学优秀本科生导师(2023、2024). 

曾获中国发明协会创新奖二等奖(2024), 联合作战智能博弈挑战赛三等奖(2020), 江苏省教育教学与研究成果奖一等奖(2018); 指导学生获全国智能联合海上作战算法赛一等奖(2022), 空中智能博弈大赛三等奖(2022), CAA青年学术年会最佳理论论文奖(2020)等奖励10余项. 在国内外学术期刊和会议发表论文100余篇, 其中SCI论文60余篇, IEEE汇刊20篇; 作为第一发明人申请专利20余项, 其中授权10余项.

作者简介

朱文博  博士研究生, 目前研究方向为多智能体系统分布式优化;张师峥  硕士研究生, 目前研究方向为多智能体系统协同控制、强化学习;王庆领  教授, 目前研究方向为多智能体系统自适应控制、分布式协同控制.

期刊介绍

《控制理论与应用》(Control Theory & Applications)是经国家科学技术部批准, 教育部主管, 由华南理工大学和中国科学院数学与系统科学研究院联合主办的全国性一级学术刊物, 1984年创刊, 月刊, 国内外公开发行. 《控制理论与应用》是中国科学引文数据库首批统计源期刊之一,中文核心期刊,入选中国精品科技期刊顶尖学术论文F5000项目,中国科协自动化学科领域高质量科技期刊目录以及中国科协百篇优秀科技论文遴选计划,2021年入选广东省高质量科技期刊建设项目,2022-2024年连续获得基金委资助(科技活动专项).

期刊封面2.jpg目录2.jpg

【收录】

目前被美国《工程索引》(Ei Compendex)、SCOUPS、CSCD、美国的《化学文摘》(CA)、英国《科学文摘》(Inspec)、德国《数学文摘》、俄罗斯《文摘杂志》(AJ)、《日本科学技术振兴机构中国文献数据库》等国内外检索系统收录.

【联系我们】

编辑部地址: 广州市五山路华南理工大学《控制理论与应用》

编辑部邮编: 510640

电话: 020-87111464

E-mail: aukzllyy@scut.edu.cn

官网:https://jcta.ijournals.cn/cta_cn/ch/index.aspx

公众号二维码.jpg

欢迎扫码关注控制理论与应用公众号

【2024-2025年期刊合集】

2025年第42卷第3期

2025年第42卷第2期

2025年第42卷第1期

2024年第41卷第12期

2024年第41卷第11期

2024年第41卷第10期

2024年第41卷第9期

2024年第41卷第8期(“区块链与工业4.0”专刊)

2024年第41卷第7期(“秦化淑教授90寿诞—复杂系统控制理论及其应用”专刊)

2024年第41卷第6期(“数据与模型融合的智能调度优化”专刊)

2024年第41卷第5期

2024年第41卷第4期

2024年第41卷第3期(“人工智能驱动的过程工业自动化与智能化”专刊)

2024年第41卷第2期

2024年第41卷第1期



https://wap.sciencenet.cn/blog-3633987-1486262.html

上一篇:带有输入死区的欠驱动水面船有限时间路径跟踪控制
下一篇:桂卫华院士团队提出平衡补偿滑模策略:攻克飞机防滑制动与纠偏协同控制难题
收藏 IP: 218.192.172.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-5-22 01:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部