本次分享“Distributed Nash equilibrium seeking with order-reduced dynamics based on consensus exact penalty(基于一致性精确惩罚的降阶动态分布式纳什均衡寻求)”。
本文提出一种基于共识精确惩罚机制的分布式降阶动力学方法,致力于解决带耦合约束网络博弈中传统算法因辅助变量导致的通信与计算开销过大的问题。 多智能体非合作博弈作为分布式决策的核心框架,广泛应用于认知无线电功率分配、智能电网调度、多机器人协同控制等资源受限场景。本研究为耦合约束博弈的实时均衡求解提供了高效解决方案,其精确惩罚策略与降阶设计可进一步拓展至网络化系统优化、边缘智能决策等新兴领域。
标题:Distributed Nash equilibrium seeking with order-reduced dynamics based on consensus exact penalty
作者:Shu Liang1,2, Shuyu Liu1,2, Yiguang Hong1,2, Jie Chen1,2
机构:1 同济大学;2 上海自主智能无人系统科学中心
引用:Liang, S., Liu, S., Hong, Y. et al. Distributed Nash equilibrium seeking with order-reduced dynamics based on consensus exact penalty. Control Theory Technol. 21, 363–373 (2023). https://doi.org/10.1007/s11768-023-00166-7
摘 要
论文中,作者考虑了具有耦合约束的网络博弈,并寻求其变分纳什均衡。为了设计分布式算法,通过采用局部拉格朗日函数消除了耦合约束,并构造精确惩罚项实现了乘子的最优一致性,得到一组没有任何耦合约束和一致性约束的均衡条件。而且,这些条件仅基于策略和乘子变量,无需辅助变量。在此基础上,作者提出了一种分布式降阶动力学用来更新策略和乘子变量,且具有收敛性保证。与许多分布式算法相比,作者提出的算法不包含辅助变量,因此可以节省计算量和通信量。
引 言
多参与者非合作博弈的分布式纳什均衡求解已在机器人集群控制、自动驾驶、充电调度等诸多领域获得广泛应用。该方法旨在通过参与者自主计算与网络通信获取均衡策略组合,其中每个参与者仅利用本地数据及网络邻居信息。特别适用于网络化博弈场景——参与者间的策略交互模式与网络拓扑结构保持一致。
耦合约束在多智能体系统中普遍存在,尤其在智能体共享有限资源时更为典型。例如文献针对分布式优化问题设计耦合约束处理机制并开发资源分配算法。博弈场景中的参与者同样可能面临耦合约束。由于每个智能体或参与者无法完全获取其他个体与耦合约束相关的数据信息,如何分布式处理耦合约束成为核心难题。
广义纳什均衡适用于含耦合约束的博弈问题。而变分纳什均衡作为其精炼概念,因具备更优特性被广泛采用。近期部分研究聚焦分布式变分纳什均衡求解:有研究设计基于梯度的分布式投影算法;另有研究提出前向-后向算子分裂法;还有研究则研究多积分器智能体的分布式追踪动力学。
含耦合约束的博弈模型可视为耦合约束优化问题的推广形式,但伴随新的理论挑战:该模型中多参与者交互作用导致均衡问题无法解耦为独立优化子问题。因此,对偶理论与罚函数法等优化理论在博弈场景中适用性受限。值得注意的是,每个约束优化问题都有对应的拉格朗日函数,在博弈模型中每个参与者的决策优化都对应一个局部拉格朗日函数,但全局统一的拉格朗日函数不复存在。故基于单一拉格朗日函数的方法无法直接应用于变分纳什均衡问题。
在分布式算法设计中简化局部动力学至关重要,因其协同运作的复杂度与网络规模成正比。然而针对含耦合约束的问题,分布式算法需引入额外变量扩展(或增广)问题空间以解耦约束。在许多研究中,除策略变量与乘子变量外,均在算法中采用了辅助变量。
降低动力学阶次是简化分布式动态过程的有效思路,可通过删减更新变量实现。鉴于此,罚函数法能将约束问题转化为无约束形式以减少变量数量。事实上,部分研究采用精确罚函数法实现分布式优化问题的降阶动力学,还有研究则运用非精确罚函数法求解均衡点。
本文针对含耦合约束的网络化博弈,提出分布式变分纳什均衡追踪动力学。受限于耦合约束,直接求解变分纳什均衡需全局信息支撑。我们通过两阶段等价变换构建适用于分布式设计的降阶均衡条件:首先基于局部拉格朗日函数给出消除耦合约束的条件集;其次构造精确罚项实现乘子最优一致性。由此获得不含耦合约束与一致性约束的均衡条件。通过简单调用局部(次)梯度信息,我们构建了求解该变换后均衡问题的分布式动力学模型,其解集包含所求变分纳什均衡。
相较于现有研究,本方法的核心特征在于:摒弃传统基于一阶变分不等式定义变分纳什均衡的路径,转而聚焦乘子的零阶目标函数,这使得采用精确罚函数法实现降阶成为可能。本文主要贡献如下:
1.博弈场景的优化方法拓展:尽管博弈中不存在全局统一的拉格朗日函数,我们证明乘子变量实际对应于一个共识优化问题。由此,本方法不仅求解了变分纳什均衡问题,更将精确罚函数法从耦合约束优化问题成功拓展至耦合约束博弈场景。
2.无辅助变量的降阶设计:推导的分布式等价条件仅含策略变量与乘子变量(对比其余研究需引入辅助变量)。据此构建的分布式追踪动力学具有更低阶数——无需更新辅助变量,显著降低计算与通信成本。
3.恒定罚系数的理论突破:所构造精确罚项允许采用恒定有界罚系数且保证收敛正确性,故动力学模型仅需常数系数。相较而言,其他研究基于非精确罚函数法的动力学必须依赖时变无界罚系数。
结 论
本文针对含耦合约束的网络化博弈问题,提出一种分布式变分纳什均衡求解算法。所设计的降阶动力学模型通过同步更新策略变量与乘子变量,在保证收敛性的前提下,相较现有分布式算法显著节省计算与通信成本。这一突破性成果得益于精确罚函数法的创新应用——即使在全局统一拉格朗日函数缺失的情况下,该方法仍能有效保障乘子共识达成。未来研究可将本技术拓展应用于更复杂的分布式系统设计场景。
作 者
Shu Liang,2010年于中国科学技术大学获自动化专业工学学士学位,2015年获该校工学博士学位。2015至2017年在中国科学院数学与系统科学研究院(北京)从事博士后研究;2017—2018年任美国密歇根州底特律市韦恩州立大学访问学者。2017-2021在北京科技大学先后担任讲师、副教授,2021年加入同济大学(上海)任研究教授。研究方向涵盖分布式优化与博弈学习理论。
Shuyu Liu, 2021年于中央民族大学获理学学士学位,现于同济大学控制科学与工程系/上海自主智能无人系统科学研究院攻读博士学位。研究方向聚焦分布式优化与非光滑优化理论。
Yiguang Hong,获北京大学理学学士和硕士学位,中国科学院(CAA)博士学位。现任同济大学上海智能科学与技术研究院教授,曾任中国科学院数学与系统科学研究院教授。目前研究方向包括分布式优化与博弈、非线性控制、多智能体系统及社交网络。担任《控制理论与技术》主编,并兼任《IEEE自动控制汇刊》《IEEE网络控制系统汇刊》《IEEE控制系统杂志》等期刊副主编。曾获中国控制会议关肇直奖、国际自动控制联合会世界大会青年作者奖、中国科学院青年科学家奖、中国青年科技奖以及国家自然科学奖。
Jie Chen,1986年、1996年与2001年分别获得北京理工大学控制理论与控制工程专业学士、硕士及博士学位。任同济大学控制科学与工程系教授,曾任北京理工大学自动化学院教授,并担任该校复杂系统智能控制与决策重点实验室主任。其研究方向涵盖复杂系统、多智能体系统、多目标优化与决策、约束非线性控制及优化方法。现任中国自动化学会(CAA)与中国人工智能学会(CAAI)副理事长,担任《无人系统》与《自主智能系统》主编、《系统科学与复杂性》期刊执行主编,同时兼任《IEEE控制论汇刊》《国际鲁棒与非线性控制杂志》《中国科学:信息科学》等多家期刊编委及副主编。现为中国工程院院士,IEEE、IFAC、CAA及CAAI会士。
期刊简介
欢迎扫码进入期刊主页
Control Theory and Technology (CTT), 中文名《控制理论与技术》, 创刊于2003年,原刊名为Journal of Control Theory and Applications,2014年刊名更改为Control Theory and Technology。由华南理工大学与中国科学院数学与系统科学研究院联合主办,主要报道系统控制科学中具有新观念、新思想的理论研究成果及其在各个领域中的应用。目前被 ESCI (JIF 1.5)、EI、Scopus (CiteScore 3.2)、CSCD、INSPEC、ACM 等众多数据库收录, 并于2013–2018年获得两期中国科技期刊国际影响力提升计划项目资助。2017–2021年连续获得“中国最具国际影响力学术期刊”和“中国国际影响力优秀学术期刊”称号,获得广东省高水平科技期刊建设项目(2021-2024年),2022-2024年进入中国科协自动化学科领域高质量科技期刊目录。
官网:https://link.springer.com/journal/11768 (即http://www.springer.com/11768)
https://jcta.ijournals.cn/cta_en/ch/index.aspx
投稿:https://mc03.manuscriptcentral.com/ctt
微信:ControlTheoryTech (欢迎扫码关注期刊微信公众号)
微博:ControlTheoryTech
Email:jcta@scut.edu.cn
Tel:020-8711 1464
2023-2024刊期合集
Volume 22 (February - November 2024)
Issue 3, 2024 - Special issue on analysis and control of complex systems in honor of the 90th birthday of Professor Huashu Qin
Issue 2, 2024 - Special issue on system identification and estimation
Volume 21 (February - November 2023)
Issue 3, 2023 - Special issue on frontiers of control and automation, dedicated to Prof. Ben M. Chen 60th birthday
Issue 1, 2023 - Special issue on connecting theory and practice with ADRC
转载本文请联系原作者获取授权,同时请注明本文来自邹铁枫科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3635716-1494542.html?mobile=1
收藏