||
本次分享“STP-based verification of extended finite multi-potential games (基于STP的扩展有限多势博弈验证)”。
博弈论广泛应用于生物、社会和网络等领域。势博弈作为其中的重要分支,因其纯策略纳什均衡的优良性质吸引了众多研究,近年来基于矩阵半张量积(STP)的研究推进了势博弈检测与建模。为刻画玩家权重与外部因素对博弈的影响,本文提出了 q-加权势博弈和 q-状态势博弈两类新模型,利用 STP 构造了结构矩阵和代数方程,将博弈验证问题转化为求解特定方程,拓展了多势博弈的理论框架与应用场景。
STP-based verification of extended finite multi-potential games基于矩阵半张量积的扩展有限多势博弈验证
Zhipeng Zhang1 • Haotian Peng2 • Jianbo Song1 • Zengqiang Chen3
机构:1 天津工业大学人工智能学院;2 天津工业大学控制科学与工程学院;3 南开大学人工智能学院
引用:Zhang, Z., Peng, H., Song, J. et al. STP-based verification of extended finite multi-potential games. Control Theory Technol. (2025). https://doi.org/10.1007/s11768-025-00255-9
摘 要
势博弈(Potential Games, PG)因其优良性质而受到众多研究人员的关注,而多势博弈(multi-PG)则更加灵活和可扩展,大大提升了势博弈的应用范围。考虑到权重和状态在许多应用场景中对每个玩家而言是共有的且具有实际意义,本文通过将权重值和状态引入多势博弈,分别系统地讨论并分析了q-加权势博弈(q-weighted PG)和q-状态势博弈(q-state PG),以拓展势博弈的类型。首先,利用矩阵的半张量积(Semi-Tensor Product of Matrices, STP),研究了一种加权势博弈的矩阵建模方法,并通过定义三个矩阵提出了加权势博弈的验证方法。该方法将如何识别加权势博弈的问题转化为求解一个由上述三个矩阵构成的代数方程问题。其次,通过将权重值引入多势博弈,并对每一组进行加权势博弈的检测,将验证方法推广至q-加权势博弈。随后,构建了基于状态的势博弈模型,将如何识别基于状态的势博弈问题转化为求解另一个代数方程问题,这也被视为对加权势博弈验证方法的一种扩展。接着,讨论了q-状态势博弈的验证方法。最后,通过两个实例验证了所提出方法的有效性。
引 言
博弈行为广泛存在于人类社会和自然界中,从棋类游戏、纸牌游戏到物种进化都可以看到其身影。人们很早就注意到了博弈行为的存在,并对其有了初步的认识和应用。自开创性的工作以来,博弈论真正成为一种数学模型,用于研究个体在理性思考与学习过程中相互作用时的决策行为。随后,生物学家利用博弈论研究动植物之间的冲突与合作行为;生态学家提出了复制动态理论来描述生态学中的演化现象等。得益于学者们的不懈努力,博弈论本身不断发展并取得了丰硕的理论成果,例如应用于生物学、社会决策、群体行为、复杂网络等领域,以及其它诸多领域。
作为重要的研究分支,势博弈(Potential Games, PG)被证明具有一项优良性质:即如果一个博弈被验证为势博弈,则该博弈一定存在纯策略纳什均衡。因此,势博弈吸引了来自经济学和工程领域的众多研究人员的关注。一些研究首次提出了验证势博弈的方法,并在此基础上提出了改进措施以降低方法的复杂度。近年来,许多学者集中于使用矩阵半张量积(Semi-Tensor Product, STP)对势博弈相关问题进行建模与验证,提供了一种非常系统的分析工具。更具体地说,有研究首先将势博弈检测问题转化为所构建势方程的求解问题,并进一步将结果扩展至网络演化博弈;紧接着,又有一项研究提出了一种降低验证势博弈存在性的复杂度条件,能够保证以最小数量的解来求解势方程;在另一项研究中,作者将权重引入势博弈,定义了共集加权势博弈的概念,并更重要地,利用有限博弈的向量空间结构构造了一种新的正交分解形式。这种分解揭示了有限博弈的代数与几何特性;近期,有研究进一步推广了加权势博弈的应用,系统研究了近似加权势博弈与接近加权势博弈,并构建了一些有效的判据与算法用于识别加权势博弈。
近期关于势博弈的研究表明,多势博弈(严格称为 q-PG)具有更强的灵活性与可扩展性,大大拓展了势博弈的应用范围,代表了传统势博弈的一种扩展形式。在一个 q-PG 中,玩家被划分为 q 个非空且互不相交的部分,每个部分对应的势函数是特定于玩家的。多势博弈是博弈论中一个复杂的领域。随着研究深度与广度的不断拓展,多势博弈理论的研究已从简单的模型与概念发展到更为复杂的系统,如多智能体系统和网络博弈。同时,其应用领域也在持续扩展,多势博弈理论已被广泛应用于工程、政治、社会学等多个领域。例如在经济学中,它被用来研究市场行为、产业组织与企业战略;在政治学中,它则被用于研究国际关系、政治决策与公共政策。总之,多势博弈理论是一个充满活力和发展潜力的领域,其发展前景广阔,将为人们解决实际问题提供更多有益的思路与方法。
在传统的多势博弈中,需要注意的是,所有子集的玩家都被假设为彼此地位平等。然而,随着多势博弈理论的推广与深入研究,越来越多的研究开始关注玩家子集之间的差异性。
在现实中,例如一家公司内部,部门主管与普通员工由于职能不同,对公司的影响也必然不同。在许多应用场景中,为每个玩家赋予不同的权重是非常普遍且实用的做法,并带动了多个领域的研究,其中权重可用于更好地刻画玩家对博弈的不同影响程度。例如,当某个子集内的玩家选择下一步更新策略时,过程中的代价消耗(如信息通信、数据分析等)是不可避免的,并且对于不同玩家来说是不同的,这给策略分析带来了障碍。考虑到这一点,本文为参与博弈的所有玩家分配不同的权重,以表示他们在博弈中重要性的不同层次。这样,就可以用数值的方式表达每位个体对整个系统的影响。此外,个体行为不仅受到其他个体的影响,还会受到一些外部因素的作用,而个体行为反过来又会影响这些外部因素。就像自然界的生物一样,它们的数量受到环境限制,但它们的行为也会反过来影响环境。这种相互作用为博弈模型增添了额外的复杂性,因为在验证加权势函数时必须综合考虑内部与外部因素。或者在经典的控制领域,例如闭环控制中,系统输入影响输出,但输出也会实时影响输入。考虑到现实情况中,不同的外部环境也会对博弈产生不同程度的影响。为了对上述博弈行为进行建模,目前尚未充分研究并需要进一步分析的、更加精确的博弈模型——带有权重和状态的多势博弈——仍有待深入探讨。
本文将权重与状态引入多势博弈,以描述个体与外部因素之间的相互作用。我们分别提出了两种新的多势博弈概念:q-加权势博弈(q-weighted PG)与 q-状态势博弈(q-state PG),并给出了它们的代数模型。通过使用STP,可以对整个系统进行代数建模,从而更直观地表现系统的线性关系,尤其是在刻画多智能体模型时展现出独特优势。借助STP的优势,我们构造了两类结构矩阵,并基于这些矩阵建立了两个相应的代数方程,进而将如何检测与验证 q-加权势博弈与 q-状态势博弈的问题转化为某些特定方程的求解问题。
与现有研究相比,本文的主要贡献可总结如下:
通过引入权重与状态扩展了传统的多势博弈,提出了 q-加权势博弈与 q-状态势博弈的新概念,进一步推广了势博弈的应用范围。
提出了验证有限博弈是否为 q-加权势博弈或 q-状态势博弈的方法,通过建立包含若干结构矩阵的两个代数方程来实现。
基于STP构建了两类博弈的两种基本验证算法,为类似问题提供了一般化的计算流程。
结 论
本文研究了 q-加权势博弈和 q-状态势博弈。在加权势博弈概念的基础上,给出了 q-加权势博弈的定义。利用矩阵半张量积(STP)方法,提出了对 q-加权势博弈的验证方法。类似于 q-加权势博弈的处理方式,基于状态的势博弈也被推广为 q-状态势博弈,并给出了相应的验证方法。最后,通过两个实例验证了本文所提出方法的有效性。 本文中仍有一些可进一步解决的问题有待后续研究:本文仅考虑了在 q-PG 中引入权重或状态中的一种,如何构建同时包含权重与状态的 q-PG 模型是一个值得进一步探讨的研究方向?当博弈中的节点数量增加时,计算过程中涉及的矩阵维度会变得很大,如何降低矩阵维度的增长速度是另一个具有实际意义的研究课题。
作者介绍
Zhipeng Zhang,2016年获得天津大学电气与信息工程学院控制科学与工程硕士学位,并于2019年获得南开大学人工智能学院运筹学与控制论博士学位。他目前是天津工业大学人工智能学院的副教授。他的研究兴趣包括复杂网络中的演化博弈、网络离散事件系统的监督控制以及信息物理系统的安全性。
Haotian Peng,2022年获得洛阳师范学院电气工程及其自动化专业工学学士学位。目前在天津工业大学控制科学与工程学院攻读硕士学位。研究重点在于离散事件系统中的状态估计和加权系统的安全性。
Jianbo Song,2023年获得河南大学土木工程学士学位。目前,正在天津工业大学人工智能学院攻读硕士学位。研究兴趣包括网络博弈和演化博弈。
Zengqiang Chen,分别于1987年、1990年和1997年从南开大学获得数学学士学位、自动控制硕士和博士学位。现在是南开大学人工智能学院的全职教授。发表了超过200篇期刊论文。主要研究兴趣集中在复杂网络、多智能体系统以及智能优化与控制领域。
期刊简介
欢迎扫码进入期刊主页
Control Theory and Technology (CTT), 中文名《控制理论与技术》, 创刊于2003年,原刊名为Journal of Control Theory and Applications,2014年刊名更改为Control Theory and Technology。由华南理工大学与中国科学院数学与系统科学研究院联合主办,主要报道系统控制科学中具有新观念、新思想的理论研究成果及其在各个领域中的应用。目前被 ESCI (JIF 1.7)、EI、Scopus (CiteScore 3.1,更新于2025年4月5日)、CSCD、INSPEC、ACM 等众多数据库收录, 并于2013–2018年获得两期中国科技期刊国际影响力提升计划项目资助。2017–2021年连续获得“中国最具国际影响力学术期刊”和“中国国际影响力优秀学术期刊”称号,获得广东省高水平科技期刊建设项目(2021-2024年),2022-2024年进入中国科协自动化学科领域高质量科技期刊目录。
官网:https://link.springer.com/journal/11768 (即http://www.springer.com/11768)
https://jcta.ijournals.cn/cta_en/ch/index.aspx
投稿:https://mc03.manuscriptcentral.com/ctt
微信:ControlTheoryTech (欢迎扫码关注期刊微信公众号)
微博:ControlTheoryTech
Email:jcta@scut.edu.cn
Tel:020-8711 1464
2023-2024刊期合集
Volume 22 (February - November 2024)
Issue 3, 2024 - Special issue on analysis and control of complex systems in honor of the 90th birthday of Professor Huashu Qin
Issue 2, 2024 - Special issue on system identification and estimation
Volume 21 (February - November 2023)
Issue 3, 2023 - Special issue on frontiers of control and automation, dedicated to Prof. Ben M. Chen 60th birthday
Issue 1, 2023 - Special issue on connecting theory and practice with ADRC
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-6-12 21:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社