赵兰浩
【科普向】浅论多智能体控制的几个新方向
2023-3-17 15:58
阅读:3767

多智能体协同控制产生于21世纪初。到如今已经发展了二十余年。积累了大量的论文,也是时候开始讨论讨论未来的走向了。在这里就啰嗦一下个人的感受,供各位批评指正。

1.几个概念

我们首先来探讨一下多智能体系统、信息物理系统、复杂网络、网络化系统这四个的联系与区别,可以看到,这四个各自产生了许多文章。首先要清楚的是,这四个的发源地都是图论。

对于图论的研究始于柯尼斯堡七桥问题,随着技术进步,在工业上,我们遇到了需要将多个个体之间相连的问题,既然是多个体相连,我们首先注意到的是它们之间的通信方式与通信效果,比如:

拥塞控制是在网络中使用反馈的早期例子。在保持高吞吐量的同时,对向网络中注入数据包的速率进行调节以避免拥塞(Jacobson,1988年)。事实上,TCP(后来的TCP/IP协议)正是互联网的核心,也是互联网迅速发展的原因之一。一般来说,网络的运行需要多个层次的控制原则和控制回路。

进而关注点聚焦于:

从网络传输数据包角度来看,具有三个重要特征:网络处理传入数据包的速度、由于网络上的流量负载,数据包在到达预定目的地之前可能遇到的延迟,以及网络可能遇到丢弃数据包的概率或可能性。

通信是网络化系统的一个重要研究角度。这里还需要注意的是,网络化系统是多个个体,而中文表达上较为相似的网络化控制则是偏向于控制器与被控对象通过网络相连,也可以是单体系统。

90年代末,兴起了两件新事物,一个多智能体、一个复杂网络。多智能体系统走入了人们的视野:

相对于网络化系统对于通信速率的关注,多智能体系统则源于对“简单规则产生复杂行为”的好奇与模仿,并且将这一问题抽象简化为一致性问题展开研究。当然,随着研究深入,这两个方向也变得越来越融合了,但拿最新文献对比,我们仍然可以看出一下研究思路上的细微区别:

比如,我们以可控性研究为例,多智能体系统可控性的文献中,比如Chao Sun, Guoqiang Hu, and Lihua Xie. Controllability of Multiagent Networks With Antagonistic Interactions.IEEE TRANSACTIONS ON AUTOMATIC CONTROL, VOL. 62, NO. 10 ,会利用到拉普拉斯矩阵,换句话说,要想写出这个矩阵需要提前知道网络结构是怎样的。

而在同样研究可控性的网络化系统文献中,Yuyu Zhou and Tong Zhou, A Revisit to the Controllability and Observability of Networked Dynamic Systems ,IEEE Transactions on Control of Network Systems ,DOI 10.1109/TCNS.2021.3078070. 则用抽象的耦合矩阵代替了图,而不需要提前知道网络结构是什么样子。反映了建模思路上的差异。

随着考虑节点的增多,无论是画图分析还是给出耦合矩阵都变的力不从心,统计物理此时进入了人们的视野,小世界网络、无标度网络相继诞生,每一个进入网络科学学习的新人首先接受的也是各种统计量。复杂网络的研究就这样展开了。

随着时间的推移,这三个的界限是越来越模糊了,但从研究主流来看,如果搜索关键词,复杂网络还是统计特色和社会类研究为主,多智能体则更聚焦于一致性,网络化系统则倾向于通信的具体实现。

信息物理系统是网络化系统的进一步发展,这个发展并不是数学形式上的,而是假设条件上的发展,以往的网络化系统,很少有人考虑攻击的问题,因为其属于局域网,且不与外界相连,攻击的可能性很低,而随着技术进步,尤其是工业互联网的发展、数据分析技术的引入,在带来方便的同时,也给了攻击的机会,为理论分析提供了可行性。有了这个可行性作保证,无论是网络化系统、多智能体还是复杂网络都引入了安全的因素,相关文章成了这几年的一个热点。

简单总结一下:网络系统:通信实现、多智能体:群体行为、复杂网络:拓扑与其统计学表现、信息物理系统:工业互联安全优化

2.从基本一致性出发

关于多智能体系统协同控制主要研究在于一致性。一致性,简单理解,就是网络当中的每一个个体都达到了同一个状态。如果我们转化一下,就可以归结成微分方程的稳定性问题。关于稳定性问题,控制理论体系里有很多的研究工具。特别对于多智能体系统而言,针对拉普拉斯矩阵的性质。也有一些比较成熟的处理工具,大家如果看这方面论文认为比较多的话,相信都会有这样一个感觉:场景虽然不同,但是核心方法都是类似的。

我们这里用图片的形式简单梳理一下目前的多智能体工作。

图里别的先不看,单看一致性,从被控对象上看:线性一致性、非线性一致性、时滞的一致性、异构的一致性、切换拓扑的一致性、从通信上,丢包的一致性,事件触发的一致性、网络攻击条件下的一致性和弹性一致性,隐私保护的一致性,从应用上,编队、合围等。基本所有控制理论的经典成果都可以用到多智能体一致性研究上。我们这里统称是应用场景上的新东西

顺带一提,应用场景上的新东西,大多随着工程实践的技术突破提供可能性一阵阵的都火上几年,然后又一阵阵被更新的东西所代替,如果入场晚,一方面容易无效卷起来,另一方面也会对热情产生损害,研究问题当中本来解决不了已经存在的困难就够心塞了,自己给自己制造困难则更为难受。当然,最开始或者较早开始做的感受就不一样了。

这里需要多提几句,以上说的早入场晚入场说法,均指的常见的研究思路,并不意味这些组合已经无事可做,那句俗语形容比较贴近,好摘的桃子尽数被摘了,事实上任何一个东西做的特别仔细都可以出有意思的东西,需要讨论的特别细致,深入机理的讨论。

站在今天来看,什么算早入场,这是本篇回答所重点关注的地方。希望能通过这种简单的记录,帮助思考一下这个问题。

既然问题是探讨未来,未来这个词又太过于宏大。一个好的办法是通过现在的研究基础慢慢展望一下。那么,首先我们来看这个一致性的定义。网络中的每一个个体都达到同一个状态。比如说这个状态是位置信息的话,那么说。全部的个体从四面八方而来,都汇集到了一个位置。那么一个很自然的拓展就是,如果我们设计的目的是:要求一部分个体去A点会合,一部分个体去B点会合。或者说类似的这类情况。那么这种情况又该如何处理呢?这里就引出了一个有关键词。叫分组一致或者聚类一致(group consensus or cluster consensus or multi consensus)。这方面的研究基础是讨论矩阵的零特征值的重数,结合比较特殊的网络结构(比如Eqiutable partition(第四节会进一步解释) or Acyclic partition)或者满足一定条件的组间耦合关系。这里多提几句:group consensus 和 cluster consensus 还是有些区别的,group consensus不要求各个组之间状态严格不同,做仿真有可能会出现不同组的曲线汇合现象,而cluster consensus往往会要求。

又比如近几年的研究当中,出现了对于一致性的进一步限定。比如positive consensus:

The positive systems mean that the states of the systems can be always nonnegative for any nonnegative initial conditions. Some significant conclusions have been acquired for the positive consensus of integer-order multiagent systems (IOMASs).

再比如搞研究时经常想到的“有何必要”疑问,如何我们按这个角度来看,让所有个体都精确达到一个相同的状态,是永远必要的吗?比如我们需要驱赶群体越过某条线,大于某个值算个体通过,而不去管它究竟大了多少,或者对于投票模型,设定个体状态超过某个数即为同意,只关心是不是同意票,而不关心个体同意的程度。这个目标在2018年被拿出来单独研究,至今也产生了那么几篇文章吧,称作Herdability,属于刚开始的研究阶段。诸如此类有意思的概念,等等。

当然,这几年中对一致性最为广泛和成功的改造讨论当属符号网络,考虑到符号网络是对社会网络的某种简化,我们放在这里起到承上启下的作用。所谓符号网络,是指权重引入了负数,用来模拟个体之间的对抗关系,像历史上的诸多概念一样,也是被不同学科的多人独立发现,最早考虑符号网络的一致性问题的是Claudio Altafini 在2013年的文章,首次建立了结构平衡与一种特殊的一致性:二分一致性的关系。揭示出当网络满足结构平衡特性时,可以收敛到绝对值相等、符号相反的两个状态,而对于结构不平衡网络则一般收敛到零。用通俗的话解释结构平衡,就是这里有两帮人,帮内团结、对外斗争、达到了实力均衡。但需要注意的是,对于权重形式更为复杂的网络来说,比如矩阵权重网络,即使结构不平衡,也可以达成二分一致,在某种权重选择下。进一步可以参考上海交通大学Chongzhi Wang、Haibin Duan 的工作,这个结果也暗示我们,结构平衡只是某种更为深刻的机理的表面反映,尚待挖掘。

3.社会网络与多智能体

第二部分提到了目前对于基本一致性概念的一些改进和拓展。提到了几个,算是比较新的。但也是能够归为一致性一类的概念。但仅仅有某个研究目标或理想状态是完全不够的。这部分就把思维稍微的发散一下。考虑一下场景问题。

当然,这里所提到的场景,不是指之前提到的罗列关键词的列表式场景,也不是将理论用到工程应用比如编队的场景,这两部分上边这张图已经讨论的比较详细了。本片回答还是主要以理论视角为主。

多智能体系统,不仅可以用来建模工程系统,还可以用来建模社会系统。一旦有了这么一个认识,那么很自然的就可以去考虑比如观点动力学(Opinion Dynamic)问题,疾病传播动力学问题。比如拿观点动力学问题来说,虽然模型与工程系统不一样,但是仍然存在着如何通过调控,使得最终群体达到一致意见的需求。而对于疾病传播动力学模型,这几年的各种预测或多或少都刷到过吧。

虽然无论是观点动力学还是疾病传播动力学问题,以往都在其他领域都得到了大量的关注。但在这几年,相关的研究在控制领域逐渐开始兴起。人们开始利用控制理论的视角去分析了这些问题,相关的工作,可以关注一下Ming Cao、Mengbin Ye、Ji Liu等相关课题组的工作。利用已经有的研究基础,无论是控制系统的指标还是控制系统的设计方法,在这样一个新背景下,能否得到新的结论,挖掘新的特性,都是一个未知的内容。这也是交叉学科的独特魅力之一。

在提及的观点动力学和疾病传播动力学仅仅是两个例子。在近些年的控制领域顶刊上,我们还可以看到对社会系统进行建模的,比如决策系统、投票系统都是属于这一类,在这些理论的新背景下相关的研究,将推进我们对于一致性机制的理解。

顺带一提,既然讨论社会网络,那么智能因素和社会网络的未知性是肯定要考虑的,虽然一开始的比如观点动力学模型、传播模型也是微分方程模型。但智能时代可以更进一步了,比如说,

①对于每个个体引入合作-竞争、或者博弈的因素。这在观念传播动力学模型近期研究文章当中是比较常见的方法。也就是说,如果赋予每个个体一定自主性(选择权利),那么又是如何变化的?

②近几年,计算机界风起云涌,机器学习这个概念从课本走向大众。而在众多的机器学习的概念当中,多智能体强化学习,同样带有多智能体这四个字。那么这就启发我们。如果给每个个体引入记忆-学习的能力,放在我们所熟知的网络里面,去探讨我们上面提到的问题。又会得到怎样的一种新的启示?

数据驱动的观念可以引入处理社会网络的复杂性和未知性,以便进行更好的调控。

我们可以关注到,很多长期从事多智能体研究的课题组,近几年也在转向这个方向。一方面,虽然社会网络也属于经典学科了,但带着控制观点去处理分析社会网络确实是新兴产物,尤其是这几年大背景下,另一方面,大家也都在寻找未来的着手点

需要提一下的是,本部分虽然主要讨论社会网络,但提到的因素未尝不可考虑到工程系统,但需要注意的是,对于控制学科来说,我们不仅期望的是探索新场景的机理,我们更期望的是受到启发设计调控的方式。比如考虑博弈或者学习的系统,理论分析存在很高的价值,也出现了很多可以称为经典的分析工作,但实际应用上怎么说服设计人员去采用?这一点需要深入挖掘,尤其是跟传统方法对比,有什么传统方法解决不了的问题。这将是控制科学框架下的研究重点。

4.群体复杂行为

其实在第三部分的研究的一些成果当中已经有所提醒,我们所追求的协同控制,它的关键点应该落在哪里?或者说多智能体领域最初的研究动机是?我们这里引用一段博客来回顾一下多智能体系统研究的起源:

匈牙利Vicsek等人1995年发表在物理杂志PRL上的一篇文章,考虑在平面上运动的多个粒子,采用nearest neighbor rule相互局部协调,最终达到整体一致运动。这篇以仿真为主的文章在刚发表的几年里没有引起多大的关注,也没有多少文章引用。Vicsek, T., Czirók, A., Ben-Jacob, E., Cohen, I., & Shochet, O. (1995). Novel type of phase transition in a system of self-driven particles. Physical Review Letters, 75(6), 1226. 2003年,从Vicsek模型出发,耶鲁大学Morse及其研究生采用非负矩阵、切换系统、稳定性理论等工具讨论了时变拓扑下离散系统的一致性问题,发表在IEEE TAC上,立刻引起了控制界的极大关注。在随后几年里,这两篇文章都有极高的引用率。A. Jadbabaie, J. Lin, and A. S. Morse. Coordination of groups of mobile autonomous agents using nearest neighbor rules. IEEE Transactions on Automatic Control, 46(6): 988-1001, 2003. 美国加州理工Murray课题组抓住战机、快马加鞭,在IEEE TAC上也占了一席之地。Morse和Murray这两篇文章引发了随后10多年的多智能体系统(multi-agent systems)热。Olfati-Saber, R., & Murray, R. M. (2004). Consensus problems in networks of agents with switching topology and time-delays. IEEE Transactions on Automatic Control, 49(9), 1520-1533. 随着信息化、网络化、智能化的发展,多智能体研究在国内外越来越火爆。据说这两篇TAC文章的引用数已经超过了给出H无穷控制问题状态空间解法的著名DGKF论文,在所有控制类论文中排名第一第二。(科学网-控制界的两个著名睡美人-王龙的博文)

我们可以很清晰的看到,虽然我们现在看到的大多数文章都是在研究一致性,但是,一开始的研究并不是为了追求一致性,而是重点放在了基于邻居的规则。也就是代表了这样的一个科学问题:通过局部的邻居之间的简单交互,如何去产生全局性的复杂的行为?

站在现在这个角度上。我们已经知道的是,人们从控制协议的角度上针对不同场景提出了多种的方案设计。理论证明都能够达到一致和预期的设计目标。但是这仅仅是问题的第一步。也就是说我们利用了已有的控制理论。实现了这一效果。但是达成一致这就够了吗?显然不是。而如果我们继续走,比如观察鸟群的行为,有时候不是简单的飞到一块或者分成几群就完事了,形状的变化千奇百怪。这一点可以去看一下相关的纪录片。那么它们呈现的复杂集体行为属于什么机理?因此研究者们从生物学的角度也进行了进一步的探索,提出了一些仿生机理的方法,比如华中科技大学的Haitao Zhang课题组等。这些代表性的工作是从局部规则与群体行为的关系入手去考虑的,它代表着人们对于生物界中存在的群体行为的理解。这个问题到目前为止仍然没有得到很好的解决。

当然了,这种问题跨度大,难度高。是多个学科共同关注的问题,并且多次入选了自然杂志年度科学问题表里面。值得一提的是,2021年诺贝尔物理学奖获得者乔治帕里西也研究过这个问题(可以参考科普著作《随椋鸟飞行》)。无论是数学界、生物界、物理界还是计算机界等,都有大量的学者在探索这个问题,但是每个学科都有其独特的方法论。对于我们而言,虽然不能一下子就全部跳到这个领域进行攻关,但是相关成果我们是可以借鉴的。原因正如上边所说。对于控制学科来说,我们不仅期望的是探索新场景的机理,我们更期望的是受到启发设计调控的方式

举个例子,有些时候谈多智能体必说协同控制,那么我们来想象一下协同控制的流程,而不仅仅限于一致性,首先一个工程上的群体,我们需要给他安排一个任务。这个任务是需要共同完成的,那么这里就出现了第一个问题:也就是谁去完成这个任务?是所有的人都去,还是一部分一部分的对任务进行分解之后,再去完成子任务,最后汇总成目标。第二,如果是分解成子任务,那么分配就是一个关键问题,谁去比较合适?去多少人比较合适?这是都是问题。但是这些问题很少出现在控制理论的研究当中,但是在多机器人领域的研究还是比较多的,详情可以参考:Cooperative Heterogeneous MRS_2019_ACM。

5.网络主干剖析:图论

说到群体的研究,除了第四部分提到的生物集群,我们也会想到上个世纪末诞生的网络科学,网络科学目前也发展出了许多经典成果,由于处理节点比较多,大部分使用统计概念和统计工具去描述网络,侧重于网络行为揭示和性能分析。而在阅读相关文章中,我们很多时候能够看到作者对于网络的结构进行的一些假设,比如包含一棵有向生成树,图是连通的等等,这些假设是为了后续结论的讨论和证明方便而设立的。如果我们把多智能体系统不断简化提炼,那么我们得到的就是一张图。因此,虽然侧重点和工具不同,网络科学和多智能体系统仍然具有天生的可结合点。

首先我们来说对控制方式的部分影响,如果去读近期的多智能体论文,可以发现近年的多智能体系统研究明显受到CPS系统概念的影响,上边我们展示的网络攻击下的或者弹性一致性,基本都是CPS系统带来的基础。除此之外,CPS系统结构还带了调整拓扑联系的可能性,这一点在2020年的TAC文章中有体现:

In our paper, instead, we deal with the open problem of modifying the structure of the network of interaction in a multi-agent systems such that to obtain arbitrarily selected clusters.........by implementing a cyber-layer of controllers operating in parallel with the physical connections of the multi-agent system and providing the further inputs generated by the coupling terms of the control layer.......... (Lucia Valentina Gambuzza, Mattia Frasca,Distributed control of multi-consensus ,IEEE TAC,DOI 10.1109/TAC.2020.3006820)

从事多智能体系统研究的同行们可能觉得加边、减边这类操作比较新,但我们将视角转向网络科学,则会发现,在网络科学中的网络性能分析中,像某种指标比如可控性在节点失效、边失效、增加边等变化下的鲁棒性能问题工作还是不少的,进一步工作可以参考香港城市大学陈关荣教授的工作。同样的,节点失效、边失效、增加边等变化对其他复杂行为又有什么影响?进一步,如果把“节点失效、边失效、增加边”这类操作如果放在多智能体系统控制里去考虑,一个能贴近的场景是应变能力。我们以往考虑的系统往往都是固定的拓扑或者是按照一定规律切换的拓扑。问题在于,如果我们遇到一种突发情况,被动的改变拓扑的时候,怎么去处理这种情况?

接下来说网络科学对多智能体控制研究对象和观念的部分影响,网络科学里有很多结构指向了网络的特殊结构。严格来说,特殊结构这个对于控制领域的研究人员也不算陌生,在上个世纪发展出的“系统的图表示”理论中我们已经见识过了。对于网络尤其是特殊网络结构的研究,能够产生帮助我们理解、辅助我们设计的有效工具。这里我们简单举一个例子:

在图论里面有一个概念叫做Equitable partition,为了讨论方便,我们这里讨论最为简单的图。即无向无权重无符号图。我们将具有相同邻居节点的个体称为等价节点,这种节点的重要标志是它接收的和传出的信息是完全一样的。因此在全过程里,它们状态始终一致,在不引入新的控制信号条件下,无法使得它们之间达到不一样的状态。也就是控制理论当中所描述的不可控情况。当然这里描述的比较简单,具体证明就不展开了。受这个现象启发,对于任何一个网络化系统,只要根据该网络化系统的特点,找到接收和发出信号完全一样的节点,并给出针对性的寻找方法,那么我们就可以在可控性上得到相关的结论。正如第二节所提到,这种节点间状态始终一致的现象,在研究分组一致时获得了高度重视。我们今天去搜索这个关键词时,除了从图论角度讨论数学问题的文章,基本都是在各个领域应用这一特性讨论分组一致的文章,大多发表于物理学期刊,有些文章也发表在了控制领域的顶级期刊上。目前这种工具已经成为分组一致研究领域一种常用的工具。

更多的,对于网络特殊结构的研究,可以大体分为以下几个角度。第一就是某种网络结构对于系统性能的影响,这里面涉及的内容比较多。像路图、树图,环图等,图论当中的扩张、匹配等,还有一些图的工具,比如独立强连通分量、等价划分、零迫集等。研究的性能指标也相当的多,像可控性、可观性、鲁棒性、可镇定性、结构可控性、结构可观性等等等等。第二是某种网络结构对系统控制方式设计的影响。比如对于某个特殊的网络结构,对于同样的目标,我们应该设计怎样的控制协议才是最好的。是目前关注的一个问题。第三就是新型网络的建模。借鉴了图论的一些新成果,比如矢量、矩阵权重网络,再比如超图。也诞生了一些比较不错的交叉工作。

接下来我们来提一提网络科学或者说大网络对多智能体研究观念的影响,我们举例子时经常说,这种控制方法处理一万个节点的网络怎么办?这里我们就看一下如果一个网络中有一万个节点会对系统分析与控制有什么影响?

对分布式的严格要求:都一万个节点了,如果还是整体设计,单纯算矩阵就费劲,如果其中几个节点失效了呢,又该怎么处理?分布式尤其是完全分布式的作用在此时体现出来,相较于完全分布式控制(可参考Zhongkui Li课题组的工作),使用完全分布式的判据去分析系统性能,大多数时候还是一个开放问题。

未知带来的挑战:一万个节点情况,未知的情况很多,比如这堆节点内部怎么连接?即使知道了全部结构,每条边上的权重呢?或者节点动力学是什么情况?都是问题。对于未知,人们一方面开发了数据驱动的方式去控制,这点跟网络科学使用统计工具去处理很相似。进一步,针对具体未知的情况分别讨论:针对内部连接不知道的情况,网络科学有社团发现的相关研究,控制里面也有工作尝试从输出观察网络结构(可观性)的研究。针对权重不知道的情况,人们想起来了结构化系统理论的概念,放到网络上就是研究一类系统,它们网络结构一样,边权重不一样,这类系统的共同性质。可以参考:Guilherme Ramos, A. Pedro Aguiar , Sérgio Pequito, An overview of structural systems theory,AUTO,https://doi.org/10.1016/j.automatica.2022.110229 和北京理工大学 Yuan Zhang 的系列工作。

6.结语

经历二十余年,多智能体控制领域即使“单纯罗列概念得用一张A4纸”,看了看字数统计,按照我们这种笼统的介绍方式,也有近万字了,如果展开来写,即使每部分仅仅写点基础知识讲讲故事,出本书都不成问题,所以就到这里吧~


转载本文请联系原作者获取授权,同时请注明本文来自赵兰浩科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3387802-1380777.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?