摘要
本文研究了细节平衡通信拓扑图下的一阶多智能体系统的二分一致性问题. 不同于文献中常见的动态事件触发方法, 提出一种与重置机制相结合的新型动态事件触发控制策略, 触发条件阈值中的外部动态变量可以根据预设的重置条件进行调节, 当局部不一致状态偏差达到预设重置条件时, 动态变量将被重置为其初始值, 由此避免系统临近一致点时的频繁触发现象, 在保证期望控制性能的同时, 进一步降低系统的通信负担. 文章提出的重置事件触发条件仅依赖智能体的局部状态构成, 无需全局信息. 随后, 本文应用代数图论和李雅普诺夫稳定性理论, 证明了系统的实用二分一致性. 此外, 给出了无芝诺行为的理论分析. 最后, 通过仿真验证了提出方法的有效性.
Abstract
This paper investigates the bipartite consensus problem for first-order multi-agent systems with the detailbalanced communication topology. Different from the common dynamic event-triggered control methods in the literature, a new dynamic event-triggered control strategy combined with the reset mechanism is proposed, in which the external dynamic variable in the trigger condition threshold can be adjusted according to the preset reset condition. If the local disagreement state error reaches the preset reset condition, the external dynamic variable will be reset to its initial value, to avoid the frequent triggering phenomena when the system is close to the consensus point, and further reduce the communication burden of the system while ensuring the desired control performance. The proposed reset event-triggering condition in this paper only depends on the local states of the agents and does not require any global information. Moreover, the algebraic graph theory and the Lyapunov stability theory are applied to prove the practical bipartite consensus of the system. In addition, a theoretical analysis of Zeno-free is given. Finally, the simulation verifies the effectiveness of the proposed method.
1 引言
目前,多智能体系统的协同控制已广泛应用于许多工程领域,如无人机编队 [1]、传感器网络 [2]、智能电力系统 [3] 等. 在协同控制问题中,一致性控制是最重要的基础问题,在过去的几十年里,它引起了控制领域学者们的广泛关注. 多智能体系统的一致性是指系统中的智能体通过局部的相互作用最终收敛到相同的状态,而二分一致性是一致性的重要延伸,隶属于合作竞争网络下多智能体系统的协同控制问题,意为所有智能体最终收敛到数值相同但符号相反的一致状态. 事实上,合作竞争共存的网络在现实场景中更为常见,更加符合实际的自动控制系统,例如机器人竞赛、无人机编队的双向飞行等. 文献 [4] 最先提出了多智能体系统的二分一致性问题以及相应的一致性协议,并利用规范变换和李雅普诺夫稳定性理论进行了收敛分析. 文献还给出智能体的网络通信拓扑图结构平衡和不平衡的条件,只有当通信拓扑图为结构平衡图时,系统才能实现二分一致性. 文献 [5] 提出了一种非线性一致协议来保证所有智能体的状态在有限时间内趋于二分一致性. 文献 [6] 研究了由一阶和二阶多智能体混合而成的异质多智能体系统,利用特殊变量设计二分一致性协议,并给出了系统能够实现渐近二分一致性的充要条件.
值得注意的是,上述工作均假定系统信息可持续更新,需消耗大量的通信资源. 然而,在实际应用中,智能体的通讯资源和运算能力往往受到限制. 为了提高资源利用率,事件触发控制被应用到多智能体系统的一致性问题中 [7] . 在事件触发控制机制中,当智能体的状态误差被检测到超过规定的阈值时,智能体的状态被采样并进行信息的传递和控制协议的更新. 文献 [7] 分别讨论了一阶多智能体系统的集中式和分布式事件触发一致性控制,其分布式控制方式只需自身及其相邻智能体的状态信息,减少了不必要的信息传递. 文献 [8] 提出了事件触发二分一致性控制方法,并利用反证法的思路进行了无芝诺行为(有限时间内的无穷次触发)的理论证明. 对于二阶多智能体系统 [9-10]、线性多智能体系统 [11-13],事件触发控制的研究也取得了很多成果. 在上述结果中,事件触发条件中的阈值依赖于系统内部状态,被称为静态事件触发控制.
为进一步发挥事件触发控制在资源利用上的优势,文献 [14] 针对单回路线性系统提出动态事件触发控制,通过在触发条件的阈值中引入一个外部动态变量去获取更大的触发间隔,从而降低信息传输频次,减少资源消耗. 文献 [15] 将动态事件触发控制应用到一阶多智能体系统中,实现了系统状态的一致性并排除了芝诺行为. 文献 [16] 针对通信受限的多无人艇协同系统,设计动态事件触发机制,并基于滑模控制和自适应算法设计分布式控制器,在保证预设队形的同时实现轨迹跟踪控制. 针对合作竞争关系共存的多智能体系统,文献 [17] 在一致性协议和动态事件触发条件中采用了尺度函数,以保证系统实现预设时间内的二分一致性. 文献 [18] 采用估计器的状态值设计动态事件触发条件,减少了由状态过度偏移引起的触发瞬间,最终解决了线性多智能体系统的二分一致性问题. 文献 [19] 基于观测器的状态信息设计了离散时间多智能体系统的动态事件触发二分一致性协议,通过触发次数的比较验证了动态事件触发控制方法的优越性.
动态事件触发控制优势的发挥依赖于其触发条件阈值中的外部动态变量. 为保证一致性的实现,该变量需具备随时间进展趋于零值的特性,这导致在一致性临近点处,阈值中的外部动态变量不再发挥作用,原动态触发条件将近似为静态触发条件,从而引发高频次的信息传输,造成资源的过度利用. 近来,文献 [20] 针对分数阶多智能体系统的一致性跟踪问题,提出了基于重置机制的事件触发控制,其动态阈值依据预设的重置条件进行调节,能够起到降低能耗的作用. 基于以上分析,本文将进一步研究合作竞争关系共存的多智能体系统的重置事件触发二分一致性问题,主要贡献包括: 1)提出一种新的动态事件触发策略,设计基于重置机制的动态事件触发条件,其中动态变量的取值可以根据重置条件进行调节,重置条件依据各智能体的局部不一致状态偏差构造完成,以动态调整智能体间通信次数和控制器更新频率,达到提高资源利用率的目的; 2)设计出完全分布式的控制协议和事件触发条件,且触发条件中参数的设计不依赖于全局信息(如拉普拉斯矩阵的特征根),系统最终能够实现实用二分一致性; 3)考虑具有细节平衡结构的合作竞争关系共存的通信拓扑,理论结果更具一般性.
2 预备知识
2.1 代数图论
智能体之间的通信网络用有向符号图来描述,其中:表示节点集合,表示边集合,表示所对应的邻接矩阵,其中并且假设节点没有自回路,即边(j,i)表示节点 i 可以从节点 j 处接收信息. 边集合表示为其中和分别表示正边集和负边集. 节点i的邻居集用表示,节点的邻居数用表示. 从节点i 到节点j 的路径是以(i,ik1),(ik1,ik2),· · ·,(ikl ,j)形式的边序列,其中ikm表示不同的节点,对于有向图,若任意的两个节点都可以通过一条路径连接,那么称是强连通的.
令表示符号图的拉普拉斯矩阵,则
定义 1 [21] 对于有向符号图如果存在正数对于任意的满足那么被称为细节平衡图.
定义 2 [4] 对于符号图,如果存在两个节点集合和,其中且,对于任意的满足,而对于任意的满足,那么符号图被称为结构平衡图.
引理 1 [4] 如果一个符号图是结构平衡图,则存在一个对角矩阵 D = diag{σ1,σ2,· · ·,σN } 使得中的所有元素非负,即其中σi ∈ {1,−1},
2.2 问题描述
考虑有向符号图下的一组具有单积分器动力学特性的N个智能体. 智能体i的模型为
(1)
其中分别表示智能体i的状态和控制输入.
在本文中,假设多智能体系统的通信拓扑图为细节平衡的强连通且结构平衡图,本文将设计事件触发控制机制,构造二分一致性协议和触发条件,使得系统中的所有智能体最终能够实现实用二分一致性,即其中: σi在引理1中已定义, o为期望的一致状态,c为可调的正数.
注 1 本文研究的单积分器型多智能体系统参考自文献 [22] 中研究的模型,其本身对应的物理含义仅考虑了个体位移的变化. 但在实际应用中,很多复杂系统模型也可以转换成单积分器型多智能体系统的形式,从而可以借助单积分器多智能体系统丰富的研究成果展开相关研究. 如,在文献 [23] 中,为克服轮式移动机器人的非完整性约束,作者借助辅助变量及虚拟控制输入将机器人的动力学模型转换为单积分器的形式,继而开展了多轮式移动机器人系统的一致性及编队控制问题研究.
3 主要结果
不同于传统的二分一致性协议,本文将引入事件触发机制,设计分布式的事件触发控制方法. 智能体i 的第l次事件触发时刻用表示. 定义一致性协议设计为
(2)
其中表示t时刻之前智能体j在其最后一个触发时刻的状态.
为便于构造事件触发条件,定义状态测量误差为
(3)
定义向量和针对一阶多智能体系统(1),采用一致性协议(2),并考虑状态测量误差(3),可以将闭环系统表述成以下形式:
(4)
为简化二分一致性的分析,引入一些中间变量. 定义变量 zi(t)=σixi(t)和可得 ezi(t)= σiei(t). 与前面定义类似,定义向量 z(t)= [z1(t)· · · zN(t)]T,和ez(t)= [ez1(t)· · · ezN (t)]T. 因此z(t)= Dx(t). 结合式(4)可得其中LD = DLD. 定义矩阵LW = WLD,其中W = diag{ω1,ω2,· · ·,ωN }为正对角矩阵.
定义系统的广义状态均值变量为
该变量具有如下性质.
引理 2 假设结构平衡的符号图是强连通和细节平衡的,那么在一致性协议(2)下,有
证由引理1可得
进一步,有
因符号图是细节平衡图,即,可以得到
从而可得出
因此,
证毕.
为便于研究一致性,定义不一致变量,显然有进一步可得
(5)
其中 δ(t)= [δ1(t)· · · δN(t)]T,定义向量 ω = [ω1 ω2 · · · ωN ] T,显然 ωTδ(t)= 0.
引理 3 假设结构平衡的有向符号图是强连通和细节平衡的,对于矩阵 LW ,如果向量 δ(t)满足 ωTδ(t)= 0,则
其中是LW 的最小正特征值.
证由定义1可知对角矩阵W能够使得WL为对称矩阵. 而LD =DLD,因此LW =WLD为对称矩阵. 与此同时,由引理1可知通过规范变换,结构平衡的符号图可以转换为拉普拉斯矩阵为LD的无符号图,之后利用文献 [24] 的引理2.1即可完成证明. 证毕.
定义智能体i的重置事件触发条件为
(6)
其中:是为智能体i设计的重置分段函数. ηi(t)的设计如下:
(7)
其中: α >0,ηi(0)>0,因此ηi(t)>0; ε是一个可调参数,它决定何时将变量ηi(t)重置为其初始值.
给定第一次事件触发时刻,由重置事件触发条件(6)可知,智能体i的触发时刻序列为
(8)
由前述定义知,当时,即. 因此,原多智能体系统的二分一致性分析可借助系统(5)的稳定性分析展开. 下面给出具体分析过程.
定理 1 考虑多智能体系统(1),在一致性协议(2)和重置事件触发条件(6)–(7)下,系统最终能够实现实用二分一致性.
证对于系统(5),构造李雅普诺夫函数为V(t)=关于时间的导数为
其中是矩阵W()的元素. 根据 Young不等式进一步得到
(9)
根据式(7)可以得到而,且回顾式(8),有
由ezi(t),zi(t),的定义可知,
(10)
将式(10)代入式(9)能够得到
(11)
其中:为矩阵W()中元素的最大值,
结合式(10)可以得到
(12)
其中:ρmax =maxi{ρi},
合并式(11)和式(12),可得
(13)
其中:式中第 2个不等式是由 ωTδ(t)= 0以及引理3得到.
根据比较定理 [25] 可得V(t)≤ Y(t),其中继而,由式(13)可知
(14)
由此可得这就意味系统(1)的实用一致性得证. 证毕.
注 2 与文献 [26] 中的触发条件不同,本文中的式(6)被称为重置事件触发条件,因为该式中包含一个重置变量 ηi(t). 由式(7)可知,在相邻两次重置时刻之间,ηi(t)为衰减的指数函数. 基于智能体自身与邻居智能体间的局部不一致状态偏差构造出ηi(t)的重置条件,在各智能体濒临一致状态点时,将本身取值已衰减至极小的ηi(t)重置为其初值,从而避免频繁触发,减少通信资源消耗. 此外,各智能体的触发条件只依赖于自身和其邻居的状态信息,无需任何全局参数,触发条件(6)可视为分布式触发条件.
注 3 ηi(0)的大小不仅影响事件触发次数,也将影响系统最终的收敛区域. ηi(0)越大,事件触发条件中的阈值越大,事件触发次数越少,从而导致通信资源消耗越少. 然而,ηi(0)的增大也会导致收敛区域的扩大,智能体之间最终状态值的差值较大. 因此,ηi(0)的选择为设计者在资源消耗和收敛性能间提供了一种折中关系.
注 4 重置事件触发机制需要依赖智能体的状态信息来判断重置条件,进而判断事件触发条件来决定信息的传输动作. 与无重置的事件触发机制相比,重置事件触发机制需要更多的计算资源. 然而,现有实验结果表明,在典型环境下,每执行3000条指令所需的计算资源仅与在100 m范围内传输 1 bit所消耗的传输资源相当 [27] . 由此可见,重置事件触发机制虽然需要消耗更多的计算资源以完成事件触发条件的检测,但具有节约更宝贵的传输资源的潜力.
接下来给出系统在重置事件触发控制下的Zeno行为分析.
定理 2 考虑多智能体系统(1),在一致性协议(2)和重置事件触发条件(6)–(7)下,Zeno行为被排除.
证由式(14)可得
从而可得即是有界的.
由式(10)和的有界性可知也是有界的. 因其中LD(i,:)为LD 的第 i 行,故可以得到有界.假设考虑在时间区间(0,T] 内两个连续的事件触发时刻及可以得到在触发时刻根据式(6)能够得到继而可以推断出即对于成立. 根据以上分析可知,Zeno行为能够被排除. 证毕.
4 仿真与分析
本节将给出一个数值算例来验证理论结果的有效性,考虑具有单积分器动力学特性的8个智能体,其通信拓扑如图1所示,对应的邻接矩阵为
图1通信拓扑图
Fig.1Communication topology
基于邻接矩阵,令ω = [1 1 2 2 3 1 3 3]T,可以验证ωiaij = ωjaji,i,j = 1,2,· · ·,8,因此,图1是细节平衡的强连通图.
设置智能体的初始状态为x(0)= [15 10 8 −12 18 −8 20 −5]T,重置事件触发条件(6)中的参数为 ρi = 0.3,α = 2,ε = 0.3,ηi(0)= 0.01. 根据引理 2 可以得出多智能体系统最终的一致状态值为 ψ∗ == 2.25. 仿真结果如图2所示,由图2可知,系统能够实现实用二分一致性,即智能体1,4,7,8的状态趋于−2.25的小邻域内,智能体2,3,5,6的状态趋于2.25的小邻域内. 图3给出了各智能体的触发间隔时间,可以看到到系统不存在Zeno行为.
为进一步说明本文提出的重置事件触发控制在资源利用上的优势,将文献 [26] 中的动态事件触发控制方法和文献 [20] 中的重置事件触发控制方法应用在本文的模型和问题情景中进行仿真比较. 文献 [26] 中的动态事件触发控制方法可以概括为
(15)
其中文献 [20] 中的重置事件触发控制方法可以概括为
(16)
表1中列出了在3种触发条件下触发间隔的最大值、最小值及平均值. 可以看出在重置事件触发条件(6)下,平均触发间隔更大,能够进一步节省智能体之间的通信资源.
图2智能体状态轨迹
Fig.2The state trajectory of agents
图3重置事件触发条件(6)下的事件触发时刻
Fig.3Triggering instants under reset event-triggering condition (6)
表1智能体的最大、最小和平均触发间隔时间
Table1Maximum, minimum and average inter-event times of agents