欠驱动系统自适应事件触发约束跟随控制
doi: 10.7641/CTA.2025.40603
张展1 , 管震涛1 , 卜洋2 , 徐晟3 , 付铎1
1. 中国计量大学机电工程学院, 浙江 杭州 310018
2. 安徽工程大学安徽省绿色建筑与数字建造工程研究中心, 安徽 芜湖 241000
3. 浙江工业大学信息工程学院, 浙江 杭州 310023
基金项目: 中国计量大学青年科技人才培育专项项目(01029)资助.
Adaptive event-triggered constraint-following control for underactuated systems
ZHANG Zhan1 , GUAN Zhen-tao1 , BU Yang2 , XU Cheng3 , FU Duo1
1. College of Mechanical and Electrical Engineering, China Jiliang University, Hangzhou Zhejiang 310018 , China
2. Engineering Research Center of Anhui Green Building and Digital Construction, Anhui Polytechnic University, Wuhu Anhui 241000 , China
3. College of Information Engineering, Zhejiang University of Technology, Hangzhou Zhejiang 310023 , China
Funds: Supported by the China Jiliang University Young Scientific Talent Cultivation Special Program (01029).
摘要
欠驱动系统因其独特的性能优势被广泛研究和应用, 但其复杂的动力学特性会导致控制上的困难. 约束跟随控制方法可以有效解决欠驱动系统的控制问题. 为降低通信成本, 提升控制性能, 针对该方法提出了一种新型的事件触发机制. 首先, 将系统期望轨迹设计为伺服约束, 并利用约束跟随控制理论导出伺服控制输入的解析解; 其次, 引入含自适应增益的事件触发机制: 通过比较状态偏差补偿控制输入与实时/目标控制输入的偏差, 确定允许控制信号更新的时间, 再通过自适应增益选择合适的时间点触发控制信号更新. 该机制通过自适应增益动态调整更新频率, 以优化通信效率. 通过Lyapunov方法分析了该控制策略的稳定性, 并证明了能够有效避免Zeno现象; 最后, 通过欠驱动平面垂直起降飞行器上的仿真实验, 验证了所提方法的有效性. 结果表明, 该事件触发机制不仅实现了通信负载和系统性能之间的平衡, 还表现出对干扰的强适应性.
Abstract
Underactuated systems have been widely studied and applied due to their unique performance advantages, but their complex dynamic characteristics can lead to challenges in control. Constrained-following control method can effectively address the control problems of underactuated systems. To reduce communication costs and enhance control performance, a novel event-triggered mechanism is proposed for this method. Firstly, the desired trajectories of the system are designed as servo constraints, and the analytical solution of servo control input is derived using constraint-following control theory. Secondly, an event-triggered mechanism with adaptive gain is introduced: By comparing the state deviation compensation control input with the deviation of the real-time/target control inputs, the mechanism determines permissible time instants for control signal updates. Subsequently, adaptive gain is employed to select optimal moments for triggering control signal updates. This mechanism dynamically adjusts the update frequency through adaptive gain to optimize communication efficiency. The stability of this control strategy is analyzed using the Lyapunov method, and it is demonstrated that the proposed approach effectively avoids Zeno phenomenon. Finally, simulations on an underactuated planar vertical take-off and landing (PVTOL) aircraft verify the effectiveness of the proposed method. Results indicate that the eventtriggered mechanism not only achieves a balance between communication load and system performance but also exhibits strong adaptability to disturbances.
1 引言
欠驱动系统是指独立控制输入数量小于系统自由度的一类系统. 虽然欠驱动系统具有节省能源、节省材料、节省空间等优点,但是由于其可能存在不确定性和非线性的特性,给控制带来了较大的难度 [1] . 近年来,一种适用于欠驱动系统的约束跟随控制方法受到了广泛关注 [2-3] . 该方法的核心思想是将系统的运动控制问题(如系统镇定、轨迹跟踪等)设计成合适的伺服约束,再将这些约束重写为系数为正的常系数齐次线性微分方程,利用方程的解随着时间的增加趋近于0的特性,使系统严格跟踪所需的约束,从而实现对机构运动的有效控制. 该方法的优势在于其本身具备一定的鲁棒性,并且不需要对非线性系统进行线性化. 这种方法源于 Udwadia和Kalaba 等 [4-5] 对受完整或非完整约束系统的拉格朗日动力学方程的扩展. Chen [6] 在此基础上提出了满足等式约束的全驱动机械系统. 随后Yin等 [7] 将这种方法扩展到含有等式约束和不等式约束的欠驱动系统. 然而,对于一些通信资源紧张和执行器容易损耗的欠驱动系统(如欠驱动船舶和飞行器等),约束跟随控制方法与其他基于连续时间采样的控制算法一样,都无法解决这些问题.
事件触发控制(event-triggered control,ETC)在减少控制系统中通信资源的浪费和机械结构的磨损等方面效果显著. 事件触发控制系统主要由两个元件组成,即计算控制输入的反馈控制器和确定何时必须再次更新控制输入的触发机制 [8] . 其基本思想是根据系统状态的变化而非固定的时间间隔,来触发控制信号的更新和传输. 典型的事件触发控制通过静态(固定)或动态(相对和切换)的阈值策略触发控制信号更新 [9] . 比如Cao等 [10] 针对多智能体系统的时变输入延迟问题,根据控制信号幅值设计了动态切换阈值策略,有效减少了控制器更新频率. 事件触发控制按照触发时参考的信号可以大致分类为误差型 [11-18] 和控制输入型 [19-23] . 前者的优势是可以确保控制器在系统偏离期望轨迹时立即执行控制,有助于提高系统的响应速度和稳定性,但是易发生频繁切换导致抖振; 后者通常较为直观,便于实现相应的控制策略,不发生抖振,但会导致控制精度下降. 此外,也有诸如模型事件触发 [24] 和周期性事件触发 [16] 等特殊触发方式. 当事件触发控制过程中存在较大跟踪误差或初始状态偏差时,通常的做法是提高触发频率,使实际控制输入尽可能接近期望值 [12-1317-1820],但这必然会减弱事件触发的优势,造成不必要的资源浪费. 某些动态阈值触发策略,如相对阈值触发 [1923],虽然在一定程度上能够缓解这个问题,但是可能会减弱系统的鲁棒性. 如何设计事件触发机制以平衡通信效率和系统性能是一个值得关注的重要问题 [25] . 事实上,事件触发不应仅仅关注误差的大小,更应该关注系统在当前控制下的稳定性. 因此,更为合理的做法是在当前控制输入下,系统不稳定或接近不稳定时触发更新. 本文基于这一思想,设计一种新型的事件触发机制,旨在进一步降低系统存在较大跟踪误差时的触发频率.
近几年,对欠驱动系统的事件触发控制已经存在一定数量的研究. 例如,对欠驱动水面船只路径跟踪的相关研究 [16222426-27],通过引入事件触发机制显著降低了执行器的触发频率,减少了机械结构的磨损和能源损耗. 此外,Li等 [23] 在固定/相对阈值策略下,通过添加幂积分器技术,设计了中间连续控制信号,并在含倒立摆的欠驱动系统中验证了方案的有效性. Yao等 [17] 对平面二连杆机械臂使用事件触发机制来决定是否更新位置和速度信息,实现了通信负载和系统性能之间的权衡. Qian等 [18] 在存在外部干扰的情况下,通过分布式事件触发自适应控制在单控制输入的双质弹簧系统中实现了更好的一致性. 上述文献在显示事件触发控制优势的同时,也指出了其面临的几个挑战: 1)实现通信负载和系统性能之间的平衡; 2)保证控制的有效性(系统稳定且不发生Zeno现象)和高效性; 3)具备应对外部干扰等不确定因素的能力.
基于上述研究,本文的主要贡献如下:
1)提出了一种与约束跟随控制深度结合的事件触发机制,兼具两者的优势,在保障欠驱动系统稳定性的同时显著降低了控制器更新频率;
2)引入自适应增益,使触发阈值随着跟踪误差动态变化. 相比于传统控制输入型事件触发(如文献 [19]),具有鲁棒性强、误差精度可控的优点;
3)相比于误差型事件触发(如文献 [12]),所提机制的优势在于,只有在当前控制输入下,系统不稳定或接近不稳定时才触发更新,触发频率受跟踪误差的影响较小;
4)通过对控制输入的精准调控,触发间隔的严格保障以及约束跟随控制鲁棒性的动态调整,使得所提方法能够有效应对上述3个挑战.
2 欠驱动约束跟随控制
2.1 欠驱动机械系统模型
欠驱动机械系统,常见的例如倒立摆、轮式移动机器人 [3] 等,其动力学模型通常可以表示为
M(q(t),q˙(t),t)q¨(t)+C(q(t),q˙(t),t)q˙(t)+G(q(t),q˙(t),t)=B(q(t),q˙(t),t)u(t),
(1)
其中:tR为系统运行时间; qq˙q¨Rn分别为系统的位置矢量、速度矢量和加速度矢量; n为系统的自由度数; uRll<n为系统的控制输入矢量,其中 l表示控制输入的数量.MRn×nCRn×nGRnBRn×l分别表示系统的质量矩阵(正定)、科氏力矩阵、重力矩阵以及控制输入矩阵. 如同文献 [328],本研究中的系统被限定在无奇异构型、无参数突变的工况下运行. 因此,假设矩阵MCGB都是连续可微且已知的.
2.2 约束跟随控制
2.2.1 约束方程
首先,需要将系统的控制目标(包括系统镇定、轨迹跟踪等)设计成等效的伺服约束形式. 假设控制目标下系统需要满足mm ≤ l)个连续可微的等式约束,包括hhm)个完整约束(约束不包含坐标对时间的导数)和mh个非完整约束(约束包含坐标对时间的导数)[28],则约束方程可以表示为
(2)
其中:YhRhYm-hRm-h是由系统状态和时间表示的函数向量; dhRhdm-hRm-h是表示函数目标值的常数向量.
其次,将约束(2)对时间t分别求一阶和二阶导,得到与其等效的二阶形式约束:
Y ¨ h ( q , t ) + Y ˙ h ( q , t ) = 0 Y ˙ m h ( q , q ˙ , t ) = 0
(3)
约束(3)可以表示成以下形式:
A(q,q˙,t)q¨=b(q,q˙,t)
(4)
其中:ARm×nbRm.
约束的一阶形式可以通过计算二阶约束(3)对时间t的积分或将等式约束(2)重写为以下形式得到:
Y ˙ h ( q , t ) + Y h ( q , t ) = d h , Y m h ( q , q ˙ , t ) = d m h ,
(5)
一阶约束(5)可以表示成以下的矩阵形式:
A(q,q˙,t)q˙=c(q,t)
(6)
其中cRm.
定义 1 对于给定的Ab,如果方程(4)至少存在一个解q¨,则称约束(4)是相容的(consistent).
引理 1 根据文献 [6],约束(4)相容的充要条件是AA+b=b,其中A+表示A的Moore-Penrose广义逆矩阵.
假设 1 约束(4)是相容的,即AA+b = b.
注 1 假设1保证了约束(4)是实际可行(不存在矛盾)的. 约束(4)是一个通用的等式约束形式,在工程上的许多控制问题,如最优控制、轨迹跟踪、系统镇定等,都可以直接或间接转化为这种形式 [28] .
2.2.2 控制律求解
根据文献 [29],在初始时刻t0 = 0时,如果qt0)和q˙t0满足约束(6),则令u = τn,式(1)可化为
q¨=M-1Bτn-Cq˙-G,
(7)
联立式(7)和约束(4),得到
AM-1Bτn-Cq˙-G=b,
(8)
整理后得到
AM-1Bτn=b+AM-1(Cq˙+G),
(9)
Ψ=AM-1BΨRm×lΨ+Rl×m得到
Ψτn=b+AM-1(Cq˙+G)b^.
(10)
假设 2 约束(10)是相容的,即ΨΨ+b^=b^
注 2 假设2保证了τn解的存在性,即对于所有的qq˙tΩq×Ωq˙×Ωt一定存在
rank[Ψ(q,q˙,t)]1
(11)
因此可以得到以下二阶伺服控制输入:
τn=Ψ+b+AM-1(Cq˙+G).
(12)
式(12)表示的伺服控制输入只能保证系统满足二阶形式的约束(4). 由于约束(6)可由约束(4)对时间积分得到,因此只有当qt0q˙t0满足约束(6)时,式(12)才可以保证系统满足约束(6). 然而,实际中系统的初始状态很可能不满足这一条件. 事实上,满足约束(6)是控制设计的最终目的,因此需要添加额外的控制来处理可能的初始条件偏差.
β(q,q˙,t):=A(q,q˙,t)q˙-c(q,t),
(13)
由于约束(6)是控制的目标,因此式(13)中的β可以被认为是系统性能的直接度量(即一阶约束跟踪误差)[229] . 下面,在控制输入(12)的基础上增加一项补偿输入τaRl满足方程
Ψτa(q,q˙,t)=-κZ(t)β(q,q˙,t)β^,
(14)
其中:κ为正的常数; Zt)≥ 1是单调递增且连续的自适应增益函数,是为了配合本文事件触发机制而增加的系数,其更新规则将在稍后给出.κZt的大小直接影响约束跟随控制器对状态偏差的反馈能力. 增大κZt可以提高系统对跟踪误差的响应速度,增强鲁棒性,但也会增加执行器的负担.
假设 3 方程(14)是相容的,即ΨΨ+β^=β^.
注 3 假设1保证了假设2和假设3通常是同时存在的. 特别地,当rank(Ψ)= m时,假设2和假设3一定成立.
则方程(14)的解为
τa(q,q˙,t)=-κZ(t)Ψ+β(q,q˙,t).
(15)
最终,不考虑事件触发时系统的控制输入为
u(t)=τ(t)=τn(q,q˙,t)+τa(q,q˙,t)
(16)
注 4 由于系统(1)中矩阵MCGB 和约束(2)连续可微且不含任何加速度项,根据连续可微性的基本性质,可以得到τ t)也是连续可微的.
3 事件触发机制
3.1 事件触发控制架构
本文利用如图1所示架构来结合约束跟随控制器和事件触发机制.
1事件触发控制架构
Fig.1Event-triggered control architecture
在这种控制架构中,由事件触发机制决定控制器到执行器的信息传输,从而降低控制器到执行器的通信负担.
3.2 跟踪误差和稳态误差带
在设计事件触发机制前,为了尽可能节约通信资源并反映系统对目标约束的实际跟踪能力,需要确定系统状态的实际跟踪误差以及稳态误差带.
上文提到,β是系统状态的一阶约束跟踪误差. 然而,由于β中存在速度项q˙,不能直观地表达系统状态关于完整约束的跟踪误差,因此需要将约束(2)转换为实际跟踪误差εRm,即
ε=Yh(q,t)-dhYm-h(q,q˙,t)-dm-h
(17)
注 5 由于约束(2)中所有的约束均由控制目标等效转换得到,因此对任意的i=1,2mεi表示当前系统状态相对于第i个控制目标的偏差.
ηRmηi>0i=1,2m表示事先设定的对应实际跟踪误差ε的目标跟踪精度. 对于一个受伺服约束控制的系统,在受到外部干扰或初始条件变化时,若系统的状态在有限时间内使β收敛到平衡点的某个邻域内,并使ε稳定在有界区域[−η,+η]内,就可以认为系统在该邻域内处于稳态. 本文将该邻域命名为一阶跟踪误差β在目标跟踪精度η下的稳态误差带.
3.3 事件触发机制设计
在约束跟随控制输入(16)的基础上,设计如下考虑事件触发机制的控制器:
u(t)=τtk,ttk,tk+1,kN,
(18)
tk+1=inft>tkmax(γ(t))t-tk>λ(t),
(19)
其中:
γ (t) =|u (t) -τ (t) |-kaτa (t) , ka (0, 1) , λ (t) =u (t) -τ (t) u (t) -τ (t) +Z2 (t)
tk表示由式(19)决定的控制信号更新时间序列(t0 = 0), ka是范围(0,1)的比例系数,max(γt))表示在t时刻向量γ的所有分量{γ1γ2,· · ·,γl}中的最大值,表示向量的模长.
下面给出自适应增益函数Zt)的更新律
Z˙(t)=δ(ε(t),η,t),Z˙t0=0,Z(0)=1,
(20)
其中δεtηt为增益函数斜率,下面用δ表示. 为了保证实际跟踪误差ε的每个分量最终都能收敛到目标精度范围η内,斜率δεη按照以下规则生成: 在任意区间tktk+1上,令ε-t=|εt|-ηε-jt=maxε-tj{1,2m}.当max(γt))≤ 0时,δ = 0; 当max(γt))>0时,若ε-jt<0ε各分量在目标精度范围内),则保持 δ = 0,否则令 δ =ηjεjt+p.公式化表达如下:
(21)
其中: 斜率下限参数p >0,条件1为max(γt))>0且ε-jt0.
注 6 这里引入斜率下限参数 p 的作用是,在满足条件1时,避免自适应函数斜率δ趋近于零导致的控制失效. 虽然参数p可以保障控制的高效性,但是参数p取值过大可能会导致Zt)增长过快,严重削弱事件触发带来的性能优势. 由于在条件1下,ηjεjt(0,1]本文建议p <1,但该上限可根据具体场景调整.
事件触发机制(19)可以描述为,当t >tk 时,若 max(γt))≤ 0,即目标控制输入τt)与实时控制输入ut)在所有的 l 个分量上的差距都小于或等于 kaτat)对应分量的绝对值,那么由于阈值λt)≥ 0,控制器更新事件不会触发. 反之,若存在max(γt))>0,随着tZt)逐渐增大,“max(γt))(t tk)”必然会变得足够大并超越阈值λt),从而触发事件并生成新的更新时刻tk+1. 此外,当max(γt))不变时,Zt)越大,λt)越小,从而使得触发间隔“tk+1tk”越小. 因此,可以将Zt)在这里的应用认为是一种在系统不稳定时自适应缩短事件触发间隔时间,提高控制精度,使系统稳定并最终进入稳态误差带的方法.
自适应增益 Zt)具有以下特点: 1)Zt)≥ 1,从而保证ut-τt0λt)始终有界; 2)单调递增且连续. 对于任意的tR都有0Z˙t1+p,故Zt)关于t是全局Lipschitz的; 3)对系统的初始状态偏差不敏感. 当系统在初始状态或受到外部扰动而存在较大的误差ε 时,增益斜率δ 较小,Zt)的增长速度受到抑制,从而减小了对瞬态响应阶段触发频率的影响,更有利于节约通信资源.
4 控制性能分析
欠驱动系统(1)在约束跟随控制律(16)和事件触发机制(18)–(19)作用下的控制性能主要受两个因素影响,即系统的稳定性和是否会发生Zeno现象.
4.1 系统的稳定性
首先讨论系统在什么情况下是渐近稳定的. 下面的定理给出了系统的稳定性与实时控制输入的关系.
定理 1 满足假设1–3的条件下,若实时控制输入ut)和目标控制输入τt)对任意的i = 1,2,· · ·,l 都满足关系式uit-τit<τati且仅当(τat))i = 0 时,满足uit)− τit)=(τat))i,则系统(1)是渐近稳定的.
τ^=u-τ+τa根据上述条件,一定存在矩阵N = diag{N1N2,· · ·,Nl},其中
(22)
使得τ^=Nτa.显然0<Ni<2N正定.
选择Lyapunov函数为
V=12βTβ,
(23)
V 对时间t求导,根据式(4)和式(6)的关系得到
V˙=βTβ˙=βT(Aq¨-b),
(24)
考虑事件触发机制(18),代入式(1)消去q¨,得到
V˙=βTAM-1 (-Cq˙-G) +M-1Bu-b=βTAM-1 (-Cq˙-G) +M-1B (u-τ) +M-1Bτ-b=βTAM-1 (-Cq˙-G) +AM-1Bτn-b+βTAM-1Bu-τ+τa.
由于AM−1B = Ψ,又根据式(10)得到
βTAM-1 (-Cq˙-G) +Ψτn-b=0,
所以
V˙=0+βTΨu-τ+τa,
(25)
根据式(14),Ψτa=-κZβ,即
β=-1κZΨτa,
再结合τ^=u-τ+τaτ^=Nτa得到
V˙=βTΨu-τ+τa=-1κZτaTΨTΨNτa=-1κZτaTΨTΨNτa,
(26)
根据式(11),显然Ψ TΨN是半正定的. 由于V˙的上界为非正数,并且仅当τa = 0时才等于0,因此系统在该条件下是渐近稳定的. 证毕.
根据定理1可以推断: 当max(γt))≤0时,系统在实时控制输入u下渐近稳定,系统状态趋近于平衡点; 但是,对于max(γt))>0时系统的稳定性还需要进一步讨论.
接下来,证明当自适应增益Z变得足够大时,系统状态最终能够稳定在目标稳态误差带内,并讨论在何种情况下,Z有界.
定理 2 在本文控制算法作用下,若自适应增益Zt)足够大,且目标控制输入τt)连续,则系统状态能够最终持续稳定在稳态误差带内,自适应增益 Zt)有界.
在任一区间ttktk+1上,令γjt=maxγtj{1,2l}将触发机制(19)变换为
tk+1=inft>tkuj-τj-kaτaju-τ>1u-τ+Z2t-tk.
(27)
由于生成新的更新时刻tk+1时,γjt)>0,因此存在两种可能的触发情况:
1)ttktk+1时,Zt)足够大,始终存在
1u-τ+Z2t-tk1-kaτaju-τ>uj-τj-kaτaju-τ,
(28)
即始终存在kaτaj<uj-τj<τaj.根据定理1,系统在这种情况下渐近稳定. 若长期处于这种情况,跟踪误差ε会持续减小直到为0,根据式(21),此时 Z不再增大;
2)ttktk+1时,存在uj-τjτaj系统可能不稳定,使状态远离平衡点.
根据式(23),V=12βTβ=12β2可以通过函数 V 的变化说明此时系统的稳定性. 根据式(25)可得
V˙=βTΨu-τ+τamaxttk,tk+1 βTΨu-τ+τa.
(29)
由于ut)= τtk),根据τ的连续性,一定存在某一时刻te满足
te=mint>tk||uj(t)-τj(t)|=|τa(t)j,
(30)
于是,V˙在区间[tetk+1)上的积分
tetk+1- V˙dt=Vtk+1--Vtemaxttk,tk+1 βTΨu-τ+τatk+1--te.
(31)
由于t <tk+1时未触发更新,根据式(27)得
t-tku-τu-τ+Z2uj-τj-kaτaj,
(32)
因此,触发间隔随自适应增益Z的增大而减小. 这意味着当前触发间隔内一定存在足够大的 Zm,使得当 Z = Zmtk+1--te0,从而根据式(31),Vtk+1--Vte0.根据定理1,t ∈ [tkte)时系统渐近稳定,所以V tk)≥ Vte). 因此,若系统处于瞬态阶段,状态向平衡点收敛; 若处于稳态阶段,则一定存在一个稳态增益下界Zs∈[1,Zm],使得Z ∈[ZsZm]时maxttktk+1 Vt足够小,系统在当前触发间隔内始终保持在稳态误差带以内,即始终满足ε[-η+η]Z 不再增大. 并且,根据式(21)的条件1可知,稳态增益下界Zs由目标跟踪精度η决定. 因此,通过Z的自适应动态调整,可以实现触发频率与控制精度的平衡.
综合两种情况的分析说明,若Z足够大,就能保证系统在瞬态阶段保持渐近稳定,在稳态阶段始终维持在稳态误差带内,即Z是全局有界的. 证毕.
根据定理1和定理2可以总结出本文事件触发机制的原理,如图2所示.
2事件触发机制原理
Fig.2Principle of event triggering mechanism
对于任意的kN设当自适应增益 Z = Zs,且t=tk+1-时存在等式uj-τj=Us其中Us是大于0 的常数. 从图2中可以看到,当Z >Zm 时,生成的更新时刻tk+1在渐近稳定区域和允许信号更新区域的交叉带内,系统渐近收敛. 当ZZsZm时,将会在τajuj-τjUs的情况下生成更新时刻tk+1,使系统稳定在稳态误差带内. 当Z <Zs,即Z不够大时,生成更新时刻tk+1'由于不能始终满足ε[-η+η]Z将继续增大.
4.2 避免Zeno现象
事件触发机制需要保证不会发生Zeno现象,即避免控制信号更新事件在有限时间内被无限次触发. 避免Zeno现象的常用方法是保证任意两个触发时刻的时间间隔大于0. 下面的定理给出了本文机制下事件触发时间间隔的下确界.
定理 3 在本文控制算法作用下,对于kN若控制输入τ连续可微且自适应增益Z全局有界,则事件触发时间间隔存在严格正下界Tu >0,使得inf{k} tk+1-tkTu.
γjt=maxγtj{1,2l}.由于只有当γjt>0时才可能触发更新,因此当t =tk+1 时,根据式(27)得到
t-tk>u-τu-τ+Z2uj-τj-kaτaj,
(33)
注意到当γj t)>0即uj-τj>kaτaj时,
0<uj-τj-kaτaju-τuj-τju-τ1,
ρ=u-τuj-τj-kaτaj,
ρ ≥1,代入式(33)得到
t-tk>ρu-τ+Z2
(34)
由于 τ 连续可微,根据拉格朗日中值定理,存在stkt使得
τ(t)-u(t)=t-tkτ˙(s)
(35)
所以一定存在一个常数 υ >0,使得t-tkτ˙sv.并且根据Z的有界性,存在一个常数 φ >0 满足Z2φ.因此,一定存在时间间隔下界Tu>ρv+φ>0,满足
inf{k} tk+1-tkTu,
(36)
即Zeno现象不会发生. 证毕.
5 仿真案例
5.1 欠驱动PVTOL飞行器动力学模型
平面垂直起降(planar vertical take-off and landing,PVTOL)飞行器是非线性欠驱动系统的一个典型案例. 一些广泛应用的飞行器,例如Wingtra测绘无人机、喷气式战斗机、小型电子火箭等,都属于PVTOL飞行器 [30] . 该飞行器模型可以假设成一个具有三个自由度和两个控制输入的欠驱动系统,运动简图如图3所示. 系统的动力学方程为
x ¨ = sin θ u 1 + μ cos θ u 2 , y ¨ = cos θ u 1 + μ sin θ u 2 1 , θ ¨ = u 2 .
(37)
3平面垂直起降飞行器
Fig.3PVTOL aircraft
该系统中,控制输入u1是垂直于飞行器的推力(可以是正向或反向),控制输入u2是使飞行器旋转的转矩. xy分别表示飞行器质心的水平与垂直位移,θ为机翼与水平方向的夹角. “−1”表示归一化后的重力加速度,µ表示转矩与水平加速度之间的耦合系数. 将系统(37)写成式(1)的矩阵形式为
1 0 00 1 00 0 1x¨y¨θ¨+010=-sinθμcosθcosθμsinθ01u1u2,
则式(1)中的MqCGBu可分别表示为
M=100010001,q=xyθ,C=0G=010,B=-sinθμcosθcosθμsinθ01,u=u1u2.
(38)
5.2 控制律求解与仿真结果
为验证欠驱动系统约束跟随控制方法在本文事件触发机制下的控制效果和鲁棒性,分别设计了完整和非完整约束下,以及存在外界干扰时的仿真实验. 并且,为了突出本文事件触发机制的特性,将其与文献 [12]中的误差型时变事件触发控制(time-varying threshold event-triggered condition,TVETC)和常见的控制输入型固定阈值策略ETC [19]进行对比.
给定PVTOL飞行器系统的各状态初始值分别为x0=0x˙0=20m/sy0=92my˙0=10m/sθ0=0.2radθ˙0=0.5rad/s设耦合系数µ = 1.
5.2.1 仿真实验1(只有完整约束)
设置以下完整约束为控制目标:
(39)
其中: H = 90 m,d = 0.5 m,ω = 0.1,σ = 0.
定义跟踪误差
e 1 = y d sin ( ω x ) H e 2 = θ σ
(40)
定义二阶约束方程
e¨1+e˙1=0,e¨2+e˙2=0,
(41)
则一阶约束方程为
e˙1+e1=0e˙2+e2=0
(42)
将式(41)–(42)写成式(4)和式(6)的形式,可以得到
A = d ω cos ( ω x ) 1 0 0 0 1 b = d ω 2 x ˙ 2 sin ( ω x ) y ˙ + d ω x ˙ cos ( ω x ) θ ˙ c = y d sin ( ω x ) H θ σ
(43)
显然矩阵A是行满秩的,由Ψ = AM−1B
Ψ=AM-1B=ξsinθ+cosθμ(sinθ-ξ)01,
(44)
其中ξ = cos(ωx). 显然rank(Ψ)≥ 1,根据式(12)可得
τn=Ψ+b+AM-1(Cq˙+G)
(45)
再由式(13)–(15)得
τa=-κZΨ+(Aq˙-c),
(46)
最终得到约束跟随伺服控制律τ = τn + τa.
为显示自适应增益Z的增长对控制性能的影响,实验中对不同的触发方式采用不同的收敛系数: 本文ETC收敛系数κs = 1,TVETC和固定阈值ETC的收敛系数κp = 2. TVETC和固定阈值ETC下控制律中Z 的值始终为1. 事件触发机制所需的参数如下: 比例参数ka = 0.8,实际跟踪误差ε = [e1 e2] T,目标精度η = [0.02 0.02]T,斜率下限参数p = 0.1.
图4–7所示为上述控制律分别在本文ETC,TVETC和固定阈值ETC作用下,对受完整约束(39)的PVTOL飞行器的控制性能.
4不同策略下的竖直方向轨迹和水平方向夹角
Fig.4Vertical trajectory and horizontal angle under different strategies
5不同策略下的竖直方向跟踪误差
Fig.5Vertical tracking error under different strategies
6自适应增益和不同策略下的触发次数
Fig.6Adaptive gain and trigger times under different strategies
7不同策略下的控制输入u1u2
Fig.7Control inputs u1 and u2 under different strategies
仿真结果表明:
1)图4显示,在约束跟随控制和事件触发机制的作用下,飞行器的轨迹和姿态从初始状态向平衡点收敛,并最终都能够稳定在目标轨迹和目标姿态附近,说明所提控制策略是有效的; 2)图5表明,相比于TV
2)图5表明,相比于TVETC和固定阈值ETC对误差精度的不完全可控,本文ETC的跟踪误差可以最终稳定保持在事先设定的精度范围内. 从图6中自适应增益Z的变化可以观察到,当κsZ <κp = 2时,本文 ETC的误差略大于另外两种ETC; 随着Z不断增大,当Z >2时,轨迹误差不断减小直至最终收敛到目标精度范围内,Z不再增大. 这反映了自适应增益将每个误差分量控制到各自的精度范围内的重要作用. 自适应增益Z的持续增大,提高了控制器反馈能力并缩短了触发间隔,使控制具有更高的精度;
3)图6的触发次数图中,每个点代表每次触发的时间和对应的触发次数. 这一结果显示,在控制初期(仿真开始的前5 s),本文ETC的触发次数仅为TVETC的 3.73%和固定阈值ETC的9.79%. 这是因为系统处于瞬态阶段时存在较大的跟踪误差和控制信号变化速率,以这些信号为参考的ETC会随之提高触发频率; 而根据本文的触发策略,由于此时τa较大,允许更大的实时/目标控制输入偏差,因此在保证稳定性的同时保持了较低的触发频率. 结合图5可以发现,到达稳态时,固定阈值ETC与本文ETC有相近的触发频率和跟踪误差,虽然TVETC的触发频率极低,但跟踪误差很大. 在整个控制过程中,本文ETC,TVETC和固定阈值ETC 的最小触发间隔分别为: 0.051 s,0.010 s 和 0.005 s. 并且由于控制初期的优势,本文ETC总体上有更少的触发次数,约为其他两种ETC的64%;
4)图7表明在系统不受干扰时,自适应增益的增大不会显著增加执行器的输出负担. 并且在t = 0时,由于κsZ <κp,本文ETC比其他两种ETC有更小的控制输入,这意味着更低的执行器成本.
5.2.2 仿真实验2(含非完整约束)
设置以下约束为控制目标:
x˙=y˙+11, , θ=0.5sint, 姿.
(47)
定义跟踪误差
e1=x˙-y˙-11,e2=θ-0.5sint.
(48)
将式(48)写成式(4)和(6)的形式可以得到
A = 1 1 0 0 0 1 , b = 0 θ ˙ + 0.5 cos t 0.5 sin t , c = 11 θ + 0.5 cos t + 0.5 sin t .
(49)
同样的,仿照实验1中的步骤,可得控制律τ =τn+ τa.
为了检验本文事件触发策略能否实现控制性能与通信负载的平衡,在不同目标精度下进行了仿真实验. 设置目标精度由高到低分别为: η1 = [0.05 0.02]Tη2 = [0.1 0.05]Tη3 = [0.2 0.1]T. 实验2的其他相关参数设置与实验1相同. 仿真结果如图8–10所示.
图8–9表明,在约束跟随控制和事件触发机制的作用下,飞行器的轨迹和姿态逐渐收敛到目标值附近,并最终稳定在3个不同目标精度范围内,说明所提控制策略对含非完整约束(47)的欠驱动系统是有效的. 结合图10可以观察到,由于自适应增益Z最终稳定在不同值,3组实验具有不同的稳态误差和触发次数. 通过比较发现,相对于精度为η1的实验,精度为η2η3时总的触发次数分别减少了31.62%和52.14%. 这一结果表明,降低控制精度可以有效减少事件触发频率,本文的算法可以实现控制性能与通信成本之间的平衡.
8不同精度下的跟踪误差e1
Fig.8Tracking error e1 under different accuracies
9不同精度下的跟踪误差e2
Fig.9Tracking error e2 under different accuracies
10不同精度下的自适应增益和触发次数
Fig.10Adaptive gain and trigger times under different accuracies
5.2.3 仿真实验3(含周期性干扰)
为了检验控制的鲁棒性,在实验1的基础上,添加周期性干扰. 干扰设置为每隔20 s施加持续时间为 10 s的竖直向上的力,其大小为3倍重力. 有干扰时目标精度η = [0.5 0.02]T. 图11–13为干扰下的仿真结果.
11干扰下的跟踪误差e1
Fig.11Tracking error e1 under interference
12干扰下的自适应增益和触发次数
Fig.12Adaptive gain and trigger times under interference
13干扰下的控制输入u1u2
Fig.13Control inputs u1 and u2 under interference
图11显示,飞行器在受到严重的周期性干扰时,本文ETC作用下干扰引起的竖直方向跟踪误差随时间增加逐渐减小,并最终维持在目标精度范围内. 这主要得益于自适应增益Z的不断增大,在提高系统对误差的反馈能力的同时,也增加了控制器的更新频率,使系统在受到较大的外界扰动时依然能保持较小的跟踪误差. 并且,根据图12,在受到干扰时(如图11中,第60∼70 s),即使TVETC显著提高触发频率,依然无法避免误差增大; 而本文ETC由于此时τa较大,触发频率反而有所下降,说明所提机制对外部扰动具有良好的适应性. 同时,图12也显示出,即使在严重干扰下,自适应增益Z最终仍然会收敛到某一个特定的值,这一特征也反映了自适应增益的有界性. 然而,观察触发次数变化和图13可以发现,自适应增益的增大也带来了负面影响,即通信和执行器成本的提高. 因此,在使用本文事件触发机制控制一个受到严重干扰的系统时,应尽可能放松目标精度,避免自适应增益过大带来的负面影响.
6 结论
本文结合约束跟随控制方法,提出了一种含自适应增益的事件触发机制,解决了欠驱动机械系统中存在的通信资源浪费和执行器易损耗的问题,并实现了系统性能和通信负载的平衡. 自适应增益在本文中主要有两个作用: 1)提高系统的反馈能力,增强系统的鲁棒性; 2)提高事件触发的频率,使控制更加准确. 但需要注意,过大的自适应增益会导致通信损耗的增加和执行器成本的提高. 仿真实验结果显示出该事件触发机制在控制上的有效性和在节约通信资源方面的优越性,并且对外界干扰有较强的适应能力. 相较于其他事件触发控制,本文提出的方法具有以下优点:
1)控制器更新频率受系统初始状态偏差的影响较小,可以最大程度地节省系统的通信资源;
2)对完整约束和非完整约束都能有效控制,适用于更加多样的控制方案;
3)误差精度可控,利用自适应增益,将跟踪误差严格限制在预设的精度范围内.
随着协同控制技术的发展,多智能体系统(multiagent system,MAS)已广泛应用于无人机编队、智能交通等领域 [31],但其性能往往受限于通信资源 [32] . 未来工作将把本文方法推广到多智能体系统,以解决欠驱动智能体协同问题和实现全局性能优化. 此外,解决由系统参数不确定性带来的控制问题也将是重要方向.
1事件触发控制架构
Fig.1Event-triggered control architecture
2事件触发机制原理
Fig.2Principle of event triggering mechanism
3平面垂直起降飞行器
Fig.3PVTOL aircraft
4不同策略下的竖直方向轨迹和水平方向夹角
Fig.4Vertical trajectory and horizontal angle under different strategies
5不同策略下的竖直方向跟踪误差
Fig.5Vertical tracking error under different strategies
6自适应增益和不同策略下的触发次数
Fig.6Adaptive gain and trigger times under different strategies
7不同策略下的控制输入u1u2
Fig.7Control inputs u1 and u2 under different strategies
8不同精度下的跟踪误差e1
Fig.8Tracking error e1 under different accuracies
9不同精度下的跟踪误差e2
Fig.9Tracking error e2 under different accuracies
10不同精度下的自适应增益和触发次数
Fig.10Adaptive gain and trigger times under different accuracies
11干扰下的跟踪误差e1
Fig.11Tracking error e1 under interference
12干扰下的自适应增益和触发次数
Fig.12Adaptive gain and trigger times under interference
13干扰下的控制输入u1u2
Fig.13Control inputs u1 and u2 under interference
HE B, WANG S, LIU Y J. Underactuated robotics: A review. International Journal of Advanced Robotic Systems,2019,16(4):1-29.
SUN Q Q, WANG X Y, YANG G L,et al. Optimal constraint following for fuzzy mechanical systems based on a time-varying βmeasure and cooperative game theory. IEEE Transactions on Systems, Man,and Cybernetics: Systems,2022,52(12):7574-7587.
FU D, HUANG J, SHANGGUAN W B,et al. Constraint-following servo control for an underactuated mobile robot under hard constraints. Proceedings of the Institution of Mechanical Engineers, Part I: Journal of Systems and Control Engineering,2021,236(1):26-38.
UDWADIA F E. A new perspective on the tracking control of nonlinear structural and mechanical systems. Proceedings of the Royal Society of London Series A: Mathematical, Physical and Engineering Sciences,2003,459(2035):1783-1800.
UDWADIA F E, KALABA R E. On the foundations of analytical dynamics. International Journal of Non-Linear Mechanics,2002,37(6):1079-1090.
CHEN Y H. Constraint-following servo control design for mechanical systems. Journal of Vibration and Control,2009,15(3):369-389.
YIN H, CHEN Y H, YU D J. Vehicle motion control under equality and inequality constraints: A diffeomorphism approach. Nonlinear Dynamics,2018,95(1):175-194.
HEEMELS W P M H, JOHANSSON K H, TABUADA P. An introduction to event-triggered and self-triggered control. Proceedings of 2012 IEEE 51st IEEE Conference on Decision and Control(CDC). Maui, Hawaii, USA: IEEE,2013:3270-3285.
PAN Y, CHEN Y, LIANG H. Event-triggered predefined-time control for full-state constrained nonlinear systems: A novel command filtering error compensation method. Science China Technological Sciences,2024,67(9):2867-2880.
CAO L, PAN Y, LIANG H,et al. Observer-based dynamic eventtriggered control for multiagent systems with time-varying delay. IEEE Transactions on Cybernetics,2023,53(5):3376-3387.
ABDELRAHIM M, POSTOYAN R, DAAFOUZ J,et al. Stabilization of nonlinear systems using event-triggered output feedback controllers. IEEE Transactions on Automatic Control,2016,61(9):2682-2687.
LI Z, ZHAI J. Event-triggered-based sliding mode asymptotic tracking control of robotic manipulators. IEEE Transactions on Circuits and Systems II: Express Briefs,2024,71(3):1266-1270.
LIU T F, JIANG Z P. A small-gain approach to robust event-triggered control of nonlinear systems. IEEE Transactions on Automatic Control,2015,60(8):2072-2085.
POSTOYAN R, TABUADA P, NESIC D,et al. A framework for the event-triggered stabilization of nonlinear systems. IEEE Transactions on Automatic Control,2015,60(4):982-996.
SHEN M, WANG X, ZHU S,et al. Data-driven event-triggered adaptive dynamic programming control for nonlinear systems with input saturation. IEEE Transactions on Cybernetics,2024,54(2):1178-1188.
YAN Y, YU S H, GAO X M,et al. Continuous and periodic eventtriggered sliding-mode control for path following of underactuated surface vehicles. IEEE Transactions on Cybernetics,2024,54(1):449-461.
YAO X Y, PARK J H, DING H F,et al. Event-triggered consensus control for networked underactuated robotic systems. IEEE Transactions on Cybernetics,2022,52(5):2896-2906.
QIAN Y Y, LIU L, FENG G. Distributed event-triggered adaptive control for consensus of linear multi-agent systems with external disturbances. IEEE Transactions on Cybernetics,2020,50(5):2197-2208.
XING L T, WEN C Y, LIU Z T,et al. Event-triggered output feedback control for a class of uncertain nonlinear systems. IEEE Transactions on Automatic Control,2019,64(1):290-297.
ZHANG C H, YANG G H. Event-triggered global finite-time control for a class of uncertain nonlinear systems. IEEE Transactions on Automatic Control,2020,65(3):1340-1347.
HUANG Y X, LIU Y G. Practical tracking via adaptive eventtriggered feedback for uncertain nonlinear systems. IEEE Transactions on Automatic Control,2019,64(9):3920-3927.
ZHU G B, MA Y, LI Z X,et al. Event-triggered adaptive neural fault-tolerant control of underactuated MSVS with input saturation. IEEE Transactions on Intelligent Transportation Systems,2022,23(7):7045-7057.
LI T, YANG J, LI S H. Event-triggered state feedback control for p-normal uncertain nonlinear systems. International Journal of Systems Science,2020,52(7):1284-1296.
DENG Y J, ZHANG X K, IM N Y,et al. Model-based eventtriggered tracking control of underactuated surface vessels with minimum learning parameters. IEEE Transactions on Neural Networks and Learning Systems,2020,31(10):4001-4014.
YANG Gengjiao, HAO Fei, ZHANG Lin. Event-triggered control for positive linear systems with actuator saturation. Control Theory & Applications,2024,41(7):1304-1312.(杨庚佼, 郝飞, 张霖. 具有执行器饱和的正线性系统的事件触发控制. 控制理论与应用,2024,41(7):1304-1312.)
PENG Z H, JIANG Y, WANG J. Event-triggered dynamic surface control of an underactuated autonomous surface vehicle for target enclosing. IEEE Transactions on Industrial Electronics,2021,68(4):3402-3412.
LI Jiqiang, ZHANG Guoqing, ZHANG Xianku,et al. Adaptive neural sliding mode control for USV with the hybrid threshold eventtriggered mechanism. Control Theory & Applications,2023,40(9):1665-1671.(李纪强, 张国庆, 张显库, 等. 基于混合阈值事件触发机制的船舶自适应神经滑模控制. 控制理论与应用,2023,40(9):1665-1671.)
LI Wen, XIONG Liang, YIN Hui,et al. Constrained follow control of underactuated systems with inequality constraints. Control Theory & Applications,2020,37(9):1971-1982.(李旻, 熊亮, 尹辉, 等. 含不等式约束的欠驱动系统约束跟随控制. 控制理论与应用,2020,37(9):1971-1982.)
YIN H, CHEN Y H, YU D J. Controlling an underactuated twowheeled mobile robot: A constraint-following approach. Journal of Dynamic Systems Measurement and Control-Transactions of the Asme,2019,141(7):071002.
LOZANO R, EULOPA-HERNANDEZ J F, SALAZAR-CRUZ S. Control of the PVTOL with strong input coupling. Journal of Intelligent & Robotic Systems,2024,110(1):33.
LUO J, LIU W. Leader-following consensus with prescribed performance for linear multiagent systems. IEEE Transactions on Automatic Control,2025,70(2):1402-1409.
WU B, LIU W. Event-triggered cooperative exponential practical tracking for a class of higher-order uncertain nonlinear multiagent systems. IEEE Transactions on Systems, Man,and Cybernetics: Systems,2023,53(11):6931-6942.