含参数不确定和输入时延的线性系统自适应Tube模型预测控制
doi: 10.7641/CTA.2025.40395
李凯 , 苏延旭
安徽大学人工智能学院, 安徽 合肥 230601 ; 自主无人系统技术教育部工程研究中心, 安徽 合肥 230601
基金项目: 国家自然科学基金项目(62203001)资助.
Adaptive Tube model predictive control for linear systems with parameter uncertainties and input delays
LI Kai , SU Yan-xu
School of Artificial Intelligence, Anhui University, Hefei Anhui 230601 , China ; Engineering Research Center of Autonomous Unmanned System Technology, Ministry of Education, Hefei Anhui 230601 China
Funds: Supported by the National Natural Science Foundation of China (62203001).
摘要
模型预测控制(MPC)在现代控制中因其在处理多变量和约束系统中的优势, 得到了广泛应用. 然而, 系统的不确定性和输入延迟为MPC的设计和实现带来了显著挑战. 本文提出了一种适用于含有参数不确定性和输入延迟的线性系统的自适应Tube-MPC算法. 首先, 采用状态变量扩展的方法将原始系统转化为增广系统来处理时延问题, 并设计一种基于时变更新率的自适应更新律进行参数估计, 确保估计误差在有界范围内; 其次, MPC控制器采用椭球体集合来参数化状态Tube用于捕获状态轨迹, 将离线和在线优化问题转化成半定规划(SDP)问题, 以简化计算复杂度, 实现了对系统的鲁棒控制; 最后, 通过两组仿真实例验证了所提自适应Tube-MPC算法的有效性.
Abstract
Model predictive control (MPC) has been widely applied in modern control due to its advantages in handling multivariable and constrained systems. However, the uncertainties and input delays of the systems pose significant challenges to the design and implementation of MPC. This paper proposes an adaptive Tube-MPC algorithm for linear systems with parameter uncertainties and input delays. Firstly, the original system is transformed into an augmented system using the state variable extension to address the delay problem. An adaptive updating law with time-varying update rates is designed for parameter estimation, ensuring that the estimation error remains bounded. Secondly, the MPC controller uses ellipsoidal sets to parameterize the state Tube to capture the state trajectories. The offline and online optimization problems are converted into semi-definite programming (SDP) problems, simplifying computational complexity and achieving robust control of the system. Finally, two sets of simulation examples are used to verify the effectiveness of the proposed adaptive Tube-MPC algorithm.
1 引言
模型预测控制(model predictive control,MPC)作为一种强大的控制策略日益受到重视,它在多变量和约束系统中的应用显示了其在复杂系统控制中的优越性 [1] . MPC的核心思想是利用系统的数学模型预测在未来一段时间内的行为,通过优化算法计算出最优控制序列,以使系统在给定的性能指标下实现最优控制 [2] .
在实际应用中,系统中总是存在着由各种因素引起的不确定性,如随机噪声、模型参数的不确定性,包括加性或乘性的不确定性 [3] . 这些不确定性会影响系统的性能,甚至导致系统不稳定. 此外,在一些实时响应系统中,传感器延迟、执行器延迟和信号传输延迟等输入延迟也会影响系统性能,甚至造成安全隐患 [4-6] . 目前,针对不确定系统模型的 MPC研究主要集中在两个方面: 鲁棒MPC [7] 和自适应MPC [8] . 鲁棒 MPC是解决系统不确定性的常见和有效的方法,主要包括min-max MPC和Tube-MPC. 传统的鲁棒MPC通常考虑参数不确定性的最坏情况,结果相对保守. 因此,在同时考虑系统参数不确定性和输入延迟的情况下,结合自适应控制是一种很有前景的技术解决方案. 自适应MPC的核心思想是设计自适应算法在线更新不确定参数,并基于更新后的系统模型计算最优控制输入,同时保证系统稳定性. 当前已经研究了多种自适应MPC的参数识别策略,包括隶属识别 [9-10]、递归最小二乘法 [11-12]、神经网络 [13] 和自适应更新律 [14-16] 等. 其中文献 [14] 在系统状态可测且输出矩阵已知,但参数矩阵未知的情况下,将参数估计的自适应更新律与MPC相结合,设计了一种无约束的自适应MPC 方法; 文献 [15] 在文献 [14] 的基础上,针对一类具有参数不确定性的约束离散线性系统,提出了一种基于 min-max算法的改进的自适应MPC方法.
针对具有恒定参数不确定性和输入延迟的约束线性系统,本文提出一种自适应更新策略来更新系统的不确定参数. 首先通过状态扩展将原系统改写为增广系统,以补偿输入延迟. 接着采用基于时变自适应更新率的自适应更新律,在输入延迟和参数不确定的条件下更新系统的估计参数,并保证估计误差有界. 控制器采用鲁棒 MPC 思想设计,重点是目前流行的 Tube-MPC. 在Tube-MPC方法中,扰动对状态轨迹的影响通过一系列称为状态Tube的集合来捕获. 使用集合论的概念,将状态Tube构造为在线优化变量的函数,以包含系统所有可能的未来轨迹,并要求状态Tube能满足约束以确保鲁棒性. 传统的Tube通常采用多面体集序列对状态Tube进行参数化 [17-19],这种参数化方法将动态集合表示为线性约束,实现凸二次规划的在线求解. 然而这种方法存在一个明显缺点: 随着状态维数的增加,描述多面体所需的超平面和顶点数量会显著增多,导致在线优化中存在大量约束和变量. 针对这一问题,本文提出了一种基于椭球体的鲁棒MPC 方法,与多面体参数化方法不同,椭球体可以通过单一的圆约束来定义,其可以转化为一个单一的凸优化问题,而不是多面体设计的迭代过程 [20],这种设计显著降低了计算复杂度.
本文的主要贡献可概括如下:
1)设计了一种自适应更新律,在线更新系统不确定参数并确保估计误差有界,有效应对输入延迟和参数不确定性问题;
2)设计了一种基于参数化椭球体的Tube-MPC方法,相对多面体参数化方法降低了计算复杂性;
3)设计离线和在线两阶段优化方案,通过求解半正定规划和凸半正定规划问题,确保系统的递归可行性与闭环稳定性.
符号说明和背景引理.
符号说明:RR0R>0分别表示实数集、非负实数集和正实数集; Rn表示n维欧氏空间; Nn1n2表示从n1n2的整数序列; AT表示矩阵A的转置; 对于两个方阵AB,符号diag(AB)表示由AB组成的块对角矩阵; 两个集合的闵可夫斯基和表示为AB; 矩阵A的第i行表示[A] i; al|k表示在时间步k计算的时间步k + 1的a值; 2表示2-范数; In表示大小为n × n 的单位矩阵; A ≤ 0表示A为负半定矩阵; 对称矩阵中,上三角元素中的∗表示该值是相应下三角元素的转置.
引理 1 [21] 当且仅当矩阵X y * z是负半定矩阵时,变量xRn所定义的二次约束x TXx+2y Tx + z ≤ 0对所有x都成立.
引理 2(Schur补 [22])考虑对称矩阵Q R; 若 Q <0,那么当且仅当R − S TQ−1 S ≤ 0时,满足
QS*R0.
2 问题描述
2.1 问题建模
本文考虑具有参数不确定性和输入时延的离散线性系统
xθ(k+1)=Aθxθ(k)+Bθu(k-d),
(1)
其中:xθkRnuk-dRm 分别表示系统的状态和输入; d N表示已知的时间延迟; AθRn×nBθRn×m表示含不确定性的系统矩阵. 系统的状态和输入位于包含原点的集合中,定义如下:
C:={(x,u)Fx+Gu1},
(2)
其中:FRnc×nGRnc×m.
由于系统包含输入时延,本文采用状态变量扩展的方法,通过添加状态向量的方法来合并输入时延,它引入了历史的控制输入数据,从而更准确地描述系统的动态特性. 扩展后的增广系统如下所示:
x(k+1)=Ax(k)+Bu(k),
(3)
其中:xkRmd+n表示扩展后的状态向量,A Rmd+n×md+nBRmd+n×m表示扩展后的系统矩阵,形式如下:
x (k) =uT (k-1) uT (k-d) xθT (k) T,
A=0000I0000I0000BθAθ, B=I000.
由于上述系统矩阵A中含有不确定性,为了处理这个问题,本文设计系统(3)的估计系统,如下所示:
x^(k+1)=A^(k)x(k)+Bu(k),
(4)
其中A^kx^k分别是系统扩展矩阵A和状态x的估计值. 用式(3)减去式(4)可得如下误差传递系统:
x~(k+1)=A~(k)x(k),
(5)
其中: x~ = xx^为状态误差,A~k = AA^k为状态矩阵的估计误差. 为了更新不确定参数,定义当前时刻状态向量 δk)= [u TkdxθTk)]T,其中 δk)∈ Rn+m,相应的可以得到
x~θ(k+1)=a~(k)δ(k)
(6)
其中 a~kRn×n+m 为参数估计误差. a~k,a 和 a^k分别为
a~ (k) =a-a^ (k) ,
a=Bθ Aθ,
a^ (k) =B^θ (k) A^θ (k) .
2.2 自适应更新律
为了更新不确定参数,本节设计了一种自适应更新律,可以保证估计参数误差是有界的. 定义关于状态估计误差x~的代价函数如下:
Jxx~θT(k+1)x~θ(k+1)=(aδ(k)-a^(k)δ(k))T(aδ(k)-a^(k)δ(k)).
(7)
Jx相对于a^的梯度通过下式求得:
Jx(a^)=Jxa^=-2(aδ(k)-a^(k)δ(k))δT(k)=-2x~θ(k+1)δT(k).
(8)
接着采用一种自适应更新律来最小代价函数,引入更新率λk)>0如下:
a^(k+1)=a^(k)-λ(k)Jx(a^)=a^(k)+2λ(k)x~θ(k+1)δT(k).
(9)
λk)可由下面成本函数得到:
λ(k)=argminλ(k)Jxa^(k)+2λ(k)x~θ(k+1)δT(k).
(10)
对目标函数Jx关于λk)求导并将其设为零,即
Jxa^ (k) +2λ (k) x~θ (k+1) δT (k) λ (k) =
-4x~θ (k+1) δT (k) δ (k) x~θT (k+1) +
8λ(k)x~θ(k+1)δT(k)δ(k)2x~θT(k+1)=0,
(11)
可以得到
λ (k) =12δT (k) δ (k) ,
将式(12)代入式(9)可得
a^(k+1)=a^(k)+1δT(k)δ(k)x~θ(k+1)δT(k).
(13)
注 1 对于自适应更新律(13),x~θk+1k + 1时刻可以通过计算x~θk+1 = xθk + 1)− a^kδk)得到,其中 xθk + 1)是在时间k + 1所测量的系统状态.
引理 3 考虑具有恒定参数不确定性和输入时延的约束线性系统(1),如果应用上述自适应更新律,则需要确保估计参数误差a~k)是有界的.
选取Vθk)= tr(a~ Tka~k))作为Lyapunov 函数,tr(·)为矩阵的迹,有
Vθ(k+1)=tra~T(k+1)a~(k+1)=traTa-2aTa^(k+1)+a^T(k+1)a^(k+1).
(14)
其中分别将式(14)的第2项和第3项展开得
tr-2aTa^(k+1)=tr-2aTa^(k)-λ(k)Jx(a^)=tr-2aTa^(k)+2λ(k)aTJx(a^),
(15)
tra^T(k+1)a^(k+1)=tra^(k)-λJx(a^)Ta^(k)-λ(k)Jx(a^)=tra^T(k)a^(k)-2λ(k)a^T(k)Jx(a^)+λ(k)2JxT(a^)Jx(a^).
(16)
将式(15)–(16)代入(14)得
Vθ (k+1) =Vθ (k) +tr2λ (k) a~T (k) Jx (a^) +
λ2(k)JxT(a^)Jx(a^).
(17)
将上式移项展开可得
Vθ(k+1)-Vθ(k)=tr2λ(k)a~T(k)Jx(a^)+λ2(k)JxT(a^)Jx(a^)=tr-2δT(k)δ(k)x~θT(k+1)x~θ(k+1)+1δT(k)δ(k)x~θT(k+1)x~θ(k+1)=tr-1δT(k)δ(k)x~θT(k+1)x~θ(k+1)
(18)
假设存在一个常数γ >δ Tkδk),可得
Vθ(k+1)-Vθ(k)-1γx~θT(k+1)x~θ(k+1)
(19)
因此可以证明估计参数误差a~k)是有界的. 证毕.
3 MPC控制器设计
根据上述内容,可以将式(3)写成如下形式:
x(k+1)=A^(k)x(k)+Bu(k)+Dw(k),
(20)
其中wk)= A~kxk)表示以扰动形式表示的参数不确定性,满足W:=wwTPww1其中 Pw Rmd+n×md+n为正定矩阵,D = Imd+n. 为了处理扰动,使用Tube-MPC 算法思想构造了一组集合序列Xlkl=0N称为状态Tube,它包含了输入序列ulkl=0N-1所能产生的系统的所有轨迹. 优化问题如下:
minulkl=0N-1,Xlkl=0N l=0N-1 JXlk,ulk+JTXNk,
(21)
s.t. x^kX0k,
(22)
Xl+1kA^XlkBulkDwlk,wlkW,
(23)
Fxlk+Gulk1,
(24)
XNkXT,
(25)
其中J(·,·)和JT(·)分别表示基于状态Tube定义的阶段和终端成本函数,形式如下:
JXlk, ulk=l=0N-1 xTQxx+uTQuu, JTXNk=xTPCx,
其中:QxRmd+n×md+nQuRm×m为正定矩阵,PCRmd+n×md+n是离线计算的正定终端成本矩阵. 由于对系统进行了状态扩展,式(24)中参数应改为FRnc×md+nGRnc×m.本文采用参数化状态Tube的方法,利用缩放变量和移位变量对固定形状的椭球体进行平移和缩放.
鲁棒MPC优化问题(21)取决于集合Xlkl=0N和控制输入ulkl=0N-1这个优化问题需在每个时间步在线解决. 为此,控制输入将使用仿射控制律进行参数化,状态Tube将使用预定义的椭球体进行参数化,并设计终端集来保证闭环稳定,且优化问题(21)递归可行.
3.1 参数化控制输入和状态Tube
集合Xlkl=0N使用预定义的椭球体进行参数化,形式如下:
X¯:=xxTPx1=xLx21,
(26)
其中:PRmd+n×md+n为正定矩阵,LP =LTL 的Cholesky分解获得. 使用缩放变量αl|kR >0和移位变量zl|k Rmd+n,状态Tube被参数化为如下形式:
Xlk:=Xzlk, αlk:=zlkαlkX¯=
xx-zlkTPx-zlkαlk2=
xLx-zlk2αlk,lN0N.
(27)
为方便起见,定义elk=xlk-zlklN0N.
控制输入参数化为
ulk=Kelk+νlk, lN0N-1,Kxlk, l>N,
(28)
其中: K为离线设计的反馈增益,vlKl=0N-1为在线优化变量.
终端集用椭球体定义为
XT:=xxTPx1=X¯.
(29)
3.2 约束重构
利用参数化方法(28)–(29),优化问题需要根据变量zl|kνl|kαl|k重新表述. 式(22)的初始条件可表示为如下形式:
Lx^k-z0k2α0k,
(30)
这是一个二次约束.
定理 1 在参数化条件(27)下,如果存在τ1lkτ2lkR0 对于 dlk=A^zlk+Bvlk-zl+1k和下式成立:
-τ1,lkP***0-τ2,lkPw**00Q1*αlk(A^+BK)Ddlk-αl+1kP-10,
(31)
其中
Q1=τ1, lk+τ2, lk-αl+1k,
那么状态Tube包含约束(23)成立.
定理1的证明过程在附录给出. 通过定理1可得式(31)是关于变量zlkαlkαl+1kτ1lkτ2lk的线性矩阵不等式(linear matrix inequality,LMI).
引理 4 在参数化条件(27)下,如果满足下式:
Fzlk+Gνlk+αlkf-1,lN0N-1,
(32)
其中[f-]i:=maxxX¯ [F+GK]ixiN1nc是离线计算的,那么可以得到式(24)的控制输入和状态Tube的参数化形式. 因此,状态和输入约束可以重新表述为线性不等式.
定理 2 在参数化条件(27)–(29)下,如果存在正标量τ1,T使得下式成立:
-τ1,TP***0-1**0αNk-τ1,T*τ1,TInxzNkT0-P-10,
(33)
那么终端约束(25)将满足. 式(33)是关于变量 zN|kαN|kτ1,T中的线性矩阵不等式(LMI).
根据椭球体定义的终端集(29),终端约束(25)可以表述为
XNkXTzNk+eTPzNk+e-10e:eTPe-αNk20.
(34)
利用S-Procedure引理 [23],如果存在标量τ1T-1 ≥ 0使得下式成立:
zNk+eTPzNk+e-1-τ1,T-1eTPe-αNk20eTP1-τ1,T-1e+2zNkTPe+τ1,T-1αNk2+zNkTPzNk-10
(35)
那么式(34)成立. 应用引理1,式(35)可以写成
P-τ1,T-1P*zNkTPτ1,T-1αNk2-1+zNkTPzNk0.
(36)
利用引理2,式(36)可写成如下形式:
-τ1,T-1P***0-1**0αNk-τ1,T*InxzNk0-P-10.
(37)
将式(37)两边同时乘以diagτ1TInx1,1Inx可以得到式(33). 证毕.
3.3 离线设计
由上述内容可知,椭球体的形状影响状态Tube的速率和终端集的大小. 本节将制定离线优化问题来计算椭球体形状矩阵P和反馈项K.
为了保证递归可行性,MPC 控制器的终端集被设计为在终端控制器下保持不变,即终端集XT满足如下条件:
x+=A^x+Bu+DwXT,xXT,wW.
(38)
在椭球Tube的框架下可以写成
(z,α) s.t. x(x-z)TP(x-z)α2XT z+,α+s.t. x+xx-z+TPx-z+α+2XT,
(39)
其中x + = A^x +Bu+Dwu = KxwO. 式(39)是一个比式(38)更强的条件,但是系统不会自动保证式(39)中的(z +α+)的存在. 下面的定理3说明了式(38)的充分条件,也保证式(39)的成立.
定理 3 如果存在正标量τ1,Oτ2,OR>0使得下式成立:
-τ1,OP-1***0-τ2,OPw**00τ1,O+τ2,O-1*P-1A^+BTYTD0-P-10,
(40)
其中: Y = KP −1τ1,O + τ2,O ≤ 1,那么终端集 XT 满足条件式(39).
在参数化(26)–(29)下,式(38)满足zl|k = νl|k = zl+1|k = 0和αl|k = αl+1|k = 1. 由定理1得,当存在正标量τ1,Oτ2,OR >0满足如下矩阵不等式:
-τ1,OP***0-τ2,OPw**00τ1,O+τ2,O-1*(A^+BK)D0-P-10,
(41)
那么式(38)成立,将式(41)两边同时乘以diag{P −1,1,1,Inx },得到式(40).
利用式(58)–(60)定义的二次型,定义
mx+,O=mx+,l,mx,O=mx,l,mw,O=mw,l
(42)
通过替换zlk=νlk=zl+1k=0αlk=αl+1k=1并将向量elkT wlkTT替换成eT wTT然后利用引理2,式(40)等价于如下形式:
mx+,O-τ1,Omx,O-τ2,Omw,O0,
(43)
m~xO=x-zTPx-z-α2并应用S-Procedure 引理,假设存在一个常数τx >0,使得满足mx,Oτxm~xO0那么式(43)可以写成如下形式:
mx+,O-τ1,Oτxm~x,O-τ2,Omw,O0.
(44)
因此可以得到式(40)是满足式(39)的一个充分条件.
证毕.
另外,终端集需要满足在终端控制律下的状态和输入约束,如下所示:
Fx+Gu1
(F+GK) -1TP (F+GK) -11
-1FP-1+GYi*-P-10, iN1nc,
x:xTPx1,u=Kx,
(45)
其中maxxxxTPx1 fTx=fTP-1f和引理 2一起使用,得到上述结果.
最后,需要制定离线优化问题来计算椭球形状P 和反馈增益K. 为了使控制器的吸引区域最大化,从而使终端集的大小最大化,可以通过最小化P的行列式来实现. 因此,离线优化问题可以表示为
minP-1,Y,τ1,O,τ2,O -logdetP-1, s.t. P-1>0,τ1,O>0,τ2,O>0, (40)(45).
(46)
在计算出状态Tube的形状P和反馈增益K后,需要设计终端成本矩阵PC. 本文考虑扰动为零时的运行成本方案.
定理 4 如果存在一个矩阵PC满足如下不等式:
(A^+BK)TPC(A^+BK)+Qx+KTQuK-PC0,PC>0,
(47)
那么系统在控制器 uk = Kxk下,对于所有 k >0且 wk = 0,满足以下成本界限:
l=k xlTQxxl+ulTQuulxkTPCxk.
(48)
为了展示当不存在扰动时,成本界限(48)成立(即对于所有l > k),使用以下不等式:
xl+1TPCxl+1+xlTQx+KTQuKxl-xlTPCxl0,
(49)
然后将不等式(49)进行如下变换:
xl+1TPCxl+1+xlTQx+KTQuKxl-xlTPCxl0xlT(A^+BK)TPC(A^+BK)+Qx+KTQuK-PCxl0(A^+BK)TPC(A^+BK)+Qx+KTQuK-PC0,PC>0.
(50)
证毕.
4 自适应Tube-MPC
首先,描述待解决的在线优化问题,其中优化变量由下式给出:
Rk=zlk,αlkl=0N,νlk,τ1,lk,τ2,lkl=0N-1,τ1,T
(51)
则在线优化问题可写成如下形式:
minRk l=0N-1 JXlk, ulk+JTXNk,
s.t. τ1, T>0, τ1, lk, τ2, lk, αlk>0,
式(29)-(30)(42)-(43), lN0N-1.
(52)
本文提出的MPC策略的详细流程见算法1(表1).
4.1 递归可行性和稳定性
为了证明系统的递归可行性和闭环稳定性,结合文献 [24] 定义的输入–状态实际稳定性(input-to-statepractically stable,ISpS)的概念,给出下面定理:
定理 5 假设离线优化问题(46)有一个可行解,那么对于任意初始条件 x^0XNXT,由满足系统动态方程和算法1定义的自适应 Tube-MPC(adaptive Tube-MPC,ATMPC)控制器形成的闭环系统的所有状态轨迹将保持在集合XN XT)内. 另外优化问题(52)对于所有k >0 时都是可行的,并且闭环系统在集合 XN XT)中关于wk是区域性输入–状态实际稳定的.
1算法 1: 自适应Tube-MPC
Table1Algorithm 1: Adaptive Tube-MPC
根据文献 [24]XNXT)的定义,优化问题(52)在k = 0时是可行的,然后可以证明如果优化问题(52)在任意时刻k是可行的,则在时间步k + 1也存在一个可行解. 证明遵循标准的递归可行性证明方法,其中时间k的最优解用于计算时间k + 1的可行解. 时间k的最优解用变量的上标( ∗)进行表示.
根据定理3,时间k + 1时优化问题(52)的候选解可以写成如下形式:
zlk+1=zl+1k*, αlk+1=αl+1k*, lN0N-1, νjk+1=νj+1k*, jN0N-2, zNk+1= (A^+BK) zNk*, αNk+1=αNk*, νN-1k+1=KzNk*.
因为候选集Xlk+1:=Xl+1k*提供了lN0N-1的可行状态Tube,所以对应的S-Procedure变量和代价界也相应移动. 时间k + 1的候选解vN-1k+1是可行的,因为zNkXT并且终端集XT满足式(45). 通过定理3 可以说明XNk+1A^+BKzNk*αNk*满足集合动力学并且位于XT内. 因此,通过数学归纳法,优化问题(52)是可行的,并且状态轨迹在所有k >0时保持在集合XNXT)内. 闭环系统的实际稳定性是式(2)中定义的约束集合C的紧致性和集合XN XT)的鲁棒正不变性的直接结果 [24] . 证毕.
5 数值仿真
在本节中,通过两个仿真实例来验证提出的自适应Tube-MPC算法的有效性.
5.1 算例1
考虑一个由两个质量块组成的系统,这两个质量块沿着一条线与弹簧和阻尼器连接. 在实验中,系统的状态变量被定义为质量块的相对位移和速度,控制输入为作用在每个质量块上的力. 弹簧的标称弹性系数取值范围为[0.7,0.9] N/m,阻尼器的标称阻尼系数取值范围为 [0.3,0.7] N·s/m,每个质量块的标称质量参数是1 kg. 实际系统的参数在标称值的基础上引入了0.1 倍标准差的正态分布不确定性,同时在标称输入的基础上添加了一个0.05倍标准差的正态分布随机扰动,以模拟实际输入存在的不确定性. 考虑到作用在一个质量块上的力会对另一个质量块产生影响,通过设置耦合作用因子0.05,模拟了一个输入力对系统其他部分的影响. 考虑系统具有一步时延,因此选用式(1)对系统动力学进行建模,通过采用欧拉离散化对该质量–弹簧–阻尼器系统的连续时间动态进行离散化,采样时间Ts = 0.3 s,形式如下:
x(k+1)=Ax(k)+Bu(k-1),
(53)
其中:
A=1Ts00-kuTs-cuTs+1kuTscuTs001TskuTscuTs-kuTs-cuTs+1,
B=00TsuTsu'00Tsu'Tsxu
由于系统(53)具有输入延迟,本文用扩展状态表示法来转换系统,以在状态空间描述中表示延迟效应,参考式(3). 使用系统的标称参数用作估计参数的初始值. 两个质量块的初始状态分别设定为 [–1.5 m,1m·s −1 ]和 [1.5 m,–1m·s −1 ],使用对角矩阵 QxQu 作为成本矩阵,其中位置状态和控制输入的成本为1,速度状态的成本为0.1. 其中Qx需要写成扩展状态表达式,在线优化问题的预测时域和控制时域Np = 8,状态和输入的大小以2为界. 为了验证本文所提方法的性能,选取经典MPC 算法作为对照试验. 本文所提算法用ATMPC表示,仿真结果如图1–4所示.
图1–4验证了所提出的算法在具有参数不确定性和输入时延系统下的性能表现. 从图1–2可以看出所提出的自适应Tube-MPC算法和MPC算法都能够稳定闭环系统,并且控制在其约束范围内; 图3可以看出两种方法产生的控制输入是不同的,这说明不同的控制器提供了不同的解决方案,但是实际控制性能是类似的,本文的算法产生的控制输入更小,收敛速度更快,说明本文的算法能够以较小的成本获得类似的实际控制性能,并且满足约束; 图4可以看出使用自适应更新律时估计参数有界. 由此证明了所提出方法的有效性和优越性.
1两个质量块的位置状态轨迹
Fig.1Position state trajectories of the two mass blocks
2两个质量块的速度状态轨迹
Fig.2Velocity state trajectories of the two mass blocks
3两个质量块的控制输入
Fig.3Control inputs of the two mass blocks
4估计矩阵误差的范数
Fig.4Estimation matrix error norm
5.2 算例2
考虑具有不确定参数和输入时延的约束系统,其动态可以建模为
xθ(k+1)=Aθxθ(k)+Bθu(k-d),
(54)
其中:
Aθ=0.850.09-0.91.8, Bθ=0.210.52.
上式中AθBθ未知,它们的标称参数是已知的,并用作估计矩阵的初始值,如下所示:
A=10.15-0.761.9, B=0.41.10.82.08.
同样,由于系统(54)含有输入时延,用扩展状态法来转换系统以消除延迟,参考式(3). 在本例中,设置系统初始状态为xθ(0)= [0.8,1],预测时域和控制时域为Np = 10,采样间隔为0.1,权重矩阵Qx = diag{0.1,0.1},Qu = diag {0.1,0.1},输入约束 u ≤ 2,状态约束x ≤ 2,上述参数需根据不同的延迟步长进行扩展. 仿真结果如图5–6所示.
5不同延迟步长下的控制输入
Fig.5Control inputs under different delay steps
6不同延迟步长下的状态轨迹
Fig.6State trajectories under different delay steps
图5–6中比较了系统在不同输入延迟步长下的性能表现. 从图5可以看出所提出的自适应 Tube-MPC 算法在3种不同的延迟步长下都能使系统的控制输入收敛; 从图6可以看出在3种不同的延迟步长下都能使闭环系统稳定并且满足约束. 因此证明本文提出的方法对具有时延的系统是有效的.
6 结论
本文针对具有参数不确定性和输入时延的线性系统,提出了一种自适应Tube-MPC算法. 通过扩展状态的方法有效地处理了输入时延问题,确保了控制策略的有效性和准确性. 该算法利用自适应更新律动态调整系统参数,增强了系统在面对不确定性时的鲁棒性. 基于Tube-MPC算法设计的控制器保证了系统的递归可行性和闭环稳定性. 最后通过仿真验证了算法的有效性.
附录
定理1的证明:
根据系统方程和式(23)可得
xl+1kXl+1k,xlkXlk,wlkW
(A1)
接着式(A1)可改写成
el+1kTPel+1kαl+1k2,xlkXlk,wlkW,
(A2)
其中
el+1k=A^xlk+Bulk+Dwlk-zl+1k=A^elk+BKelk+Dwlk+A^zlk+Bvlk-zl+1k=A^elk+BKelk+Dwlk+dlk,
(A3)
其中:dlk=A^zlk+Bvlk-zl+1k条件xlkXlk可以写成elkTPelkαlk2条件wlkW可以写成wlkTPwwlk1.
考虑elkT wlkTT中的二次型mx+lmxlmwl分别根据式(A2)–(A3),elkTPelkαlk2wlkTPwwlk1定义如下所示:
mx+, l=elkT wlkT (A^+BK) TDTP[ (A^+BK) D]×
elkwlk+2dlkTP[(A^+BK)D]elkwlk+
(A4)
mx,l=elkT wlkTInx0PInx 0elkwlk-αlk2,
(A5)
mw,l=elkT wlkT0InxPw0 Inxelkwlk-1.
(A6)
因此,状态Tube包含约束(A2)可表示为
mx+,l0elkTwlkTTelkTwlkTTmx,l0,mw,l0.
(A7)
应用 S-Procedure引理,如果存在正标量 τ1,l|kτ2,l|k使得下式成立:
αl+1k-1mx+,l-τ1,lkαlk-2mx,l-τ2,lkmw,l0,
(A8)
那么式(A2)成立.
应用引理1,式(A8)可以写成如下形式:
Q2**αl+1k-1DTP(A^+BK)αl+1k-1DTPD-τ2,lkPw*αl+1k-1dlkTP(A^+BK)αl+1k-1dlkTPDQ30,
(A9)
其中:
Q2=αl+1k-1 (A^+BK) TP (A^+BK) -τ1, lkαlk-2P, Q3=αl+1k-1dlkTPdlk-αl+1k+τ1, lk+τ2, lk.
接着式(A9)可改写成如下形式:
(A^+BK) TDTdlkTαl+1k-1PA^+BK D dlk+
-τ1,lkαlk-2P000-τ2,lkPw000τ1,lk+τ2,lk-αl+1k0.
(A10)
利用引理2,当满足以下线性矩阵不等式(LMI)时,矩阵不等式(A10)成立:
-τ1,lkαlk-2P***0-τ2,lkPw**00Q4*(A^+BK)Ddlk-αl+1kP-10,
(A11)
其中
Q4=τ1, lk+τ2, lk-αl+1k.
将式(A11)两边同时乘以diagαlkInx1,1Inx可以得到式(31). 证毕.
1两个质量块的位置状态轨迹
Fig.1Position state trajectories of the two mass blocks
2两个质量块的速度状态轨迹
Fig.2Velocity state trajectories of the two mass blocks
3两个质量块的控制输入
Fig.3Control inputs of the two mass blocks
4估计矩阵误差的范数
Fig.4Estimation matrix error norm
5不同延迟步长下的控制输入
Fig.5Control inputs under different delay steps
6不同延迟步长下的状态轨迹
Fig.6State trajectories under different delay steps
1算法 1: 自适应Tube-MPC
Table1Algorithm 1: Adaptive Tube-MPC
WANG Junxiao, CHEN Linjie, YU Li. Model predictive control of magnetic levitation ball system based on equivalent input disturbance sliding mode observer. Control Theory & Applications,2021,38(1):137-146.(王军晓, 陈林杰, 俞立. 基于等价输入干扰滑模观测器的磁悬浮球系统模型预测控制. 控制理论与应用,2021,38(1):137-146.)
CHEN S R, PRECIADO V M, MORARI M,et al. Robust model predictive control with polytopic model uncertainty through system level synthesis. Automatica,2024,162:111431.
LORENZEN M, CANNON M, ALLGÖWER F. Robust MPC with recursive model update. Automatica,2019,103:461-471.
WANG Z Q, ZOU W, ZHANG W,et al. Auditory feature driven model predictive control for sound source approaching. International Journal of Control, Automation and Systems,2024,22(2):676-689.
WANG Y, LEIBOLD M, LEE J,et al. Incremental model predictive control exploiting time-delay estimation for a robot manipulator. IEEE Transactions on Control Systems Technology,2022,30(6):2285-2300.
INCREMONA G P, FERRARA A, MAGNI L. MPC for robot manipulators with integral sliding modes generation. IEEE/ASME Transactions on Mechatronics,2017,22(3):1299-1307.
SASFI A, ZEILINGER M N, KÖHLER J. Robust adaptive MPC us-ing control contraction metrics. Automatica,2023,155:111169.
TAN W, WANG M F, MA K. Research on intelligent vehicle trajectory tracking control based on improved adaptive MPC. Sensors,2024,24(7):2316.
PARSI A, LIU D, IANNELLI A,et al. Dual adaptive MPC using an exact set-membership reformulation. IFAC-PapersOnLine,2023,56(2):8457-8463.
BUJARBARUAH M, ZHANG X J, TANASKOVIC M,et al. Adaptive stochastic MPC under time-varying uncertainty. IEEE Transactions on Automatic Control,2020,66(6):2840-2845.
WANG W R, YAN J H, WANG H,et al. Adaptive MPC trajectory tracking for AUV based on Laguerre function. Ocean Engineering,2022,261:111870.
ZHANG K W, SUN Q, SHI Y. Trajectory tracking control of autonomous ground vehicles using adaptive learning MPC. IEEE Transactions on Neural Networks and Learning Systems,2021,32(12):5554-5564.
LUBINIECKI T, SCHILDBACH G. Adaptive MPC for trajectory tracking with online adaption of the vehicle model’s yaw intensification. European Control Conference(ECC). Piscataway, NJ, USA: IEEE,2023:1-6.
ZHU B, XIA X H. Adaptive model predictive control for unconstrained discrete-time linear systems with parametric uncertainties. IEEE Transactions on Automatic Control,2015,61(10):3171-3176.
ZHU B, ZHENG Z W, XIA X H. Constrained adaptive modelpredictive control for a class of discrete-time linear systems with parametric uncertainties. IEEE Transactions on Automatic Control,2019,65(5):2223-2229.
HU Y J, GOU L F, FAN D,et al. An adaptive model predictive control strategy for a class of discrete-time linear systems with parametric uncertainty. International Journal of Adaptive Control and Signal Processing,2021,35(12):2389-2405.
ZHANG K W, SHI Y. Adaptive model predictive control for a class of constrained linear systems with parametric uncertainties. Automatica,2020,117:108974.
RAKOVICS V, ZHANG S X, HAO Y,et al. Safe polyhedral tubes for ´ locally convexified MPC. Automatica,2021,132:109791.
RAKOVICS V, DAI L, XIA Y Q. Homothetic tube model predictive ´ control for nonlinear systems. IEEE Transactions on Automatic Control,2023,68(8):4554-4569.
PARSI A, IANNELLI A, SMITH R S. Scalable tube model predictive control of uncertain linear systems using ellipsoidal sets. International Journal of Robust and Nonlinear Control,2022,35(7):2499-2520.
DULLERUD G, SMITH R. A nonlinear functional approach to LFT model validation. Systems Control Letters,2002,47(1):1-11.
ZHANG F Z. The Schur Complement and its Applications. New York, USA: Springer Science & Business Media,2006.
BOYD S, GHAOUI L E, FERON E,et al. Linear matrix inequalities in system and control theory. Society for Industrial and Applied Mathematics. Philadelphia, PA, USA: Society for Industrial and Applied Mathematics,1994.
RAIMONDO D M, LIMON D, LAZAR M,et al. Min-max model predictive control of nonlinear systems: A unifying overview on stability. European Journal of Control,2009,15(1):5-21.