摘要
模型预测控制(MPC)在现代控制中因其在处理多变量和约束系统中的优势, 得到了广泛应用. 然而, 系统的不确定性和输入延迟为MPC的设计和实现带来了显著挑战. 本文提出了一种适用于含有参数不确定性和输入延迟的线性系统的自适应Tube-MPC算法. 首先, 采用状态变量扩展的方法将原始系统转化为增广系统来处理时延问题, 并设计一种基于时变更新率的自适应更新律进行参数估计, 确保估计误差在有界范围内; 其次, MPC控制器采用椭球体集合来参数化状态Tube用于捕获状态轨迹, 将离线和在线优化问题转化成半定规划(SDP)问题, 以简化计算复杂度, 实现了对系统的鲁棒控制; 最后, 通过两组仿真实例验证了所提自适应Tube-MPC算法的有效性.
关键词
Abstract
Model predictive control (MPC) has been widely applied in modern control due to its advantages in handling multivariable and constrained systems. However, the uncertainties and input delays of the systems pose significant challenges to the design and implementation of MPC. This paper proposes an adaptive Tube-MPC algorithm for linear systems with parameter uncertainties and input delays. Firstly, the original system is transformed into an augmented system using the state variable extension to address the delay problem. An adaptive updating law with time-varying update rates is designed for parameter estimation, ensuring that the estimation error remains bounded. Secondly, the MPC controller uses ellipsoidal sets to parameterize the state Tube to capture the state trajectories. The offline and online optimization problems are converted into semi-definite programming (SDP) problems, simplifying computational complexity and achieving robust control of the system. Finally, two sets of simulation examples are used to verify the effectiveness of the proposed adaptive Tube-MPC algorithm.
1 引言
模型预测控制(model predictive control,MPC)作为一种强大的控制策略日益受到重视,它在多变量和约束系统中的应用显示了其在复杂系统控制中的优越性 [1] . MPC的核心思想是利用系统的数学模型预测在未来一段时间内的行为,通过优化算法计算出最优控制序列,以使系统在给定的性能指标下实现最优控制 [2] .
在实际应用中,系统中总是存在着由各种因素引起的不确定性,如随机噪声、模型参数的不确定性,包括加性或乘性的不确定性 [3] . 这些不确定性会影响系统的性能,甚至导致系统不稳定. 此外,在一些实时响应系统中,传感器延迟、执行器延迟和信号传输延迟等输入延迟也会影响系统性能,甚至造成安全隐患 [4-6] . 目前,针对不确定系统模型的 MPC研究主要集中在两个方面: 鲁棒MPC [7] 和自适应MPC [8] . 鲁棒 MPC是解决系统不确定性的常见和有效的方法,主要包括min-max MPC和Tube-MPC. 传统的鲁棒MPC通常考虑参数不确定性的最坏情况,结果相对保守. 因此,在同时考虑系统参数不确定性和输入延迟的情况下,结合自适应控制是一种很有前景的技术解决方案. 自适应MPC的核心思想是设计自适应算法在线更新不确定参数,并基于更新后的系统模型计算最优控制输入,同时保证系统稳定性. 当前已经研究了多种自适应MPC的参数识别策略,包括隶属识别 [9-10]、递归最小二乘法 [11-12]、神经网络 [13] 和自适应更新律 [14-16] 等. 其中文献 [14] 在系统状态可测且输出矩阵已知,但参数矩阵未知的情况下,将参数估计的自适应更新律与MPC相结合,设计了一种无约束的自适应MPC 方法; 文献 [15] 在文献 [14] 的基础上,针对一类具有参数不确定性的约束离散线性系统,提出了一种基于 min-max算法的改进的自适应MPC方法.
针对具有恒定参数不确定性和输入延迟的约束线性系统,本文提出一种自适应更新策略来更新系统的不确定参数. 首先通过状态扩展将原系统改写为增广系统,以补偿输入延迟. 接着采用基于时变自适应更新率的自适应更新律,在输入延迟和参数不确定的条件下更新系统的估计参数,并保证估计误差有界. 控制器采用鲁棒 MPC 思想设计,重点是目前流行的 Tube-MPC. 在Tube-MPC方法中,扰动对状态轨迹的影响通过一系列称为状态Tube的集合来捕获. 使用集合论的概念,将状态Tube构造为在线优化变量的函数,以包含系统所有可能的未来轨迹,并要求状态Tube能满足约束以确保鲁棒性. 传统的Tube通常采用多面体集序列对状态Tube进行参数化 [17-19],这种参数化方法将动态集合表示为线性约束,实现凸二次规划的在线求解. 然而这种方法存在一个明显缺点: 随着状态维数的增加,描述多面体所需的超平面和顶点数量会显著增多,导致在线优化中存在大量约束和变量. 针对这一问题,本文提出了一种基于椭球体的鲁棒MPC 方法,与多面体参数化方法不同,椭球体可以通过单一的圆约束来定义,其可以转化为一个单一的凸优化问题,而不是多面体设计的迭代过程 [20],这种设计显著降低了计算复杂度.
本文的主要贡献可概括如下:
1)设计了一种自适应更新律,在线更新系统不确定参数并确保估计误差有界,有效应对输入延迟和参数不确定性问题;
2)设计了一种基于参数化椭球体的Tube-MPC方法,相对多面体参数化方法降低了计算复杂性;
3)设计离线和在线两阶段优化方案,通过求解半正定规划和凸半正定规划问题,确保系统的递归可行性与闭环稳定性.
符号说明和背景引理.
符号说明:分别表示实数集、非负实数集和正实数集; 表示n维欧氏空间; 表示从n1 到n2的整数序列; AT表示矩阵A的转置; 对于两个方阵A和B,符号diag(A,B)表示由A和B组成的块对角矩阵; 两个集合的闵可夫斯基和表示为A ⊕ B; 矩阵A的第i行表示[A] i; al|k表示在时间步k计算的时间步k + 1的a值; 表示2-范数; In表示大小为n × n 的单位矩阵; A ≤ 0表示A为负半定矩阵; 对称矩阵中,上三角元素中的∗表示该值是相应下三角元素的转置.
引理 1 [21] 当且仅当矩阵是负半定矩阵时,变量所定义的二次约束x TXx+2y Tx + z ≤ 0对所有x都成立.
引理 2(Schur补 [22])考虑对称矩阵Q, R; 若 Q <0,那么当且仅当R − S TQ−1 S ≤ 0时,满足
2 问题描述
2.1 问题建模
本文考虑具有参数不确定性和输入时延的离散线性系统
(1)
其中:和 分别表示系统的状态和输入; d ∈ 表示已知的时间延迟; 和表示含不确定性的系统矩阵. 系统的状态和输入位于包含原点的集合中,定义如下:
(2)
其中:
由于系统包含输入时延,本文采用状态变量扩展的方法,通过添加状态向量的方法来合并输入时延,它引入了历史的控制输入数据,从而更准确地描述系统的动态特性. 扩展后的增广系统如下所示:
(3)
其中:表示扩展后的状态向量,A ∈和表示扩展后的系统矩阵,形式如下:
由于上述系统矩阵A中含有不确定性,为了处理这个问题,本文设计系统(3)的估计系统,如下所示:
(4)
其中和分别是系统扩展矩阵A和状态x的估计值. 用式(3)减去式(4)可得如下误差传递系统:
(5)
其中: = x − 为状态误差, = A − 为状态矩阵的估计误差. 为了更新不确定参数,定义当前时刻状态向量 δ(k)= [u T(k − d)(k)]T,其中 δ(k)∈ ,相应的可以得到
(6)
其中 ∈ 为参数估计误差. ,a 和 分别为
2.2 自适应更新律
为了更新不确定参数,本节设计了一种自适应更新律,可以保证估计参数误差是有界的. 定义关于状态估计误差的代价函数如下:
(7)
Jx相对于的梯度通过下式求得:
(8)
接着采用一种自适应更新律来最小代价函数,引入更新率λ(k)>0如下:
(9)
λ(k)可由下面成本函数得到:
(10)
对目标函数Jx关于λ(k)求导并将其设为零,即
(11)
可以得到
将式(12)代入式(9)可得
(13)
注 1 对于自适应更新律(13),在k + 1时刻可以通过计算 = xθ(k + 1)− δ(k)得到,其中 xθ(k + 1)是在时间k + 1所测量的系统状态.
引理 3 考虑具有恒定参数不确定性和输入时延的约束线性系统(1),如果应用上述自适应更新律,则需要确保估计参数误差(k)是有界的.
证选取Vθ(k)= tr( T(k)(k))作为Lyapunov 函数,tr(·)为矩阵的迹,有
(14)
其中分别将式(14)的第2项和第3项展开得
(15)
(16)
将式(15)–(16)代入(14)得
(17)
将上式移项展开可得
(18)
假设存在一个常数γ >δ T(k)δ(k),可得
(19)
因此可以证明估计参数误差(k)是有界的. 证毕.
3 MPC控制器设计
根据上述内容,可以将式(3)写成如下形式:
(20)
其中w(k)= (k)x(k)表示以扰动形式表示的参数不确定性,满足其中 Pw ∈为正定矩阵,D = Imd+n. 为了处理扰动,使用Tube-MPC 算法思想构造了一组集合序列称为状态Tube,它包含了输入序列所能产生的系统的所有轨迹. 优化问题如下:
(21)
(22)
(23)
(24)
(25)
其中J(·,·)和JT(·)分别表示基于状态Tube定义的阶段和终端成本函数,形式如下:
其中:为正定矩阵,是离线计算的正定终端成本矩阵. 由于对系统进行了状态扩展,式(24)中参数应改为和本文采用参数化状态Tube的方法,利用缩放变量和移位变量对固定形状的椭球体进行平移和缩放.
鲁棒MPC优化问题(21)取决于集合和控制输入这个优化问题需在每个时间步在线解决. 为此,控制输入将使用仿射控制律进行参数化,状态Tube将使用预定义的椭球体进行参数化,并设计终端集来保证闭环稳定,且优化问题(21)递归可行.
3.1 参数化控制输入和状态Tube
集合使用预定义的椭球体进行参数化,形式如下:
(26)
其中:为正定矩阵,L由P =LTL 的Cholesky分解获得. 使用缩放变量αl|k ∈ >0和移位变量zl|k ∈ md+n,状态Tube被参数化为如下形式:
(27)
为方便起见,定义
控制输入参数化为
(28)
其中: K为离线设计的反馈增益,为在线优化变量.
终端集用椭球体定义为
(29)
3.2 约束重构
利用参数化方法(28)–(29),优化问题需要根据变量zl|k,νl|k,αl|k重新表述. 式(22)的初始条件可表示为如下形式:
(30)
这是一个二次约束.
定理 1 在参数化条件(27)下,如果存在和下式成立:
(31)
其中
那么状态Tube包含约束(23)成立.
定理1的证明过程在附录给出. 通过定理1可得式(31)是关于变量的线性矩阵不等式(linear matrix inequality,LMI).
引理 4 在参数化条件(27)下,如果满足下式:
(32)
其中是离线计算的,那么可以得到式(24)的控制输入和状态Tube的参数化形式. 因此,状态和输入约束可以重新表述为线性不等式.
定理 2 在参数化条件(27)–(29)下,如果存在正标量τ1,T使得下式成立:
(33)
那么终端约束(25)将满足. 式(33)是关于变量 zN|k,αN|k和τ1,T中的线性矩阵不等式(LMI).
证根据椭球体定义的终端集(29),终端约束(25)可以表述为
(34)
利用S-Procedure引理 [23],如果存在标量 ≥ 0使得下式成立:
(35)
那么式(34)成立. 应用引理1,式(35)可以写成
(36)
利用引理2,式(36)可写成如下形式:
(37)
将式(37)两边同时乘以可以得到式(33). 证毕.
3.3 离线设计
由上述内容可知,椭球体的形状影响状态Tube的速率和终端集的大小. 本节将制定离线优化问题来计算椭球体形状矩阵P和反馈项K.
为了保证递归可行性,MPC 控制器的终端集被设计为在终端控制器下保持不变,即终端集XT满足如下条件:
(38)
在椭球Tube的框架下可以写成
(39)
其中x + = x +Bu+Dw,u = Kx和w ∈ O. 式(39)是一个比式(38)更强的条件,但是系统不会自动保证式(39)中的(z +,α+)的存在. 下面的定理3说明了式(38)的充分条件,也保证式(39)的成立.
定理 3 如果存在正标量τ1,O,τ2,O ∈ >0使得下式成立:
(40)
其中: Y = KP −1,τ1,O + τ2,O ≤ 1,那么终端集 XT 满足条件式(39).
证在参数化(26)–(29)下,式(38)满足zl|k = νl|k = zl+1|k = 0和αl|k = αl+1|k = 1. 由定理1得,当存在正标量τ1,O,τ2,O ∈ >0满足如下矩阵不等式:
(41)
那么式(38)成立,将式(41)两边同时乘以diag{P −1,1,1, },得到式(40).
利用式(58)–(60)定义的二次型,定义
(42)
通过替换并将向量替换成然后利用引理2,式(40)等价于如下形式:
(43)
让并应用S-Procedure 引理,假设存在一个常数τx >0,使得满足mx,O −那么式(43)可以写成如下形式:
(44)
因此可以得到式(40)是满足式(39)的一个充分条件.
证毕.
另外,终端集需要满足在终端控制律下的状态和输入约束,如下所示:
(45)
其中和引理 2一起使用,得到上述结果.
最后,需要制定离线优化问题来计算椭球形状P 和反馈增益K. 为了使控制器的吸引区域最大化,从而使终端集的大小最大化,可以通过最小化P的行列式来实现. 因此,离线优化问题可以表示为
(46)
在计算出状态Tube的形状P和反馈增益K后,需要设计终端成本矩阵PC. 本文考虑扰动为零时的运行成本方案.
定理 4 如果存在一个矩阵PC满足如下不等式:
(47)
那么系统在控制器 uk = Kxk下,对于所有 k >0且 wk = 0,满足以下成本界限:
(48)
证为了展示当不存在扰动时,成本界限(48)成立(即对于所有l > k),使用以下不等式:
(49)
然后将不等式(49)进行如下变换:
(50)
证毕.
4 自适应Tube-MPC
首先,描述待解决的在线优化问题,其中优化变量由下式给出:
(51)
则在线优化问题可写成如下形式:
(52)
本文提出的MPC策略的详细流程见算法1(表1).
4.1 递归可行性和稳定性
为了证明系统的递归可行性和闭环稳定性,结合文献 [24] 定义的输入–状态实际稳定性(input-to-statepractically stable,ISpS)的概念,给出下面定理:
定理 5 假设离线优化问题(46)有一个可行解,那么对于任意初始条件 ,由满足系统动态方程和算法1定义的自适应 Tube-MPC(adaptive Tube-MPC,ATMPC)控制器形成的闭环系统的所有状态轨迹将保持在集合XN (XT)内. 另外优化问题(52)对于所有k >0 时都是可行的,并且闭环系统在集合 XN (XT)中关于wk是区域性输入–状态实际稳定的.
表1算法 1: 自适应Tube-MPC
Table1Algorithm 1: Adaptive Tube-MPC
证根据文献 [24] 中XN(XT)的定义,优化问题(52)在k = 0时是可行的,然后可以证明如果优化问题(52)在任意时刻k是可行的,则在时间步k + 1也存在一个可行解. 证明遵循标准的递归可行性证明方法,其中时间k的最优解用于计算时间k + 1的可行解. 时间k的最优解用变量的上标( ∗)进行表示.
根据定理3,时间k + 1时优化问题(52)的候选解可以写成如下形式:
因为候选集提供了的可行状态Tube,所以对应的S-Procedure变量和代价界也相应移动. 时间k + 1的候选解是可行的,因为并且终端集XT满足式(45). 通过定理3 可以说明满足集合动力学并且位于XT内. 因此,通过数学归纳法,优化问题(52)是可行的,并且状态轨迹在所有k >0时保持在集合XN(XT)内. 闭环系统的实际稳定性是式(2)中定义的约束集合C的紧致性和集合XN (XT)的鲁棒正不变性的直接结果 [24] . 证毕.
5 数值仿真
在本节中,通过两个仿真实例来验证提出的自适应Tube-MPC算法的有效性.
5.1 算例1
考虑一个由两个质量块组成的系统,这两个质量块沿着一条线与弹簧和阻尼器连接. 在实验中,系统的状态变量被定义为质量块的相对位移和速度,控制输入为作用在每个质量块上的力. 弹簧的标称弹性系数取值范围为[0.7,0.9] N/m,阻尼器的标称阻尼系数取值范围为 [0.3,0.7] N·s/m,每个质量块的标称质量参数是1 kg. 实际系统的参数在标称值的基础上引入了0.1 倍标准差的正态分布不确定性,同时在标称输入的基础上添加了一个0.05倍标准差的正态分布随机扰动,以模拟实际输入存在的不确定性. 考虑到作用在一个质量块上的力会对另一个质量块产生影响,通过设置耦合作用因子0.05,模拟了一个输入力对系统其他部分的影响. 考虑系统具有一步时延,因此选用式(1)对系统动力学进行建模,通过采用欧拉离散化对该质量–弹簧–阻尼器系统的连续时间动态进行离散化,采样时间Ts = 0.3 s,形式如下:
(53)
其中:
由于系统(53)具有输入延迟,本文用扩展状态表示法来转换系统,以在状态空间描述中表示延迟效应,参考式(3). 使用系统的标称参数用作估计参数的初始值. 两个质量块的初始状态分别设定为 [–1.5 m,1m·s −1 ]和 [1.5 m,–1m·s −1 ],使用对角矩阵 Qx 和Qu 作为成本矩阵,其中位置状态和控制输入的成本为1,速度状态的成本为0.1. 其中Qx需要写成扩展状态表达式,在线优化问题的预测时域和控制时域Np = 8,状态和输入的大小以2为界. 为了验证本文所提方法的性能,选取经典MPC 算法作为对照试验. 本文所提算法用ATMPC表示,仿真结果如图1–4所示.
图1–4验证了所提出的算法在具有参数不确定性和输入时延系统下的性能表现. 从图1–2可以看出所提出的自适应Tube-MPC算法和MPC算法都能够稳定闭环系统,并且控制在其约束范围内; 图3可以看出两种方法产生的控制输入是不同的,这说明不同的控制器提供了不同的解决方案,但是实际控制性能是类似的,本文的算法产生的控制输入更小,收敛速度更快,说明本文的算法能够以较小的成本获得类似的实际控制性能,并且满足约束; 图4可以看出使用自适应更新律时估计参数有界. 由此证明了所提出方法的有效性和优越性.
图1两个质量块的位置状态轨迹
Fig.1Position state trajectories of the two mass blocks
图2两个质量块的速度状态轨迹
Fig.2Velocity state trajectories of the two mass blocks
图3两个质量块的控制输入
Fig.3Control inputs of the two mass blocks
图4估计矩阵误差的范数
Fig.4Estimation matrix error norm
5.2 算例2
考虑具有不确定参数和输入时延的约束系统,其动态可以建模为
(54)
其中:
上式中Aθ和Bθ未知,它们的标称参数是已知的,并用作估计矩阵的初始值,如下所示:
同样,由于系统(54)含有输入时延,用扩展状态法来转换系统以消除延迟,参考式(3). 在本例中,设置系统初始状态为xθ(0)= [0.8,1],预测时域和控制时域为Np = 10,采样间隔为0.1,权重矩阵Qx = diag{0.1,0.1},Qu = diag {0.1,0.1},输入约束 ≤ 2,状态约束 ≤ 2,上述参数需根据不同的延迟步长进行扩展. 仿真结果如图5–6所示.
图5不同延迟步长下的控制输入
Fig.5Control inputs under different delay steps
图6不同延迟步长下的状态轨迹
Fig.6State trajectories under different delay steps
图5–6中比较了系统在不同输入延迟步长下的性能表现. 从图5可以看出所提出的自适应 Tube-MPC 算法在3种不同的延迟步长下都能使系统的控制输入收敛; 从图6可以看出在3种不同的延迟步长下都能使闭环系统稳定并且满足约束. 因此证明本文提出的方法对具有时延的系统是有效的.
6 结论
本文针对具有参数不确定性和输入时延的线性系统,提出了一种自适应Tube-MPC算法. 通过扩展状态的方法有效地处理了输入时延问题,确保了控制策略的有效性和准确性. 该算法利用自适应更新律动态调整系统参数,增强了系统在面对不确定性时的鲁棒性. 基于Tube-MPC算法设计的控制器保证了系统的递归可行性和闭环稳定性. 最后通过仿真验证了算法的有效性.
附录
定理1的证明:
证根据系统方程和式(23)可得
(A1)
接着式(A1)可改写成
(A2)
其中
(A3)
其中:条件可以写成条件可以写成.
考虑中的二次型分别根据式(A2)–(A3),定义如下所示:
(A4)
(A5)
(A6)
因此,状态Tube包含约束(A2)可表示为
(A7)
应用 S-Procedure引理,如果存在正标量 τ1,l|k,τ2,l|k使得下式成立:
(A8)
那么式(A2)成立.
应用引理1,式(A8)可以写成如下形式:
(A9)
其中:
接着式(A9)可改写成如下形式:
(A10)
利用引理2,当满足以下线性矩阵不等式(LMI)时,矩阵不等式(A10)成立:
(A11)
其中
将式(A11)两边同时乘以可以得到式(31). 证毕.