摘要
针对受参数不确定性和外部干扰影响的高超声速变体飞行器姿态控制问题, 本文提出了一种基于复合观测器的数据驱动模型预测控制方法. 为了解决高超声速变体飞行器建模与控制中的非线性问题, 采用基于Koopman算子理论的数据驱动建模方法, 利用Autoencoder神经网络拟合Koopman算子的最优升维函数, 并通过拓展动态模式分解(EDMD)获得有限维空间截断的线性标称模型. 此外, 为了抑制干扰带来的不利影响, 提出了一种同步估计方法构建复合观测器, 该观测器包括基于Koopman升维模型的Luenberger型观测器和同步干扰观测器; 随后, 基于线性标称模型和干扰估计值设计了模型预测控制器, 并且证明了其迭代可行性和输入输出稳定性; 最后, 通过仿真验证了控制器的有效性和可行性.
Abstract
In order to address the attitude control problem for hypersonic morphing vehicle affected by parameter perturbation and external disturbances, a data-driven model predictive control (MPC) approach is developed based on the composite observer in this paper. To tackle nonlinearities in aircraft modeling and control, this study introduces a data-driven modeling method based on the Koopman operator theory. An autoencoder neural network is employed to approximate the optimal lifting function of the Koopman operator, enabling the extraction of a linear nominal model on finite-dimensional lifting space using extended dynamic mode decomposition (EDMD). Additionally, to mitigate the adverse effects of disturbances, a synchronous estimation scheme is proposed to construct a composite observer for hypersonic vehicles, which consists of a Luenberger-type observer based on Koopman lifting model and a synchronous disturbance observer. Subsequently, a MPC controller is designed based on the linear nominal model and disturbance estimates. The recursive feasibility and the input-output stability of the controller are proven. Finally, simulation results validate the effectiveness and feasibility of the proposed controller.
1 引言
高超声速变体飞行器(hypersonic morphing vehicle,HMV)是在临近空间以大于5马赫速度飞行的一种新型飞行器,具有长飞行距离、高机动能力以及强突防能力等显著特点,在近十年来取得了迅速发展 [1] . 然而,近空间特殊的环境,导致HMV的飞行走廊十分狭窄,气动特性难以描述,操纵力矩与姿态、环境强烈耦合,这使得HMV 的控制问题具有强耦合、强非线性、强时变和强扰动的特点,此外,由于地面风洞实验的缺陷及传感器精度的不足,飞行器还遭受严重气动参数不确定性的影响 [2] . 因此,HMV再入姿态控制成为了一项非常有挑战性和吸引力的课题.
近年来,许多学者针对不断变化的飞行工况、干扰和不确定性条件下,如何获得更加准确、快速、鲁棒的姿态控制器进行了研究,诸如反步控制 [3]、动态逆控制 [4]、性能预设控制[5] 等多种控制算法被应用于高超声速飞行器. 文献 [6] 利用通道耦合特性设计了协调鲁棒自适应控制姿态技术. 文献 [7] 使用滑模控制和干扰观测器,保证了高超声速飞行器在未知扰动下姿态控制的鲁棒性. 文献 [8] 结合自适应高斯伪谱法和二阶滑模控制,不仅保证了实时最优再入制导律,同时实现了无抖振的快速姿态跟踪.
模型预测控制(model predictive control,MPC)能系统地处理约束问题,并基于被控对象数学模型滚动优化得到开环最优控制律,然而,对于强非线性的 HMV 而言,传统的非线性模型预测控制(nonlinear MPC,NMPC)方法需要解决非线性优化问题,很难满足HMV的强动态特性的控制要求. 对此,许多学者将反馈线性化技术运用于高超声速飞行器的MPC 控制器设计中. 文献 [9] 将反馈线性化和管模型预测控制(tube MPC,TMPC)相结合,设计了一种集中鲁棒控制器. 文献 [10] 将反馈线性化技术和鲁棒模型预测控制(robust MPC,RMPC)结合,提出了一种针对具有状态依赖输入约束和参数不确定性的高超声速飞行器 RMPC策略. 文献 [11] 提出了一种基于强化学习的参数自适应MPC,有效地应对了控制器在约束条件和参数时变状态下性能受限的挑战.
然而,上述的方法都依赖于被控对象的机理模型,模型的准确性会限制控制器的性能,为了克服这一缺陷,许多新方法被提出和应用. 文献 [12] 采用基于神经网络的状态观测器拟合高超声速飞行器的纵向动力学模型中的非线性项. 文献 [13] 基于控制向量参数化的方法处理偏微分方程约束的最优控制问题. 文献 [14] 基于Koopman算子理论,在升维空间中辨识挠性航天器的标称线性模型,并基于线性模型设计了线性二次型调节器(linear quadratic regulator,LQR)控制器. 在上述方法中,Koopman算子理论利用非线性系统的输入输出数据计算系统高维全局线性化模型,在理论上能够保留系统的完整非线性特征,因此,可以将线性控制方法拓展到非线性动力学系统的控制问题中. 但是Koopman算子是一种线性的无限维算子,这使得它在工程上难以应用. 因此,文献 [15] 提出了扩展动态模式分解(extended dynamic mode decomposition,EDMD)计算Koopman算子的有限维近似,这表示可以用一组特定升维函数的有界矩阵表征 Koopman算子. 但升维函数依赖于人工选择,存在主观性,基于此,文献 [16] 使用机器学习训练升维函数和Koopman算子的有限维截断,在此基础上. 文献 [17] 进一步考虑时变非线性系统,提出了一种迭代式的多步预测 Koopman Autoencoder,并设计了一种自适应Koopman模型预测控制(Koopman MPC,KMPC).
借助于Koopman算子,可以在线性系统框架中辨识和控制强非线性的HMV,并满足其快速动态响应的控制需求,因此,设计面向HMV的KMPC控制器被认为是一种有前景的方法. 本文针对受模型不确定性和外界扰动影响,处于无动力滑翔段的高超声速变体飞行器姿态控制问题,结合干扰观测器与基于 Koopman算子的数据驱动模型预测控制,设计姿态跟踪控制器:
1)利用 Koopman算子理论,根据输入输出数据,采用Autoencoder 离线训练HMV的近似Koopman算子的最佳升维函数,避免了观测函数的人工选取;
2)基于Koopman线性模型,设计复合观测器,用于估计集总扰动,并基于Lyapunov稳定理论证明了观测器的一致渐近有界;
3)在线性标称模型和复合观测器基础上,设计了 KMPC控制器,并证明了其迭代可行性和输入输出稳定性. 仿真验证了控制器的有效性及可行性,相比于直接使用机理模型的非线性MPC,能有效降低计算负担.
2 HMV姿态动力学模型
基于文献 [18] 的折叠翼型高超声速变体飞行器作为一种无动力飞行器,其通常依靠自身较大的升阻比,借助气动升力以实现宽速域、大空域和长航程的高速滑翔飞行. HMV动力学的数学模型包括平动动力学方程和旋转动力学方程,其旋转运动由作用在飞行器上绕质心的气动力矩引起,折叠式变体飞行器姿态运动方程描述如下:
(1)
式中: α,β,σ分别为攻角、倾侧角和侧滑角; ωx,ωy,ωz分别表示滚转、偏航、俯仰角速度; I1 ∼ I9是飞行器惯量参数; Mtx,Mty,Mtz是滚转、偏航、俯仰三通道合力矩,其具体形式和值见参考文献 [18] .
选取u = [δx δy δz] T,即三轴等效舵偏角作为直接控制输入,取θ = [α β σ] T表示姿态角向量,ω = [ωx ωy ωz] T表示姿态角速度向量,则面向控制的连续时间非线性模型可表示为
(2)
(3)
式中: d为外部干扰力矩,d0为集总扰动项,式(2)中的矩阵R,I,ω ×,和式(3)中的向量,的具体形式见参考文献 [18] .
为了适应计算机仿真的需求,以采样时间∆T进行离散化,可得
(4)
式中: f (xk,uk)= xk + ∆T[f1 f2] T + ∆Tguk,x = [θ ω] T,d1 = [0 ∆Td0] T. 根据式(2)–(4),注意到舵偏角(δx,δy,δz)与状态量(α,β,σ)有很强的非线性关系,而且地面风洞实验很难模拟高马赫数飞行环境,导致气动参数存在很大的不确定性 [19] . 而高性能的控制算法对模型的精确性要求极高,因此,对于 HMV这类难以获取精确模型的非线性控制系统,引入数据驱动的建模与控制方法显得尤为重要.
为了设计基于复合观测器的HMV 数据驱动模型预测控制,首先,给出如下假设:
假设 1 姿态角θ,角速度ω,控制量u均可测.
假设 2 外部干扰d1k变化缓慢,且d1k及其导数 是有界的,即.
3 HMV数据驱动建模
对于HMV这类受约束系统,MPC能够通过预测系统状态,以滚动优化的形式得到最优控制指令并满足状态和输入约束,在系统控制中得到了广泛的应用,成为现代控制的主要方法之一 [20] . 但是MPC是一种基于模型的控制算法,模型精度影响控制器的闭环性能,而HMV的精确面向控制模型(4)难以获得,且其强非线性特点使得MPC的计算负担很大,甚至出现无解的情况. 针对以上特点,基于Koopman 算子理论的数据驱动建模与控制方法被引入,将HMV非线性的控制问题映射到线性控制,然后以 Koopman MPC 的方法设计控制策略,在后文中将其简称为KMPC.
3.1 Koopman 算子理论
Koopman算子及其谱性质在动力学系统和控制中有广泛的应用,考虑如下非线性系统:
(5)
其中,表示系统状态演化的向量场. 对于如式(5)描述的非线性系统,存在一组希尔伯特空间内的非线性升维函数(又称观测函数),系统沿该函数线性演化,该计算由一种无限维算子(即 Koopman算子)控制,即
(6)
其中◦表示合成算子. 令yk =xk+1,则截断的Koopman算子可通过求解式(7)的优化问题得到
(7)
其中: 升维函数矩阵Ψ(x)由元素ψ(x)组成,ψ(x)是标量函数,K是有限维近似后的Koopman算子.
对于如式(4)描述的受控系统xk+1 = f(xk,uk),其中 ,定义扩张状态 [x u] T ∈ ,那么,基于扩张状态空间,可以使用EDMD方法逼近扩张Koopman算子的有限维近似. 定义: ,其中: 为升维后线性系统的系统矩阵; 为升维后线性系统的控制矩阵; Nk表示升维状态维数,则升维后的线性系统可以表示为
(8)
式中: 定义新的升维后线性系统的数据快照,即
(9)
(10)
其中: †符号表示伪逆, . 综上,非线性系统可以如式(11)描述,变换到线性系统框架中,
(11)
其中表示重构状态,式(11)描述了基于近似 Koopman算子的线性模型,其可以作为设计非线性系统的线性MPC控制器的标称模型.
3.2 基于学习的近似Koopman算子
尽管如第3.1节所述的扩展动态模式分解引入了一种计算近似Koopman算子的方法,但是升维函数依赖于人工选取,这可能导致主观性和局限性. 文献 [16-17] 针对这一问题,引入Autoencoder神经网络用于识别潜在的最佳升维函数,以实现强非线性系统的内在线性坐标转换.
为了便于处理MPC中的约束问题,将原状态也列入升维函数,即,其中Nk = n + N. 综上,基于Koopman算子理论的自编码器(Koopman auto-encoder,KAE)的损失函数被定义为一个多目标学习问题,其由4部分组成,即
(12)
其中: L∗表示均方误差; L1为状态重构损失; 为 KAE网络的输出,即重构的状态; L2为线性损失,旨在通过减小预测误差来近似Koopman算子的线性动力学; L3为预测损失,以确保学习到的升维函数和近似Koopman算子能够有效预测未来状态xk+1,而需要考虑的附加损失函数; L4表示正则化项.
4 基于复合观测器的数据驱动模型预测控制器方案设计
在获得有限维截断的Koopman算子和标称线性模型后,本文考虑外部扰动带来的不利影响,基于第3节中学习到的标称线性模型式(11),设计了一种新型的复合观测器,结合了基于Koopman升维模型的Luenberger型观测器和同步干扰观测器.
首先,引入如下引理:
引理 1 对于一个正定矩阵,存在向量和一个正标量ℓ,满足
(13)
引理 2 对于一个对称矩阵和一个向量,存在
(14)
其中λmin(·)和λmax(·)分别表示矩阵的最小特征值和最大特征值.
4.1 复合观测器设计
基于式(12)学习得到的标称线性模型,是通过对无限维的Koopman算子进行估计和有限维截断得到的,当数据快照和升维维度趋于无穷时,有限维截断的Koopman算子才能无差地反映非线性系统的映射和演化. 为了减少截断误差带来的不利影响,本文基于Koopman升维模型,针对升维状态Ψ(xk)设计Luenberger型观测器,引入状态观测误差,通过设计观测器增益L使观测误差一致渐近有界,并根据观测状态设计干扰观测器. 基于Koopman升维模型的Luenberger型观测器如下所示:
(15)
式中: 分别为状态观测值和干扰观测值; L为待设计的状态观测器增益; 为基于式(10)和式(12)学习到的标称线性模型系数; , 令xk为测量得到的实际值.
假设 3 近似Koopman算子的截断和估计误差r 有界,即 [21] .
根据式(4)(15),状态估计误差为
(16)
其中,为了精确估计式(15)中状态估计值 的,必须考虑集中扰动的估计值. 为了实现这一目标,设计如下形式的干扰观测器:
(17)
其中: vk为辅助变量; k1,k2为待设计的正定干扰观测器的增益系数,则根据式(4),得到
(18)
为了估计辅助变量,基于文献 [22],辅助变量vk的估计值设计为
(19)
借助式(18)–(19),辅助变量vk的估计误差定义为
(20)
式中. 基于式(17),集中干扰 d1k的估计值为
(21)
在式(17)和式(21)基础上,集中干扰d1k的估计误差为
(22)
下一步本文将提供观测器增益L和相关参数的设计条件,以保证估计误差的有界性.
定理 1 当正定矩阵L和P、正系数k1,k2满足如下条件时,式(16)(22)的估计误差是一致渐近有界的,且辅助变量vk的估计误差是有界的,
(23)
证构建Lyapunov函数如式(24)所示:
(24)
其中: 定义,那么基于式(16)可以得出V1k的一阶差分为
(25)
根据引理1和引理2,可以得出
(26)
基于假设2和式(20),同理可以得出V2k的一阶差分
(27)
其中.
综合考虑式(26)–(27),可以得到Vk的一阶差分表达式为
(28)
其中ε =. 通过式(28)可知,要使∆Vk负定,只要满足如下不等式组:
(29)
其中ζ为一个正的微小常数. 利用舒尔补引理,P − 等价于如下矩阵不等式:
(30)
证毕.
由式(15)(19)和式(21)构成的复合观测器,利用真实状态xk的负反馈来减小近似Koopman算子估计和截断误差带来的不利影响. 随后,基于状态观测器设计干扰观测器,用于集中扰动的估计. 通过式(24)–(30)的推导,证明了在满足式(29)条件下,复合观测器的估计误差是一致渐近有界的,且辅助变量vk的估计误差是有界的.
4.2 KMPC控制器设计
HMV作为一种无动力飞行器,其状态和控制输入是受限的,其姿态角约束和等效舵偏角约束分别为
本节提出一种基于复合观测器的数据驱动模型预测控制方案,旨在解决在外部干扰和系统约束影响下,难以获得精确控制模型的HMV姿态跟踪问题. 利用 Koopman算子和EDMD理论,构建了HMV的数据驱动标称线性模型,进一步地,采用复合观测器减轻有限维近似的截断误差和外部干扰的负面影响,整体控制框架示意图如图1所示,算法流程图见表1.
图1姿态控制系统设计框图
Fig.1The design block diagram of attitude control system
表1算法步骤图
Table1Schematic diagram
令表示标称模型的状态、控制输入和输出,MPC 被设计为轨迹跟踪器,则取增广状态向量 z =,X 表示状态约束集合,则原系统可表示为: zk+1 = 应用近似Koopman算子的升维线性模型作为标称模型,则标称模型可同样增广为
(31)
其中: 表示控制增量,即 表示建模误差定义如下:
(32)
(33)
MPC的优化问题可以重新表述如下:

(34)
其中: 是基于当前状态 xk 的最优控制序列; 表示代价函数; 是终端成本函数; xr是参考状态; L式(15)描述的反馈校正矩阵. U是控制约束; 表示控制增量约束,是状态约束,表示集合减法,是终端约束,Xf :=
终端代价矩阵,PK由如下Lyapunov等式定义:
(35)
其中: ,满足 是舒尔稳定的,K ∈ .
(36)
其中E0 = . 取最优控制序列的第 1 组控制量,那么最终应用到被控系统的控制律为
(37)
4.3 迭代可行性和输入输出稳定性
要证明HMV系统的输入输出稳定性(input-output stability,IOS),首先,引入如下引理和假设:
引理 3 令,若成立,其中 a ∈ Zj+1,则b ∈ Zj .
假设 4 存在控制律 和Lyapunov函数使得
1)对所有,其中
2)在上是Lipschitz连续的,即对任意的,成立. 其中,,使得.
假设 5 对所有,存在Xf ,满足,其中.
基于以上引理和假设,可证明如下定理:
定理 2 (闭环系统一致有界性)对于具有状态和控制约束的HMV系统,记D为MPC优化问题(34)的可行状态集,若假设4和假设5满足,则
1)若果系统建模误差满足,则闭环系统在D上是稳定的;
2)对所有,该闭环系统跟踪误差是一致有界的.
证 1)首先,证明D是一个鲁棒不变集.
对∀zk−1 ∈ D,有zi+1|k = 成立. 可以通过证明对所有zk−1 ∈ D,基于k − 1 时刻的最优解,优化问题在 k 时刻存在一个可行解
(38)
a) : 由的可行性及控制律,对任意的均成立;
b): 因为. 根据假设4,有
(39)
由假设 5可知,,应用控制律 ;
c): 由和k时刻控制序列,以递推得到第j = 1,· · ·,Np − 2个预测时域有根据引理3可知
因为 所以预测状态在 j = Np − 1时刻是可行的. 因此,D 是一个鲁棒正不变集,即闭环系统在D上是稳定的.
2)定义k时刻和k − 1时刻代价函数的差为∆Jk = J¯∗ k − J¯∗ k−1 ,则
(40)
其中: 为k − 1时刻对应的最优状态序列: 的代价函数. 为k 时刻控制序列得到的预测状态序列: 对应的次最优代价函数. . 从的定义可知,,其中i = 1,· · ·,Np − 1,则有 其中Lc为阶段代价l(z,∆u)的Lipschitz常数. 类似地,有,代入式(40),由假设4可知
(41)
由于是有界的,则是一个IOS-Lyapunov 函数,由输入输出稳定的定义,可知 是一致有界的 [27] .
5 仿真分析
本文的仿真分析基于文献 [18] 提出的高超声速变形飞行器,为确保满足持续激励条件,每条轨迹的姿态角初值、姿态角速度初值和控制输入满足均匀分布. 仿真算例中,设置离线数据集的工况与控制仿真的实际工况不同,其中,离线数据集的初始高度和速度分别为60 km和6 488 m/s,控制仿真初始工况为70 km和 6 535 m/s(22马赫).
用于离线训练近似Koopman算子升维函数的KAE 神经网络超参数设置为: 升维维度Nk = 16,即N = 10,n = 6,损失函数权值α1 = 1,α2 =α3 = 50,α4 = 10−6,encoder与decoder网络的中间层数是3,激活函数是DAf =EAf = {Linear,ReLU,ReLU,ReLU,Linear},encoder 每层的神经元数量EL = {6,100,100,100,10},decoder 每层的神经元数量DL = {10,100,100,100,6}.
为了检验复合观测器的干扰估计性能,设置外部扰动与气动力矩系数偏差为
(42)
复合观测器参数取= 0.6,k1 = 2, k2 = 1.6. 干扰观测器估计效果见图2.
图2干扰及其估计曲线
Fig.2The diagram of disturbance and its estimation
复合观测器能够有效估计干扰并快速收敛,但其性能受限于训练数据的有限性和近似Koopman算子的截断误差,这使得观测值与实际干扰曲线之间存在偏差,这一现象与本文第4.1节的理论分析是一致的.
选取NMPC [28],反馈线性化模型预测控制(feedback linearization MPC,Fb-MPC)[29]和基于径向基函数(radial basis function,RBF)的Koopman MPC [30] 作为对比方法. 其中,基于第2节中的式(2),Fb-MPC 的控制律取
(43)
式中,vk为使用反馈线性化后得到的线性标称模型通过MPC计算的最优虚拟控制律,控制器参数均设计为 Np = Nc = 10,Q = I6×6, R = 0.001I3×3, P 为经式(35)计算得到,观测器使用固定时间干扰观测器 [18] . RBF-KMPC 的径向基函数取薄板样条插值函数(thin-plate spline),RBF-KMPC 和本文方法的干扰观测器采用第4.1节的复合观测器,参考文献 [25],式中的E0取[10−5 10−5 10−5 ] T.
仿真实验分析了4种不同控制方法的效果,具体结果见图3–5及表2–3,其中“对比1”曲线为不使用扰动观测器的 KMPC 效果图,表2以稳态误差(单位(10−3) ◦)评估跟踪性能.
图3姿态角跟踪曲线
Fig.3The tracking curves of attitude angle
图3和表2表明使用扰动观测器可以显著提升稳态性能,减少侧滑角和倾侧角的稳态误差,图5表明使用观测器还减小了副翼偏转角,平滑控制律.
表3MPC求解时间对比了本文方法和直接使用非线性模型的NMPC优化时间,MPC代码均基于MATLAB和Yalmip [31],其中本文方法求解器使用quadprog,NMPC求解器使用fmincon,由表3知,使用Koopman升维模型的本文方法MPC 控制律求解总时间为12.46 s,远低于NMPC的1060.88 s.
图4姿态角跟踪误差曲线
Fig.4Attitude angle tracking error curves
图5等效舵偏角曲线
Fig.5The curves of equivalent rudder angle
表2跟踪性能对比
Table2The comparison of tracking performance
表3MPC求解总时间
Table3Total time-consuming of MPC solution
由图3–5知,4种方法在稳态性能上均表现出色,控制精度高. Fb-MPC在稳态状态下能实现最高的侧滑角和倾侧角跟踪精度,但在姿态角变化时控制律出现剧烈抖振,而且,在模型存在偏差的情况下,传统的依赖精确模型的Fb-MPC和NMPC在跟踪期望轨迹时表现不佳,特别是在跟踪倾侧角和侧滑角的过渡过程中瞬态性能较差,缺乏鲁棒性. 相比之下,RBF-KMPC 和本文提出的方法不仅展现出良好的瞬态和稳态性能,还具备较强的鲁棒性. 本文所提出的基于复合观测器的数据驱动模型预测控制算法,具有良好的瞬态性能,收敛速度更快,超调量更小,稳态精度也更高. 此外,控制输入方面,RBF-KMPC 在t=10 s 时的舵偏角存在短暂的抖振,而本文方法的舵偏角曲线更为平滑. 综合而言,本文方法在外部扰动和模型不确定性的影响下,仍能表现出较高品质的轨迹跟踪性能.
6 结论
本文针对难以获得精确机理模型的高超声速变体飞行器,提出了一种基于数据驱动和复合观测器的模型预测控制方法. 本文采用Autoencoder神经网络和 EDMD理论,训练得到了有限维截断的Koopman算子和标称线性模型. 通过构建基于Koopman升维模型的状态观测器,引入状态量的观测误差以减小有限维截断的不利影响,并设计了基于该状态观测器的MPC轨迹跟踪器. 此外,为了抑制外部干扰对系统的不利影响,设计了一种同步干扰观测器,仿真结果表明,本文所提出的控制方法在面对模型不确定性和外部干扰时,能够实现姿态跟踪任务目标,充分说明了本文所提出方法的有效性和鲁棒性.