欢迎访问《控制理论与应用》期刊网站！

准最优稳定的约束非线性系统优先级多目标模型预测控制

doi: 10.7641/CTA.2024.21041

田宇，何德峰，穆建彬

浙江工业大学信息工程学院, 浙江杭州 310000

基金项目: 国家自然科学基金项目(62173303), 中央引导地方科技发展资金项目(2023ZY1045)资助.

详细信息

作者简介

田宇博士研究生,目前研究方向为模型预测控制,E-mail: 1112003016@zjut.edu.cn;

何德峰教授,目前研究方向为学习预测与最优控制、智能网联系统与综合能源系统运行优化,E-mail: hdfzj@zjut.edu.cn;

穆建彬讲师,目前研究方向为分布式系统控制与优化、预测控制,E-mail: jianbinmu@zjut.edu.cn.

通信作者

何德峰，E-mail: hdfzj@zjut.edu.cn.

Prioritized multi-objective model predictive control of constrained nonlinear systems with quasi-optimal stability

TIAN Yu ， HE De-feng ， MU Jian-bin

College of Information Engineering, Zhejiang University of Technology, Zhejiang Hangzhou 310000 , China

Funds: Suppoted by the National Natural Science Foundation of China (62173303) and the Central Guidance Local Science and Technology Development Fund Projects (2023ZY1045).

摘要

针对具有控制约束的非线性系统, 提出一种准最优稳定的优先级多目标模型预测控制策略. 采用多目标字典序方法, 根据决策者偏好排序多目标函数, 将冲突多目标控制问题转化为具有优先级顺序的单目标序列优化控制问题. 再引入准稳态最优性准则, 得到各个优化控制问题目标函数的终端性质, 进而建立优先级多目标滚动时域优化控制问题的递推可行性和闭环性能的近似最优性. 数值仿真结果验证了本文策略的优越性.

关键词

模型预测控制 / 非线性系统 / 多目标控制 / 稳定性 / 经济优化

Abstract

This paper proposes a prioritized multi-objective model predictive control (MO-MPC) strategy with quasioptimal stability for nonlinear systems subject to control constraints. Using the multi-objective lexicographical method, the multiple objective functions are sorted based on decision-maker’s preferences. Then the conflict multi-objective optimization control problem is transformed into a sequence of single objective optimization control problems with the priority order. By introducing the quasi steady-state optimality criterion, the terminal properties of the objective function for each optimization control problem are obtained. Moreover, the recursive feasibility and approximate optimality of closed-loop performance for the prioritized multi-objective receding horizon optimal control problem are established. Numerical simulation results verify the effectiveness of the proposed strategy.

Keywords

model predictive control / nonlinear systems / multi-objective control / stability / economic optimization

1 引言 2 问题描述与预备知识 3 优先级多目标预测控制 4 实例仿真 4.1 仿真实验1 4.2 仿真实验2 4.3 仿真实验3 5 结论

1 引言

工业控制问题通常涉及多个重要性不同且相互冲突的控制目标，如设定点跟踪 ^[1-2]、经济效益 ^[3-4]、污染物减排 ^[5-6] 等冲突目标. 由于多个目标之间缺乏统一的度量标准，常见的加权多目标控制方法难以有效解决目标间不可公度问题 ^[7-9]，进而不能显式地处理系统多目标优先级控制要求. 近年来，基于目标优先级和滚动时域控制原理的字典序多目标模型预测控制（multi-objective model predictive control，MO-MPC）方法成为冲突多目标优先级控制问题的最有效解决方案之一 ^[10-13]，但由于字典序MO-MPC采用分层优化策略，在应用中存在优化求解计算量大等问题，特别是对非线性系统，其计算量问题尤为突出.

传统字典序MO-MPC首先解决最高优先级的优化问题，然后在下一层优化问题中施加关于上层值函数的优先级约束，保证更高优先级目标的最优性. 同时，结合平衡点处的终端三要素建立字典序MO-MPC的递推可行性和闭环稳定性. 例如，文献 ^[14] 提出了一种次优字典序MO-MPC策略，在降低计算量的同时实现闭环系统的稳定性，文献 ^[15] 进一步将该策略推广到一般的经济目标函数优化，并在文献 ^[16] 中实现了变目标优先级的字典序MO-MPC策略设计. 上述方法采用优先级最高目标函数的值函数构建Lyapunov函数，保证闭环系统的渐近稳定性，但随着字典序MOMPC优化问题层数的增加，其在线优化的计算量也将大幅增加. 同时为保证优化问题递推可行性添加的终端约束进一步限制了系统的控制性能.

为了降低计算复杂度和提高闭环系统性能，相关学者采用隐藏模型预测控制（model predictive control，MPC）的终端约束，提出了无终端约束MPC方法，确保闭环系统达到近似最优，避免了终端约束对原始性能的影响，同时降低了优化问题的计算量. 例如，文献 ^[17]采用强对偶假设下的近似最优性质消除了MPC优化问题的终端约束，提高了控制器的计算效率; 文献 ^[18] 基于耗散性和可控性条件，去除了终端约束并证明闭环系统的近似最优; 文献 ^[19] 在N步可达性假设下，通过在目标函数中增加状态增量的罚项，推导出使闭环系统满足近似最优的参数调节MPC策略，使得系统在有限时域内渐近稳定到包含最优稳态的邻域内. 相比于附加终端约束MPC策略 ^[20-22]，上述无终端约束MPC策略通过施加一定条件使得系统渐近稳定到一个包含最优稳态的邻域. 据笔者所知，目前还未见到约束非线性系统的无终端约束字典序MO-MPC 策略的结果.

考虑约束非线性系统多目标优先级控制问题，本文提出一种准最优稳定的非线性字典序MO-MPC策略. 将目标函数按照优先级顺序排列，使多目标问题表述为字典序优化问题. 在不显式处理系统稳态的前提下，通过在目标函数中引入对状态增量的罚项以实现闭环系统的近似最优，并推导了优化问题递推可行性和闭环系统近似最优的充分条件. 相比于传统字典序MO-MPC方法，本文策略避免在最高层构建关于稳态的Lyapunov函数，并去除了字典序 MO-MPC的终端约束，降低预测控制器在线优化的计算量，同时扩大了闭环系统初始可行域范围. 最后仿真对比实验结果验证了本文策略的优越性.

2 问题描述与预备知识

考虑离散时间非线性系统

x_{k + 1} = f (x_{k}, u_{k}), k \in I_{⩾ 0},

(1)

其中:

x_{k} \in R^{n} 和 u_{k} \in R^{m}

为采样时刻k的状态和控制输入，函数 f 关于 x 和u 满足 Lipschitz连续，且f（0，0）= 0. 进一步考虑控制约束集

U \in R^{m}

为紧集. 定义系统（1）的状态增量函数为

Δ (x, u) = ‖ f (x, u) - x ‖,

则该系统的平衡点集为

Z = \{(x, u) \in R^{n} \times U ∣ Δ (x, u) = 0\} .

(2)

考虑系统（1）的

l \in I_{⩾ 2}

个相互冲突且优先级各异的性能函数

L_{j} : R^{n} \times R^{m} \to R ， j \in I_{1 : l} .

不失一般性，约定下标越小则优先级越高，即L₁优先级最高，L_l 优先级最低. 为书写方便，令z =（x，u）. 定义关于性能函数L₁（z）的最优平衡点集Z_s ⊆ Z如下:

Z_{s} = \{z_{s} \in Z ∣ L_{1} (z) ⩽ L_{1} (z_{s}), \forall z \in Z\},

(3)

则最优稳态集

X_{s} \subseteq R^{n}

为Z_s在状态空间的投影.

定义 1 ^[19] 考虑系统（1）及其平衡点z_s和性能函数L₁（z）及充分小常数ε >0. 当k → ∞时，该系统满足不等式

Δ (z_{k}) ⩽ ε,

(4a)

|L_{1} (z_{k}) - L_{1} (z_{s})| ⩽ ε,

(4b)

则系统（1）在平衡点z_s是ε准最优稳定的. 进一步，满足不等式（4）的状态–控制对z_k集合称为ε域. 若在ε域内存在L₁（z_s）= 0，且在ε域外L₁（z_k）非零，则当k → ∞ 且ε足够小时，有L₁（z_k）→ L₁（z_s）和z_k → z_s .

假设 1 存在 κ 类函数ψ（·）和δ_s（·），当ε 足够小时，对满足d（z，Z_s）≤ δ_s（ε）的所有z，下述不等式

L_{1} (z_{s}) ⩽ L_{1} (z) + ψ (Δ (z))

(5)

成立. 通常δ_s（ε）取值为1.

引理 1 ^[19] 考虑系统（1），性能函数L₁（z）和充分小常数 ε ≥ 0. 令L_ψ表示函数ψ（∆（z））关于 z 的Lipschitz常数，则存在参数α >L_ψ使不等式

L_{1} (z) + α Δ (z) ⩽ ε \Rightarrow \{\begin{matrix} Δ (z) ⩽ κ_{1} ε \\ L_{1} (z) ⩽ [- κ_{2} ε ε] \end{matrix}

(6)

成立，其中:

κ_{1} = 1 / (α - L_{ψ}) ， κ_{2} = α / (α - L_{ψ}) .

本文目标是寻找系统（1）的多目标状态反馈控制律，在极小化l个性能函数的同时满足系统控制量约束，并使闭环系统达到近似最优. 为此，本文将采用字典序多目标优化方法设计多目标模型预测控制策略.

下面回顾字典序多目标优化基本概念，具体细节可参考文献 ^[15，23] . 考虑l个性能函数

φ_{j} ， j \in I_{1 : l} ，

定义相应多目标优化问题

\underset{θ \in Θ}{m i n} \{φ_{1} (θ), φ_{2} (θ), \dots, φ_{l} (θ)\},

(7)

其中:

Θ \subseteq R^{P}

为决策变量θ的可行集; φ_j是关于标量 θ值函数，∀j ∈ I_1:_l，φ₁优先级最高，φ_l优先级最低.

定义 2 ^[15] 考虑多目标问题（7）的可行解 θ^∗ ∈ Θ，当且仅当不存在其他可行解θ ∈ Θ和标量i^∗∈I_2:_l，使得对所有

i \in I_{1 : i^{*} - 1}

满足

φ_{i^{*}} （ θ ） < φ_{i^{*}} (θ^{*})

和φ_i（θ）=

φ_{i} (θ^{*})

，则θ^∗为该优化问题一个字典序最优解.

求解字典序最优解的标准方法是将多目标问题（7）转换为按优先级排列的单目标优化问题，即

φ_{1}^{*} = \underset{θ \in Θ}{m i n} φ_{1} (θ),

(8a)

φ_{i}^{*} = \underset{θ \in Θ}{m i n} \{φ_{i} (θ) ∣ φ_{j} (θ) = φ_{j}^{*}, \forall j \in I_{1 : i - 1}\}, i \in I_{2 : l},

(8b)

则多目标问题（7）的字典序最优解为

θ^{*} = a r g \underset{θ \in Θ}{m i n} \{φ_{l} (θ) ∣ φ_{j} (θ) = φ_{j}^{*}, \forall j \in I_{1 : l - 1}\} .

(9)

为改进字典序优化的计算效率，通常将优先级等式约束

φ_{j} （ θ ） = φ_{j}^{*}

松弛为

φ_{j} (θ) ⩽ φ_{j}^{*} + σ, \forall j \in I_{1 : l - 1},

(10)

其中容差σ ≥ 0为充分小数. 为简单起见，将不等式约束（10）记为

φ_{j} （ θ ） ⩽ φ_{j}^{*} .

注 1 假设每个

φ_{j} ， j \in I_{1 : l} 在 Θ

内达到最小值，则问题（7）的最优化是在支配性概念 ^[15] 上定义. 由定义2可知，字典序最优解θ^∗本质上是一个考虑各性能函数优先级的Pareto最优解，当且仅当性能函数φ_i极小化的同时，至少有一个其他更高优先级的目标函数{φ₁，φ₂，· · ·，φ_i₋₁}非极小化，从而字典序最优解总是存在的，且对应的最优值函数是唯一.

3 优先级多目标预测控制

令

N \in I_{⩾ 1}

为预测时域，定义k时刻的控制序列

u_{k} = \{u_{0 ∣ k} ， u_{1 ∣ k} ， \dots ， u_{N ∣ k}\}

和相应预测状态量序列

x_{k} = \{x_{0 ∣ k} ， x_{1 ∣ k} ， \dots ， x_{N ∣ k}\} ，

其中: 控制量

u_{t ∣ k}

表示在 k时刻对第k + t步的预测控制量，状态

x_{t ∣ k}

表示在k时刻对第k + t步的预测状态量. 令

\begin{matrix} ψ_{1} (x, u) = L_{1} (x, u) + α Δ (x, u), \\ V_{1} (x_{k}, u_{k}) = \sum_{t = 0}^{N - 1} ψ_{1} (x_{t ∣ k}, u_{t ∣ k}), \\ E_{1} (x_{k}, u_{k}) = γ ψ_{1} (x_{N ∣ k}, u_{N ∣ k}), \\ u_{N - 1 ∣ k} = u_{N ∣ k}, \end{matrix}

参数α >0，γ >0. 定义系统（1）中l个性能函数对应的有限时域目标函数

J_{1} (x_{k}, u_{k}) = \sum_{t = 0}^{N - 1} ψ_{1} (x_{t ∣ k}, u_{t ∣ k}) + γ ψ_{1} (x_{N ∣ k}, u_{N ∣ k}),

(11a)

J_{j} (x_{k}, u_{k}) = \sum_{t = 0}^{N - 1} L_{j} (x_{t ∣ k}, u_{t ∣ k}), j \in I_{⩾ 2},

(11b)

进一步定义系统（1）的控制可行域C（x_k）为

C (x_{k}) = \{u_{k} \in U^{N + 1} |\begin{matrix} x_{t + 1 ∣ k} = f (x_{t ∣ k}, u_{t ∣ k}), \\ x_{0 ∣ k} = x_{k}, \\ u_{t ∣ k} \in U, \forall t \in I_{0 : N}, \\ ψ_{1} (x_{N ∣ k}, u_{N ∣ k}) ⩽ ε \end{matrix}\},

(12)

其中x_0|_k = x_k为初始条件.

在当前时刻k求解如下字典序多目标优化问题:

J_{1}^{*} (k) = \underset{u_{k}}{m i n} \{J_{1} (x_{k}, u_{k}) ∣ u_{k} \in C (x_{k})\},

(13a)

J_{j}^{*} (k) = \underset{u_{k}}{m i n} \{J_{j} (x_{k}, u_{k}) |\begin{matrix} J_{i} (x_{k}, u_{k}) ⩽ J_{i}^{*} (k), \\ u_{k} \in C (x_{k}), \forall i \in I_{1 : j - 1} \end{matrix}\},

(13b)

其中:

j \in I_{2 : l}; J_{i}^{*}

为第i个目标函数最优值函数，对应的最优控制序列为

u_{k}^{（ j ） *} .

求解优化问题（13）得字典序最优控制序列

\begin{matrix} u_{k}^{(l) *} = \\ a r g \underset{u_{k}}{m i n} \{J_{l} (x_{k}, u_{k}) |\begin{matrix} J_{j} (x_{k}, u_{k}) ⩽ J_{j}^{*} (k), \\ u_{k} \in C (x_{k}), \forall j \in I_{1 : l - 1} \end{matrix}\}, \end{matrix}

(14)

即

u_{k}^{(l) *} = \{u_{0 ∣ k}^{(l) *}, u_{1 ∣ k}^{(l) *} \dots, u_{N - 1 ∣ k}^{(l) *}, u_{N ∣ k}^{(l) *}\} .

(15)

根据 MPC 滚动时域控制原理，定义优先级MOMPC控制律为

u_{k} = u_{k}^{m p c} = u_{0 ∣ k}^{(l) *}, \forall k \in I_{⩾ 0},

(16)

其中

u_{0 ∣ k}^{（ l ） *}

是最优解序列（15）的第1个分量，则对应的闭环系统为

x_{k + 1} = f (x_{k}, u_{k}^{m p c}), \forall k \in I_{⩾ 0} .

(17)

算法（准最优稳定MO-MPC算法）:

步骤 1 设置预测时域N ≥ 1和l ≥ 2个性能指标，参数α >0和γ >0; 令k = 0.

步骤 2 测量k时刻的状态量x_k，并使用以下子过程在线求解字典序有限时域最优控制问题（13）:

1）求解优化问题（13）第1层子问题（13a），得到最优序列

u_{k}^{（ 1 ） *};

2）求解优化问题（13）的第

j \in I_{2 : l}

层的优化子问题（13b），得到最优序列

u_{k}^{（ j ） *};

3）计算多目标优化问题（13）的字典序最优序列

u_{k}^{*} = u_{k}^{（ l ） *} .

步骤 3 将字典序多目标最优控制序列

u_{k}^{*}

k的第 1个分量作用于系统（1）.

步骤 4 令k = k + 1，并返回到步骤2.

假设 2 ^[19] 考虑初始状态集

X_{0} \subset R^{n} ，

对于任意

x_{k} \in X_{0} ，

系统（1）存在 N + 1步可达控制序列

u_{k}^{#} \in U^{N + 1} 满足 (x_{N ∣ k}^{#} ， u_{N ∣ k}^{#}) \in Z_{s} .

假设 2给出字典序优化问题（13）的一个可行解，使初始状态x_k ∈ X₀能够N + 1步进入到最优稳态集X_s. 存在特殊情况，当k → ∞且ε足够小时，

ψ_{1} (x_{N ∣ k}^{#}, u_{N ∣ k}^{#}) \to 0 .

引理 2（终端性质）^[19] 考虑初始状态集X₀和参数α >L_ψ，对于任意初始状态x_k ∈ X₀，存在两个正实数κ₃和κ₄，目标函数（11a）满足以下终端不等式:

\{\begin{matrix} Δ (x_{N ∣ k}, u_{N ∣ k}^{(1) *}) ⩽ γ^{- 1} κ_{3}, \\ L_{1} (x_{N ∣ k}, u_{N ∣ k}^{(1) *}) ⩽ γ^{- 1} κ_{4}, \end{matrix}

(18)

其中:

κ_{0} ⩽ 2 \underset{（ x ， u ） \in X_{0} \times U}{m a x} V (x_{k} ， u_{k}) ， κ_{3} = κ_{0} κ_{1} ， κ_{4} = κ_{0} m a x \{1 ， κ_{2}\} \cdot u_{k}^{（ 1 ） *}

表示第1层字典序优化问题的最优解.

引理 3 考虑系统（1）和参数α，γ >0，则对于任意x_k∈ X₀，字典序优化问题各层最优解（13b）满足如下终端性质:

\{\begin{matrix} Δ (x_{N ∣ k}, u_{N ∣ k}^{(j) *}) ⩽ γ^{- 1} κ_{3} [m a x \{1, κ_{2}\} + α κ_{1} - 1], \\ L_{1} (x_{N ∣ k}, u_{N ∣ k}^{(j) *}) ⩽ γ^{- 1} κ_{4} [m a x \{1, κ_{2}\} + α κ_{1} - 1], \end{matrix}

(19)

其中:

j \in I_{2 : l} . u_{k}^{（ j ） *}

表示

j \in I_{2 : l}

层字典序优化问题的最优解，

κ_{0} ⩽ 2 \underset{（ x ， u ） \in X_{0} \times U}{m a x} V_{1} (x_{k} ， u_{k}) ， κ_{3} = κ_{0} κ_{1} ， κ_{4} = κ_{0} m a x \{1 ， κ_{2}\} .

证已知字典序优化问题（13b）中包含字典序约束

J_{1} (x_{k} ， u_{k}^{（ j ） *}) ⩽ J_{1}^{（ 1 ） *} （ k ） ， \forall j \in I_{2 : l} ，

则可得

\begin{matrix} J_{1} (x_{k}, u_{k}^{(j) *}) - J_{1}^{(1) *} (k) = \\ \sum_{t = 0}^{N - 1} ψ_{1} (x_{t ∣ k}, u_{t ∣ k}^{(j) *}) + γ ψ_{1} (x_{N ∣ k}, u_{N ∣ k}^{(j) *}) - \\ (\sum_{t = 0}^{N - 1} ψ_{1} (x_{t ∣ k}, u_{t ∣ k}^{(1) *}) + γ ψ_{1} (x_{N ∣ k}, u_{N ∣ k}^{(1) *})) ⩽ 0, \end{matrix}

(20)

推得

ψ_{1} (x_{N ∣ k}, u_{N ∣ k}^{(j) *}) ⩽ ψ_{1} (x_{N ∣ k}, u_{N ∣ k}^{(1) *}) - \frac{κ_{0}}{γ},

(21)

其中

\begin{matrix} \bar{V} (x_{k}, u_{k}) = m a x \{V_{1} (x_{k}, u_{k}^{(j) *}), V_{1} (x_{k}, u_{k}^{(1) *})\}, \\ κ_{0} ⩽ 2 \bar{V} (x_{k}, u_{k}) . \end{matrix}

由引理1得到

ψ_{1} (x_{N ∣ k}, u_{N ∣ k}^{(1) *}) ⩽ γ^{- 1} κ_{0} [m a x \{1, κ_{2}\} + α κ_{1}],

(22)

将（22）代入（21）得到

ψ_{1} (x_{N ∣ k}, u_{N ∣ k}^{(j) *}) ⩽ γ^{- 1} κ_{0} [m a x \{1, κ_{2}\} + α κ_{1} - 1] .

(23)

根据引理1可得

\{\begin{matrix} Δ (x_{N ∣ k}, u_{N ∣ k}^{(j) *}) ⩽ γ^{- 1} κ_{3} [m a x \{1, κ_{2}\} + α κ_{1} - 1] \\ |L_{1} (x_{N ∣ k}, u_{N ∣ k}^{(j) *})| ⩽ γ^{- 1} κ_{4} [m a x \{1, κ_{2}\} + α κ_{1} - 1] \end{matrix}

(24)

其中:

j \in I_{2 : l} \cdot κ_{3} = κ_{0} κ_{1} 和 κ_{4} = κ_{0} m a x \{1 ， κ_{2}\} .

证毕.

定义 3 ^[14] 给定多目标优先级p，在当前时刻k，如果由第j层子问题的可行性可以推得第j + 1层子问题也是可行的，则字典序优化问题（13）具有层级递推可行性.

定义 4 ^[14] 如果由字典序优化问题（13）在当前时刻k的可行性可以推得其在k + 1时刻也是可行的，则字典序优化问题（13）具有时域递推可行性.

注 2 层级递推可行性描述的是同一时刻层级子问题之间的可行性，时域递推可行性描述的是整个优化问题在相邻时刻的可行解的存在性. 两者共同构成字典序MO-MPC的递推可行性.

定理 1 考虑假设2和字典序优化问题（13），如果第1层优化问题（13a）在k时刻优化可行，则字典序优化问题（13）在k + 1时刻也可行.

证 1）根据假设2，设候选控制序列

u_{k}^{*} = \{u_{0 ∣ k}^{*}, \dots, u_{N - 1 ∣ k}^{*}, u_{N ∣ k}^{*}\}

(25)

为第1层优化问题（13a）在k时刻的可行解，则满足约束（12）和（18）. 再考虑第

j \in I_{2 : l}

个目标函数及其优化问题（13b）将

u_{k}^{*}

代入上述优化问题，则满足约束（12）和（19），字典序约束

J_{i} (x_{k} ， u_{k}^{（ j ）}) ⩽ J_{i}^{（ j ） *} （ k ） ， \forall i \in I_{1 : l - 1} ， j \in I_{2 : l}

成立，从而优化问题（13）在k时刻存在可行解. 考虑到j的任意性，可得第1层优化问题（13a）可行，意味着后续各层优化问题都是可行的.

2）考虑第1层优化问题（13a）及其k时刻一个可行解

u_{k}^{*} ，

u_{k + 1}^{*} : = \{u_{1 ∣ k}^{*}, \dots, u_{N - 1 ∣ k}^{*}, u_{N ∣ k}^{*}, u_{N ∣ k}^{*}\},

(26)

考虑假设 2成立，控制序列（26）是优化问题（13a）在 k + 1时刻的一个可行解. 故通过归纳得到字典序最优控制问题（13）在k + 1时刻可行. 证毕.

定理 2 考虑系统（1）和假设1–2及其参数 α 和 γ >0，如果优化问题（13）初始可行，则闭环系统（17）在初始可行集X₀内满足ε准最优稳定.

证第1层字典序优化问题（13a）初始可行，从定理1可知，在

k \in I_{⩾ 0}

时刻，字典序优化问题（13）都可行. 令

u_{k}^{*}

为k时刻问题（13）的最优解，

u_{k}^{（ 1 ） *}

为k时刻第 1层子问题（13a）的最优解. 通常

u_{k}^{*} \neq u_{k}^{（ 1 ） *} ，

满足

J_{1} (x_{k} ， u_{k}^{*}) ⩽ J_{1}^{（ 1 ） *} （ k ） . 令 u_{k + 1}^{*}

为k + 1时刻问题（13）的最优解，

u_{k + 1}^{（ 1 ） *}

为k + 1时刻第1层子问题（13a）最优解，将k时刻和k + 1时刻最优控制

u_{k}^{*} 和 u_{k + 1}^{*}

分别代入式（11a），并沿闭环轨迹（17）做差分运算，得

\begin{matrix} J_{1}^{*} (k + 1) - J_{1}^{*} (k) ⩽ \\ - (L_{1} (x_{0 ∣ k}, u_{0 ∣ k}^{*}) + α Δ (x_{0 ∣ k}, u_{0 ∣ k}^{*})) + \\ ψ (x_{N ∣ k}, u_{N ∣ k}^{#}) + γ (ψ (x_{k + 1}, u_{k + 1}^{*}) - \\ ψ (x_{N ∣ k}, u_{N ∣ k}^{*})), \end{matrix}

(27)

进一步整理得

\begin{matrix} ψ (x_{k + 1}, u_{k + 1}^{*}) - ψ (x_{N ∣ k}, u_{N ∣ k}^{*}) ⩽ \\ (L_{1} + α L_{Δ}) Δ (x_{N ∣ k}, u_{N ∣ k}^{*}), \end{matrix}

(28)

结合假设2，整理式（27）有

\begin{matrix} J_{1}^{*} (k + 1) - J_{1}^{*} (k) ⩽ \\ - (L_{1} (x_{0 ∣ k}, u_{0 ∣ k}^{*}) + α Δ (x_{0 ∣ k}, u_{0 ∣ k}^{*})) + \\ γ (L_{1} + α L_{Δ}) Δ (x_{N ∣ k}, u_{N ∣ k}^{*}) ⩽ \\ - (L_{1} (x_{0 ∣ k}, u_{0 ∣ k}^{*}) + α Δ (x_{0 ∣ k}, u_{0 ∣ k}^{*})) + ρ (α, γ), \end{matrix}

(29)

其中: L_l和L_∆分别是L₁和∆的Lipschitz常数，

ρ (α, γ) : = γ (L_{1} + α L_{Δ}) Δ (x_{0 ∣ k}, u_{0 ∣ k}^{*}) .

定义系统（1）的集合

\begin{matrix} S = \{x_{k} \in R^{n} ∣ L_{1} (x_{k}, u_{k}) + \\ α Δ (x_{k}, u_{k}) ⩽ 2 ρ (α, γ)\}, \end{matrix}

(30)

则当状态x停留在集合S外，可得

J_{1}^{*} (x_{k + 1}) - J_{1}^{*} (x_{k}) ⩽ - ρ (α, γ),

(31)

显然，最高优先级目标函数最优值J₁单调递减. 当x_k在S内，系统以2ρ（α，γ）为边界进行约束. 结合定义 1 和假设 1可知，邻域δ_s（2ρ（α，γ））≤ 1，使系统满足ε准最优稳定.

在上限时刻

\bar{k}

存在V₁（x_k，u_k）= K_s（1）. 当k ≥

\bar{k}

时，得到下述不等式:

Δ_{1} = (x_{0 ∣ k}, u_{0 ∣ k}^{*}) ⩽ 2 κ_{1} ρ (α, γ),

(32)

|L_{1} (x_{0 ∣ k}, u_{0 ∣ k}^{*})| ⩽ 2 m a x \{1, κ_{2}\} ρ (α, γ),

(33)

随着时间 k 趋于充分大，闭环系统的状态轨迹将渐近稳定于最优稳态集

X_{s} \subset X_{0}

. 证毕.

4 实例仿真

考虑具有平行反应的非线性连续搅拌釜反应器，在反应器中给定物料R₁进行二级反应，一个反应 R₁ → P₁，另一个反应R₁ → P₂. 其动态方程可描述为 ^[19，24]

\{\begin{array}{l} {\dot{x}}_{1} = 1 - 10^{4} x_{1}^{2} e^{- 1 / x_{3}} - 400 x_{1} e - 0.55 / x_{3} - x_{1}, \\ {\dot{x}}_{2} = 10^{4} x_{1}^{2} e^{- 1 / x_{3}} - a x_{2}, \\ {\dot{x}}_{3} = u - x_{3}, \end{array}

(34)

其中: 状态量x₁代表P₁的浓度，x₂代表P₂浓度，x₃代表反应器中混合物的温度. 控制量u在0.049和0.449 范围内. 给出目标函数L₁（x，u）= −x₂和L₂（x，u）= x₁，目的是在保证废品量最小的前提下，保证产物量最大. 系统稳态表示为x_s =（0.0832，0.0846，0.149）和u_s= 0.149. 仿真步长为T_sim = 60，预测步长为6，采样周期T_s为0.1 s. 终端代价

E (x_{k}) = {(x_{N ∣ k} - x_{s})}^{T} \times Q (x_{N ∣ k} - x_{s}) ， Q = d i a g {1，1 ， 1} ， R = 1 .

终端域

X_{T} = \{x \in R^{3} ∣ E （ x ） ⩽ 0.01\} .

用已知系统稳态的传统字典序MO-MPC 算法 ^[18-20，22]（traditional-lexicographical MPC，Tra-LMPC）与本文算法（Our-LMPC）进行对比.

4.1 仿真实验1

考虑初始状态对（x₀，u₀）=（0.001，0.02，0.13，0.12），针对参数α和γ选择不同，对应控制效果如图1所示. 其中，实线为 Tra-LMPC的仿真结果; 虚线为 Our-LMPC（γ = 0.04，α = 0.0001）的仿真结果; 点线为Our-LMPC（γ = 0.03，α = 0.0001）的仿真结果; 点划线为 Our-LMPC（γ = 0.02，α = 0.0001）的仿真结果. 当α不变（α = 0.0001）时，α/γ越小（值函数V₁（x_k，u_k）不变，终端性质E₁（x_k）起主要作用），约束（19）越严格，Our-LMPC效果越接近Tra-LMPC对应的期望稳态，且变化过程越平稳. 产物浓度x₂变化大致相同，物料浓度x₁越高，反应温度x₃越低，说明物料转化率越高. 同时结合定理2观察系统，Tra-LMPC计算时间是 37.84 s，稳定起始时刻从12 s开始收敛，提前到OurLMPC的5 s. 结合表1看出，Tra-LMPC的显式处理系统稳态和带终端约束将影响原始性能，会加重MPC在线优化的计算量，Our-LMPC具有更快收敛性和计算速度.

由定义1可知，在不显式处理系统稳态的前提下，可通过 ε控制系统准稳态域. 由式（32）–（33）可知，当 α =0.0001时，γ越大，ε准稳态域越大，系统可行域越大. 结合图1–2所示，参数α/γ越小，约束（19）越严格，系统在期望稳态的 ε邻域内越稳定. 其中，当 α = 0.0001时，受α/γ 的影响，γ = 0.04比γ = 0.01的约束条件（19）更严格，效果更稳定，计算的更快.

图1不同γ的状态量和控制量曲线

Fig.1Profiles of states and control with different γ

表1不同γ的总计算时间

Table1The total computation time with different γ

图2不同γ的ε准稳态最优值曲线

Fig.2Profiles of ε quasi steady-state optimal values with different γ

如图3所示，考虑初始状态对（x₀，u₀）=（0.001，0.03，0.13，0.12）. 其中: 实线为 Tra-LMPC的仿真结果; 虚线为 Our-LMPC（γ = 0.01，α = 0.000 1）的仿真结果; 点线为 Our-LMPC（γ = 0.01，α = 0.000 01）的仿真结果; 点划线为 Our-LMPC（γ = 0.01，α = 0.000 001）的仿真结果. 当γ（γ = 0.01）不变时，α越大（目标函数V₁（x_k，u_k）和终端性质E₁（x_k）受到影响主要调节状态幅值变化∆（x_k，u_k）Our-LMPC越接近对应的期望稳态）. 对比Tra-LMPC，Our-LMPC受参数α 影响明显，α变大的过程中，V₁（x_k，u_k）起主要作用，降低终端性质E₁（x_k）对系统的影响. 参数α取值变化细微，但E₁（x_k）也随参数α的变大而变大，故仿真过程中产生震荡，可见松弛约束条件（19）对ε准稳态具有很大影响. 观察图3仿真可知在 γ = 0.01，α = 0.000 1时震荡最小. 另外，对比计算速度，Tra-LMPC 计算时间是34.13 s，Our-LMPC求解速度更快，如表2所示.

图3不同α的状态量和控制量曲线

Fig.3Profiles of states and control with different α

表2不同α的总计算时间

Table2The total computation time with different α

如图4所示，当γ（γ = 0.01）不变时，参数α变化，ε 的范围大体一致. 由式（32）–（33）可知，在ε准稳态域相同的情况下，参数γ比参数α更影响ε的范围. 对比表2，看出Our-LMPC计算量也受参数α影响. 说明改善终端性质对计算量产生影响.

图4不同α的ε准稳态最优值曲线

Fig.4Profiles of ε quasi steady-state optimal value with different α

因此，可以通过调节参数α和γ改善系统的收敛速度和计算量，从而提高预测控制器应用的灵活性.

4.2 仿真实验2

根据集合S可知状态轨迹与Lipschitz常数相关，系统在可达控制序列下渐近到最优稳态集X_s内，预测时域的变化会影响系统的稳定性和计算量. 考虑初始状态对（x₀，u₀）=（0.001，0.03，0.13，0.15），为了验证 Our-LMPC的优越性，将Our-LMPC和Tra-LMPC对比不同预测时域下控制效果.

表3表示两种策略在不同预测时域下的平均运行时长对比，在相同预测时域下，Our-LMPC速度更快; 随着预测时域变化，Our-LMPC整体运行速度更快. 但是随着预测时域的增加（N = 4的情况过短的预测时域会影响系统性能，如图5所示，从计算的角度，OurLMPC效果很可观），反应器中的产物x₁浓度变高，废物x₂浓度相近，反应器中的温度低，说明产品转化率变高，体现出随着预测时域的变化经济效果越好但是计算时间越长，不同预测步数表现出相近的产量，N = 2更接近系统最优稳态. 实际上，通过调节参数缩小ε准稳态区域大小，确实起到了减小计算量的效果. 综上，本文算法运行速度更快，且预测时域越短效果越好.

表3不同预测时域下平均运行时长

Table3The average running times with different prediction horizons

图5在不同预测时域下的状态量和控制量曲线

Fig.5Profiles of states and control with different prediction horizons

4.3 仿真实验3

以相同的初始点作为初始量，对比 Tra-LMPC和 Our-LMPC的最小预测时域. 根据表4看出，在相同的初始值下，Our-LMPC比Tra-LMPC预测时域更小，说明Our-LMPC具有更大的可行范围.

表4保证MO-MPC初始可行性的最短预测时域（N）

Table4The shortest prediction hrizon (N) ensuring the initial feasibility of MO-MPC

5 结论

本文提出了一种准最优稳定的优先级MO-MPC策略. 将准最优稳定MPC位于最高优先级，利用该MPC 的近似最优性质优先解决系统渐近到最优稳态的问题，同时实现去掉全局终端约束的效果，该算法从去掉终端约束条件和不用显式处理系统稳态的角度减少字典序优化算法计算量. 本文算法没有利用跟踪稳态构造最高优先级的目标函数，而是对目标函数进行设计，通过设计参数使系统在较小邻域内维持稳定，降低了计算量，并且扩大了可行域. 最后结合字典序约束给出目标函数满足的终端性质，证明了该策略的可行性和近似最优性.

图1不同γ的状态量和控制量曲线

Fig.1Profiles of states and control with different γ

下载: 全尺寸图片

图2不同γ的ε准稳态最优值曲线

Fig.2Profiles of ε quasi steady-state optimal values with different γ

下载: 全尺寸图片

图3不同α的状态量和控制量曲线

Fig.3Profiles of states and control with different α

下载: 全尺寸图片

图4不同α的ε准稳态最优值曲线

Fig.4Profiles of ε quasi steady-state optimal value with different α

下载: 全尺寸图片

图5在不同预测时域下的状态量和控制量曲线

Fig.5Profiles of states and control with different prediction horizons

下载: 全尺寸图片

表1不同γ的总计算时间

Table1The total computation time with different γ

下载: 全尺寸图片

表2不同α的总计算时间

Table2The total computation time with different α

下载: 全尺寸图片

表3不同预测时域下平均运行时长

Table3The average running times with different prediction horizons

下载: 全尺寸图片

表4保证MO-MPC初始可行性的最短预测时域（N）

Table4The shortest prediction hrizon (N) ensuring the initial feasibility of MO-MPC

下载: 全尺寸图片

图1不同γ的状态量和控制量曲线

Fig.1Profiles of states and control with different γ

图2不同γ的ε准稳态最优值曲线

Fig.2Profiles of ε quasi steady-state optimal values with different γ

图3不同α的状态量和控制量曲线

Fig.3Profiles of states and control with different α

图4不同α的ε准稳态最优值曲线

Fig.4Profiles of ε quasi steady-state optimal value with different α

图5在不同预测时域下的状态量和控制量曲线

Fig.5Profiles of states and control with different prediction horizons

表1不同γ的总计算时间

Table1The total computation time with different γ

表2不同α的总计算时间

Table2The total computation time with different α

表3不同预测时域下平均运行时长

Table3The average running times with different prediction horizons

表4保证MO-MPC初始可行性的最短预测时域（N）

Table4The shortest prediction hrizon (N) ensuring the initial feasibility of MO-MPC

图(5) / 表(4)

引用本文

田宇, 何德峰, 穆建彬. 准最优稳定的约束非线性系统优先级多目标模型预测控制. 控制理论与应用, 2025, 42(4): 731 – 739

复制

TIAN Yu, HE Defeng, MU Jianbin. Prioritized multi-objective model predictive control of constrained nonlinear systems with quasi-optimal stability. Control Theory & Applications, 2025, 42(4): 731 – 739

Copy

计量

图1不同γ的状态量和控制量曲线

Fig.1Profiles of states and control with different γ

图2不同γ的ε准稳态最优值曲线

Fig.2Profiles of ε quasi steady-state optimal values with different γ

图3不同α的状态量和控制量曲线

Fig.3Profiles of states and control with different α

图4不同α的ε准稳态最优值曲线

Fig.4Profiles of ε quasi steady-state optimal value with different α

图5在不同预测时域下的状态量和控制量曲线

Fig.5Profiles of states and control with different prediction horizons

表1不同γ的总计算时间

Table1The total computation time with different γ

表2不同α的总计算时间

Table2The total computation time with different α

表3不同预测时域下平均运行时长

Table3The average running times with different prediction horizons

表4保证MO-MPC初始可行性的最短预测时域（N）

Table4The shortest prediction hrizon (N) ensuring the initial feasibility of MO-MPC

NADERI Y, HOSSEINI S H, SAVAGHEBI M,et al. Multi-objective model predictive control for microgrid applications. International Journal of Electrical Power & Energy Systems,2023,154:109441.

ZHENG Y, WANG D. A survey of recommender systems with multiobjective optimization. Neurocomputing,2022,474:141-153.

XAVIER J, PATNAIK S K, PANDA R C. Economic optimization and predictive control for nonlinear systems using Lyapunov based nonlinear cost function design. Chemical Engineering Science,2023,270:118530.

ZHANG Z, LI S. Enhanced reinforcement learning in two-layer economic model predictive control for operation optimization in dynamic environment. Chemical Engineering Research & Design,2023,196:133-143.

OH J, BARTOS M. Model predictive control of stormwater basins coupled with real-time data assimilation enhances flood and pollution control under uncertainty. Water Research,2023,235:119825.

LUND N S V, FALK A K V, BOAUP M,et al. Model predictive control of urban drainage systems: A review and perspective towards smart real-time water management. Critical Reviews in Environmental Science and Technology,2018,48(3):279-339.

QAZANI M R C, ASADI H, MOHAMED S,et al. A time-varying weight MPC-based motion cueing algorithm for motion simulation platform. IEEE Transactions on Intelligent Transportation Systems,2022,23(8):11767-11778.

GARG S, JAIN A, MUKHERJEE P,et al. Cryptography with weights: MPC,encryption and signatures. Annual International Cryptology Conference. Cham: Springer Nature Switzerland,2023:295-327.

TAHERIAN S, HALDER K, DIXIT S,et al. Autonomous collision avoidance using MPC with LQR-based weight transformation. Sensors,2021,21(13):4296.

ANILKUMAR M, PADHIYAR N, MOUDGALYA K. Lexicographic optimization based MPC: Simulation and experimental study. Computers & Chemical Engineering,2016,88:135-144.

RASEKHIPOUR Y, FADAKAR I, KHAJEPOUR A. Autonomous driving motion planning with obstacles prioritization using lexicographic optimization. Control Engineering Practice,2018,77:235-246.

WANG H, HUANG Y, KHAJEPOUR A,et al. Ethical decisionmaking platform in autonomous vehicles with lexicographic optimization based model predictive controller. IEEE Transactions on Vehicular Technology,2020,69(8):8164-8175.

HU J, DING B, ZHANG M,et al. Enhancing output feedback robust MPC via lexicographic optimization. IEEE Transactions on Industrial Informatics,2022,19(3):3068-3078.

HE D F, WANG L, SUN J. On stability of multi-objective NMPC with objective prioritization. Automatica,2015,57:189-198.

HE D F, YU S M, OU L L. Lexicographic MPC with multiple economic criteria for constrained nonlinear systems. Journal of the Franklin Institute,2018,355(9):753-773.

HE D F, LI H, DU H. Lexicographic multi-objective MPC for constrained nonlinear systems with changing objective prioritization. Automatica,2021,125:109433.

GRÜNE L. Economic receding horizon control without terminal con-straints. Automatica,2013,49(3):725-734.

GRÜNE L, STIELER M. Asymptotic stability and transient optimal-ity of economic MPC without terminal conditions. Journal of Process Control,2014,24(8):1187-1196.

ALAMIR M, PANNOCCHIA G. A new formulation of economic model predictive control without terminal constraint. Automatica,2021,125:109420.

AMRIT R, RAWLING J B, ANGELI D. Economic optimization using model predictive control with a terminal cost. Annual Reviews in Control,2011,35:178-186.

ANGELI D, AMRIT R, RAWLINGS J B. Receding horizon cost optimization for overly constrained nonlinear plants. In Proceedings of the 48th IEEE Conferenceon Decision and Control. Shanghai, China: IEEE,2009,7972-7977.

ANGELI D, RAWLINGS J B. Receding horizon cost optimization and control for nonlinear plants. In Proceedings of the 8th IFAC Symposium on Nonlinear Control Systems(NOLCOS). Bologna, Italy:2010:1217-1223.

MARLER R T, ARORA J S. Survey of multi-objective optimization methods for engineering. Structural and Multidisciplinary Optimization,2004,26(6):369-395.

MÜLLER M, ANGELI D, ALLGÖWER F,et al. Convergence in e-conomic model predictive control with average constraints. Automatica,2014,50(12):3100-3111.