欢迎访问《控制理论与应用》期刊网站！

移动机器人轨迹跟踪的参数估计与原对偶神经网络预测控制

doi: 10.7641/CTA.2024.30790

张浪文，王中旭，魏海翔，谢巍

华南理工大学自动化科学与工程学院, 广东广州 510640

基金项目: 国家自然科学基金项目(62473160), 广东省基础与应用基础研究基金项目(2023A1515030119, 2023A1515240070), 清远市科技计划项目(2023 DZX006)资助.

详细信息

作者简介

张浪文副教授,目前研究方向为复杂系统的分布式模型预测控制理论及应用,E-mail: aulwzhang@scut.edu.cn;

王中旭硕士研究生,目前研究方向为模型预测控制及移动机器人控制,E-mail: auwangzx@mail.scut.edu.cn;

魏海翔博士研究生,目前研究方向为模型预测控制方法,E-mail: 18928198801@163.com;

谢巍教授,目前研究方向为机器视觉、线性参数变化系统控制等,E-mail: weixie@scut.edu.cn.

通信作者

张浪文,E-mail: aulwzhang@scut.edu.cn;Tel.:+8613760804711.

Trajectory tracking of mobile robots based on parameter estimation and primal-dual neural network predictive control

ZHANG Lang-wen ， WANG Zhong-xu ， WEI Hai-xiang ， XIE Wei

School of Automation Science and Engineering, South China University of Technology, Guangzhou Guangdong 510640 , China

Funds: Supported by the National Natural Science Foundation of China (62473160), the Guangdong Basic and Applied Basic Research Foundation (2023A1515030119, 2023A1515240070) and the Science and Technology Planning Project of Qingyuan (2023DZX006).

摘要

本文针对轮式移动机器人的不确定参数估计与轨迹跟踪问题, 研究了基于卷积神经网络(CNN)的移动机器人不确定模型参数估计方法, 提出了移动机器人的原对偶神经网络(PDNN)模型预测控制(MPC)轨迹跟踪控制算法. 对于轮式移动机器人而言, 轮胎侧偏刚度受到负载扰动、未建模动态和路况变化等不确定因素影响, 在实际行驶过程中难以实时测量. 论文研究侧偏刚度的CNN回归模型, 以估计机器人运行过程中的不确定性. 考虑前轮偏角与加速度等状态的约束条件, 研究基于CNN参数估计的移动机器人预测控制设计方法, 提出基于PDNN的移动机器人预测控制问题求解算法, 并证明了所提出基于CNN参数估计的PDNN-MPC算法稳定性. 最后, 为了验证控制器的有效性, 对所提出的PDNN-MPC算法进行验证.

关键词

轮式移动机器人 / 轨迹跟踪 / 模型预测控制 / 原对偶神经网络 / 卷积神经网络

Abstract

This work focuses on the problem of uncertain parameter estimation and trajectory tracking for wheeled mobile robots. A method for estimating uncertain model parameters of mobile robots based on the convolutional neural network (CNN) is studied, and a primal-dual neural network (PDNN) model predictive control (MPC) tracking control algorithm for mobile robots is proposed. For wheeled mobile robots, tire lateral stiffness is affected by load disturbance, unmodelled dynamics and load changes, which is difficult to measure in real time during actual driving. CNN estimator of lateral stiffness is designed to eliminate uncertainty during robot operation considering the constraint conditions of front wheel deviation and acceleration. This work studies the design of predictive control for mobile robots based on CNN parameter estimation and proposes a PDNN based algorithm with CNN parameter estimation for solving the predictive control problem of mobile robots. The stability of the proposed PDNN-MPC algorithm is proved. Finally, to verify the effectiveness of the controller, the proposed PDNN-MPC algorithm is validated.

Keywords

mobile robots / trajectory tracking / model predictive control / primal-dual neural network / convolutional neural network

1 引言 2 移动机器人建模与CNN参数估计 2.1 移动机器人建模 2.2 基于卷积神经网络的机器人参数估计 3 基于原对偶神经网络预测控制的移动机器人轨迹跟踪方法 3.1 移动机器人轨迹跟踪预测控制设计 3.2 基于PNDD的二次规划求解 3.3 闭环系统稳定性证明 4 仿真 4.1 参数估计结果 4.2 控制结果 5 总结

1 引言

轨迹跟踪控制是自动驾驶和智能交通系统中的一个重要问题，它涉及到如何使移动机器人按照预期的路径进行准确而稳定的运动，也是自动驾驶领域的一个重要组成部分 ^[1] . 移动机器人被广泛应用到各种场合，如工厂、娱乐区以及一些危险区域等 ^[2-3] . 同时，人工智能和大数据技术的发展进一步刺激了移动机器人的智能控制研究，结合深度学习的控制方法成为了机器人运动控制的一大重要领域 ^[4-6] .

近年来，移动机器人的轨迹跟踪得到广泛研究关注. 文献 ^[7] 提出了一种基于人工势场法的移动机器人轨迹规划与跟踪方法，以实现其跟踪控制. 文献 ^[8] 提出了一种带有状态观测器的控制方法以消除外部扰动. 此外，文献 ^[9] 中研究了基于模糊–PID结合的自适应控制器进行机器人的轨迹跟踪，可以在控制过程中调整参数，实现在线自适应学习. 然而，上述研究在轨迹跟踪方面取得良好控制效果的同时，并未考虑移动机器人运行过程中的参数不确定，以及固有的约束，包括前轮偏角、速度增量与速度上限等.

为满足控制过程中移动机器人固有的的运动学约束，模型预测控制（model predictive control，MPC）作为一种优化控制方法，已被应用于非线性多输入多输出系统，并且可以解决不确定性和约束问题 ^[10] . 在MPC中，通过对性能指标的连续优化，可以在有限预测时域的条件下获得控制信号以实现最优控制. 文献 ^[11] 中提出了一种基于考虑量化和丢包的模型预测控制方法，有效地处理了执行器饱和约束问题. 文献 ^[12] 中采用最小二乘估计方法对机器人侧偏刚度进行实时估计，从而获得更准确的控制模型. 文献 ^[13] 将MPC与扩展卡尔曼滤波相结合，消除外部扰动以进行移动机器人的稳定控制. 文献 ^[14] 中利用BP神经网络估计机器人侧偏刚度，采用MPC控制器进行轨迹跟踪控制，并采取遗传算法用于权重矩阵的优化. 文献 ^[15] 中，研究者利用径向基神经网络解决移动机器人的不确定性，采取MPC作为控制器，进行轨迹跟踪的鲁棒控制. 然而，已有方法对侧偏刚度的估计还不够精确，影响移动机器人的控制效果.

基于上述分析，本文针对移动机器人的轨迹跟踪控制，提出一种基于卷积神经网络（convolutional neural network，CNN）参数估计的原对偶神经网络预测控制方法. 首先，研究侧偏刚度的CNN参数回归模型，以估计机器人运行过程中的不确定性; 然后，针对轮式移动机器人的不确定参数估计与轨迹跟踪问题，考虑前轮偏角与加速度等状态的约束条件，构建了移动机器人MPC轨迹跟踪控制算法; 最后，提出基于原对偶神经网络（primal-dual neural network，PDNN）的移动机器人预测控制问题求解算法.

论文的组织结构如下: 第2部分研究了移动机器人的运动学及动力学建模，并设计了轮胎侧偏刚度的 CNN参数估计结构; 第3部分研究基于MPC的移动机器人跟踪控制算法，完成了基于PDNN的二次规划求解器设计，并证明了闭环系统的稳定性; 第4部分给出了仿真测试，并对仿真结果进行了分析; 最后，第5部分总结了全文并展望了未来的研究方向.

2 移动机器人建模与CNN参数估计

为了使控制性能更安全、更平稳，准确的动态控制模型是必不可少的. 因此，针对移动机器人的轨迹跟踪问题，本文研究了机器人运动学模型和动力学模型设计，并提出基于CNN的轮胎侧偏刚度估计设计，为后续基于PDNN求解的MPC设计提供模型基础.

2.1 移动机器人建模

针对后轮驱动，前轮转向的四轮移动机器人模型，其运动学模型可以被描述如下:

[\begin{matrix} \dot{x} \\ \dot{y} \\ \dot{φ} \end{matrix}] = [\begin{matrix} V c o s φ \\ V s i n φ \\ ω \end{matrix}] = [\begin{matrix} c o s φ & 0 \\ s i n φ & 0 \\ 0 & 1 \end{matrix}] u,

(1)

其中:（x，y）表示机器人坐标;

V = \frac{(v_{1} + v_{r})}{2}

为机器人速度;

ω = \frac{(v_{l} - v_{r})}{L}

为机器人角速度; v_l，v_r分别表示机器人左轮和右轮速度; L为机器人后轮间距; φ为机器人航向角; u =（V，ω）为机器人控制向量; 系统的状态量为[x y φ]. 在进行参考轨迹生成时，轨迹必须要满足机器人运动学模型以保障移动机器人的平滑移动与转弯.

本文采取了文献 ^[16] 中提出的标准自行车模型来近似机器人动力学模型，它既能准确地进行控制，又易于部署，如图1所示. 在此模型中，前轮与后轮做相似的处理，两个轮子被拼接成了一个整体. 横向动力学受轮胎侧偏力和侧偏角等因素影响. 具体的动力学模型如下 ^[16] :

\begin{matrix} m \ddot{y} = \\ - m \dot{x} \dot{φ} + 2 [C_{f} (δ_{f} - \frac{\dot{y} + l_{f} \dot{φ}}{\dot{x}}) + C_{r} \frac{l_{r} \dot{φ} - \dot{y}}{\dot{x}}], \end{matrix}

(2)

\begin{matrix} m \ddot{x} = \\ m \dot{y} \dot{φ} + 2 [C_{f} (δ_{f} - \frac{\dot{y} + l_{f} \dot{φ}}{\dot{x}}) δ_{f} + C_{r} l_{r}] \end{matrix}

(3)

\begin{matrix} I_{z} \ddot{φ} = \\ 2 [l_{f} C_{f} (δ_{f} - \frac{\dot{y} + l_{f} \dot{φ}}{\dot{x}}) - l_{r} C_{r} \frac{l_{r} \dot{φ} - \dot{y}}{\dot{x}}] \end{matrix}

(4)

\dot{Y} = \dot{x} s i n φ + \dot{y} c o s φ,

(5)

\dot{X} = \dot{x} c o s φ - \dot{y} s i n φ,

(6)

其中: C_f，C_r分别为机器人前轮和后轮的轮胎侧偏刚度; l_f，l_r分别为机器人质点中心到前后轮的长度; δ_f为机器人前轮偏角; m为机器人质量; I_z为机器人惯性系数; 式（5）–（6）表示车身坐标系与惯性坐标系间的坐标转换.

对于机器人而言，轮胎侧偏刚度系数、质量和惯性系数是系统模型中的不确定参数. 本文考虑轮胎转弯刚度的不确定性对机器人轨迹跟踪控制精度的影响，研究基于CNN的不确定C_f，C_r估计方法，设计MPC轨迹跟踪控制器，并研究PDNN求解的MPC优化问题求解算法，以实现机器人的轨迹跟踪，控制框架如图2所示.

图1移动机器人动力学模型

Fig.1Kinetic model of wheeled mobile robots

图2本文控制结构图

Fig.2Control structure diagram of this work

2.2 基于卷积神经网络的机器人参数估计

对于轮式移动机器人，机器人的状态和参数直接影响轨迹跟踪控制效果. 轮胎的行为参数是一项必须要考虑的因素，许多研究都对轮胎进行了建模，以获取准确的轮胎模型 ^[17]，如轮胎的侧偏刚度系数反映了轮胎侧偏角与侧偏力的关系，但是在机器人运行过程中实时测量较为困难，人们往往采取“魔术公式” ^[18] 来估计. 但是该方法对饱和段轮侧偏刚度的估计往往存在失真的现象，不能准确的反应系统模型. 因此，本文采取了一种基于CNN的轮胎侧偏刚度系数估计方法，以获得更好的机器人轨迹跟踪控制效果.

CNN是深度学习领域中被广泛应用的一个分支 ^[19]，可以提取局部特征，具有抗噪声、不变性等特点，可有效地处理大规模数据并防止过拟合风险. CNN的基本结构包括输入层、卷积层、池化层、全连接层和输出层等，卷积层和池化层通常有多个. 网络的学习过程由前向传播和反向传播组成.

为了解决针对C_f，C_r的回归问题，本文设计了包含9个隐藏层的CNN，包括输入层、卷积层、批归一化层、ReLU激活层、最大池化层、最大卷积层、最大批归一化层、最大ReLU激活层、Dropout层、全连接层和回归层. 每个神经元的输出都是下一层神经元的输入. 在训练CNN时，神经元激活函数采用了ReLU激活函数，神经网络的输入选取为

[\begin{matrix} v_{x} v_{y} ω a δ_{f} \end{matrix}] ，

输出为估计的轮胎侧偏刚度系数

[{\bar{C}}_{f} {\bar{C}}_{r}] ，

其中v_x，v_y分别为机器人横、纵向速度. 各层参数如下:

第1层为输入层，尺寸大小为5 × 1，对应每一时刻在机器人传感器中实时读取到的数据.

第2层为一维卷积层conv1，定义了16个大小为 3 × 1的卷积核，卷积步长s为1 × 1，对输入数据进行 “same”填充，对输入图像进行局部感知，提取出输入数据的空间特征. 通过卷积操作，每个卷积核在不同位置对数据进行扫描，从而生成特征图. 对于卷积层的输出维度可以用以下公式表示:

H_{o u t} = ⌊\frac{H_{i n} + 2 P a d - K_{h}}{s + 1}⌋,

(7)

W_{o u t} = ⌊\frac{W_{i n} + 2 P a d - K_{w}}{s + 1}⌋,

(8)

其中: H_in，H_out分别为输入、输出特征图高度; W_in，W_out为输入、输出特征图; Pad为填充大小; K_h，K_w 为卷积核的高度、宽度; ⌊·⌋为向下取整符号，计算可得conv1层的输出维度为5 × 16，通道数为16.

第3层为二维最大池化层maxpool，池化窗口大小为2 × 1，步长为1 × 1. 每层池化层在CNN中起到减小特征图空间尺寸、提取主要特征和减少过拟合的作用. 通过对输入特征图进行降采样和聚合操作，帮助网络集中关注最显著的信息，增强模型的鲁棒性，并且减少计算负荷和参数数量，以及降低过拟合的风险. 其输出维度为2 × 1，通道数为16.

第4层为激活层，应用ReLU激活函数，将卷积层输出中的负值置零，保留正值.

第5层为一维卷积层conv2，定义了32个大小为 3 × 1的卷积核，对输入数据进行“same”填充，卷积步长为1 × 1，输出矩阵大小为5 × 16，通道数为32.

第6层为ReLU激活层，再次应用激活函数.

第7层为Dropout层，以10%的概率随机丢弃神经元，防止过拟合.

第8层为全连接层，将学习到的特征转化为最终的输出结果.

第9层为回归输出层，对回归结果进行计算和输出，共有两个神经元分别对应待回归参数

{\bar{C}}_{f} ， {\bar{C}}_{r} .

3 基于原对偶神经网络预测控制的移动机器人轨迹跟踪方法

基于上述构建的 CNN 车轮侧偏刚度实时回归模型，可以对侧偏刚度进行实时估计，本节将设计MPC轨迹跟踪控制算法，并研究基于PDNN的问题求解方法，并证明闭环系统的稳定性.

3.1 移动机器人轨迹跟踪预测控制设计

根据文献 ^[20] 可知，轨迹跟踪误差模型可拆分为横向误差模型与纵向误差模型两部分，其中横向误差模型描述如下:

{\dot{ϑ}}_{1} = A_{1} ϑ_{1} + B_{1} δ_{f} + C_{1},

(9)

其中:

A_{1} = [\begin{matrix} 0 & 1 \\ 0 & - \frac{2 C_{f} + 2 C_{r}}{m V} \\ 0 & 0 \\ 0 & \frac{2 C_{f} l_{f} - 2 C_{r} l_{r}}{I_{z} V} \end{matrix} \begin{matrix} 0 & 0 \\ \frac{2 C_{f} + 2 C_{r}}{m} & \frac{- 2 C_{f} l_{f} + 2 C_{r} l_{r}}{m V} \\ 0 & 1 \\ \frac{2 C_{f} l_{f} - 2 C_{r} l_{r}}{I_{z}} & - \frac{2 C_{f} l_{f}^{2} + 2 C_{r} l_{r}^{2}}{I_{z}} \end{matrix}], B_{1} = [\begin{matrix} 0 \\ \frac{2 C_{f}}{m} \\ 0 \\ \frac{2 C_{f} l_{f}}{I_{z}} \end{matrix}], C_{1} = κ [\begin{matrix} 0 \\ - \frac{2 C_{f} l_{f} - 2 C_{r} l_{r}}{m V} - V \\ 0 \\ - \frac{2 C_{f} l_{f}^{2} + 2 C_{r} l_{r}^{2}}{I_{z} V} \end{matrix}],

V 为机器人运行速度，κ代表道路曲率，状态量为ϑ₁ =

{[\begin{matrix} y_{e} {\dot{y}}_{e} φ_{e} {\dot{φ}}_{e} \end{matrix}]}^{T}

分别为横向误差、横向误差率、航向误差和航向误差率.

为考虑纵向速度补偿，本文选取u = [δ_f a] ^T作为控制量，分别为前轮偏角与加速度，以满足实际速度与期望速度之间的偏差. 因此，式（9）可改写为

\dot{ϑ_{1}} = A_{2} ϑ_{1} + B_{2} u + C_{2},

(10)

其中:

A_{2} = A_{1} ， C_{2} = C_{1} ， B_{2} = [\begin{matrix} 0 & 0 \\ \frac{2 C_{f}}{m} & 0 \\ 0 & 0 \\ \frac{2 C_{f} l_{f}}{I_{z}} & 0 \end{matrix}] .

针对纵向误差，选取状态量ϑ₂ = [x_e v_e] ^T，分别表示纵向误差与纵向误差率，得到纵向误差模型

\dot{ϑ_{2}} = A_{3} ϑ_{2} + B_{3} u + C_{3},

(11)

其中:

A_{3} = [\begin{matrix} 0 1 \\ 0 0 \end{matrix}], B_{3} = [\begin{matrix} 0 0 \\ 0 - 1 \end{matrix}], C_{3} = κ [\begin{matrix} 0 \\ - 1 \end{matrix}] .

考虑道路曲率κ的影响，综合横向误差模型和纵向误差模型，得到移动机器人横纵向误差模型

\dot{ϑ} = A ϑ + B u + C,

(12)

其中:

A = [\begin{matrix} A_{2} & 0 \\ 0 & A_{3} \end{matrix}], B = [\begin{matrix} B_{2} \\ B_{3} \end{matrix}], C = [\begin{matrix} C_{2} \\ C_{3} \end{matrix}] .

系统的状态量为

ϑ = {[\begin{matrix} y_{e} {\dot{y}}_{e} φ_{e} {\dot{φ}}_{e} x_{e} v_{e} \end{matrix}]}^{T} ，

控制量为

u = {[\begin{matrix} δ_{f} a \end{matrix}]}^{T} ，

参数C_f，C_r由CNN回归模型实时估计，得到系统模型.

考虑到实际仿真过程中要对离散数据进行处理，对状态空间模型利用双边离散化方法进行离散化处理，离散化公式如下:

\bar{A} = (I + \frac{T A}{2}) {(I - \frac{T A}{2})}^{- 1},

(13)

\bar{B} = T B,

(14)

\bar{C} = T C .

(15)

得到离散化后移动机器人横纵向误差模型如下:

ϑ (k + 1) = \bar{A} ϑ (k) + \bar{B} u (k) + \bar{C} .

(16)

为设计移动机器人的轨迹跟踪，构建如下代价函数J，MPC的轨迹跟踪优化问题为考虑约束条件的情况下最小化J:

J = \sum_{j = 1}^{N_{p}} ‖ (ϑ (k + j ∣ k) ‖_{Q}^{2} + \sum_{j = 0}^{N_{C} - 1}‖ Δ u (k + j ∣ k) ‖_{R}^{2},

(17)

其中:

‖ \cdot ‖

表示欧几里得范数， Q 和R 均表示正定矩阵，ϑ（k + j|k）表示预测的未来 k + j 时刻的状态，

Δ u （ k + j ∣ k ） = u （ k + j ∣ k ） - u （ k - 1 + j ∣ k ）

表示控制增量. 系统的约束描述如下:

\{\begin{matrix} ϑ_{m i n} ⩽ ϑ (k) ⩽ ϑ_{m a x} \\ u_{m i n} ⩽ u (k) ⩽ u_{m a x} \\ Δ u_{m i n} ⩽ Δ u (k) ⩽ Δ u_{m a x} \end{matrix}

(18)

其中:

ϑ_{m i n} ， ϑ_{m a x} ， u_{m i n} ， u_{m a x} ， Δ u_{m i n} ， Δ u_{m a x}

分别为状态量、控制量与控制增量变化的上下界.

根据状态空间方程可得以下递推关系 ^[12] :

(19)

为将式（19）写成紧凑形式，定义如下向量:

\begin{matrix} \bar{ϑ} (k) = {[\begin{matrix} ϑ (k + 1 ∣ k) & \dots & ϑ (k + N_{p} ∣ k) \end{matrix}]}^{T}, \\ \bar{u} (k) = {[\begin{matrix} u (k + 1 ∣ k) & \dots & u (k + N_{p} ∣ k) \end{matrix}]}^{T}, \\ Δ u (k) = {[\begin{matrix} Δ \bar{u} (k) & \dots & Δ \bar{u} (k + N_{C} - 1 ∣ k) \end{matrix}]}^{T}, \end{matrix}

可将（19）写成

\bar{ϑ} (k + 1) = \tilde{A} \bar{ϑ} (k) + \tilde{B} \bar{u} (k) + \tilde{C}

(20)

其中:

\begin{matrix} \tilde{A} = {[\begin{matrix} \bar{A} & {\bar{A}}^{2} & \dots \\ {\bar{A}}^{N_{p}} \end{matrix}]}^{T}, \\ \tilde{B} = [\begin{matrix} \bar{B} & 0 & \dots & 0 \\ \bar{A} \bar{B} & \bar{B} & \dots & 0 \\ ⋮ & ⋮ & ⋮ \\ {\bar{A}}^{N_{p}} \bar{B} & {\bar{A}}^{N_{p} - 1} \bar{B} & \dots & \bar{B} \end{matrix}], \\ \tilde{C} = [\begin{matrix} \bar{C} \\ \bar{C} + \bar{A} \bar{C} \\ ⋮ \\ \bar{C} + \bar{A} \bar{C} + \dots + {\bar{A}}^{N_{p}} \bar{C} \end{matrix}] . \end{matrix}

因此，关于移动机器人的MPC优化问题可转化为以下最小化问题:

\begin{matrix} m i n J = Δ {\bar{u}}^{T} {\tilde{B}}^{T} Q_{e} \tilde{B} Δ \bar{u} + R_{e} + \\ 2 (Δ \bar{u} \tilde{B})^{T} Q_{e} (\tilde{A} η + \tilde{C}), \\ s . t . 式 (18) (20), \end{matrix}

(21)

其中:

Q_{e} = [\begin{matrix} Q & 0 & \dots & 0 \\ 0 & Q & \dots & 0 \\ ⋮ & ⋮ & ⋮ \\ 0 & 0 & \dots & Q \end{matrix}], R_{e} = [\begin{matrix} R & 0 & \dots & 0 \\ 0 & R & \dots & 0 \\ ⋮ & ⋮ & ⋮ \\ 0 & 0 & \dots & R \end{matrix}] .

可以将移动机器人的预测控制问题转换成求解如下二次规划问题:

\begin{matrix} J = \frac{1}{2} Δ u^{T} H_{t} Δ u + G_{t}^{T} Δ u \\ s . t . \tilde{E} Δ u ⩽ \tilde{b} \\ Δ u_{m i n} ⩽ Δ u ⩽ Δ u_{m a x}, \end{matrix}

(22)

其中:

\begin{matrix} H_{t} = 2 ({\tilde{B}}^{T} Q_{e} \tilde{B} + R_{e}), G_{t} = 2 {\tilde{B}}^{T} Q_{e} (\tilde{A} η + \tilde{C}), \\ \tilde{E} = [- I_{e} I_{e} - \tilde{B} \tilde{B}], \\ \tilde{b} = [\begin{matrix} - {\bar{u}}_{m i n} + \bar{u} (k - 1) \\ {\bar{u}}_{m a x} - \bar{u} (k - 1) \\ - {\bar{ϑ}}_{m i n} + \tilde{A} \\ {\bar{ϑ}}_{m a x} - \tilde{A} \end{matrix}], I_{e} = [\begin{matrix} I & 0 & \dots & 0 \\ 0 & I & \dots & 0 \\ ⋮ & ⋮ & ⋮ \\ 0 & 0 & \dots & I \end{matrix}] . \end{matrix}

至此，构建了关于移动机器人的 MPC优化问题（22），该问题是典型的二次规划问题. 接下来，本文将研究基于PDNN的优化问题（22）求解方法，以得到最优控制策略.

3.2 基于PNDD的二次规划求解

通过上文的分析，将MPC的一般优化问题转化为二次规划问题进行控制变量的求解，本节进一步提出基于PDNN求解标准二次规划问题（22）. 定义µ为对偶决策变量，ρ为原对偶决策系数，可得PDNN的动态方程描述如下:

μ = [\begin{matrix} Δ u \\ ρ \end{matrix}], μ^{+} = [\begin{matrix} Δ u_{m a x} \\ ρ^{+} \end{matrix}], μ^{-} = [\begin{matrix} Δ u_{m i n} \\ - ρ^{+} \end{matrix}],

(23)

其中上下界向量中的

ρ^{+} ≫ 0 ，

在仿真中用极大值来近似，针对式（22）中描述的二次规划问题，定义参数矩阵M和参数向量p如下:

M = [\begin{matrix} H_{t} & {\tilde{E}}^{T} \\ - \tilde{E} & 0 \end{matrix}], p = [\begin{matrix} G_{t} \\ \tilde{b} \end{matrix}] .

(24)

带约束条件的二次规划（quadratic programming，QP）问题可以转化为线性变分不等式的求解问题 ^[21]，即寻找一个满足以下不等式的向量µ ^∗ ∈ Θ，使得

{(μ - μ^{*})}^{T} (M μ^{*} + p) ⩾ 0, \forall μ \in Θ .

(25)

进而，式（25）可以转化为以下分段线性等式进行求解:

P_{Θ} (μ - M μ + p) - μ = 0,

(26)

其中P_Θ（·）为在集合Θ上的投影函数，集合

Θ = {μ ∣ μ^{-} < μ < μ^{+}\} ，

定义如下:

P_{Θ} (\cdot) = \{\begin{matrix} μ^{-}, μ_{i} ⩽ μ^{-}, \\ μ_{i}, μ^{-} < μ_{i} < μ^{+}, \\ μ^{+}, μ_{i} ⩾ μ^{+} . \end{matrix}

(27)

因此，为了求解二次规划问题（22），将其转化为线性不等式的求解问题，则可以根据对偶动力学系统设计方法，设计出PDNN神经动力学模型如下所示:

\dot{μ} = γ (I + M^{T}) \{P_{Θ} (μ - (M μ + p)) - μ\} .

(28)

通过构建如图3所示的PDNN求解结构，可对（28）进行求解，得到所需要的控制器，实现移动机器人的 MPC轨迹跟踪控制.

图3PDNN求解二次规划问题结构图

Fig.3PDNN structure diagram for solving QP problem

3.3 闭环系统稳定性证明

为保证所提出方法的有效性，本节将讨论基于PDNN求解MPC控制的闭环系统稳定性.

定理 1 考虑移动机器人系统（12），假设初始状态为x（0），构建基于CNN参数估计的预测控制优化问题（28）. 利用 PDNN对问题（28）进行求解得到控制序列

u^{*} （ k ∣ k ） ， u^{*} （ k + 1 ∣ k ） ， \dots ， u^{*} (N_{C} - 1 ∣ k) .

那么，移动机器人系统（12）在

u^{*} （ k ∣ k ）

控制下是闭环稳定的.

证将状态在ϑ，预测时域为N_p，控制时域为N_C 时的最优控制序列表示为

u^{*} = \{u^{*} (k ∣ k), u^{*} (k + 1 ∣ k), \dots, u^{*} (N_{C} - 1 ∣ k)\} .

(29)

最优控制序列u^∗ 在每一时刻由 PDNN求解问题（28）得到，PDNN 解u^∗的长度为µ的一半，值为其前

\frac{1}{2}

个单元. 同样的，将最优控制下的移动机器人状态轨迹序列描述如下:

ϑ^{*} = \{ϑ^{*} (k + 1 ∣ k), \dots, ϑ^{*} (N_{p} ∣ k)\} .

(30)

在k时刻，可定义如下李雅普诺夫函数，对稳定性进行证明:

\begin{matrix} V_{0}^{*} = \\ \sum_{j = 1}^{N_{P}} ‖ (\bar{ϑ} (k + j ∣ k) ‖_{Q}^{2} + \sum_{j = 0}^{N_{C} - 1}‖ Δ \bar{u} (k + j ∣ k) ‖_{R}^{2} . \end{matrix}

(31)

那么，在k + 1时刻有

\begin{matrix} V_{1}^{*} = \sum_{j = 1}^{N_{p}} ‖ (\bar{ϑ} (k + j + 1 ∣ k) ‖_{Q}^{2} + \\ \sum_{j = 0}^{N_{C} - 1} ‖ Δ \bar{u} (k + j + 1 ∣ k) ‖_{R}^{2} . \end{matrix}

(32)

进一步地，得到

\begin{matrix} V_{1}^{*} = \sum_{j = 1}^{N_{p}} ‖ (\bar{ϑ} (k + j ∣ k) ‖_{Q}^{2} + \sum_{j = 0}^{N_{C} - 1}‖ Δ \bar{u} (k + j ∣ k) ‖_{R}^{2} - \\ ‖ (\bar{ϑ} (k + 1 ∣ k) ‖_{Q}^{2} -‖ Δ \bar{u} (k ∣ k) ‖_{R}^{2} + \\ ‖ (\bar{ϑ} (k + N_{p} + 1 ∣ k) ‖_{Q}^{2} + \\ {‖Δ \bar{u} (k + N_{C} ∣ k)‖}_{R}^{2} . \end{matrix}

(33)

考虑增量系统模型，当系统进入稳态时，有

Δ \bar{u} (k + N_{C} ∣ k) = 0, \bar{ϑ} (k + N_{p} + 1 ∣ k) = 0

那么得到以下等式:

V_{1}^{*} = V_{0}^{*} - ‖ (\bar{ϑ} (k + 1 ∣ k) ‖_{Q}^{2} -‖ Δ \bar{u} (k ∣ k) ‖_{R}^{2} .

(34)

由于权重矩阵Q和R均为正定矩阵，则有式（34）中右边的两项

‖ (\bar{ϑ} （ k + 1 ∣ k ） ‖_{Q}^{2} ⩾ 0 ，‖ Δ \bar{u} （ k ∣ k ） ‖_{R}^{2} ⩾ 0 ，

可进一步得到

V_{1}^{*} - V_{0}^{*} = - ‖ (\bar{ϑ} （ k + 1 ∣ k ） ‖_{Q}^{2} - ‖ Δ \bar{u} （ k ∣ k ） ‖_{R}^{2} ⩽ 0 ，

即证明了所定义的李亚普诺夫函数是递减的，即在所提出控制下的闭环系统稳定.

证毕.

至此，对所提出的基于CNN参数回归的移动机器人原对偶神经网络预测控制方法进行了设计和证明，得到如下PDNN-MPC求解算法流程:

步骤 1 初始化: 在k = 0时，初始化结构参数 Q、R、采样时间T以及其他固定的模型参数.

步骤 2 生成参考路径，并利用CNN辨识系统参数

{\bar{C}}_{f} ， {\bar{C}}_{r}

以更新系统模型.

步骤 3 针对移动机器人轨迹跟踪问题建立待解QP问题，并提供矩阵M， P.

步骤 4 为获得系统的最优解，采用PDNN来实时求解带约束的QP问题.

步骤 5 更新机器人位置与速度等信息.

步骤 6 判断是否到达终点，若机器人继续前进，则令k = k + 1，重复步骤2–6.

接下来将对移动机器人的CNN侧偏刚度估计和基于PDNN-MPC轨迹跟踪效果进行验证.

4 仿真

本文基于MATLAB/SIMULINK和Carsim协同仿真平台进行了仿真. 在Carsim平台上搭建HatchbackB级实验平台获得实验数据，并进行参数回归模型构建. 在轨迹跟踪控制中，利用MATLAB/SIMULINK平台进行仿真，设计移动机器人在模型不确定的条件下的轨迹跟踪仿真.

4.1 参数估计结果

如第3节所述，本文利用深度学习方法对轮胎侧偏刚度系数进行学习. 为了获得轮胎参数数据，在Carsim平台上执行多种驾驶场景并收集数据进行训练，通过经典MPC控制器控制移动机器人在不同速度和参考轨迹下运动，再由Carsim导出神经网络模型训练所需要的输入输出数据.

经过数据采集与预处理，最终得到包含12572个数据点的数据集，其中80%用于训练，20%用于验证. 本文选择使用MATLAB的Deep Learning Toolbox进行训练，训练时采取sgdm求解器，batchsize大小选为32，共训练2000个Epoch，初始学习率α选为0.01，每训练 800次学习率下降十倍. 该模型能够在不过度拟合的情况下学习数据，损失和训练损失很快就降低到了 10⁻²数量级. 最终的验证损失值降到了0.0049，而训练损失降到了0.0034. 另外，图4给出了C_f，C_r的参数拟合效果，结果表明所提出的CNN回归模型可以较好地估计模型参数.

图4基于CNN的模型参数C_f，C_r拟合效果图

Fig.4C_f, C_r fitting effect based on CNN model

4.2 控制结果

为验证PDNN-MPC控制效果，选择控制时域和预测时域分别为N_C = 2，N_p = 10，权重矩阵分别为 Q = diag{0.5，0，1，0，0，0}，R = diag{1，1}，选择采样时间为 T = 100 ms，质量 m = 1732 kg，惯性系数 I_z= 4175 kg·m²，前悬长度l_f = 1.14 m，后悬长度l_r = 1.16 m，后轮间距 L= 2.4 m，PDNN 中决策系数 γ = 1.5，控制量的约束为

u_{m a x} = [\begin{matrix} 25 \\ 4 \end{matrix}] ， u_{m i n} = - [\begin{matrix} 25 \\ 4 \end{matrix}] ，

控制增量的约束为

Δ u_{m a x} = [\begin{matrix} 1.06 \\ 0.092 \end{matrix}] ， Δ u_{m i n} = - [\begin{matrix} 1.06 \\ 0.092 \end{matrix}] ，

仿真过程中目标跟踪速度为 v_ref = 10 m/s.

本文对移动机器人进行一种给定参考路径的轨迹跟踪控制，并将本文提出的方法与经典MPC、线性二次调节控制方法（linear quadratic regulator，LQR）以及文献 ^[22] 中基于BP神经网络的MPC方法进行了对比，选取的参考轨迹满足模型的运动学模型（1），移动机器人的初始位置为[0，0].

参考轨迹下移动机器人的运动轨迹如图5所示，结果表明本文所述方法具有最好的轨迹跟踪效果. 表1横纵向误差做了量化分析，给出了误差最大值与误差的均方根值，可以看到量化分析下本文所述方法均方根误差与最大误对移动机器人的差均为最小.

横纵向误差在内的各状态量与控制量分别如图6所示，系统的6个误差变量均收敛到0，同时本文方法的横纵跟踪误差均为最小，说明本文所提出的求解方法得到了更好的优化效果，且可以看到MPC控制下的系统在转向控制上更加平稳. 综合考虑横纵跟踪误差以及各状态的收敛情况，可以看到，本文提出的控制策略的跟踪效果优于经典MPC方法、LQR方法，以及基于BP神经网络的MPC方法.

图5移动机器人轨迹跟踪效果及和已有方法的对比

Fig.5Trajectory tracking performance for mobile robot and comparisons with existing methods

表1不同方法的误差均方根和误差最大值

Table1Root mean square error and maximum error for different methods

5 总结

本文针对轮式移动机器人设计了一种基于MPC的自适应控制策略，建立了轮式机器人的误差状态空间模型，包括轮胎侧偏刚度的不确定性. 同时，提出了一种基于机器学习的数据驱动方法，利用易测得的测量参数实现对车轮侧偏刚度的实时估计、预测. 此外，MPC中的优化问题可以被转化为QP问题，利用PDNN 进行该问题的高效求解，并进行了控制算法稳定性的证明. 最终，本文针对移动机器人的轨迹跟踪问题，利用MATLAB/SIMULINK仿真平台进行控制算法的测试，结果表明所采取的控制器性能良好，能在确保轨迹跟踪精度的同时使得控制变量满足约束. 未来的研究将针对移动机器人的不确定性开发基于数据驱动的MPC，并在更加复杂的场景下进行实验.

图6移动机器人各状态量与控制量以及和已有方法的对比

Fig.6State and control quantities of mobile robot and comparisons with existing methods

图1移动机器人动力学模型

Fig.1Kinetic model of wheeled mobile robots

下载: 全尺寸图片

图2本文控制结构图

Fig.2Control structure diagram of this work

下载: 全尺寸图片

图3PDNN求解二次规划问题结构图

Fig.3PDNN structure diagram for solving QP problem

下载: 全尺寸图片

图4基于CNN的模型参数C_f，C_r拟合效果图

Fig.4C_f, C_r fitting effect based on CNN model

下载: 全尺寸图片

图5移动机器人轨迹跟踪效果及和已有方法的对比

Fig.5Trajectory tracking performance for mobile robot and comparisons with existing methods

下载: 全尺寸图片

图6移动机器人各状态量与控制量以及和已有方法的对比

Fig.6State and control quantities of mobile robot and comparisons with existing methods

下载: 全尺寸图片

表1不同方法的误差均方根和误差最大值

Table1Root mean square error and maximum error for different methods

下载: 全尺寸图片

图1移动机器人动力学模型

Fig.1Kinetic model of wheeled mobile robots

图2本文控制结构图

Fig.2Control structure diagram of this work

图3PDNN求解二次规划问题结构图

Fig.3PDNN structure diagram for solving QP problem

图4基于CNN的模型参数C_f，C_r拟合效果图

Fig.4C_f, C_r fitting effect based on CNN model

图5移动机器人轨迹跟踪效果及和已有方法的对比

Fig.5Trajectory tracking performance for mobile robot and comparisons with existing methods

图6移动机器人各状态量与控制量以及和已有方法的对比

Fig.6State and control quantities of mobile robot and comparisons with existing methods

表1不同方法的误差均方根和误差最大值

Table1Root mean square error and maximum error for different methods

图(6) / 表(1)

引用本文

张浪文, 王中旭, 魏海翔, 等. 移动机器人轨迹跟踪的参数估计与原对偶神经网络预测控制. 控制理论与应用, 2026, 43(2): 278 – 286

复制

ZHANG Langwen, WANG Zhongxu, WEI Haixiang, et al. Trajectory tracking of mobile robots based on parameter estimation and primal-dual neural network predictive control. Control Theory & Applications, 2026, 43(2): 278 – 286

Copy

计量

图1移动机器人动力学模型

Fig.1Kinetic model of wheeled mobile robots

图2本文控制结构图

Fig.2Control structure diagram of this work

图3PDNN求解二次规划问题结构图

Fig.3PDNN structure diagram for solving QP problem

图4基于CNN的模型参数C_f，C_r拟合效果图

Fig.4C_f, C_r fitting effect based on CNN model

图5移动机器人轨迹跟踪效果及和已有方法的对比

Fig.5Trajectory tracking performance for mobile robot and comparisons with existing methods

图6移动机器人各状态量与控制量以及和已有方法的对比

Fig.6State and control quantities of mobile robot and comparisons with existing methods

表1不同方法的误差均方根和误差最大值

Table1Root mean square error and maximum error for different methods

XU Yang, LU Liping, CHU Ruifeng,et al. Unified modeling of trajectory planning and tracking for unmanned vehicle. Acta Automatica Sinica,2019,45(4):799-807.(徐杨, 陆丽萍, 褚端峰, 等. 无人车辆轨迹规划与跟踪控制的统一建模方法. 自动化学报,2019,45(4):799-807.)

GU Wanli, HU Yunfeng, GONG Xun,et al. Trajectory tracking control of mobile robot with parameter uncertainties. Control and Decision,2019,34(1):81-88.(顾万里, 胡云峰, 宫洵, 等. 考虑参数不确定性的移动机器人轨迹跟踪控制. 控制与决策,2019,34(1):81-88.)

ZHENG K, GLAS D F, KANDA T,et al. Designing and implementing a human-robot team for social interactions. IEEE Transactions on Systems, Man,and Cybernetics: Systems,2013,43(4):843-859.

ZHANG Shouwu, WANG Heng, CHEN Peng,et al. Overview of the application of neural networks in the motion control of unmanned vehicles. Chinese Journal of Engineering,2022,44(2):235-243.(张守武, 王恒, 陈鹏, 等. 神经网络在无人驾驶车辆运动控制中的应用综述. 工程科学学报,2022,44(2):235-243.)

DUAN Yanjie, LÜ Yisheng, ZHANG Jie,et al. Deep learning for control: The state of the art and prospects. Acta Automatica Sinica,2016,42(5):643-654.(段艳杰, 吕宜生, 张杰, 等. 深度学习在控制领域的研究现状与展望. 自动化学报,2016,42(5):643-654.)

XIAO X, LIU B, WARNELL G,et al. Motion planning and control for mobile robot navigation using machine learning: A survey. Autonomous Robots,2022,46(5):569-597.

ZHU Yi, ZHANG Tao, SONG Jingyan. Path planning for nonholonomic mobile robots using artificial potential field method. Control Theory & Applications,2010,27(2):152-158.(朱毅, 张涛, 宋靖雁. 非完整移动机器人的人工势场法路径规划. 控制理论与应用,2010,27(2):152-158.)

QU Yi, XU Fang, YU Shuyou,et al. Model predictive control based on extended state observer for vehicle yaw stability. Control Theory & Applications,2020,37(5):941-949.(曲逸, 许芳, 于树友, 等. 基于扩张状态观测器的车辆横摆稳定模型预测控制器设计. 控制理论与应用,2020,37(5):941-949.)

ZHAO Huichao, SHI Wuxi. Trajectory tracking of mobile robot based on variable gain fuzzy PID control. Automation & Instrumentation,2020,35(2):32-36,51.(赵会超, 师五喜. 基于变增益模糊PID控制的移动机器人轨迹跟踪. 自动化与仪表,2020,35(2):32-36,51.)

ZHANG L, WANG B, LI Y,et al. Distributed stochastic model predictive control for cyber-physical systems with multiple state delays and probabilistic saturation constraints. Automatica,2021,129:109574.

ZHANG L, WANG B, ZHENG Y,et al. Robust packetized MPC for networked systems subject to packet dropouts and input saturationwith quantized feedback. IEEE Transactions on Cybernetics,2022,53(11):6987-6997.

WANG W, ZHANG Y, YANG C,et al. Adaptive model predictive control-based path following control for four-wheel independent drive automated vehicles. IEEE Transactions on Intelligent Transportation Systems,2021,23(9):14399-14412.

DAI Y, YU S, YAN Y,et al. An EKF-based fast tube MPC scheme for moving target tracking of a redundant underwater vehiclemanipulator system. IEEE/ASME Transactions on Mechatronics,2019,24(6):2803-2814.

KEBBATI Y, AIT-OUFROUKH N, PUIG V,et al. Autonomous driving using GA-optimized neural network based adaptive LPV-MPC controller.2022 IEEE International Conference on Networking, Sensing and Control(ICNSC). Shanghai: IEEE,2022:1-6.

CHEN Y, LI Z, KONG H,et al. Model predictive tracking control of nonholonomic mobile robots with coupled input constraints and unknown dynamics. IEEE Transactions on Industrial Informatics,2018,15(6):3196-3205.

GONG Jianwei, LIU Kai, QI Jianyong. Model Predictive Control for Self-Driving Vehicles. Beijing: Beijing Institute of Technology Press,2020.(龚建伟, 刘凯, 齐建永. 无人驾驶车辆模型预测控制. 北京: 北京理工大学出版社,2020.)

ZHAO Xijun, CHEN Huiyan. A study on lateral control method for the path tracking of intelligent vehicles. Automotive Engineering,2011,33(5):382-387.(赵熙俊, 陈慧岩. 智能车辆路径跟踪横向控制方法的研究. 汽车工程,2011,33(5):382-387.)

PACEJKA H B, BESSELINK I J M. Magic formula tyre model with transient properties. Vehicle System Dynamics,1997,27(S1):234-249.

ZHOU Feiyan, JIN Linpeng, DONG Jun. Review of convolutional neural network. Chinese Journal of Computers,2017,40(6):1229-1251.(周飞燕, 金林鹏, 董军. 卷积神经网络研究综述. 计算机学报,2017,40(6):1229-1251.)

RAJAMANI R. Vehicle Dynamics and Control. NewYork: Springer Science & Business Media,2011.

ZHANG Y, GE S S, LEE T H. A unified quadratic-programmingbased dynamical system approach to joint torque optimization of physically constrained redundant manipulators. IEEE Transactions on Systems, Man,and Cybernetics, Part B(Cybernetics),2004,34(5):2126-2132.

WANG Y, GUO Z, WU J,et al. Research on vehicle adaptive cruise control based on BP neural network working condition recognition. The Journal of Engineering,2022,2022(2):132-147.