摘要
针对铝电解过程强干扰和强时变导致模型精确度和稳定性不佳的难题, 本文提出一种基于自适应双层无迹卡尔曼滤波神经网络的建模方法. 该方法首先构建一种双层无迹卡尔曼滤波神经网络模型, 以提高模型对扰动系统的稳定性. 具体为: 使用双层无迹卡尔曼滤波在线更新神经网络的权值和阈值; 然后, 在双层无迹卡尔曼滤波神经网络的状态变量均方误差中引入约束调节参数; 同时, 采用梯度下降法自适应调整比例调节参数, 将其均方误差约束至较小的范围内, 以此来削弱滤波递归计算过程中误差累积对模型的影响; 最后, 通过铝电解电流效率预测, 验证了本文所提方法具有较高的精确度和稳定性.
Abstract
This paper presents a novel modeling method based on an adaptive double layer unscented Kalman filter neural network (ADLUKFNN), which tackles the challenges of poor model accuracy and stability resulting from strong interference and time-varying disturbances in the aluminum electrolysis process. Firstly, this method constructs a double layer unscented Kalman filter neural network (DLUKFNN) model to enhance the stability of the model towards the disturbance system. Specifically, the weights and thresholds of the neural network are updated online using the double layer unscented Kalman filter. Then, a constraint adjustment parameter is introduced into the mean square error of the state variables in DLUKFNN. Meanwhile, by employing the gradient descent method to adaptively adjust the constraint adjustment parameter, the mean square error is constrained within a smaller range, thereby weakening the impact of error accumulation during the filtering recursive calculation on the model. Finally, the accuracy and stability of the proposed method are verified through aluminum electrolysis current efficiency prediction.
1 引言
我国原铝产量和消费量连续十几年保持世界第一,但我国流程工业单位GDP能耗、物耗和污染排放较发达国家仍有较大差距 [1] . 提高电流效率是铝电解过程重要的生产目标之一,同时,也是降低能耗的关键因素. 目前,研究者主要从改善硬件性能和优化槽控参数两个方面提高电流效率 [2-3] . 显然,改善硬件设备性能需要投入大量人力财力资源,对于中小铝电解企业并不现实. 相对改善硬件设备,优化槽控参数可以在原有设备基础之上,实现提高电流效率的目标. 但前提是需要有准确且可靠的建模技术,用于描述槽控参数和电流效率之间的潜在关系. 因此,研究稳定性高、精确度高的铝电解电流效率建模技术,对铝电解实际工业生产具有重要意义.
人工神经网络(neural network,NN)基于其卓越的非线性拟合能力,已经在铝电解过程建模中具有丰富的研究. 例如: 卷积神经网络用于铝电解过热度检测 [4]; 长短时记忆神经网络用于铝电解槽阳极效应预测和锅温检测 [5-6]; 模糊神经网络制定氟化铝添加策略 [7] . 但是,实际槽控参数优化过程需要在铝电解生产系统频繁波动的情况下,实时求解最优槽控参数. 传统NN已被证实属于静态建模方法 [8] . 由于铝电解过程内外部干扰因素众多 [9],因此,若想建立精确的铝电解过程模型,需要结合传统NN优点的同时,具备对系统的自适应学习能力. 基于这种需求,学者提出使用扩展卡尔曼滤波(extended Kalman filter,EKF)、无迹卡尔曼滤波(unscented Kalman filter,UKF)和粒子滤波(particle filter,PF)在线更新NN的权值和阈值. 文献 [10] 中介绍相较于传统反向传播学习算法,EKF 实时训练NN参数具有更快的收敛性; 文献 [11-12] 设计了一种强跟踪UKF神经网络,并将其用于铝电解过程建模,相较于传统NN具有更高的鲁棒性; 文献 [13] 采用UKF训练径向基神经网络的权重、中心值和宽度,并将该方法应用于抽油机故障诊断,实验结果表明该方法可有效提高抽油机故障诊断地准确性; 文献 [14-16] 使用PF实时训练NN的权值和阈值,其建立的粒子滤波神经网络(particle filter NN,PFNN)能较高精确度预测铝电解能耗. 但是,上述滤波中,EKF已被证实在处理强非线性系统时精确度和稳定性远不如 UKF [17-18] . PF中粒子退化和重要性函数的选取仍是研究的难点问题 [19-21] . 同时,在复杂系统中,PF需要大量的粒子逼近系统会显著增加模型计算负担 [22-23] . 相较于PF,UKF采用一组确定粒子逼近系统的均值和方差,不会产生粒子退化的同时可以达到泰勒三阶精确度 [24] .
需要指出的是,滤波神经网络搭建状态空间方程时,状态变量一步预测过程不包含系统的时变信息. 当模型遭遇突变扰动时,模型稳定性会降低. 文献 [25] 提出一种双层无迹卡尔曼滤波(double layer UKF,DLUKF)方法,其主要思想之一是将现场量测值修正过的内层滤波结果作为外层的初始信息,这则可以看作模型已经包含了系统的时变信息. 因此,本文利用 DLUKF 实时训练 NN的权值和阈值,构建了一种双层无迹卡尔曼滤波神经网络(double layer UKFNN,DLUKFNN)方法,用于解决状态变量一步预测过程中未包含系统时变信息的难题. 同时,DLUKFNN的估计状态变量经过两次现场量测值的修正,能够进一步加强模型对扰动的自适应性. 另外,DLUKFNN并未改变UKF计算的核心过程,本质仍是一种递归的估计方法. 由于递归计算过程中,第k 时刻估计时会考虑历史时刻的值,随着滤波次数的增加,存在误差累积的情况. 为此,本文以DLUKFNN的状态变量均方误差最小为目标,设计了一种自适应策略,进一步提高模型精确度. 综上所述,本文主要创新和贡献如下:
1)利用 UKF对动态系统的跟踪能力,赋予传统 NN动态性能,具体为: 将NN的权值阈值作为UKF的状态变量,输出作为其量测变量. 为提高模型对扰动系统的稳定性,提出使用DLUKF实时训练NN的权值和阈值.
2)为改善DLUKFNN中的误差累积,提出一种状态变量的均方误差自适应调整策略. 在DLUKFNN中引入约束调节参数,并结合状态变量均方误差构建代价函数. 然后,采用梯度下降法自适应调整约束调节参数,削弱因滤波次数增加而产生的误差累积.
3)结合上述两种策略,构建自适应双层无迹卡尔曼滤波神经网络(adaptive DLUKFNN,ADLUKFNN)的建模机制与完整架构,并建立铝电解槽工艺电流效率动态预测模型. 同时,以重庆某铝厂电解车间工艺系统为例,采集9种主要铝电解过程槽控变量进行电流效率建模. 从拟合实验、随机实验和人为扰动3个角度评判所提模型对扰动系统的稳定性和精确度. 实验结果表明,ADLUKFNN具有较高的预测精度和稳定性.
2 ADLUKFNN动态预测模型设计
2.1 DLUKFNN算法设计及分析
将NN权值和阈值作为UKF的状态变量,将NN预测输出作为UKF的预测量测变量,详细无迹卡尔曼滤波神经网络(unscented Kalman filter neural network,UKFNN)算法可以参考文献 [11] . UKFNN 状态空间方程表示为
(1)
式中:和分别表示第k时刻的状态变量和量测变量; uk表示第k时刻输入变量. qk−1 和rk分别表示第k时刻和k − 1时刻的系统噪声和量测噪声,且两者互不相关. 本文假设qk−1和rk服从均值为0,协方差分别为和的高斯白噪声. f(·)为 NN前馈传播网络结构.
基于式(1)状态空间方程,将DLUKFNN动态预测模型的详细实施步骤描述如下:
步骤 1 初始化状态变量.
(2)
步骤 2 sigma对称采样.

(3)
步骤 3 状态预测.

(4)
步骤 4 状态校正.

(5)
步骤 5 将和作为下层滤波的初始信息,定点再次进行sigma对称采样.

(6)
步骤6再次进行步骤2至步骤5过程,得到k时刻下层估计状态变量和预测协方差.
步骤 7更新NN权值和阈值; 同时,按式(7)进行NN前馈计算.
(7)
步骤 8 重复步骤2至步骤7过程. 此外,本文使用工业实况数据对模型进行验证. 当采集的数据运行完毕,模型停止运行.
上述式子中: 上标*表示上层UKF计算结果,**表示下层UKF计算结果; x表示状态变量; Σ表示协方差矩阵; k 表示时刻; zk 表示第 k 时刻的现场量测值; 采用 Cholesky分解得到,i 表示的第 i列; 和表示采样点对应均值和协方差的权值,i表示第i个采样点; n表示状态变量维度; a决定sigma点与均值距离的大小; γ 为自由度参数; 表示第i个输入与第j个隐含层神经元在第k时刻的连接权值; 表示第j个隐含层神经元与第s个输出层神经元在第k时刻的连接权值; 表示输出层神经元在第k时刻的阈值; ui,k表示k时刻的第i个输入参数; 9表示输入层具有9个神经元; 12表示隐含层具有12个神经元.
UKFNN状态空间方程一步预测过程不包含系统的时变信息. UKFNN的权值和阈值为其估计状态变量,而估计状态变量通过一步预测值与在线量测值进行融合计算而得到,若估计状态变量中缺乏系统的时变信息,NN前馈计算时会存在较大的参数不确定性. 而从上述DLUKFNN搭建过程可知,DLUKFNN将上层滤波结果作为下层滤波的初始信息,则下层滤波结果中包含了系统的时变信息. 同时,DLUKFNN估计状态变量经过两次现场量测值的修正,对系统时变和环境扰动更具备自适应性. 综合上述策略,图1给出了 DLUKFNN模型框架.
2.2 ADLUKFNN算法设计及分析
UKF是一种基于最小均方误差原则的递推算法. 其中,DLUKFNN状态变量预测误差斜方差矩阵表示为
(8)
式中: n表示状态变量维度; 表示状态变量最优估计值和真实值之差,表示为
(9)
式(8)中,对角线和即为状态变量的均方误差. 根据最小均方误差原则,状态变量的均方误差和即应满足趋于极小值. 其中tr表示矩阵的迹. 但是,UKF在进行第k时刻估计时,会考虑k时刻之前的所有数据,随着滤波次数的增加会出现误差累积的情况. 而DLUKFNN并不改变UKF计算的核心过程,因此,误差累积依然存在.
图1DLUKFNN算法框架
Fig.1Algorithm framework of DLUKFNN
梯度下降法使用迭代计算的方式,不断调整参数取值,能够使目标函数的值不断减小. 受此启发,本文在DLUKFNN状态变量的先验预测方差和量测预测方差中引入两个约束调节参数,并构建代价函数. 然后,使用梯度下降法自适应调整该两个约束调节参数. 期望能够将代价函数值约束至较小范围内,以此来迫使DLUKFNN状态变量均方误差逼近较小的理想值.
将上述自适应策略优化DLUKFNN的具体实施步骤阐述如下:
步骤 1 执行DLUKFNN得到和
步骤 2 更新NN的权值和阈值. 同时,按式(7)NN前馈计算;
步骤 3 在DLUKFNN的状态变量估计方差中,引入两个约束调节参数,并构造式(10)代价函数,即
(10)
式中: µk和νk为第k时刻估计状态变量方差的约束调节参数,上标2表示平方.
步骤 4 基于式(10),约束调节参数µk和νk使用梯度下降法更新;
(11)
即
(12)
式中: learn表示学习率,k表示时刻.
步骤 5 使用µk和νk更新 DLUKFNN估计状态变量的方差. 将和的对角线值分别写作向量Ak和Bk. 使用步骤4得到的µk和νk,按照式(13)更新Ak和Bk,即
(13)
式中和表示更新后的Ak和Bk,最终状态变量方差的更新应为
(14)
为了和原DLUKFNN预测状态变量协方差区分,将更新后的估计状态变量协方差写为
注 1 将向量Ak和Bk写为
(15)
取向量Ak和Bk中任意一个元素,比如a1和b1,按照式(12),其更新方式写为

(16)
式中和分别表示更新后的a1,k和b1,k,按照式(14)将 写为
(17)
其中,根据式(10)可知,b1为负值. 因此,并不能保证更新后的始终为正. 为此,需要对每个状态变量方差更新时加入大于0的约束条件,保证每个状态变量方差更新过程中均大于0. 由于状态变量方差为预测协方差矩阵的对角线值,也即该矩阵的特征值. 对于实对称矩阵来说,如果矩阵特征值大于0,也能保证矩阵的正定性.
注 2 根据式(10)可知,构造的代价函数为标准凸函数形式,梯度将沿着梯度减小的方向变化. 因此,能达到状态变量约束方差中“误差累积”的情况.
步骤 6 重复步骤1至步骤5过程.
步骤 7 当J(µk,νk)达到预设极小值时,停止步骤3至步骤5过程. 此外,本文使用工业实况数据验证模型的有效性. 当采集的数据运行完毕,模型停止运行.
综合上述策略,图2给出了ADLUKFNN模型框架.
图2ADLUKFNN算法框架
Fig.2Algorithm framework of ADLUKFNN
3 铝电解电流效率建模应用实验
3.1 实验对象
本文采用重庆某铝制造车间铝电解装备作为实验对象,如图3所示. 电流效率定义为单位时间电解产出铝质量和按照法拉第定律计算的理论产出之比 [26],实际生产过程中,希望电流效率能够尽可能接近100. 使用数学模型优化槽控参数的前提是需要建立的数学模型实时指导求解最优槽控参数,使得槽内始终保持物料和能量的平衡,只有在这种情况下电流效率才会尽可能地高. 分析铝电解生产过程,得到影响电流效率的主要槽控参数有系列电流、工作电压、打壳下料次数(number of break-Offs,NB)、分子比、铝水平、电解质水平、槽温度、实际出铝和氟化盐日用量 [14],表1为截取的部分样本.
原始数据共1757组,将数据采集过程中存在的两类明显无效异常值: 1)电流效率小于 10或大于 100; 2)大面积空白缺失,作删除处理. 对氟化盐日用量缺失值,采用插值法补齐 [27] . 按照该两种方式处理后数据总1539组. 为还原铝电解过程的复杂性和扰动性,本实验将保留输入数据波动较大的值如表格中加粗部分. 同时,也保留原始数据的时间顺序,以此来验证模型对强时变系统的稳定性. 由于数据采集量纲不同,对该1539组数据进行0–1归一化处理 [11,28] .
图3电解槽结构示意图
Fig.3Schematic diagram of the structure of the aluminum electrolytic cell
3.2 动态建模
为验证本文所提 ADLUKFNN 方法的有效性,依托上述实验对象,在相同数据样本和仿真平台(Python 3.9)条件下,同经典的反向传播人工神经网络(back propagation NN,BPNN)[29]算法、PFNN和UKFNN开展对比实验. 实验所涉及的网络结构均构建为9–12–1 形式. 因此,可以计算得出NN的权值和阈值总参数为 133个,即状态变量维数为133. 其中,9为网络输入,在本文中则为筛选出的9种关键槽控参数,12为隐含层神经元个数,1为输出层神经元个数. 隐含层激活函数设置为 sigmoid,输出层激活函数设置为 relu. 其中,PFNN分别使用100,300和500个粒子观察粒子数量同模型精确度的联系,由PFNN(100),PFNN(300)和PFNN(500)表示. 此外,将上述数据集前1489组数据作为训练集,后50组数据作为测试集.
表1电解槽数据样本
Table1Sample of electrolytic cell data
3.3 结果和讨论
本文中,构建的NN结构输出层节点为1,即模型的预测电流效率值. 因此,使用拟合评价指标衡量各模型预测性能. 文中,平均绝对误差(mean absolute error,MAE)、误差平方和(sun of squared errors,SSE)和相对误差(relative error,RE)评价模型预测精度,确定系数(correlation of coefficient,R)衡量模型拟合能力.
图4给出了BPNN,PFNN,UKFNN在测试集中的拟合效果. BPNN基于反向传播算法,使用训练集获得一组最优权值和阈值. 从图4(a)看出,BPNN在测试集中的拟合效果并不理想. 究其原因为当系统时变或遭受扰动后,该组使用历史数据(训练集)获得的最优权值和阈值便不再满足本时刻预测要求. 此外,图4(b)–(d)显示,PFNN随着粒子数量的增加其拟合效果逐步提升,UKFNN采用固定粒子数近似系统分布,根据上述状态变量维度可以计算得出其粒子数为 133 × 2+ 1 = 267,即当 PFNN 粒子数为 300时,应和 UKFNN 拟合效果相当. 然而,图4和表2显示,当PFNN粒子数为300时,UKFNN的拟合效果优于 PFNN. 此外,PFNN粒子数为500时,和UKFNN拟合效果相当,但表2显示,其计算耗时明显高于UKFNN. 由于PFNN的重要性函数选取仍是目前研究的难点问题,本文使用最优重要性函数 [30] 构建PFNN,该方法缺乏现场值对重要性函数的修正,其实验结果并不稳定. 综合考虑铝电解过程建模时效和精度要求,本文研究基于UKFNN铝电解过程电流效率预测模型构建方法.
表1截取实验数据样本显示,铝电解过程蕴含较大的异常扰动. 因此,需要模型即使面临异常扰动时仍能保持较高的预测性能,则要求状态变量(NN的权值和阈值)跟随工况进行自适应调整. 而DLUKFNN的主要特点是采用两次现场量测值修正状态变量,故较 UKFNN而言,其状态变量更符合系统当前时刻特点. 与此同时,DLUKFNN将上层滤波结果作为下层滤波初始信息,也能解决状态空间方程一步预测过程未包含系统时变信息的弊端. 图5给出了 DLUKFNN和 ADLUKFNN在测试集上的拟合效果,图5(a)显示,DLUKFNN在测试集上拟合效果较好. 此外,ADLUKFNN对DLUKFNN状态变量的预测均方误差构建了一种代价函数,使用梯度下降法迫使其值逼近于较小的理想值. 图5(c)给出了两者的MAE,图5(c)显示,ADLUKFNN 相较于DLUKFNN 其MAE得到了进一步降低.
图4不同模型拟合效果
Fig.4The fitting effect of different models
表2不同模型相关性能指标比较
Table2The comparison of related performance indicators from different models
图5DLUKFNN和ADLUKFNN的拟合效果
Fig.5The fitting effect of DLUKFNN and ADLUKFNN
PFNN和UKFNN的现场量测值会对状态变量不断修正,原则上两者在测试集和训练集上均能获得良好的预测性能. 因此,表2和图6分析了各模型所有样本的预测性能. 表2显示,BPNN 运行时间最短. 但是其 MAE和SSE最大,R最小. 因此,预测误差较大,BPNN 不能满足铝电解过程高精度建模需求. PFNN随着粒子数量的增加,其拟合效果逐步提高,当粒子数量为 500时,其MAE 稍小UKFNN. 但是,其SSE大于UKFNN,R稍小于UKFNN,即PFNN存在部分预测值更大偏离实际值得情况. 同时,在时效性上,UKFNN表现出更大的优势.
图6不同模型的误差统计分析
Fig.6Statistical analysis of errors in different models
表2显示,DLUKFNN相较于UKFNN其精确度得到了较大的提升,其MAE降低了约3.5倍,SSE则降低了约16.4倍. 此外,对DLUKFNN采用误差自适应策略后,运行时间在可接受的范围内有一定增加,但是,其MAE降低了约1.2倍,SSE降低了约1.4倍. 同时,ADLUKFNN在各模型中的误差最大值(Max)和误差最小值(Min)之间距离最短,即误差集中于较小的范围内. 图6显示,DLUKFNN和ADLUKFNN将所有样本的MAE分布于0.0至0.1之间,集中于0.05 至0.06左右. RE分布于−0.14 至0.02之间,集中于−0.06至−0.04 左右. 同时,图6显示,ADLUKFNN相较于DLUKFNN 其误差均有一定程度的降低. 综合上述,ADLUKFNN 预测性能最佳.
此外,由于网络的初始值是随机产生的,因此,每次实验结果具有一定的随机性. 为了避免上述实验结果的偶然性,对各模型开展15次独立随机实验. 本文采用最优重要性函数构建PFNN,该方法由于缺乏现场值对重要性函数的修正. 因此,其实验结果并不稳定. BPNN基于训练集获得最优权值和阈值后不再改变. 因此,不再对PFNN和BPNN开展独立随机实验. 图7统计了各模型的MAE和SSE.
图7(a)显示,15次随机实验中,DLUKFNN的MAE 最低可以达到0.0568左右,最高不超过0.0588. 而ADLUKFNN 的MAE最低能达到0.0476左右,最高不超过0.0492.
图7随机实验分析
Fig.7Analysis of random experiments
图7(b)显示,DLUKFNN的SSE最低能达到5.00左右,最高不超过5.35,而ADLUKFNN的SSE最低能达到3.50,最高不超过3.75. 由此可见,即使在随机实验下,ADLUKFNN的预测误差并没有产生过大的波动.
铝电解生产过程具有较多的人为操作,如阳极更换和出铝等 [12] . 因此,槽内具有较强的时变性和扰动性. 为了进一步验证所提模型对铝电解生产系统时变和扰动的自适应性,对UKFNN,DLUKFNN和ADLUKFNN的输入数据按照X =X+ d ×rand(m,n)×X 的方式施加人为扰动. 其中: X为输入数据,rand为(−1,1)均匀分布的随机数,m 为1539,n为9,d是扰动因子. 本文中, d 分别取 5%,10%,15%,20%,25%,30%,35%,40%,45%,50%. 图8显示,当面临不同程度的人为干扰时,DLUKFNN 相较于 UKFNN,能够将MAE压缩至更小范围之内,另外,ADLUKFNN相较于DLUKFNN也将MAE压缩至更小的范围之内. 因此,即使ADLUKFNN面临不同程度的人为干扰时,依然能保持最高的预测性能,再次证明了本方法的有效性.
图8扰动实验MAE统计分析
Fig.8MAE statistical analysis of perturbation experiment
4 结论
本文旨在建立一种稳定且可靠的铝电解过程电流效率预测模型. 首先,提出采取双层结构的无迹卡尔曼滤波更新人工神经网络权值和阈值,以此来提高模型对铝电解这种强扰动和强时变系统的稳定性. 然后,以DLUKFNN状态变量的均方误差最小为目标,构建了一种自适应策略. 以此来削弱DLUKFNN中误差累积对模型的影响,进一步提高模型的精确度. 最后,本文使用上述策略搭建了铝电解过程电流效率动态预测模型,使用拟合实验、随机实验和人为扰动实验证实了DLUKFNN和ADLUKFNN具有对扰动系统的稳定性和预测准确性.
在后续研究工作中,将进一步探索精度和计算复杂度平衡的难题. 同时,将进一步考虑融合能耗、电流效率、炭排放等生产与环保指标,建立一个平衡多指标的系统优化模型,并探索多指标预测问题中精度和计算复杂度平衡的难题.