欢迎访问《控制理论与应用》期刊网站！

双空间特征自适应融合的故障检测方法

doi: 10.7641/CTA.2024.30492

刘美枝^1,2 ，孔祥玉¹ ，安秋生³ ，罗家宇¹

1. 火箭军工程大学导弹工程学院, 陕西西安 710025

2. 山西大同大学物理与电子科学学院, 山西大同 037009

3. 山西师范大学数学与计算机科学学院, 山西临汾 041004

基金项目: 国家自然科学基金项目(62273354, 61673387), 山西省高等学校科技创新项目(2022L434)资助.

详细信息

作者简介

刘美枝讲师,博士研究生,目前研究方向为复杂系统特征提取、数据驱动的故障检测与诊断研究,E-mail: lmzdtdx@163.com;

孔祥玉教授,博士生导师,目前研究方向为随机系统分析、非线性系统建模及其应用、复杂系统故障检测与诊断等研究,E-mail: xiangyukong01@163.com;

安秋生教授,博士,硕士生导师,目前研究方向为数据库理论、粗糙集、故障检测与诊断研究,E-mail: aaqqss@sina.com;

罗家宇博士研究生,目前研究方向为数据驱动的复杂系统下故障监测与诊断等研究,E-mail: 540629964@qq.com.

通信作者

孔祥玉，E-mail: xiangyukong01@163.com;Tel.:+8613593021015.

Fault detection method with adaptive fusion of dual-space features

LIU Mei-zhi^1,2 ， KONG Xiang-yu¹ ， AN Qiu-sheng³ ， LUO Jia-yu¹

1. School of Missile Engineering, Rocket Force University of Engineering, Xi’an Shaanxi 710025 , China

2. School of Physics and Electronic Science, Shanxi Datong University, Datong Shanxi 037009 , China

3. School of Mathematics and Computer Science, Shanxi Normal University, Linfen Shanxi 041004 , China

Funds: Supported by the National Natural Science Foundation of China (62273354, 61673387) and the Science and Technology Innovation Project of Colleges and Universities in Shanxi Province (2022L434).

摘要

对于大型复杂工业过程, 因其结构复杂, 过程变量往往呈现混合相关性, 单一模型无法精确表征变量之间的混合相关性, 导致故障检测中存在大量漏报或误报. 针对该问题, 本文提出一种双空间特征自适应融合的故障检测方法. 首先, 采用分层级联特征提取策略, 分别在原始数据空间和残差核空间提取高斯线性特征和非高斯非线性特征. 其次, 采用贝叶斯推理将不同空间的监测统计指标转换为故障概率, 并设计自适应概率加权策略, 进而构造总体概率统计指标以监测过程运行状态. 最后, 通过数值仿真和田纳西–伊仕曼过程, 验证所提算法的可行性和有效性.

关键词

故障检测 / 特征提取 / 混合相关性 / 贝叶斯推理 / 统计指标

Abstract

Due to the complex structure of the large complex industrial processes, the process variables often exhibit hybrid correlations. A single model cannot accurately represent the hybrid correlations between variables, resulting in a large number of missed alarms or false alarms in the fault detection. To address this problem, a fault detection method with adaptive fusion of dual-space features is proposed. Firstly, the Gaussian linear features and non-Gaussian nonlinear features are extracted in the original data space and the residual kernel space, respectively, using a hierarchical feature extraction strategy. Then, the Bayesian inference is utilized to convert the monitoring statistics from different spaces into failure probabilities, and an adaptive probabilistic weighting strategy is designed to construct the total probabilistic statistical indices for monitoring the process operation status. Finally, several experiments on a numerical simulation and the Tennessee Eastman benchmark process are presented to demonstrate the feasibility and effectiveness of the proposed method.

Keywords

fault detection / feature extraction / hybrid correlations / Bayesian inference / statistical index

1 引言 2 传统多元统计分析方法 2.1 基于PCA的过程监测方法 2.2 基于KICA的过程监测方法 3 分层级联特征提取和贝叶斯融合 3.1 高斯线性特征提取 3.2 非高斯非线性特征提取 3.3 基于贝叶斯推理的自适应概率加权统计指标 4 实验验证 4.1 数值仿真 4.2 TEP仿真 5 结论

1 引言

为满足市场需求，现代工业过程正朝着大规模、高集成化的方向发展. 这种发展趋势导致过程故障复杂多样，如何保障系统的安全稳定运行成为需要迫切解决的问题 ^[1-2]，因此，近年来故障检测和诊断得到了诸多学者的青睐. 得益于传感器、数据采集和存储技术的迅猛发展，工业过程中的大量过程数据得以收集、存储，因此，基于数据驱动的故障检测方法成了近些年的研究热点 ^[3-4]，其中多元统计分析的故障检测是数据驱动方法的重要分支，主要包括主成分分析（principle component analysis，PCA）^[5-6]、偏最小二乘（Partial least squares，PLS）^[7-8]、独立成分分析（independent component analysis，ICA）^[9-10] 及规范变量分析（canonical variable analysis，CVA）^[11] 等.

赵帅等 ^[12] 采用互信息衡量主元与质量变量之间的相关关系，提出一种基于加权互信息主元分析算法的质量相关故障检测. SchÖlkopf 等 ^[13] 提出了核主成分分析（Kernel PCA，KPCA）模型，在高维特征空间实施PCA故障检测，解决了非线性系统的故障检测问题. 郭大权等 ^[14] 针对变量多重相关性问题，分块建立了PCA模型. Fan等 ^[15] 针对工业过程中普遍存在的数据缺失问题，提出了一种用于缺失数据插补的快速增量非线性矩阵方法，使得模型即使在数据缺失的情况下，依然具有稳定的监测性能. 齐咏生等 ^[16] 在KPCA的基础上，进一步提出核熵成分分析（Kernel entropy component analysis，KECA）模型. 彭开香等 ^[17] 在 KECA的基础上，融合了典型相关分析（canonical correlation analysis，CCA）的思想，提出一种核典型相关–熵成分分析的质量相关故障检测方法，并在带钢热连轧工业过程数据中验证了模型.

考虑到工业过程中过程变量之间可能同时存在线性和非线性关系，单一模型特征提取能力不足，Deng 等 ^[18] 提出一种深度主成分分析（deep PCA，DePCA）模型，设计深层特征挖掘策略提高故障检测性能. Jiang等 ^[19] 提出了并行PCA-KPCA模型，该模型结合了随机算法和遗传算法，分别针对线性变量和非线性变量实施故障检测.

对于大型复杂工业过程，观测数据往往具有混合相关性，即观测数据中线性与非线性、高斯与非高斯等多种特性并存 ^[20] . 在实际应用中选择合适的故障检测模型至关重要. 传统的故障检测方法通常基于先验知识来判断系统属于线性或非线性，以及过程数据是否符合高斯分布. 但在实际生产过程中，该先验知识是难以准确获取的，这直接导致选择的模型可能并不符合实际情况，从而降低了故障检测性能. 前述方法均未能同时兼顾线性与非线性、高斯与非高斯. 针对这种具有混合相关性的复杂过程，本文提出一种双空间特征自适应融合的故障检测方法（dual-space PCA Kernel independent component analysis，DsPCA-KICA），该方法的主要创新点和贡献包括几下几点:

1）针对过程变量的混合相关性，DsPCA-KICA 方法兼顾过程数据的多种特性，并充分利用过程数据的高阶统计特性，构建分层级联特征提取模型深入挖掘过程数据中的隐藏特征;

2）采用贝叶斯推理将各层统计量转换为后验故障概率，并融合各层统计量形成总体概率统计指标，以监测复杂过程的运行状态;

3）设计自适应概率加权策略，将历史样本信息融入当前样本统计指标构造中，更准确地监测系统状态.

2 传统多元统计分析方法

2.1 基于PCA的过程监测方法

PCA通常用来处理高斯分布的线性过程 ^[21]，考虑一组正常工况下已标准化的观测样本X ∈

R^{n \times m}

，其中n和m分别表示样本个数和变量个数，对X的协方差矩阵进行特征值分解，即

Σ = \frac{1}{n - 1} X^{T} X = P Λ P^{T}

(1)

其中

Λ = d i a g \{λ_{1} ， λ_{2} ， \dots ， λ_{m}\} 且 λ_{1} ⩾ λ_{2} ⩾ \dots ⩾ λ_{m} .

通过累计方差贡献率确定主元个数A，并将特征向量矩阵

P \in R^{m \times m}

划分为P = [P_pc P_res]. 对于任意给定样本

x \in R^{1 \times m}

均可被分解为

x = \hat{x} + \tilde{x},

(2)

\hat{x} = x P_{p c} P_{p c}^{T} \equiv s p a n \{P_{p c}\},

(3)

\tilde{x} = x P_{r e s} P_{r e s}^{T} \equiv s p a n \{P_{r e s}\} .

(4)

2.2 基于KICA的过程监测方法

KICA通常用来处理非高斯非线性过程 ^[22]，其核心思想是将非线性样本X通过非线性转换ϕ（·）映射到高维线性空间，由于ϕ（·）难以显式表示，引入核函数为

[K]_{i, j} = k (x_{i}, x_{j}) = e x p (- \frac{{‖x_{i} - x_{j}‖}^{2}}{c}),

(5)

其中c为核参数. 对核矩阵K进行中心化和缩放，即

\tilde{K} = K - 1_{n} K - K 1_{n} + 1_{n} K 1_{n},

(6)

\bar{K} = \frac{\tilde{K}}{\frac{t r a c e (\tilde{K})}{n}},

(7)

式中1_n是元素均为

\frac{1}{n}

的n维方阵. 对K矩阵进行特征值分解，得到特征值矩阵Λ=diag{λ₁，λ₂，· · ·，λ_n}和特征向量矩阵V 后，可将原始数据白化为

Z = \sqrt{n} \bar{K} V Λ^{- 1}

(8)

利用白化矩阵，根据非高斯最大化准则，采用FastICA（fast independent component analysis）求得核独立成分S及混解矩阵W为

S = Z C D^{\frac{1}{2}} = \sqrt{n} \bar{K} V Λ^{- 1} C D^{\frac{1}{2}} = \bar{K} W,

(9)

W = \sqrt{n} V Λ^{- 1} C D^{\frac{1}{2}},

(10)

其中C为白化特征空间中的标准化正交矩阵，具体计算推导过程可参考文献 ^[22] .

3 分层级联特征提取和贝叶斯融合

考虑到复杂过程的混合相关性，为了充分挖掘过程数据中的隐藏信息，本文采用分层级联特征提取和贝叶斯融合的策略，针对高斯线性特征和非高斯非线性特征分层建立特征提取模型，将上层模型的输出作为下层模型的输入; 采用贝叶斯推理将各空间统计量转化为后验故障概率，结合历史样本统计信息，设计自适应概率加权策略构造总体概率统计指标，形成完整的故障检测方案如图1所示.

图1算法整体方案

Fig.1Overall scheme of the algorithm

3.1 高斯线性特征提取

对于正常工况观测样本矩阵X，建立PCA模型将其分解为主元子空间

\hat{X}

和残差子空间

\tilde{X}

，即

\{\begin{array}{l} X = \hat{X} + \tilde{X} = T P_{pc}^{T} + \tilde{X} \\ T = X P_{pc} \end{array}

(11)

通常，Hotelling’s T²统计量和平方预测误差（squared prediction error，SPE，本文记作QPCA）统计量被用来检测是否发生异常 ^[23]，对于样本x_l，其具体计算公式如下:

T_{l}^{2} = x_{l} P_{p c} Λ_{p c}^{- 1} P_{p c}^{T} x_{l}^{T},

(12)

Q_{l}^{P C A} = x_{l} (I - P_{p c} P_{p c}^{T}) x_{l}^{T},

(13)

T²和Q^PCA统计量的控制限分别为

J_{t h, T^{2}} = \frac{A (n^{2} - 1)}{n (n - A)} F_{α} (A, n - A),

(14)

J_{t h, Q^{P C A}} = g χ_{h, α}^{2}

(15)

其中:

F_{α} （ A ， n - A ）

是具有A和n − A个自由度、置信水平为α 的F 分布临界值;

g = \frac{θ_{2}}{θ_{1}}; h = \frac{θ_{1}^{2}}{θ_{2}}; θ_{i} = \sum_{j = A + 1}^{m} λ_{j}^{i} （ i = 1，2 ）; χ_{h ， α}^{2}

表示自由度为h、置信水平为 α的χ²分布.

3.2 非高斯非线性特征提取

本节按照第2.2节介绍原理，对第3.1节PCA模型的残差

\tilde{X}

建立KICA模型提取非高斯非线性特征，求得白化特征空间正交矩阵C及混解矩阵W. 对于样本x_l，将残差

{\tilde{x}}_{l}

投影到KICA模型，其核独立成分

s_{l}

及残差

e_{l}

为

s_{l} = \bar{k} ({\tilde{x}}_{l}) W,

(16)

e_{l} = z_{l} - {\hat{z}}_{l} = z_{l} (I - C C^{T}),

(17)

其中

z_{l} = \sqrt{n} \bar{k} ({\tilde{x}}_{l}) V Λ^{- 1}

通常采用I²统计量和SPE 统计量（本文记作Q^KICA）来监测观测数据的异常情况

I_{l}^{2} = s_{l} D^{- 1} s_{l}^{T}

(18)

Q_{l}^{K I C A} = e_{l} e_{l}^{T} = z_{l} (I - C C^{T}) z_{l}^{T} .

(19)

由于数据分布的不确定性，本文采用核密度估计（Kernel density estimation，KDE）^[18] 来确定统计量 I² 和Q^KICA的控制限，分别记作

J_{t h ， I^{2}} 和 J_{t h ， Q^{K I C A}}

3.3 基于贝叶斯推理的自适应概率加权统计指标

为了简化诊断逻辑并整合所有特征层的监测统计信息，采用贝叶斯推理 ^[24-25] 对各层统计量进行自适应加权融合，构建基于概率的统计指标. 对于PCA线性特征层，样本x_l在故障条件C_F和正常条件C_N下发生的概率分别为

\{\begin{matrix} p_{T^{2}} (x_{l} ∣ C_{F}) = e x p (- \frac{ξ J_{t h, T^{2}}}{T_{l}^{2}}), \\ p_{Q^{P C A}} (x_{l} ∣ C_{F}) = e x p (- \frac{ξ J_{t h, Q^{P C A}}}{Q_{l}^{P C A}}), \end{matrix}

(20)

\{\begin{matrix} p_{T^{2}} (x_{l} ∣ C_{N}) = e x p (- \frac{ξ T_{l}^{2}}{J_{t h, T^{2}}}), \\ p_{Q^{P C A}} (x_{l} ∣ C_{N}) = e x p (- \frac{ξ Q_{l}^{P C A}}{J_{t h, Q^{P C A}}}), \end{matrix}

(21)

其中参数ξ用来降低模型对异常值的敏感性，本文设置为ξ = 0.2. 依据贝叶斯推理， x_l在故障条件下的后验概率分别为

\begin{matrix} p_{T^{2}} (C_{F} ∣ x_{l}) = \\ \frac{p_{T^{2}} (x_{l} ∣ C_{F}) p_{T^{2}} (C_{F})}{p_{T^{2}} (x_{l} ∣ C_{F}) p_{T^{2}} (C_{F}) + p_{T^{2}} (x_{l} ∣ C_{N}) p_{T^{2}} (C_{N})}, \end{matrix}

(22)

\begin{matrix} p_{Q^{P C A}} (C_{F} ∣ x_{l}) = \\ \frac{p_{Q^{P C A}} (x_{l} ∣ C_{F}) p_{Q^{P C A}} (C_{F})}{p_{Q^{P C A}} (x_{l} ∣ C_{F}) p_{Q^{P C A}} (C_{F}) + p_{Q^{P C A}} (x_{l} ∣ C_{N}) p_{Q^{P C A}} (C_{N})}, \end{matrix}

(23)

其中: 先验概率

p_{T^{2}}

（C_F）和

p_{Q^{P C A}}

（C_F）等于显著性水平 1 − α，

p_{T^{2}}

（C_N）和

p_{Q^{P C A}}

（C_N）则等于置信水平α.

同理可得KICA非线性层中，x_l在故障条件下的后验概率

p_{I^{2}}

（C_F|x_l）和

p_{Q^{K I C A}}

（C_F|x_l）. 为了提高系统故障检测能力，采用自适应加权策略突出故障报警信息，例如，x_l在PCA线性层未检测出故障，而在KICA非线性层检测出的系统性变化故障，则应对

p_{I^{2}}

（C_F|x_l）予以较大的权值，而对

p_{T^{2}}

（C_F|x_l）予以较小的权值. 在加权策略中，为提高系统的鲁棒性，不仅考虑当前样本x_l的监测统计，同时兼顾近邻样本的监测统计，对权值设置如下:

ω_{T^{2}} = \{\begin{array}{l} \frac{1}{μ}, p_{T^{2}} (C_{F} ∣ x_{l}) ⩾ β 且 {\bar{p}}_{T^{2}} (C_{F} ∣ x_{l}) ⩾ β, \\ μ, 其他, \end{array}

(24)

ω_{Q^{PCA}} = \{\begin{array}{l} \frac{1}{μ}, p_{Q^{PCA}} (C_{F} ∣ x_{l}) ⩾ β 且 {\bar{p}}_{Q^{PCA}} (C_{F} ∣ x_{l}) ⩾ β, \\ μ, 其他, \end{array}

(25)

其中: β = 1 − α，µ 为很小的常数且 0 <µ <1，

{\bar{p}}_{T^{2}} (C_{F} ∣ x_{l})

和

{\bar{p}}_{Q^{P C A}} (C_{F} ∣ x_{l})

表示最靠近样本x_l的L个历史样本的平均后验故障概率，具体可表示为

\{\begin{matrix} {\bar{p}}_{T^{2}} (C_{F} ∣ x_{l}) = \frac{1}{L} \sum_{i = l - L + 1}^{l} p_{T^{2}} (C_{F} ∣ x_{i}), \\ {\bar{p}}_{Q^{P C A}} (C_{F} ∣ x_{l}) = \frac{1}{L} \sum_{i = l - L + 1}^{l} p_{Q^{P C A}} (C_{F} ∣ x_{i}) . \end{matrix}

(26)

同理可得

ω_{I^{2}}

和

ω_{Q^{K I C A}}

. 至此，通过对后验故障概率进行加权，可构造统计指标

\begin{matrix} P_{T} (l) = \\ \frac{ω_{T^{2}} p_{T^{2}} (C_{F} ∣ x_{l}) + ω_{I^{2}} p_{I^{2}} (C_{F} ∣ x_{l})}{ω_{T^{2}} + ω_{I^{2}}}, \end{matrix}

(27)

\begin{matrix} P_{Q} (l) = \\ \frac{ω_{Q^{P C A}} p_{Q^{P C A}} (C_{F} ∣ x_{l}) + ω_{Q^{K I C A}} p_{Q^{K I C A}} (C_{F} ∣ x_{l})}{ω_{Q^{P C A}} + ω_{Q^{K I C A}}} . \end{matrix}

(28)

鉴于实际工业过程具有动态性，本文引入指数加权移动平均（exponentially weighted moving average，EWMA）^[26]对统计量进行修正，即

\{\begin{matrix} P_{T}^{*} (l) = γ P_{T} (l) + (1 - γ) P_{T} (l - 1), \\ P_{Q}^{*} (l) = γ P_{Q} (l) + (1 - γ) P_{Q} (l - 1), \end{matrix}

(29)

其中γ是遗忘因子，通常设置γ ∈ [0.05，0.25].

综上，采用分层级联特征提取和贝叶斯推理决策，构建两个基于概率的总体概率统计指标进行故障检测，具体实施步骤如下:

1）模型训练.

步骤 1 对正常工况数据X建立PCA模型，得负载矩阵P_pc及特征值矩阵Λ_pc，并按照式（14）–（15）计算控制限

J_{t h ， T^{2}}

和

J_{t h ， Q^{P C A}}

;

步骤 2 对残差

\tilde{X}

建立 KICA 模型，并按照式（18）–（19）计算I²和

Q^{K I C A}

统计量;

步骤 3 采用KDE估计控制限

J_{t h ， I^{2}} 和 J_{t h ， Q^{K I C A}}

2）在线检测.

步骤 1 将在线样本

x_{new}

投影到PCA线性特征层，按照式（12）–（13）计算其统计量

T_{n e w}^{2} 和 Q_{n e w}^{P C A}

;

步骤 2 计算残差

{\tilde{x}}_{new}

的核向量

\bar{k} ({\tilde{x}}_{new})

，按照式（18）–（19）计算统计量

I_{new}^{2} 和 Q_{new}^{K I C A}

;

步骤 3 按照式（20）–（28）构造统计指标 P_T（x_new）和P_Q（x_new）;

步骤 4 按照式（29）对P_T（x_new）和P_Q（x_new）进行修正，得到总体概率统计指标

P_{T}^{*}

（x_new）和

P_{Q}^{*}

（x_new）;

步骤 5 在线监测:

a）如果

P_{T}^{*}

（x_new）>1 − α，样本x_new发生了系统性故障;

b）如果

P_{T}^{*}

（x_new）<1−α 且

P_{Q}^{*}

（x_new）>1 − α，样本x_new发生了残差故障;

c）如果

P_{T}^{*}

（x_new）<1−α 且

P_{Q}^{*}

（x_new）<1 − α，样本x_new为正常运行状态.

4 实验验证

本节通过数值仿真和田纳西–伊仕曼工业过程（Tennessee Eastman process，TEP）来验证所提算法的有效性，将所提算法的检测性能与 KPCA，KICA，DPCA，DICA 及DePCA方法进行对比，采用误报率（false alarm rate，FAR）和检测率（fault detection rate，FDR）作为评价指标，具体计算公式如下:

F A R = \frac{{N U M}_{(P^{*} > 1 - α ∣ f = 0)}}{{N U M}_{(f = 0)}},

(30)

F D R = \frac{{N U M}_{(P^{*} > 1 - α ∣ f \neq 0)}}{{N U M}_{(f \neq 0)}}

(31)

其中:

P^{*} \in \{P_{T}^{*} ， P_{Q}^{*}\} ， {N U M}_{(P^{*} > 1 - α ∣ f = 0)}

表示将正常样本误判为故障样本的数量，

{N U M}_{(P^{*} > 1 - α ∣ f \neq 0)}

表示正确识别的故障样本数，

{N U M}_{（ f = 0 ）} 和 {N U M}_{（ f \neq 0 ）}

则分别表示正常样本和故障样本的总数.

在本节后续实验中，DePCA模型的非线性层数默认为2，故将其记作DePCA-N2. 各模型参数设置如下: 对于KPCA，DPCA和DePCA-N2，采用累积方差贡献率确定其主元个数，使前A个主元的累计贡献率大于 85%; 根据文献 ^[5]，高斯核和多项式核参数分别设置为c = 500 m，d₀ = 100 m，d₁= 2. 根据文献 ^[27]，DPCA和DICA的动态阶数设置为l = 2. 对于KICA和 DsPCA-KICA，将独立成分个数设置为满足条件λ_i>0.21 × mean（λ）所有特征值的个数; 采用网格搜索法，设置步长为100，在[1000，5000]区间内搜索最优核参数，结果如图2所示，据此设置核参数c = 3000; 其他参数则根据经验设置为 L = 6，µ= 0.01，γ = 0.2. 此外本文所有故障检测方法均采用 α = 0.95的置信水平.

4.1 数值仿真

按照下列模型 ^[27] 构造非线性数值仿真:

\{\begin{array}{l} g (k) = A g (k - 1) + B f (u (k - 1)), \\ y (k) = g (k) + v (k), \\ u (k) = C u (k - 1) + D w (k - 1), \end{array}

(32)

其中:

v （ k ） = {[\begin{matrix} v_{1} （ k ） v_{2} （ k ） v_{3} （ k ） \end{matrix}]}^{T} ， v_{i} （ k ） \sim N （ 0，0.7 ）

为高斯噪声;

w （ k ） = {[w_{1} （ k ） w_{2} （ k ）]}^{T} ， w_{i} （ k ） \sim U [- 2，2] ，

非线性函数定义为

f （ u （ k ） ） = [u_{1}^{2} （ k ） {u_{2}^{2} （ k ）]}^{T} ，

A = [\begin{matrix} 0.118 & - 0.191 & 0.287 \\ 0.847 & 0.264 & 0.934 \\ - 0.333 & 0.514 & - 0.217 \end{matrix}],

B = [\begin{matrix} 1 & 2 \\ 3 & - 4 \\ - 2 & 1 \end{matrix}],

C = [\begin{matrix} 0.811 & - 0.226 \\ 0.447 & 0.415 \end{matrix}],

D = [\begin{matrix} 0.193 & 0.689 \\ - 0.320 & - 0.749 \end{matrix}]

按照式（32）生成 1000个正常样本 x = [y^T u^T]，其中500个作为训练集建立模型; 另外500个作为验证集确定控制限. 随后，分别对w₁和w₂引入故障各生成 500个样本组成测试集，其中前100个为正常样本，后 400个为故障样本，具体故障设置如下:

1）故障1: w₁引入幅度为+3的阶跃故障;

2）故障2: w₂引入变化率为+0.01的斜坡故障.

不失一般性，对每种故障重复实验500次，将各算法的FDR和FAR平均值记录在表1和表2中，并用粗黑体标记最佳性能.

图2核参数网格搜索结果

Fig.2Grid researching result of kernel parameter c

表1数值仿真实验中平均检测率FDR

Table1Average fault detection rate FDR in numerical simulation

表2数值仿真实验中平均误报率FAR

Table1Average false alarm rate FAR in numerical simulation

由表1可知，DsPCA-KICA对故障1的平均检测率为58.85%和78.04%，相比其他算法均有不同幅度的提高. 相比KICA及DPCA，残差统计量分别提高了 42.11%和45.86%; 相比DePCA-N2，主元统计量的检测率相差不多，但残差空间中分别提高了21.30% 和 2.26%. 由表2可知，DePCA-N2算法的误报率较高，DsPCA-KICA在主元空间的平均误报率相比DePCAN2分别降低了4.29%和3.96%，且均低于显著性水平. 图3展示各方法对故障 1的检测结果，KPCA，KICA，DPCA及DICA均不能连续稳定地检测到故障，DePCA-N2能够检测到大部分故障，但部分正常样本的统计量超过控制限. 而所提DsPCA-KICA可以稳定检测故障，且没有误报警.

为反映不同方法在重复实验中的稳健性，将故障1主元空间统计量的FDR和FAR分布绘制如图4和 5所示. 由图4可知，KPCA，DPCA和DICA大多数实验的FDR位于[0.3，0.8]之间; KICA算法大多数实验的 FDR都集中在[0.2，0.6]之间，极少数实验可以达到0.6 以上; 而所提DsPCA-KICA算法的FDR在[0.5，0.9]内的分布较多. 由图5可知，KPCA，DPCA和DePCA-N2 的FAR在[0.05，0.5]之间的分布明显偏高; KICA和DICA的FAR整体较低，但结合图3，其检测率也较低; 而 DsPCA-KICA大多数FAR均低于0.05，上述分布表明 DsPCA-KICA 在误报率和检测率的稳健性方面均优于其他方法.

图3各算法对故障1的监测结果

Fig.3Monitoring results of each algorithm for fault 1

图4各算法的FDR分布图

Fig.4FDR distribution plots of each algorithm

图5各算法的FAR分布图

Fig.5FAR distribution plots of each algorithm

4.2 TEP仿真

TEP是由Downs和Vogel按照真实化工厂的工业基准开发的一个工业模拟器 ^[28]，是一个典型的非线性动态的复杂特性系统. TEP仿真平台设计了正常工况和 21种故障工况，其中正常工况共包括1460个观测样本，随机选择500个样本作为训练集进行建模，剩余样本验证模型计算相应的控制限，21种故障工况分别记作IDV（1）–IDV（21），每种故障工况下记录960个样本，其中前160个为正常样本，后800个为故障样本. 为了直观展示检测性能，以故障19为例，分别用6种不同方法进行故障检测，结果如图6所示，图中对局部细节进行了放大处理，用紫色箭头和虚线矩形框标识.

为了进一步显示贝叶斯推理中自适应加权策略的作用，将故障19中PCA线性特征层的统计量和KICA 非线性特征层的I²统计量及其对应的权值展示如图7，并将采样时刻1∼400的样本进行局部放大. 图中蓝色线条表示统计量，绿色虚线表示控制限，而橙色线条表示对应的权值，即文中第3.3节中所述

ω_{T^{2}}

和

ω_{I^{2}}

由图7可知，单层特征提取都无法连续稳定检测到故障，PCA 线性特征层只能检测到少数的故障，而 KICA非线性层却可以检测到大部分的故障，这意味着残差空间仍包含较多故障信息，对其进一步建模有利于提取更深层的特征. 当某个样本在特定层被检测为故障样本时，那么在构造概率统计指标时，该层被赋予较大的权值; 否则，赋予较小的权值. 以第253个样本为例，从图中可以看出其高斯线性层的T²统计量为36.2805，且低于控制限，所以其对应的权值

ω_{T^{2}}

= 0.01，而非高斯非线性层的I²统计量为64.2416，高于控制限，且最近邻的L个样本（即样本253 − L至样本 252）的统计量平均值也高于控制限，所以其对应的权值

ω_{I^{2}}

= 100. 值得注意的是，并非只要当前样本的统计量高于控制限就对其赋予较大的权值，由图7中可以看出，在样本150之前同样存在某些样本的统计量高于控制限，但其权值却为 0.01，这是因为其最近邻的L个样本的统计量平均值低于控制限，这样可以有效避免异常值对监测过程的影响，有利于降低算法的误报率.

图6各算法对故障19的监测结果

Fig.6Monitoring results of each algorithm for IDV (19)

结合图6（f）与图7可知，单层特征提取都无法连续稳定地检测到故障，且非线性层存在部分误报警，但经过自适应加权融合后不仅可以稳定检测到故障且大大降低了误报，这表明对不同特征层的统计量进行自适应加权融合可以有效提升故障检测性能.

图7故障19的各层统计量及其权值

Fig.7Statistics of each layer and their weights for IDV (19)

不失一般性，本文将15种故障分别通过6种不同方法进行故障检测，并将结果记录在表3和表4中. 相较其他方法，所提DsPCA-KICA的检测率和误报率均有不同程度的改善，仅在部分故障类型的主元空间（T² /I² /

P_{T}^{*}

）检测率方面略逊色于DePCA-N2，但整体相差很小，如故障 1，2，4 和5的检测率相差均低于 0.5%. 而DsPCA-KICA在残差空间的检测率相比其他方法分别提高了12.05%，27.59%，15.03%，29.61%和 1.44%. 反观误报率，DsPCA-KICA的

P_{T}^{*}

统计量在所有故障模式下均不存在误报，相比其他方法平均误报率分别降低了2.79%，1.84%，1.54%，5.08%和3.46%. 综上，所提DsPCA-KICA可以有效提高故障检测率的同时降低误报率.

5 结论

本文针对大型复杂工业过程中观测数据具有混合相关性的问题，提出一种DsPCA-KICA故障检测方法. 针对过程中存在的多种复杂特性，包括高斯/非高斯、线性/非线性以及静态/动态特性，分别设计分层级联特征提取、贝叶斯自适应融合、指数加权移动平均等策略，构造概率统计指标实现实时故障检测. 为验证所提方法的故障检测性能，分别进行了数值仿真和 TEP实验，并将其检测结果与传统模型KPCA，KICA，DPCA，DICA及DePCA-N2进行对比分析. 结果表明，所提DsPCA-KICA方法能够保持较高故障检测率的同时有效降低误报率. 分层级联特征提取模型中PCA及KICA可以换做任何其他多元统计过程监测方法，如PLS或CVA等. 此外，文中参数c，µ，γ和L均来自于经验值，如何进一步对这些参数进行优化，以及如何提高模型对微小故障的敏感性是值得进一步研究的问题.

表3TE过程中各故障的检测率FDR

Table3Fault detection rate FDR of each fault for TEP

表4TE过程中各故障的误报率FAR

Table4False alarm rate FAR of each fault for TEP

图1算法整体方案

Fig.1Overall scheme of the algorithm

下载: 全尺寸图片

图2核参数网格搜索结果

Fig.2Grid researching result of kernel parameter c

下载: 全尺寸图片

图3各算法对故障1的监测结果

Fig.3Monitoring results of each algorithm for fault 1

下载: 全尺寸图片

图4各算法的FDR分布图

Fig.4FDR distribution plots of each algorithm

下载: 全尺寸图片

图5各算法的FAR分布图

Fig.5FAR distribution plots of each algorithm

下载: 全尺寸图片

图6各算法对故障19的监测结果

Fig.6Monitoring results of each algorithm for IDV (19)

下载: 全尺寸图片

图7故障19的各层统计量及其权值

Fig.7Statistics of each layer and their weights for IDV (19)

下载: 全尺寸图片

表1数值仿真实验中平均检测率FDR

Table1Average fault detection rate FDR in numerical simulation

下载: 全尺寸图片

表2数值仿真实验中平均误报率FAR

Table1Average false alarm rate FAR in numerical simulation

下载: 全尺寸图片

表3TE过程中各故障的检测率FDR

Table3Fault detection rate FDR of each fault for TEP

下载: 全尺寸图片

表4TE过程中各故障的误报率FAR

Table4False alarm rate FAR of each fault for TEP

下载: 全尺寸图片

图1算法整体方案

Fig.1Overall scheme of the algorithm

图2核参数网格搜索结果

Fig.2Grid researching result of kernel parameter c

图3各算法对故障1的监测结果

Fig.3Monitoring results of each algorithm for fault 1

图4各算法的FDR分布图

Fig.4FDR distribution plots of each algorithm

图5各算法的FAR分布图

Fig.5FAR distribution plots of each algorithm

图6各算法对故障19的监测结果

Fig.6Monitoring results of each algorithm for IDV (19)

图7故障19的各层统计量及其权值

Fig.7Statistics of each layer and their weights for IDV (19)

表1数值仿真实验中平均检测率FDR

Table1Average fault detection rate FDR in numerical simulation

表2数值仿真实验中平均误报率FAR

Table1Average false alarm rate FAR in numerical simulation

表3TE过程中各故障的检测率FDR

Table3Fault detection rate FDR of each fault for TEP

表4TE过程中各故障的误报率FAR

Table4False alarm rate FAR of each fault for TEP

图1算法整体方案

Fig.1Overall scheme of the algorithm

图2核参数网格搜索结果

Fig.2Grid researching result of kernel parameter c

图3各算法对故障1的监测结果

Fig.3Monitoring results of each algorithm for fault 1

图4各算法的FDR分布图

Fig.4FDR distribution plots of each algorithm

图5各算法的FAR分布图

Fig.5FAR distribution plots of each algorithm

图6各算法对故障19的监测结果

Fig.6Monitoring results of each algorithm for IDV (19)

图7故障19的各层统计量及其权值

Fig.7Statistics of each layer and their weights for IDV (19)

表1数值仿真实验中平均检测率FDR

Table1Average fault detection rate FDR in numerical simulation

表2数值仿真实验中平均误报率FAR

Table1Average false alarm rate FAR in numerical simulation

表3TE过程中各故障的检测率FDR

Table3Fault detection rate FDR of each fault for TEP

表4TE过程中各故障的误报率FAR

Table4False alarm rate FAR of each fault for TEP

LAURO C H, BRANDAO L C, BALDO D,et al. Monitoring and ˜ processing signal applied in machining processes-A review. Measurement,2014,58:73-86.

LI Han, XIAO Deyun. Survey on data driven fault diagnosis methods. Control and Decision,2011,26(1):1-9,16.(李晗, 萧德云. 基于数据驱动的故障诊断方法综述. 控制与决策,2011,26(1):1-9,16.)

YIN S, DING S, XIE X,et al. A review on basic data-driven approaches for industrial process monitoring. IEEE Transactions on Industrial Electronics,2014,61(11):6418-6428.

YAN S, YAN X. Joint monitoring of multiple quality-related indicators in nonlinear processes based on multi-task learning. Measurement,2020,165(29):108158.

DENG X, TIAN X, SHENG C,et al. Deep principal component analysis based on layerwise feature extraction and its application to nonlinear process monitoring. IEEE Transactions on Control Systems Technology,2019,27(6):2526-2540.

DONG Jie, YOU Peihang, PENG Kaixiang. Dynamic processes fault detection and classification based on dynamic-inner principal component analysis and hidden Markov model. Control Theory & Applications,2020,37(10):2073-2080.(董洁, 游培航, 彭开香. 基于动态内部主元分析和隐马尔科夫模型的动态过程故障检测于分类方法. 控制理论与应用,2020,37(10):2073-2080.)

KONG Xiangyu, CHEN Yalin, LUO Jiayu,et al. Multi-feature complex process monitoring method based on partial least squares. Journal of South China University of Technology(Natural Science Edition),2022,50(6):100-110.(孔祥玉, 陈雅琳, 罗家宇, 等. 基于偏最小二乘的多特性复杂过程监测方法. 华南理工大学学报(自然科学版),2022,50(6):100-110.)

JIAO J F, ZHEN W T, WANG G,et al. KPLS-KSER based approach for quality-related monitoring of nonlinear process. ISA Transactions,2020,108(5):144-153.

ZHANG Cheng, PAN Lizhi, LI Yuan. Fault detection and diagnosis method based on weighted statistical feature KICA. CIESC Journal,2022,73(2):827-837.(张成, 潘立志, 李元. 基于加权统计特征KICA的故障检测与诊断方法. 化工学报,2022,73(2):827-837.)

LI Z, YAN X. Performance-driven ensemble ICA chemical process monitoring based on fault-relevant models. Soft Computing,2020,24(16):12289-12302.

DONG J, JIANG L, ZHANG C,et al. A novel quality-related incipient fault detection method based on canonical variate analysis and kullback-leibler divergence for large-scale industrial processes. IEEE Transactions on Instrumentation and Measurement,2022,71:1-10.

ZHAO Shuai, SONG Bing, SHI Hongbo. Quality-related fault detection based on weighted mutual information principal component analysis. CIESC Journal,2018,69(3):962-973.(赵帅, 宋兵, 侍洪波. 基于加权互信息主元分析算法的质量相关故障检测. 化工学报,2018,69(3):962-973.)

SCHOLKOPF B, SMOLA A, M ¨ ULLER K. Nonlinear component ¨ analysis as a kernel eigenvalue problem. Neural Computation,1998,10(5):1299-1319.

GUO Daquan, YANG Zongsheng, ZHOU Xiaofeng,et al. Fault detection of AUV resource exploration system based on multi-block information extraction. Control and Decision,2021,36(4):790-800.(郭大权, 杨宗圣, 周晓锋, 等. 基于多块信息提取的AUV资源勘查系统故障检测. 控制与决策,2021,36(4):790-800.)

FAN J, CHOW T, QIN S J. Kernel based statistical process monitoring and fault detection in the presence of missing data. IEEE Transactions on Industrial Informatics,2022,18(7):4477-4487.

QI Yongsheng, ZHANG Haili, GAO Xuejin,et al. Novel fault monitoring strategy for chemical process based on KECA. CIESC Journal,2016,67(3):1063-1069.(齐咏生, 张海利, 高学金, 等. 基于KECA的化工过程故障监测新方法. 化工学报,2016,67(3):1063-1069.)

PENG Kaixiang, ZHANG Limin. A quality monitoring method for industrial process based on kernel canonical correlation-entropy component analysis. Control and Decision,2021,36(12):2999-3006.(彭开香, 张丽敏. 基于核典型相关性-熵成分分析的工业过程质量监测方法. 控制与决策,2021,36(12):2999-3006.)

DENG X, TIAN X, SHENG C,et al. Nonlinear process fault diagnosis based on serial principal component analysis. IEEE Transactions on Neural Networks & Learning Systems,2018,29(3):560-572.

JIANG Q, YAN X. Parallel PCA-KPCA for nonlinear process monitoring. Control Engineering Practice,2018,80:17-25.

LI W, ZHAO C, GAO F. Linearity evaluation and variable subset partition based hierarchical process modeling and monitoring. IEEE Transactions on Industrial Electronics,2018,65(3):2683-2692.

LI Z, TIAN L, JIANG Q,et al. Dynamic nonlinear process monitoring based on dynamic correlation variable selection and kernel principal component regression. Journal of the Franklin Institute,2022,359(9):4513-4539.

ZHOU Donghua, LI Gang, LI Yuan. Data-Driven Industrial Process Fault Diagnosis Technology: A Method Based on Principal Component Analysis and Partial Least Squares. Beijing: Science Press,2011.(周东华, 李钢, 李元. 数据驱动的工业过程故障诊断技术: 基于主元分析与偏最小二乘的方法. 北京: 科学出版社,2011.)

LEE J M, QIN S J, LEE I B. Fault detection of non-linear processes using kernel independent component analysis. Canadian Journal of Chemical Engineering,2007,85(4):526-536.

ZHENG, ZHOU Y, YANG W,et al. Multivariate/minor fault diagnosis with severity level based on bayesian decision theory and multidimensional RBC. Journal of Process Control,2021,101:68-77.

ZHONG K, HAN M, QIU T,et al. Distributed dynamic process monitoring based on minimal redundancy maximal relevance variable selection and bayesian inference. IEEE Transactions on Control Systems Technology,2020,28(5):2037-2044.

ABBAS N, RIAZ M, DOES R J M M. An EWMA-type control chart for monitoring the process mean using auxiliary information. Communications in Statistics,2014,43(16):3485-3498.

KU W, STORER R H, GEORGAKIS C. Disturbance detection and isolation by dynamic principal component analysis. Chemometrics and Intelligent Laboratory Systems,1995,30(1):179-196.

DOWNS J J, VOGEL E F. A plant-wide industrial process control problem-ScienceDirect. Computers & Chemical Engineering,1993,17(3):245-255.