欢迎访问《控制理论与应用》期刊网站！

有限标记样本下基于GSSL-GraphSage的半监督故障诊断方法

doi: 10.7641/CTA.2023.30368

曹洁^1,2 ，王庭义¹ ，王进花¹

1. 兰州理工大学电气工程与信息工程学院, 甘肃兰州 730050

2. 兰州城市学院信息工程学院, 甘肃兰州 730070

基金项目: 国家自然科学基金项目(62063020), 甘肃省自然科学基金项目(20JR5RA463)资助.

详细信息

作者简介

曹洁兰州理工大学教授，博士生导师.目前研究方向为故障诊断、智能信息处理、智能交通系统的理论与应用等,E-mail: caoj@lut.edu.cn;

王庭义兰州理工大学电气工程与信息工程学院硕士研究生.目前研究方向为故障诊断与图神经网络,E-mail: wtydq1602@163.com.

王进花兰州理工大学电气工程与信息工程学院副教授,博士.目前研究方向为信息融合理论与应用、非线性系统故障诊断,E-mail: wjh0615@lut.edu.cn.

通信作者

王进花，E-mail: wjh0615@lut.edu.cn;Tel.:13919409376.

Semi-supervised fault diagnosis using GSSL-GraphSage under limited labeled samples

CAO Jie^1,2 ， WANG Ting-yi¹ ， WANG Jin-hua¹

1. College of Electrical and Information Engineering, Lanzhou University of Technology, Lanzhou Gansu 730050 , China

2. School of Information Engineering, Lanzhou City University, Lanzhou Gansu 730070 , China

Funds: Supported by the National Natural Science Foundation of China (62063020), and the Natural Science Foundation of Gansu Province Province (20JR5RA463).

摘要

鉴于在实际工程中采集的齿轮箱标注监测数据是有限的, 且基于图神经网络的齿轮箱故障诊断方法研究仍存在标签信息挖掘不充分的问题, 本文提出一种有限标记样本下基于图的半监督学习(GSSL)与图采样聚合算法(GraphSage)的齿轮箱半监督故障诊断方法. 基于K最近邻算法和基于图的标签传播策略, 将标签信息沿边传播给分布相似的邻域样本, 从而充分利用有限样本的标签信息, 提高模型性能. 将每个振动频谱样本视为一个节点构建基于图的半监督学习框架, 最后将半监督学习框架输入到节点级GraphSage网络中进行故障分类, 避免新加入节点重新训练的情况, 可有效防止训练过拟合, 增强泛化能力. 将所提方法用于分析齿轮箱故障实验数据, 结果表明所提方法能够在6%的低标签情况下准确诊断齿轮箱的不同故障模式, 验证了对齿轮箱故障诊断的可行性和有效性.

关键词

故障诊断 / GraphSage网络 / 有限标记样本 / 半监督学习 / 标签传播策略

Abstract

In view of the limited labelled monitoring data collected in actual engineering and insufficient label information mining problem of gearbox fault diagnosis method based on Graph neural network, a Graph-based semi-supervised learning (GSSL) under limited labelled samples is proposed. GSSL and Graph sample and aggregate (GraphSage) algorithm for gearbox semi-supervised fault diagnosis. Based on the K-nearest neighbor algorithm and the graph-based label propagation strategy, the label information is propagated to neighborhood samples with similar distribution along the edge, so as to make full use of the label information of limited samples and improve the model performance. Each vibration spectrum sample was regarded as a node to construct a graph-based semi-supervised learning framework. Finally, the semi-supervised learning framework was input into the node-level GraphSage network for fault classification, avoiding the situation of new nodes being retrained, which could effectively prevent the over-fitting of training and enhance the generalization ability. The proposed method is used to analyze the experimental data of gearbox faults. The results show that the proposed method can accurately diagnose different fault modes of gearbox under the condition of 6% low label, which verifies the feasibility and effectiveness of gearbox fault diagnosis.

Keywords

Fault Diagnosis / GraphSage Network / Limited Labeled Samples：Semi-supervised Learning / Label Propagation Strategy

1 引言 2 相关工作 2.1 基于图的半监督学习 2.2 图神经网络 2.3 GraphSage网络 3 基于GSSL-GraphSage的半监督故障诊断方法 3.1 基于GSSL构造图模型 3.1.1 基于GSSL的标签传播策略 3.2 节点级GraphSage半监督学习模型构建 3.3 基于GSSL-GraphSage方法故障诊断流程 4 实验 4.1 齿轮箱故障数据集介绍 4.2 实验结果与分析 4.2.1 半监督故障诊断结果对比分析 4.2.2 K值影响 4.2.3 噪声干扰实验 5 结论

1 引言

齿轮箱作为一种重要的机械部件，由于其内部结构和受力情况极为复杂，成为机械故障中的故障易发部件 ^[1-2] . 早期基于信号统计和基于模型的齿轮箱故障诊断方法存在特征提取困难、缺乏标记样本等局限性，因此很难有效指导故障诊断过程 ^[3] . 得益于传感器技术的发展，机械系统得以采集运行过程中更加丰富的运维数据，如何挖掘其中的有效信息，是近年来齿轮箱故障诊断领域研究的热点 ^[4] . 深度学习方法已成功应用于智能故障诊断中 ^[5]，然而，它们的有效训练需要大量的标签样本，以实现对海量故障数据的挖掘与学习 ^[6] . 因此，针对工程实际中采集的齿轮箱标注数据是有限的，且基于图神经网络的齿轮箱故障诊断方法研究仍存在标签信息挖掘不充分的情况下研究高精度的齿轮箱故障诊断方法具有重要的意义.

半监督学习（Semi-Supervised Learning，SSL）已在智能故障诊断中得到广泛研究，旨在通过大量无标签样本对少量有标签样本进行辅助特征提取和模式识别，从而提高模型精度 ^[7] . 邢晓松等人 ^[8] 针对已有的智能故障诊断方法多依赖于大量有标签数据的监督学习，提出一种改进的半监督生成对抗网络，结合半监督学习进一步提升分类器的学习能力，最终实现对无标签数据的正确分类. Yu等人 ^[9] 针对标注样本有限的情况下，提出一种基于一致性正则化的数据增强方法，实现了轴承的故障诊断. Wu等人 ^[10] 同时利用有标签和无标签的数据训练模型，提出一种基于混合分类自编码器的半监督故障诊断方法，获得了较高的诊断准确率.

以上所提及半监督方法尽管能在一定程度上解决故障诊断任务中的标记样本不足的问题，但均是从欧几里得空间的角度孤立的对多个样本进行分析，使得样本间的隐式信息难以被有效挖掘 ^[11] . 对于一个机械系统，其上的监测传感器可以自然的形成一张传感器网络. 图神经网络（Graph Neural Network，GNN）的提出旨在将深度学习理论应用到无规则结构化数据处理上，通过构建数据的图，将其嵌入到网络模型的损失函数中，通过数次的迭代与学习，最终形成的表示结果用于模式识别、聚类或者回归等问题 ^[12] . 近两年来，国内外学者已逐步将GNN应用在半监督故障诊断领域.2021年，Zhao等人 ^[13] 构建了一个半监督图卷积深度信念网络（Semisupervised Graph Convolution Deep Belief Network，SSGCDBN），该网络结合了标记样本和未标记样本的信息，用于在标记10%下的电机轴承系统故障诊断.2021 年，Gao等人 ^[14] 介绍了一种半监督图卷积网络（Semi-supervised graph convolutional network，SSGCN）来学习样本之间的内部联系，实现了5%标记标签率情景下的轴承故障诊断。2021年，Tang等人 ^[15] 提出一种基于半监督条件随机场的图注意网络（Conditional random field-based graph attention network，CRF-GAT）算法，在训练样本不足10%的情况下，实现了对不同电机的故障严重程度和运行条件的识别.2023年，Bao等人 ^[16] 针对实际工况下缺乏足够的故障样本，提出一种基于多输入并行图神经网络半监督滚动轴承故障诊断方法，实现了在训练样本的比例只有20%的情况下，所提模型也能达到99%以上的准确率.

上述的GNN研究虽然在半监督故障诊断中均取得了较高的准确率，但都是基于转导式（Transductive）的半监督学习算法，难以直接对新样本进行分类，需重新训练整个网络，计算量大，且处理大规模数据时性能欠佳.考虑到这些不足，该文采用具有可扩展性优势的GraphSage网络来解决这个问题.

综上，该文提出了一种基于图的半监督学习和GraphSage网络（GSSL-GraphSage）的齿轮箱半监督故障诊断方法. 基于K最近邻（K Nearlist Neighbor，KNN）算法和基于图的标签传播（Label Propagation Algorithm，LPA）策略来构建GSSL框架，通过样本间特征的相似性建立连接关系，充分挖掘样本间标签的联合依赖关系，将标签信息沿连接边传播给具有相似分布的邻域样本，以充分利用有限的标签信息. 构建基于GraphSage网络的齿轮箱半监督学习模型，用于解决标记样本不足及提升图卷积神经网络扩展性和模型灵活性.

2 相关工作

2.1 基于图的半监督学习

基于图的半监督学习方法需要构造一个图，将标记样本和未标记样本看作是图上的众多节点，连接节点的边反映了样本之间的相似度，构造的图与标签一起从标记的样本传播到未标记的样本 ^[17] . 机械信号数据具有数据量大、非线性程度高、噪声干扰强等特点，通常分布在高维流形上 ^[18] . 因此，GSSL方法是最适合该文问题的方法.

GSSL建模分为两个步骤:（1）图构造，建立KNN图以描述标记和未标记样本之间的关系;（2）标签传播，其沿着图边缘将标签从已标记样本传播到未标记样本. 已有研究表明，传统的KNN图构造方法鲁棒性更强，应用更广泛 ^[19] . 因此，该文采用传统的方法来构造图. 标签传播的目的是确保:（1）相似样本具有相同的标签;（2）标记后的样本保持原来的标签.

2.2 图神经网络

图神经网络（Graph Neural Network，GNN）是深度学习在图结构上的拓展，具有强大的关系归纳能力，为结构化的数据挖掘提供了一个直接的途径 ^[20] . 所涉及的图结构可简化为:

G = (H, A)

其中，

H = \{{\vec{h}}_{1} ， {\vec{h}}_{2} ， \dots ， {\vec{h}}_{n}\} \in R^{n \times d}

表示节点的集合，

A \in R^{n \times n}

表示邻接矩阵且为对角矩阵.

不同于卷积神经网络（Convolution Neural Network，CNN），GNN可以在非欧氏空间基于节点间的连接关系定义图卷积. 图卷积层是通过聚合邻域节点特征来更新每个节点的特征，通常将图G作为输入，经过卷积层后，输出新的节点集合为

H^{'} = \{{\vec{h}}_{1}^{'} ， {\vec{h}}_{2}^{'} ， \dots ， {\vec{h}}_{n}^{'}\} \in R^{n \times d^{'}} ，

其中d′为输出的节点特征维度. 图卷积层则可表示为:

{\vec{h}}_{i}^{'} = Γ ({\vec{h}}_{i}, γ (\{{\vec{h}}_{j} ∣ j \in N_{i}\})) .

(1)

其中， N_i是节点

{\vec{h}}_{i}

的邻域节点数; Γ （·）表示非线性; γ（·）表示某种节点聚合模式.

一个机械系统的故障数据可以抽象为非欧氏结构数据，传统的深度学习模型对于这种结构数据的处理显得力不从心，而GNN所能处理的数据正是这种具有不规则结构的图数据. 因此，研究GNN对于推动故障诊断技术的发展、深度学习具有重大意义.

2.3 GraphSage网络

GraphSage网络由Hamilton等 ^[21] 提出的一种采用节点属性信息生成节点嵌入的归纳学习框架. 其计算过程如图1所示: 由采样、聚合和预测三个步骤组成.

图1GraphSage网络运行步骤

Fig.1GraphSage running steps

GraphSage网络定义了两个关键函数，即AGGREGATE（·）和CONCAT（·）. AGGREGATE（·）用于聚合来自节点邻居的信息，CONCAT（·）用于将当前节点特征与聚合的节点特征结合起来. 通过聚集子采样局部邻域和小批量梯度下降方式学习，实现了推断未见节点或图的归纳能力.

例如，对于任意的节点邻居

u \in N （ v ） ，

经过k次聚合的迭代，其节点特征表示如式（2）和式（3）所示:

h_{N (v)}^{(k)} = {A G G R E G A T E}_{k} (\{h_{u}^{(k - 1)}, \forall u \in N (v)\}) .

(2)

h_{v}^{(k)} = σ (θ_{k} \cdot {C O N C A T}_{k} (h_{v}^{(k - 1)}, h_{N (v)}^{(k)})) .

(3)

其中，AGGREGATE表示聚合操作，CONCAT表示连接操作; σ表示激活函数;

h_{N （ v ）}^{（ k ）} 和 h_{u}^{（ k - 1 ）}

分别表示节点v的相邻邻域的聚合节点特征和节点v的相邻节点的节点特征;

h_{v}^{（ k ）}

表示k次聚合迭代后节点v的节点特征，其中，

h_{v}^{（ 0 ）} = x_{v} .

然而，传统的图卷积神经网络主要是在单一固定的图像中进行节点嵌入，无法为未见节点或者全新子图生成快速嵌入. 而GraphSage网络可解决上述问题，因而选用该网络来进行故障节点分类.

3 基于GSSL-GraphSage的半监督故障诊断方法

基于GSSL-GraphSage的故障诊断框架如图2所示.

首先采用快速傅立叶变换进行特征提取，以频域形式输入到基于图的半监督学习框架中构造关联图，并将其加权邻接矩阵和特征矩阵作为网络的输入.

3.1 基于GSSL构造图模型

3.1.1 基于GSSL的标签传播策略

将采集的齿轮箱时域振动信号首先由快速傅立叶变换（Fast Fourier Transform，FFT）进行特征提取，得到带l个样本的标记样本集D_l和带有u个样本的未标记样本集D_u，样本总数为m = l + u，其中，

l ≪ u .

D_{l} = \{(x_{1}, y_{1}), (x_{2}, y_{2}), \dots, (x_{l}, y_{l})\} .

(4)

D_{u} = \{x_{l + 1}, x_{l + 2}, \dots, x_{l + u}\}

(5)

其中，x_i（i = 1，2，· · ·，m）是给定样本，y_i（i = 1，2，· · ·， l）是x_i（i= 1，2，· · ·，l）所对应的类标签.

根据输入数据D = D_l ∪ D_u，利用欧几里得距离（Euclidean Distance）来度量所有频谱信号样本之间的邻接关系来构造KNN图，从而更好的反映样本之间的局部几何性质. KNN算法的距离度量公式可表示为式（6）:

L_{i j} = {(\sum_{l = 1}^{d} {|h_{i}^{(l)} - h_{j}^{(l)}|}^{2})}^{\frac{1}{2}} .

(6)

其中，L_ij表示节点

{\vec{h}}_{i}

和节点

{\vec{h}}_{j}

的距离;

h_{i}^{（ l ）}

表示节点

{\vec{h}}_{i}

的第l维特征.

KNN构图的每个节点之间的边权重通过高斯核权重函数来估计，其定义如式（7）:

e_{i j} = e x p (- \frac{{‖(x_{i}, x_{j})‖}^{2}}{2 ζ^{2}}), x_{j} \in N e (x_{i}) .

(7)

其中，e_ij表示节点x_i和x_j之间的边缘权重; ζ表示高斯核的带宽.

每个节点代表每个经过FFT的频谱样本. 频谱样本KNN图中边的构造可由式（8）为:

A_{i j} = K N N (k, L_{i j}, Ω_{i}), A_{i j} \in A .

(8)

其中，

Ω_{i} = \{L_{i 1} ， L_{i 2} ， \dots ， L_{i n}\}

是

{\vec{h}}_{i}

与所有节点的距离集合; k是频谱样本KNN 图的超参数; 若L_ij是Ω_i集合中的k个最小值，KNN（ ·）= 1，否则KNN（ ·）= 0.

基于图的半监督学习可以看作是图上的能量函数E（F），E（F）是基于流形假设理论建立的. 令G =（V，E）表示一个图，其中V 表示节点集，即数据点集. 边e =（i，j）的权重为w （e）= w_ij，表示节点i，j之间的相似度，有w_ij= w_ji. 于是可以得到图G的权重矩阵W如式（9）所示:

W_{i j} = \{\begin{array}{ll} w (e) = w_{i j}, e = (i, j) \in E, \\ 0, 其他. \end{array}

(9)

由此可见W是一个对称矩阵. 令D为对角矩阵，其中以

d_{i i} = \sum_{j} w_{i j} ，

则可以得到图Laplacian. 图Laplacian最常用的有以下两种: 一种是非归一化的图Laplacian: ∆ = D − W; 另一种是归一化的图Laplacian;

L = I - D^{- \frac{1}{2}} W D^{- \frac{1}{2}} ，

其中，I是单位矩阵.

图2GSSL-GraphSage的故障诊断框架

Fig.2Fault diagnosis framework of GSSL-GraphSage

因此，能量函数E （F）的定义如式（10）所示:

\begin{matrix} E (F) = \frac{1}{2} (\sum_{i = 1}^{n} \sum_{j = 1}^{n} W_{i j} {‖\frac{1}{\sqrt{d_{i}}} F_{i} - \frac{1}{\sqrt{d_{j}}} F_{j}‖}_{2}^{2}) + \\ μ \sum_{i = 1}^{n} {‖F_{i} - Y_{i}‖}_{2}^{2} = \\ \frac{1}{2} \sum_{i = 1}^{n} (d_{i} \frac{1}{d_{i}}) F_{i}^{2} + \frac{1}{2} \sum_{i = 1}^{n} (d_{j} \frac{1}{d_{j}}) F_{j}^{2} - \\ (D^{- \frac{1}{2}} W D^{- \frac{1}{2}}) \sum_{i = 1}^{n} F_{i}^{2} + μ \sum_{i = 1}^{n} {‖F_{i} - Y_{i}‖}^{2} = \end{matrix}

\begin{matrix} \frac{1}{2} \sum_{i = 1}^{n} F_{i}^{2} + \frac{1}{2} \sum_{j = 1}^{n} F_{j}^{2} - \sum_{i = 1}^{n} S F_{i}^{2} + \\ μ \sum_{i = 1}^{n} {‖F_{i} - Y_{i}‖}_{2}^{2} = \\ \sum_{i = 1}^{n} F_{i}^{2} - \sum_{i = 1}^{n} S F_{i}^{2} + μ \sum_{i = 1}^{n} {‖F_{i} - Y_{i}‖}_{2}^{2} = \\ F^{T} (I - S) F + μ ‖ F - Y ‖_{2}^{2}, \end{matrix}

(10)

其中，

F = {(F_{1}^{T} ， F_{2}^{T} ， \dots ， F_{n}^{T})}^{T}

为n × C维的标签预测矩阵，C为故障类性数量;

S = D^{- \frac{1}{2}} W D^{- \frac{1}{2}}

是标签传播矩阵; D 是对角矩阵; Y 为初始化矩阵; µ是正则化参数.

能量函数E（F）由包含归一化拉普拉斯矩阵的正则化项和平方损失函数组成，正则化项保证相似样本具有相似的标签向量，损失函数保证样本的预测标签与真实标签尽可能一致. 之后使得能量函数最小化有

\frac{\partial E (F)}{\partial F} = [(I - S) + (I - S)^{T}] F + 2 μ (F - Y) = 0 .

(11)

则标签预测矩阵的获取如式（12）所示:

F = (1 - α) (I - α S)^{- 1} Y .

(12)

其中，

α = \frac{1}{1 + μ}

最后根据

y_{i} = a r g \underset{1 \leq j \leq C}{m a x} （ F ）_{i j}

得到类标签y_i，从而得到新的有标签数据集.

3.2 节点级GraphSage半监督学习模型构建

GraphSage用于节点级的故障诊断时，将每个样本视为一个节点，多个节点构成一张图，通过连接边建立节点间的联系 ^[23]，从而实现半监督学习. 模型设计架构如图3所示，其激活函数选用Softmax函数，聚合器选用sum aggregator，因为sum aggregator可以使用一个节点的相邻节点的全部特征来学习准确的结构信息.

图3GraphSage网络结构

Fig.3Network Structure of GraphSage

因此，将半监督学习框架中构建的关联图转化为图结构的邻接矩阵A和特征矩阵X输入到节点级GraphSage模型从而得到预测标签，以标记样本的交叉熵损失函数为目标函数，对权重参数进行反向传播更新，具体表示如式（13）:

Loss = - \sum_{i \in V_{label}} \sum_{j = 1}^{F} Y_{i j}^{r} l n (Y_{i j}^{p}) .

(13)

其中，

Y_{i j}^{r}

表示第i个标记节点的真实标记值;

Y_{i j}^{p}

表示第i 个标记节点的预测标记值; V_label是标记节点的集合.

该方法利用KNN图的加权邻接矩阵表示样本数据的局部几何性质，以标记样本的类别信息作为损失函数迭代训练网络权值参数，最终实现半监督分类.

3.3 基于GSSL-GraphSage方法故障诊断流程

图4进一步给出了本文所提基于GSSL-GraphSage方法的齿轮箱半监督故障诊断方法的原理.

1）数据预处理: 对输入的原始振动信号进行快速傅立叶变换（FFT）得到频谱数据.

2）样本数据集的获取: 将频谱数据直接截取成一定数量的具有一定采样点数的训练和测试样本. 随机选取训练样本作为具有一定标记比的标记样本，剩余的训练样本作为未标记样本. 所有标记和未标记样本形成包含m 个样本的训练数据集X.

图4GSSL-GraphSage模型的训练过程

Fig.4Training process of the GSSL-GraphSage model

3）基于图的半监督学习: 首先将每个训练样本视为一个节点，利用欧氏距离判断所有节点之间的邻接关系来构建KNN图. 最近邻参数k通过经验公式log₂（N）来确定 ^[24] . 根据公式（8）计算KNN图对应的加权邻接矩阵A. 之后基于图的标签传播策略来预测未标记节点的标签信息.

4）GSSL-GraphSage模型的构建: 双层GSSL-GraphSage模型根据式（2）和（3）来构建. 训练数据集X和加权邻接矩阵A直接作为模型的输入，交叉熵损失函数如式（13）作为目标函数来训练权重W. 当满足终止条件时，停止权重参数的训练，将测试样本输入到训练好的GSSL-GraphSage模型中，根据输出结果判断所有测试样本的状态.

4 实验

4.1 齿轮箱故障数据集介绍

该文选用东南大学采集的数据源进行仿真实验. SEU齿轮箱数据集是从传动系统动态模拟器（DDS）中收集的 ^[25]，其结构如图5所示.

图5DDS结构图

Fig.5Structure Diagram of DDS

研究了转速系统负载为20HZ（1200rpm）-0V（0Nm）和30HZ（1800rpm）-2V（7.32Nm）两种不同工况. 每个文件中有8个信号，分别代表: 1―电机振动，2、3、4―x、y 和z三个方向上行星齿轮箱的振动信号，5―电机扭矩，6、7、8―x、y和z三个方向上并联齿轮箱的振动信号: 采样频率为10KHz. 该数据集包括4种齿轮故障状态和1种健康状态，其故障类型如表1所示. 每个样本的长度为1024个采样点，每类状态的样本总数为400. 其中10 × 18个样本被随机选择为训练样本，10 × 282个样本作为未标记训练样本，10 × 100个样本作为测试样本，标签率为6%.

4.2 实验结果与分析

为避免实验结果的偶然性，对所有方法进行5次重复实验. 所有GNN的网络结构和超参数都设置为相同. 运行配置为: Python3.7; Pytorch1.6.0; GPU为NVIDIA Tesla K80; CPU为Intel Xeon E5-2678 v3. 模型的主要超参数设置如下: 迭代次数为100 次，学习率设为0.0001.

表1SEU齿轮箱信息表

Table1Gearbox Information Sheet of SEU

4.2.1 半监督故障诊断结果对比分析

首先，基于所获得的样本对本论文可用的半监督方法进行 ^[26-27] 性能比较，结果如表2所示. 从表中可以看出，GSSL方法的准确率最高，运行时间相当于自训练方法的最小运行时间. 综合考虑两个指标下的性能，GSSL 方法是最佳的样本标记方法.

表2半监督各方法性能对比

Table2Semi-supervised performance comparison of each method

之后验证GraphSage网络的优越性. 将GraphSage与GCN ^[28]、ChebyNet ^[29] 及GAT ^[23] 等3种常用的GNNs进行对比. 其诊断结果如表3所示，GraphSage，GCN，ChebyNet和GAT的准确率分别为85.24%，80.13%，81.0% 和82.5%. GraphSage取得了最高的准确率. 这是因为GAT网络通常基于固定的邻居关系来构建图结构，但在实际情况中，节点之间的关联关系具有复杂的动态性或者非线性特征. 这种固定的图结构建模能力无法很好地适应真实场景下的数据关联性，从而影响故障诊断的性能. GCN是基于局部邻居节点进行信息传播和聚合的，因此其对于全局信息的利用较为有限. 在故障诊断领域，全局的数据关联性和上下文信息对于准确的故障判断非常重要，GCN 可能无法充分利用这一方面的信息. ChebyNet网络在有限标记样本下的故障诊断场景中存在过拟合的问题.

表34种GNNs的诊断准确率

Table3Diagnostic accuracy of four GNNs

将该文所提的半监督学习框架分别加入GAT，GCN，ChebyNet等3种常用的GNNs进行对比，实验具体结果如表4所示.

表4各方法的诊断结果和运行时间

Table4Diagnostics and run times for each method

所提方法 GSSL-GraphSage 取得了99.25%的最高的平均准确率. 较 GraphSage 的诊断准确率提高了11.98%. 训练时间和测试时间分别为 14.112 0 s 和0.011 2 s. GSSL学习策略对于ChebyNet网络的提升最少，原因在于ChebyNet和GSSL方法在节点表示学习和标签传播中的不同处理方式导致的. ChebyNet采用切比雪夫多项式来逐阶聚合邻居节点的信息，而GSSL方法一般通过图的拓扑结构和节点特征相似性来传播标签. 因此，GSSL 策略对于GNNs效果的提升具有普适性.

为进一步展示所有方法对不同状态的诊断效果，将第5次实验的混淆矩阵可视化，如图6所示. 其他每类状态测试数据为100个，共10类状态. 图中的坐标0–9与表1中的两种负载下采集状态一一对应. 由混淆矩阵可知，本文所提方法的分类精度为99.75%，GSSL-GCN的分类精度为89.25%，GSSL-ChebyNet 的分类精度为 88.75%，GSSL-GAT 的分类精度为 91.75%. 本文所提方法除了20 Hz–0 V工况下的齿轮底部出现裂纹这一故障有少量样本分类错误，其他测试样本均取得了100%的分类精度，说明模型具有较高的分类精度.

通过t-SNE方法对完成训练的输出特征向量进行2维可视化，观察模型训练后的特征分布情况. 如图7所示.

图6各方法第5次实验的混淆矩阵图

Fig.6Confusion matrix diagram of the 5th experiment of each method

为验证所提方法的有效性，选用几种成熟的深度学习方法，如一维卷积神经网络（1D-CNN）^[30]、长短时记忆网络（LSTM）和支持向量机（SVM）^[31] .

图7各方法第5次实验的特征2维可视化

Fig.7Visualization of dimension reduction in the5th experiment of each method

在相同的数据集和样本数量（每种齿轮箱状态采集400个样本）下与GSSL-GraphSage方法进行对比. 实验结果是在5次试验下的平均值，如表5所示.

表5GSSL-GraphSage与其他模型的精度对比

Table5Precision comparison between GSSL-GraphSage and other models

由表可以看出，所提方法相较于传统方法在标记样本不足的条件下都有明显优势. 其原因在于，故障诊断中数据通常具有时序性，传统方法在利用时序信息方面存在限制，而所提方法可以通过图结构灵活的处理时序数据，能够更好的捕捉数据之间的动态变化和序列模式，从而提高了故障诊断的准确率.

4.2.2 K值影响

其次，基于KNN构建关联图需要选取合适得K值. 图8为所提方法在不同K值下对于两个案例的诊断准确率. 可以直观的看出，K 值为5时有99.25%的最高准确率，可信度高.

图8诊断准确率

Fig.8Diagnostic accuracy

4.2.3 噪声干扰实验

在实际工业中，齿轮箱是在噪声干扰的工作环境中运行. 为模拟复杂噪声环境下收集的齿轮箱振动信号，在振动信号中加入高斯白噪声以达到噪声干扰的效果，加入的高斯白噪声有不同信噪比（Signal to Noise Ratio，SNR），信噪比计算公式为:

S N R_{d B} = 10 {l o g}_{10} (\frac{P_{signal}}{P_{noise}})

(14)

其中，P_signal表示原始信号功率，P_noise表示高斯噪声功率.

为验证GSSL-GraphSage方法的抗噪能力，添加 SNR为–3 dB到2 dB的高斯白噪声，每组实验分别进行5次模型训练，取平均诊断准确率作为最终评价指标. 最终实验结果如图9所示.

图9不同方法在噪声下的对比

Fig.9Comparison of different methods under noise

图9中看出信噪比下降时，模型故障诊断精度会下降，在 SNR=–3 dB时，GSSL-ChebyNet诊断精度最低，所提方法达到较高的诊断精度为83.416 6%，分别比方法GSSL-GCN，GSSL-ChebyNet及GSSLGAT高14.16%、15.90%及4.45%. 随着SNR的增大，所有模型的诊断正确率都有提高，在2 dB时，所提方法的诊断正确率达到了96.3%. 由此可知，本文所提方法在不同程度的噪声干扰中仍能保持较高的诊断准确率，具有良好的抗噪性能.

5 结论

针对传统监督学习方法在有限标记样本下无法取得满意效果的问题，提出了一种基于GSSL-GraphSage的半监督故障诊断方法. 所建立的模型在标签率为6%的齿轮箱半监督故障诊断案例中验证了所提方法的有效性. 实验结果表明:（1）即使在标记样本较少的情况下，双层GSSL-GraphSage模型也能自适应的从原始振动信号中提取有效的故障特征.（2）构建的节点级GraphSage能够更好的对振动信号的图节点与边进行特征提取，增强了模型的抗噪声能力，有效地提高了齿轮箱故障识别精度.（3）所提方法能较为准确地诊断出齿轮箱不同故障模式，且性能优于其他常用的GNN 方法. 研究工作仍存在以下不足: 因获取的故障数据有限，所提方法未能在实际工业场景中得到验证. 极低标签率涉及工程实际的研究值得深入研究.

图1GraphSage网络运行步骤

Fig.1GraphSage running steps

下载: 全尺寸图片

图2GSSL-GraphSage的故障诊断框架

Fig.2Fault diagnosis framework of GSSL-GraphSage

下载: 全尺寸图片

图3GraphSage网络结构

Fig.3Network Structure of GraphSage

下载: 全尺寸图片

图4GSSL-GraphSage模型的训练过程

Fig.4Training process of the GSSL-GraphSage model

下载: 全尺寸图片

图5DDS结构图

Fig.5Structure Diagram of DDS

下载: 全尺寸图片

图6各方法第5次实验的混淆矩阵图

Fig.6Confusion matrix diagram of the 5th experiment of each method

下载: 全尺寸图片

图7各方法第5次实验的特征2维可视化

Fig.7Visualization of dimension reduction in the5th experiment of each method

下载: 全尺寸图片

图8诊断准确率

Fig.8Diagnostic accuracy

下载: 全尺寸图片

图9不同方法在噪声下的对比

Fig.9Comparison of different methods under noise

下载: 全尺寸图片

表1SEU齿轮箱信息表

Table1Gearbox Information Sheet of SEU

下载: 全尺寸图片

表2半监督各方法性能对比

Table2Semi-supervised performance comparison of each method

下载: 全尺寸图片

表34种GNNs的诊断准确率

Table3Diagnostic accuracy of four GNNs

下载: 全尺寸图片

表4各方法的诊断结果和运行时间

Table4Diagnostics and run times for each method

下载: 全尺寸图片

表5GSSL-GraphSage与其他模型的精度对比

Table5Precision comparison between GSSL-GraphSage and other models

下载: 全尺寸图片

图1GraphSage网络运行步骤

Fig.1GraphSage running steps

图2GSSL-GraphSage的故障诊断框架

Fig.2Fault diagnosis framework of GSSL-GraphSage

图3GraphSage网络结构

Fig.3Network Structure of GraphSage

图4GSSL-GraphSage模型的训练过程

Fig.4Training process of the GSSL-GraphSage model

图5DDS结构图

Fig.5Structure Diagram of DDS

图6各方法第5次实验的混淆矩阵图

Fig.6Confusion matrix diagram of the 5th experiment of each method

图7各方法第5次实验的特征2维可视化

Fig.7Visualization of dimension reduction in the5th experiment of each method

图8诊断准确率

Fig.8Diagnostic accuracy

图9不同方法在噪声下的对比

Fig.9Comparison of different methods under noise

表1SEU齿轮箱信息表

Table1Gearbox Information Sheet of SEU

表2半监督各方法性能对比

Table2Semi-supervised performance comparison of each method

表34种GNNs的诊断准确率

Table3Diagnostic accuracy of four GNNs

表4各方法的诊断结果和运行时间

Table4Diagnostics and run times for each method

表5GSSL-GraphSage与其他模型的精度对比

Table5Precision comparison between GSSL-GraphSage and other models

图(9) / 表(5)

引用本文

曹洁, 王庭义, 王进花. 有限标记样本下基于GSSL-GraphSage的半监督故障诊断方法. 控制理论与应用, 2025, 42(5): 892 – 902

复制

CAO Jie, WANG Tingyi, WANG Jinhua. Semi-supervised fault diagnosis using GSSL-GraphSage under limited labeled samples. Control Theory & Applications, 2025, 42(5): 892 – 902

Copy

计量

图1GraphSage网络运行步骤

Fig.1GraphSage running steps

图2GSSL-GraphSage的故障诊断框架

Fig.2Fault diagnosis framework of GSSL-GraphSage

图3GraphSage网络结构

Fig.3Network Structure of GraphSage

图4GSSL-GraphSage模型的训练过程

Fig.4Training process of the GSSL-GraphSage model

图5DDS结构图

Fig.5Structure Diagram of DDS

图6各方法第5次实验的混淆矩阵图

Fig.6Confusion matrix diagram of the 5th experiment of each method

图7各方法第5次实验的特征2维可视化

Fig.7Visualization of dimension reduction in the5th experiment of each method

图8诊断准确率

Fig.8Diagnostic accuracy

图9不同方法在噪声下的对比

Fig.9Comparison of different methods under noise

表1SEU齿轮箱信息表

Table1Gearbox Information Sheet of SEU

表2半监督各方法性能对比

Table2Semi-supervised performance comparison of each method

表34种GNNs的诊断准确率

Table3Diagnostic accuracy of four GNNs

表4各方法的诊断结果和运行时间

Table4Diagnostics and run times for each method

表5GSSL-GraphSage与其他模型的精度对比

Table5Precision comparison between GSSL-GraphSage and other models

CHEN Xuefeng, GUO Yanjie, XU Caibin,et al. Review of fault diagnosis and health monitoring for wind power equipment. China Mechanical Engineering,2020,31(2):175-189.(陈雪峰, 郭艳婕, 许才彬, 等. 风电装备故障诊断与健康监测研究综述. 中国机械工程,2020,31(2):175-189.)

LEI Yaguo, JIA Feng, KONG Detong,et al. Opportunities and challenges of machinery intelligent fault diagnosis in big data Era. Jour-nal of Mechanical Engineering,2018,54(5):94-104.(雷亚国, 贾峰, 孔德同, 等. 大数据下机械智能故障诊断的机遇与挑战. 机械工程学报,2018,54(5):94-104.)

LIANG Pengfei. Research on intelligent fault diagnosis technology of gearbox based on deep learning. Wuhan: Huazhong University of Science and Technology,2020.(梁朋飞. 基于深度学习的齿轮箱智能故障诊断技术研究. 武汉: 华中科技大学,2020.)

SHAO Haidong, ZHANG Xiaoyang, CHENG Junsheng,et al. Intelligent fault diagnosis of bearing using enhanced deep transfer autoencoder. Journal of Mechanical Engineering,2020,56(9):84-90.(邵海东, 张笑阳, 程军圣, 等. 基于提升深度迁移自动编码器的轴承智能故障诊断. 机械工程学报,2020,56(9):84-90.)

WEN Chenlin, LU Feiya. Review on deep learning based fault di-¨ agnosis. Journal of Electronics and Information Technology,2020,42(1):234-248.(文成林, 吕菲亚. 基于深度学习的故障诊断方法综述. 电子与信息学报,2020,42(1):234-248.)

ZHI Q Z, YANG B L, GUAN Q Q,et al. A review of the application of deep learning in intelligent fault diagnosis of rotating machinery. Measurement,2023,206:1-24.

RAZAVI-FAR R, HALLAJI E, FARAJZADEH-ZANJANI M,et al. A semi-supervised diagnostic framework based on the surface estimation of faulty distributions. IEEE Transactions on Industrial Informatics,2019,15(3):1277-1286.

XING Xiaosong, GUO Wei. Intelligent diagnosis method for bearings with few labelled samples based on an improved semi-supervised learning-based generative adversarial network. Journal of Vibration and Shock,2022,41(22):184-192.(邢晓松, 郭伟. 基于改进半监督生成对抗网络的少量标签轴承智能诊断方法. 振动与冲击,2022,41(22):184-192.)

YU K, MA H, LIN T R,et al. A consistency regularization based semi-supervised learning approach for intelligent fault diagnosis of rolling bearing. Measurement,2020,165:107987-107999.

WU X, ZHANG Y, CHENG C,et al. A hybrid classification autoencoder for semi-supervised fault diagnosis in rotating machinery. Mechanical Systems and Signal Processing,2021, DOI:10.1016/j.ymssp.2020.107327.

WU Z, PAN S, CHEN F,et al. A comprehensive survey on graph neural networks. IEEE Transactions on Neural Networks and Learning Systems,2021,32(1):4-24.

ZHIWEN C, JIAMIN X, CESARE A,et al. Graph neural networkbased fault diagnosis: A review.arXiv Preprints,2021, DOI:10.48550/arXiv.2111.08185.

ZHAO X, JIA M, LIU Z. Semisupervised graph convolution deep belief network for fault diagnosis of electormechanical system with limited labeled data. IEEE Transactions on Industrial Informatics,2020,17(8):5450-5460.

GAO Y Y, CHEN M, YU D J. Semi-supervised graph convolutional network and its application in intelligent fault diagnosis of rotating machinery. Measurement,2021, DOI:10.1016/j.measurement.2021.110084.

TANG Y, ZHANG X, ZHAI Y,et al. Rotating machine systems fault diagnosis using semisupervised conditional random field-based graph attention network. IEEE Transactions on Instrumentation and Measurement,2021,70:1-10.

BAO S, FENG J, XU X,et al. Multi-input parallel graph neural network for semi-supervised rolling bearing fault diagnosis. Measurement Science and Technology,2023,34(5):055110.

SHAO Y, SANG N, GAO C,et al. Probabilistic class structure regularized sparse representation graph for semi-supervised hyperspectral image classification. Pattern Recognition,2017,63:102-114.

XU X, LEI Y, LI Z. An incorrect data detection method for big data cleaning of machinery condition monitoring. IEEE Transactions on Industrial Electronics,2020,67(3):2326-2336.

VAN ENGELEN J E, HOOS H H. A survey on semi-supervised learning. Machine Learning,2019,109:373-440.

MA Shuai, LIU Jianwei, ZUO Xin. Survey on graph neural network. Computer Research and Development,2022,59(1):47-80.(马帅, 刘建伟, 左信. 图神经网络综述. 计算机研究与发展,2022,59(1):47-80.)

WILLIAM L H, REX Y, JURE L. Inductive representation learning on large graphs. NIPS’17: Proceedings of the 31st International Conference on Neural Information Processing Systems,2017, DOI:10.48550/arXiv.1706.02216.

SHAO Haidong, YAN Shen, XIAO Yiming,et al. Semi-supervised fault diagnosis of bearings under time-varying rotational speed based on improved graph attention network. Journal of Electronics and Information,2023,45(5):1550-1558.(邵海东, 颜深, 肖一鸣, 等. 时变转速下基于改进图注意力网络的轴承半监督故障诊断. 电子与信息学报,2023,45(5):1550-1558.)

TIANFU L, ZHENG Z, SINAN L,et al. The emerging graph neural networks for intelligent fault diagnostics and prognostics: A guideline and a benchmark study. Mechanical Systems and Signal Processing,2022, DOI:10.1016/j.ymssp.2021.108653.

VON LUXBURG U. A tutorial on spectral clustering. Statistics and Computing,2007,17(4):395-416.

SHAO S, MCALEER S, YAN R,et al. Highly-accurate machine fault diagnosis using deep transfer learning. IEEE Transactions on Industrial Informatics,2019,15(4):2446-2455.

ZOU Y, YU Z, LIU X,et al. Confidence regularized self-training.2019 IEEE/CVF International Conference on Computer Vision(ICCV). Seoul, Korea(South): IEEE,2019:5981-5990.

LIU Y, XU Z, LI C. Distributed online semi-supervised support vector machine. Information Sciences,2018,466:236-257.

DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering. NIPS’16: Proceedings of the 30th International Conference on Neural Information Processing Systems. Barcelona, Spain:2016, DOI:10.48550/arXiv.1606.09375.

KIPF T, WELLING M. Semi-supervised classification with graph convolutional networks. ArXiv Preprints,2016, DOI:10.48550/arXiv.1609.02907.

WU C, JIANG P, DING C,et al. Intelligent fault diagnosis of rotating machinery based on one-dimensional convolutional neural network. Computers in Industry,2019,108:53-61.

WIDODO A, WIDOWATI D P D, SATRIJO D,et al. Vibration gear fault diagnostics technique using wavelet support vector machine. Advances in Mechanical and Manufacturing Engineering,2014, DOI:10.4028/www.scientific.net/AMM.564.182.