首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 半监督学习 / 一种基于半监督学习深度对抗网络的故障诊断方法

一种基于半监督学习深度对抗网络的故障诊断方法

阅读:671发布:2020-05-12

专利汇可以提供一种基于半监督学习深度对抗网络的故障诊断方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于半 监督学习 深度对抗网络的故障诊断方法,获取不同工作故障下 轴承 的振动 信号 ,将故障轴承的振动时域信号进行 小波变换 为二维图像;通过生成对抗网络对少量有标签的数据进行监督学习,对大量无标签的数据进行无监督训练,用 卷积神经网络 提取高维特征实现数据的分类,从而识别轴承的故障类别。本发明实现了在有限的带标签数据的情况下训练得到高 精度 的故障诊断模型,得到更准确的判别器,从而能够基于 滚动轴承 的振动信号进行精准故障诊断。,下面是一种基于半监督学习深度对抗网络的故障诊断方法专利的具体信息内容。

1.一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,包括以下步骤:
S1,获取包含有k类轴承故障的样本总集合Y={Y1,Y2,Y3,…Yk},即Y={Yi},i=1,2,
3,…k;
Yi表示第i类轴承故障所对应的样本集合, 即 j=1,2,
3,…M;
表示第i类轴承故障所对应的样本集合Yi中的第j个样本数据;
所述样本数据是指轴承的振动信号,且样本数据为一维向量;
S2,将样本数据转换为二维图像格式,得到二维样本数据,转换后的二维图像格式不仅包括振动信号的时域特征,还包括振动信号的频域特征
S3,根据步骤S2所得的二维样本数据生成训练集;所述训练集中包括:带标签的二维样本数据,无标签的二维样本数据;其中,标签是指轴承故障类别;带标签的二维样本数据和无标签的二维样本数据均为真实样本;
S4,将训练集输入判别器D中,若判别器D的输入为带标签的二维样本数据时,则进行监督学习;若判别器D的输入为无标签的二维样本数据时,则进行无监督学习
在监督学习阶段,将带标签的二维样本数据输入到判别器D进行监督学习,判别器D能够判别出带标签的二维样本数据的标签即故障类别即可达到要求;
在无监督学习阶段,构建一个生成器G与判别器D进行对抗训练,借助生成对抗网络进行无监督学习;所述生成器G将随机噪声v映射为伪样本数据,且伪样本数据也为二维图像格式,即将随机噪声v映射为二维伪样本数据;所述生成器G的模型结构如下:生成器G:v→z,z=G(v,θg);其中,G(·)表示将随机噪声v映射为二维图像格式的伪样本数据的模型,θg表示模型参数,z表示输出的伪样本数据;将无标签的二维样本数据和二维伪样本数据输入到判别器D进行无监督学习,判别器D能够判别出无标签的二维样本数据为真实样本即可达到要求;即,不论输入无标签的二维样本数据的具体故障类别,判别器D只要能够输出该无标签的二维样本数据为真实样本即可达到要求;
S5,基于判别器D进行的监督学习,以及基于判别器D与生成器G之间的生成对抗网络以进行的无监督学习,构成了基于半监督学习深度对抗网络的故障诊断模型,并对该故障诊断模型进行训练;
S6,对训练完成后的故障诊断模型进行模型测试,以对判别器D进行优化;
S7,后续的,已知轴承的振动信号后,即可利用优化后的判别器D进行故障诊断。
2.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S2中,利用小波变换将样本数据转换为二维图像格式,得到二维样本数据;
所述小波变换的公式,如下式所示:
式中,a表示缩放因子,用于小波函数的伸缩;τ表示平移因子,用于控制小波函数的平移;f(t)表示振动信号即一维向量;t表示时间;ψ(·)表示小波函数;WT(·)表示小波变换;
小波函数ψ(·)的公式,如下式所示:
3.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,所述生成器G的网络结构为:首先是一个全连接层将原始输入即随机噪声x映射到1024维向量,后面再依次连接四个反卷积模组成,每个反卷积模块均依次连接包括:一个反卷积层,一个批归一化层即BN,一个relu激活函数层;
所述反卷积模块的形式化表示如下式所示:
式中, 表示反卷积运算;Wg表示反卷积核;bg表示反卷积核偏置;hθ表示反卷积运算的结果;上标g用于标识生成器G的参数;BN(·)表示批归一化;relu(·)表示relu激活函数;
此四个依次连接的反卷积模块中的反卷积核的大小均为5,此四个依次连接的反卷积模块中的反卷积核数目依次为256、128、64、1。
4.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,所述判别器D模型结构为:判别器D由三个卷积模块组成,每个卷积模块均为:首先是一个二维卷积操作即一个卷积层,其次是一个最大池化层Maxpool,然后接一个批归一化层即BN,最后接一个leakrelu激活函数层;
所述卷积块的形式化表示如下式所示:
md=Max_pool(Wd*x+bd);
hd=lrelu(BN(md));
式中,*表示卷积运算;Wd表示卷积核;bd表示卷积核偏置;hd表示卷积运算的结果;上标d用于标识判别器D的参数;Max_pool(·)表示最大池化;BN(·)表示批归一化;relu(·)表示leakrelu激活函数;
此三个卷积模块的卷积核大小依次为5、3、3,此三个卷积模块的卷积核数目分别为64、
128、256。
5.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,所述判别器D的输出类别共包括k+1类,判别器D的输出l为一个k+1维的向量,即l={l1,l2,l3,…lk,lk+1};其中,前k类均表示判别为真实样本,且分别对应k类轴承故障,即l={l1,l2,l3,…lk,0};第k+1类表示判别为伪样本,即l={l1,l2,l3,…lk,1}。
6.根据权利要求5所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,采用softmax函数替换判别器的输出,将判别器的输出l转换为P={P1,P2,P3,…Pk,Pk+1};softmax函数如下式所示:
式中,Pn表示判别器输出结果为第n类的概率;n=1,2,3…k均表示判别为真实样本,且分别对应k类轴承故障;n=k+1表示判别为伪样本;e为自然常数。
7.根据权利要求6所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S5中,故障诊断模型的训练分为三部分,分别对以下三个损失函数进行优化:
对于训练集中的带标签的二维样本数据,判断其输出的标签是否正确,即,带标签的二维样本数据分类正确的概率Llabel:
对于训练集中的无标签的二维样本数据,判断输出是否为真实样本,即无标签的二维样本数据不被判别为第k+1类的概率Lunlabel:
对于训练集中的二维伪样本数据,判断输出是否为伪样本,即二维伪样本数据被判别为第k+1类的概率Lfake:
上述式中,Pmodel(y|x,y<k+1)表示判别器D的输出为前k类即真实样本的概率;Pmodel(y=k+1|x)表示判别器D的输出为第k+1类即伪样本的概率;Gdata表示生成器生成的伪样本;
Pdata表示真实样本;x表示判别器D的输入数据;y表示判别器D的输入数据的标签;x,y~Pdata表示输入数据x为带有标签y的,且从Pdata中选取的真实样本;x~Pdata表示输入数据x为不带标签的,且从Pdata中选取的真实样本;x~Gdata表示输入数据x为生成器生成的,且从Gdata选取的伪样本;E表示期望; 表示将所有带标签的输入数据被判断为真实样本的概率的期望; 表示将所有不带标签的输入数据被判断为真实样本的概率的期望;
表示将所有生成器生成的输入数据被判断为伪样本的概率的期望;
所述生成对抗网络的目标函数包括:判别器D的损失函数LD和生成器G的损失函数LG;其中,
所述判别器D的损失函数LD,具体公式如下式所示:
LD=Llabel+Lunlabel+Lfake+Dregular;
式中,Dregular表示对判别器D中的所有Wd做的L2正则化;Wd表示判别器D中的网络参数;
所述生成器G的损失函数LG,具体公式如下式(11)所示:
LG=-Lfake+0.01*Gfeature_matching;
式中,Gfeature_matching表示训练过程中生成器G匹配判别器D的中间层上的特征的预期值;
判别器D的中间层是指卷积层;
得到所述生成对抗网络的目标函数后,使用反向传播算法对故障诊断模型的模型参数即θd和θg进行训练,使用Adam算法对模型参数进行更新,所述Adam算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的自适应学习率,其中,θd和θg分别为判别器D和生成器G的模型参数;
上述式中,α、β1、β2均为Adam优化器参数; 均为故障诊断模型的整体网络模型参数; 均为用求导数的方式找的模型最优点。

说明书全文

一种基于半监督学习深度对抗网络的故障诊断方法

技术领域

[0001] 本发明涉及滚动轴承振动信号处理技术领域,尤其是一种基于半监督学习 深度对抗网络的故障诊断方法。

背景技术

[0002] 研究先进的机械故障诊断方法是保障设备与人员安全的重要内容,其中, 轴承是旋转机械中最为重要的机械零件之一,广泛应用于电、化工、冶金、 航空等各个重要领域,同时轴承也是最容易损坏的元件之一,轴承性能和工况 的好坏会直接影响到整台机器设备的性能,轴承性能和工况的缺陷会导致设备 产生异常振动和噪声,甚至造成设备损坏。因此,对滚动轴承进行故障诊断, 尤其对滚动轴承早期故障的分析,尤为重要。
[0003] 现有技术中,深度学习理论以其强大的建模和表征能力成为数据驱动的智 能故障诊断领域中最活跃的研究方向之一,基于深度学习的故障诊断框架具有 强大的特征学习能力,能够通过多个隐藏层直接从原始传感器数据中学习分层 表示,并自动选择有利于识别的特征,准确的进行故障分类。但是,使用深度 学习训练故障分类模型需要提供大量带有标签的样本数据,然而在实际工况下, 虽然能够采集到的大量的振动数据,但大部分振动数据不带有标签,针对每种 故障下都收集大量带有标签的振动数据是不现实的。因此,基于深度学习的故 障诊断方法不适用于对滚动轴承进行故障诊断。

发明内容

[0004] 为了克服上述现有技术中的缺陷,本发明提供一种基于半监督学习深度对 抗网络的故障诊断方法,实现了在有限的带标签数据的情况下训练得到高精度 的故障诊断模型,得到更准确的判别器,从而能够基于滚动轴承的振动信号进 行精准故障诊断。
[0005] 为实现上述目的,本发明采用以下技术方案,包括:
[0006] 一种基于半监督学习深度对抗网络的故障诊断方法,括以下步骤:
[0007] S1,获取包含有k类轴承故障的样本总集合Y={Y1,Y2,Y3,…Yk},即Y={Yi}, i=1,2,3,…k;
[0008] Yi表示第i类轴承故障所对应的样本集合, 即
[0009] 表示第i类轴承故障所对应的样本集合Yi中的第j个样本数据;
[0010] 所述样本数据是指轴承的振动信号,且样本数据为一维向量;
[0011] S2,将样本数据转换为二维图像格式,得到二维样本数据,转换后的二维 图像格式不仅包括振动信号的时域特征,还包括振动信号的频域特征
[0012] S3,根据步骤S2所得的二维样本数据生成训练集;所述训练集中包括:带 标签的二维样本数据,无标签的二维样本数据;其中,标签是指轴承故障类别; 带标签的二维样本数据和无标签的二维样本数据均为真实样本;
[0013] S4,将训练集输入判别器D中,若判别器D的输入为带标签的二维样本数据 时,则进行监督学习;若判别器D的输入为无标签的二维样本数据时,则进行 无监督学习
[0014] 在监督学习阶段,将带标签的二维样本数据输入到判别器D进行监督学习, 判别器D能够判别出带标签的二维样本数据的标签即故障类别即可达到要求;
[0015] 在无监督学习阶段,构建一个生成器G与判别器D进行对抗训练,借助生成 对抗网络进行无监督学习;所述生成器G将随机噪声v映射为伪样本数据,且伪 样本数据也为二维图像格式,即将随机噪声v映射为二维伪样本数据;所述生成 器G的模型结构如下:生成器G:v→z,z=G(v,θg);其中,G(·)表示将随机噪声v 映射为二维图像格式的伪样本数据的模型,θg表示模型参数,z表示输出的伪样 本数据;将无标签的二维样本数据和二维伪样本数据输入到判别器D进行无监 督学习,判别器D能够判别出无标签的二维样本数据为真实样本即可达到要求; 即,不论输入无标签的二维样本数据的具体故障类别,判别器D只要能够输出 该无标签的二维样本数据为真实样本即可达到要求;
[0016] S5,基于判别器D进行的监督学习,以及基于判别器D与生成器G之间的生 成对抗网络以进行的无监督学习,构成了基于半监督学习深度对抗网络的故障 诊断模型,并对该故障诊断模型进行训练;
[0017] S6,对训练完成后的故障诊断模型进行模型测试,以对判别器D进行优化;
[0018] S7,后续的,已知轴承的振动信号后,即可利用优化后的判别器D进行故 障诊断。
[0019] 步骤S2中,利用小波变换将样本数据转换为二维图像格式,得到二维样本 数据;
[0020] 所述小波变换的公式,如下式所示:
[0021]
[0022] 式中,a表示缩放因子,用于小波函数的伸缩;τ表示平移因子,用于控制 小波函数的平移;f(t)表示振动信号即一维向量;t表示时间;ψ(·)表示小波函数; WT(·)表示小波变换;
[0023] 小波函数ψ(·)的公式,如下式所示:
[0024]
[0025] 步骤S4中,所述生成器G的网络结构为:首先是一个全连接层将原始输入 即随机噪声x映射到1024维向量,后面再依次连接四个反卷积模组成,每个 反卷积模块均依次连接包括:一个反卷积层,一个批归一化层即BN,一个relu激 活函数层;
[0026] 所述反卷积模块的形式化表示如下式所示:
[0027]
[0028] 式中, 表示反卷积运算;Wg表示反卷积核;bg表示反卷积核偏置;hθ表 示反卷积运算的结果;上标g用于标识生成器G的参数;BN(·)表示批归一化; relu(·)表示relu激活函数;
[0029] 此四个依次连接的反卷积模块中的反卷积核的大小均为5,此四个依次连接 的反卷积模块中的反卷积核数目依次为256、128、64、1。
[0030] 步骤S4中,所述判别器D模型结构为:判别器D由三个卷积模块组成,每 个卷积模块均为:首先是一个二维卷积操作即一个卷积层,其次是一个最大池 化层Maxpool,然后接一个批归一化层即BN,最后接一个leakrelu激活函数层;
[0031] 所述卷积块的形式化表示如下式所示:
[0032] md=Max_pool(Wd*x+bd);
[0033] hd=lrelu(BN(md));
[0034] 式中,*表示卷积运算;Wd表示卷积核;bd表示卷积核偏置;hd表示卷积 运算的结果;上标d用于标识判别器D的参数;Max_pool(·)表示最大池化;BN(·) 表示批归一化;relu(·)表示leakrelu激活函数;
[0035] 此三个卷积模块的卷积核大小依次为5、3、3,此三个卷积模块的卷积核数 目分别为64、128、256。
[0036] 步骤S4中,所述判别器D的输出类别共包括k+1类,判别器D的输出l为一 个k+1维的向量,即l={l1,l2,l3,…lk,lk+1};其中,前k类均表示判别为真实样本,且 分别对应k类轴承故障,即l={l1,l2,l3,…lk,0};第k+1类表示判别为伪样本,即 l={l1,l2,l3,…lk,1}。
[0037] 步骤S4中,采用softmax函数替换判别器的输出,将判别器的输出l转换 为P={P1,P2,P3,…Pk,Pk+1};softmax函数如下式所示:
[0038]
[0039] 式中,Pn表示判别器输出结果为第n类的概率;n=1,2,3…k均表示判别为真 实样本,且分别对应k类轴承故障;n=k+1表示判别为伪样本;e为自然常数。
[0040] 步骤S5中,故障诊断模型的训练分为三部分,分别对以下三个损失函数进 行优化:
[0041] 对于训练集中的带标签的二维样本数据,判断其输出的标签是否正确,即, 带标签的二维样本数据分类正确的概率Llabel:
[0042]
[0043] 对于训练集中的无标签的二维样本数据,判断输出是否为真实样本,即无 标签的二维样本数据不被判别为第k+1类的概率Lunlabel:
[0044]
[0045] 对于训练集中的二维伪样本数据,判断输出是否为伪样本,即二维伪样本 数据被判别为第k+1类的概率Lfake:
[0046]
[0047] 上述式中,Pmodel(y|x,y<k+1)表示判别器D的输出为前k类即真实样本的概 率;Pmodel(y=k+1|x)表示判别器D的输出为第k+1类即伪样本的概率;Gdata表示生 成器生成的伪样本;Pdata表示真实样本;x表示判别器D的输入数据;y表示判 别器D的输入数据的标签;
x,y~Pdata表示输入数据x为带有标签y的,且从Pdata中 选取的真实样本;x~Pdata表示输入数据x为不带标签的,且从Pdata中选取的真实 样本;x~Gdata表示输入数据x为生成器生成的,且从Gdata选取的伪样本;E表示 期望; 表示将所有带标签的输入数据被判断为真实样本的概率的期望;  表示将所有不带标签的输入数据被判断为真实样本的概率的期望; 表示将所有生成器生成的输入数据被判断为伪样本的概率的期望;
[0048] 所述生成对抗网络的目标函数包括:判别器D的损失函数LD和生成器G的 损失函数LG;其中,
[0049] 所述判别器D的损失函数LD,具体公式如下式所示:
[0050] LD=Llabel+Lunlabel+Lfake+Dregular;
[0051] 式中,Dregular表示对判别器D中的所有Wd做的L2正则化;Wd表示判别器D 中的网络参数;
[0052] 所述生成器G的损失函数LG,具体公式如下式(11)所示:
[0053] LG=-Lfake+0.01*Gfeature_matching;
[0054] 式中,Gfeature_matching表示训练过程中生成器G匹配判别器D的中间层上的特征 的预期值;判别器D的中间层是指卷积层;
[0055] 得到所述生成对抗网络的目标函数后,使用反向传播算法对故障诊断模型 的模型参数即θd和θg进行训练,使用Adam算法对模型参数进行更新,所述Adam 算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的 自适应学习率,其中,θd和θg分别为判别器D和生成器G的模型参数;
[0056]
[0057]
[0058]
[0059] 上述式中,α、β1、β2均为Adam优化器参数; 均为故障诊断模型的 整体网络模型参数; 均为用求导数的方式找的模型最优点。
[0060] 本发明的优点在于:
[0061] (1)本发明采用小波变换的方法,将时域信号转换为二维图像,通过将一 维数据转换为二维图像格式,不仅可以获得原始数据的时域特征,还可以获得 原始数据的频域特征,通过小波变换能够充分突出问题某些方面的特征,能对 时间和频率进行局部化分析,通过伸缩平移运算对信号逐步进行多尺度细化, 最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求, 从而可聚焦到信号的任意细节。
[0062] (2)本发明将无监督学习的思想引入到模型的训练过程,通过引入半监督 学习,将带标签的二维样本数据的监督学习与无标签的二维样本数据的无监督 学习相结合,虽然无标签的二维样本数据并不会提供标签,但是它提供了关于 数据分布的一种信息,这使本发明的模型对样本的整体分布有了进一步认识, 能够得到新的、更准确的判别器,能够实现在有限的带标签数据的情况下训练 得到高精度的故障诊断模型。
[0063] (3)本发明使用生成对抗网络的思想,即,将大量无标签的振动数据定义 为真,将生成器生成的伪样本数据定义为假,使判断器与生成器相互竞争生成 高质量数据,用于对判别器进行辅助训练,提高了分类的性能。附图说明
[0064] 图1为本发明的方法的整体示意图。
[0065] 图2a~2d依次为轴承在滚动体故障、内圈故障、正常、外圈十二点钟位置 故障下的振动信号的时域图。
[0066] 图3a~3d依次为轴承在滚动体故障、内圈故障、正常、外圈十二点钟位置 故障下的振动信号的二维格式即二维图像。
[0067] 图4为本发明的半监督学习深度对抗网络的网络结构示意图。

具体实施方式

[0068] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0069] 由图1和图2所示,本发明的一种基于半监督学习深度对抗网络的故障诊 断方法,包括以下具体步骤:
[0070] S1,获取包含有k类轴承故障的样本总集合Y={Y1,Y2,Y3,…Yk},即Y={Yi}, i=1,2,3,…k;本实施例中,轴承故障类别k=50;
[0071] Yi表示第i类轴承故障所对应的样本集合, 即
[0072] 表示第i类轴承故障所对应的样本集合Yi中的第j个样本数据;
[0073] 所述样本数据是指轴承的振动信号,且样本数据为一个维数为H的一维向 量;
[0074] 本实施例中,由图3a~3d所示,依次为轴承滚动体故障、内圈故障、正常、 外圈十二点钟位置故障下的振动信号的时域图。本实施例中,截取长度H=512 的振动时域信号作为训练样本。
[0075] S2,利用小波变换将样本数据转换为二维图像格式,得到二维样本数据, 转换后的二维图像格式不仅包括振动信号的时域特征,还包括振动信号的频域 特征;
[0076] 所述小波变换的公式,如下式(1)所示:
[0077]
[0078] 式(1)中,a表示缩放因子,用于小波函数的伸缩;τ表示平移因子,用 于控制小波函数的平移;f(t)表示振动信号即一维向量;t表示时间;ψ(·)表示小 波函数;WT(·)表示小波变换。
[0079] 本实施例中,所采用的小波函数ψ(·)的公式,如下式(2)所示:
[0080]
[0081] 式(2)中,选取一维振动信号中的512个时域数据点进行小波变换,且小 波变换过程中选取的中心率为0.8125,最后将小波变换后的结果转换为大小为 64×64的黑白图片,即得到振动信号经小波变换后的二维格式。
[0082] 本实施例中,由图3a~3d所示,依次为轴承在滚动体故障、内圈故障、正 常、外圈十二点钟位置故障下的振动信号的二维格式即二维图像。
[0083] S3,根据步骤S2所得的二维样本数据,生成训练集和测试集;所述训练集 中包括:带标签的二维样本数据,无标签的二维样本数据;所述测试集中包括: 无标签的二维样本数据。其中,标签是指轴承故障类别;带标签的二维样本数 据和无标签的二维样本数据均为真实样本,且带标签的二维样本数据的数据量 远小于无标签的二维样本数据的数据量。
[0084] S4,将训练集输入判别器D中,若判别器D的输入为带标签的二维样本数据 时,则进行监督学习;若判别器D的输入为无标签的二维样本数据时,则进行 无监督学习。
[0085] 由图4所示,所述判别器D模型结构为:
[0086] 判别器D由三个卷积模块组成,每个卷积模块均为:首先是一个二维卷积 操作即一个卷积层,,其次是一个最大池化层Maxpool,然后接一个批归一化层 即BN,最后接一个leakrelu激活函数层;
[0087] 所述卷积块的形式化表示如下式(3)、(4)所示:
[0088] md=Max_pool(Wd*x+bd);  (3)
[0089] hd=lrelu(BN(md));  (4)
[0090] 式(3)、(4)中,*表示卷积运算;Wd表示卷积核;bd表示卷积核偏置; hd表示卷积运算的结果;上标d用于标识判别器D的参数;Max_pool(·)表示最大 池化;BN(·)表示批归一化;relu(·)表示leakrelu激活函数;
[0091] 所述判别器D的此三个卷积模块的卷积核大小依次为5、3、3,此三个卷积 模块的卷积核数目分别为64、128、256。
[0092] 所述判别器D的输出类别共包括k+1类,判别器D的输出l为一个k+1维的向 量,即l={l1,l2,l3,…lk,lk+1};其中,前k类均表示判别为真实样本,且分别对应k类 轴承故障,即l={l1,l2,l3,…lk,0};第k+1类表示判别为伪样本,即l={l1,l2,l3,…lk,1};
[0093] 为了识别多种对象,本实施例中对判别器D进行了增强,采用softmax函 数替换判别器的输出,使判别器成为识别多种对象类型的标准判别器,将判别 器的输出l转换为P={P1,P2,P3,…Pk,Pk+1};softmax函数如下式(5)所示:
[0094]
[0095] 式(6)中,Pn表示判别器输出结果为第n类的概率;n=1,2,3…k均表示判别 为真实样本,且分别对应k类轴承故障;n=k+1表示判别为伪样本;e为自然常 数,是数学中一个常数,是一个无限不循环小数,且为超越数,其值约为2.71828。
[0096] 在监督学习阶段,将带标签的二维样本数据输入到判别器D进行监督训练, 判别器D的输出为其所判别的标签即故障类别,判断判别器D所输出的标签是否 正确。
[0097] 在无监督学习阶段,将构建一个生成器G与判别器D进行对抗训练,通过借 助生成对抗网络的思想实现无监督学习,可以从无标签的二维样本数据中进行 学习,只要能够判别出无标签的二维样本数据为真实样本即可达到要求;即, 不论输入无标签的二维样本数据的具体故障类别,只要能最大化的输出该无标 签的二维样本数据不被判别为第k+1类的概率即可,不需要识别出具体的故障类 别。
[0098] 所述生成器G将随机噪声v映射为伪样本数据,且伪样本数据也为二维图像 格式,即将随机噪声v映射为二维伪样本数据;所述生成器G的模型结构如下:
[0099] 生成器G:v→z,z=G(v,θg);其中,v表示随机噪声,该随机噪声v为一个n 维的向量;G(·)表示将随机噪声v映射为二维图像格式的伪样本数据的模型;θg表 示模型参数;z表示输出的二维伪样本数据;
[0100] 由图4所示,所述生成器G的网络结构为:首先是一个全连接层将原始输 入即随机噪声x映射到1024维向量,后面再依次连接四个反卷积模块组成,每 个反卷积模块均依次连接包括:一个反卷积层,一个批归一化层即BN,一个relu 激活函数层,一个反卷积层;
[0101] 所述反卷积模块的形式化表示如下式(6)所示:
[0102]
[0103] 式(6)中, 表示反卷积运算;Wθ表示反卷积核;bθ表示反卷积核偏置; hθ表示反卷积运算的结果;上标θ用于标识生成器G的参数;BN(·)表示批归一化; relu(·)表示relu激活函数;
[0104] 所述生成器G的此四个依次连接的反卷积模块中的反卷积核的大小均为5, 此四个依次连接的反卷积模块中的反卷积核数目依次为256、128、64、1。
[0105] S5,基于判别器D进行的监督学习,以及基于判别器D与生成器G之间的生 成对抗网络以进行的无监督学习,构成了基于半监督学习深度对抗网络的故障 诊断模型;对该故障诊断模型进行训练:
[0106] 故障诊断模型的训练分为三部分,分别对以下三个损失函数进行优化:
[0107] 对于训练集中的带标签的二维样本数据,判断其输出的标签是否正确,即, 带标签的二维样本数据分类正确的概率Llabel:
[0108]
[0109] 对于训练集中的无标签的二维样本数据,判断输出是否为真实样本,即无 标签的二维样本数据不被判别为第k+1类的概率Lunlabel:
[0110]
[0111] 对于训练集中的二维伪样本数据,判断输出是否为伪样本,即二维伪样本 数据被判别为第k+1类的概率Lfake:
[0112]
[0113] 上述式中,Pmodel(y|x,y<k+1)表示判别器D的输出为前k类即真实样本的概 率;Pmodel(y=k+1|x)表示判别器D的输出为第k+1类即伪样本的概率;Gdata表示生 成器生成的伪样本;Pdata表示真实样本;x表示判别器D的输入数据;y表示判 别器D的输入数据的标签;
x,y~Pdata表示输入数据x为带有标签y的,且从Pdata中 选取的真实样本;x~Pdata表示输入数据x为不带标签的,且从Pdata中选取的真实 样本;x~Gdata表示输入数据x为生成器生成的,且从Gdata选取的伪样本;E表示 期望; 表示将所有带标签的输入数据被判断为真实样本的概率的期望;  表示将所有不带标签的输入数据被判断为真实样本的概率的期望; 表示将所有生成器生成的输入数据被判断为伪样本的概率的期望;
[0114] 所述生成对抗网络的目标函数包括:判别器D的损失函数LD和生成器G的 损失函数LG;其中,
[0115] 所述判别器D的损失函数LD,具体公式如下式(10)所示:
[0116] LD=Llabel+Lunlabel+Lfake+Dregular;  (10)
[0117] 式(10)中,Dregular表示对判别器D中的所有Wd做的L2正则化;Wd表示判 别器D中的网络参数;
[0118] 所述生成器G的损失函数LG,具体公式如下式(11)所示:
[0119] LG=-Lfake+0.01*Gfeature_matching;  (11)
[0120] 式(11)中,Gfeature_matching表示训练过程中生成器G以匹配判别器D的中间层 上的特征的预期值来提高模型的稳定性,希望生成器G生成的伪样本输入至判 别器D的每一层结构与真实样本输入至判别器D的每一层结构尽可能相似,判别 器D的中间层是指卷积层;例如,假设a(·)为判别器D的中间层激活函数,v是对 生成器G输入的噪声,那么
Gfeature_matching即为:
[0121]
[0122] 得到所述生成对抗网络的目标函数后,使用反向传播算法对故障诊断模型 的模型参数即θd和θg进行训练,使用Adam算法对模型参数进行更新,所述Adam 算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的 自适应学习率,其中,θd和θg分别为判别器D和生成器G的模型参数;
[0123]
[0124]
[0125]
[0126] 上述式中,α、β1、β2均为Adam优化器参数;本实施例中,α=0.0001,β1=0.5, β2=0.9。 均为故障诊断模型的整体网络模型参数; 均为用 求导数的方
式找的模型最优点
[0127] S6,得到故障诊断模型的模型参数后,利用测试集对故障诊断模型进行模 型测试:在半监督学习中,在无监督学习阶段,无标签的二维样本数据集送入 故障诊断模型;在监督学习阶段,少量带标签的二维样本数据集被送入故障诊 断模型。实验中的结果为多次实验取平均后的结果。深度学习框架TensorFlow 被用于每种方法实现,然后所有方法都使用Adam算法进行求解。每种方法使用 网格搜索的方式寻找合适的超参数,然后记录最佳结果用于比较。为了验证 SACNN的小样本分类的能力,对于每个负载条件,在2005个测试样本的情况下 获得最终测试准确度。
[0128] 本实施例中,不同数量下的带标签的二维样本数据所训练生成的判别器D, 对测试集中的各类振动信号的分类精度,如下表1所示:
[0129]
[0130] 表1
[0131] 由表1可知,本发明在少量的带标签的二维样本数据的情况下,所训练生 成的判别器D的分类精度能达到98%以上。
[0132] S7,后续的,已知轴承的振动信号后,即可利用优化后的判别器D进行故 障诊断。
[0133] 以上仅为本发明创造的较佳实施例而已,并不用以限制本发明创造,凡在 本发明创造的精神和原则之内所作的任何修改、等同替换和改进等,均应包含 在本发明创造的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈