首页 / 专利库 / 专利权 / 专利合作条约 / 第I章 / 国际申请 / 明显错误 / 非平衡小样本场景下风机轴承故障深度对抗诊断方法

非平衡小样本场景下轴承故障深度对抗诊断方法

阅读:816发布:2021-02-25

专利汇可以提供非平衡小样本场景下轴承故障深度对抗诊断方法专利检索,专利查询,专利分析的服务。并且本 发明 是一种非平衡小样本场景下 风 机 轴承 故障深度对抗诊断方法,其特点是,包括风 电机 组轴承振动 信号 采集、改进AC-GAN模型构建、改进AC-GAN样本构建、风电机组轴承振动信号样本生成和各场景下风电机组轴承故障诊断等步骤:解决了基于振动信号的风机故障诊断存在的振动信号噪声干扰复杂、故障样本少且类别间样本数非平衡等问题,提高了小样本非平衡场景下故障识别准确率,能够在高噪声干扰、样本数量不足及不同类型样本训练集规模非平衡等复杂场景下具有较好的故障识别准确率,具有科学合理,适应性强,实用价值高,可为风机研发、风 电场 运行维护、风机研究等相关人员提供参考。,下面是非平衡小样本场景下轴承故障深度对抗诊断方法专利的具体信息内容。

1.一种非平衡小样本场景下轴承故障深度对抗诊断方法,其特征是,它包括以下步骤:
1)风电机组轴承振动信号采集
通过加速传感器采集风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号,并将采集的风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号由16通道的数据记录器记录,信号采样频率为12kHz;
2)改进AC-GAN模型构建
生成对抗网络(Generative Adversarial Networks,GAN)包含生成器(Generator,G)和判别器(Discriminator,D)两部分;G将噪声信号z映射到样本空间,得到生成样本数据Xfake=G(z);将生成样本Xfake或真实样本Xreal输入判别器,由D判定并输出概率值(P(S|X)=D(X)),表示判别样本X属于S的概率,S为样本来源,其有两种可能:真实(real),生成(fake),GAN目标函数为:
含D目标函数和G目标函数两部分,
其中,D目标函数为:
GAN通过式(2)式优化D参数,其中,输入为真实样本Xreal时,D最大化“真实样本”判别概率;输入为生成样本Xfake时,D最大化“生成样本”判别概率,“真实样本”与“生成样本”判别概率的期望E相加,为D目标函数,G目标函数为:
由式(3)优化G时,与真实样本无关,故舍去GAN目标函数中的第1项,即舍去E[log P(S=real|Xreal)],仅保证最小化生成样本Xfake被判别为“生成样本”的概率,GAN训练过程中,模型的生成器G与判别器D交替优化,通过G与D相互博弈,最终使G生成样本符合真实样本概率分布,达到纳什均衡,GAN无需先验概率建模,就能学习真实样本的分布,通过生成样本提高小样本场景下故障诊断准确率,但是,为解决由于GAN无先验知识指导,使GAN对初始参数极其敏感,且存在训练不稳定与模式损失,导致在部分模式上生成样本缺乏多样性;同时,输入G的随机噪声信号无约束,导致生成样本概率分布与生成目标间差异大,且学习过程易发生崩溃的问题,采用含带标签辅助分类器的生成对抗网络AC-GAN,在GAN的基础上增加了噪声标签和多分类功能,使其根据标签生成指定类型样本,或利用其判别器直接实现样本多分类;AC-GAN中,G在输入随机噪声信号z同时输入生成样本对应类标签c,利用z和c,生成对应类别样本Xfake=G(c,z),判别器D同时输出样本X来源于S的概率P(S|X)和属于不同类别的概率P(C|X),即为:
[P(S|X),P(C|X)]=D(X)                              (4)
其中C=c,c∈{1,2,…,n},n表示样本类数,
AC-GAN中,G目标函数为最大化LC-LS,D目标函数为最大化LC+LS,LS与LC与定义为:
其中,LS为正确源损失函数,衡量判别数据来源于真实样本的正确性;LC为正确类损失函数,衡量输出类别的正确性,AC-GAN通过内部博弈,最终实现有效生成与识别多类样本,为解决小样本非平衡及复杂噪声场景下,风机轴承故障诊断准确率不足问题,并提高信号特征提取效果,构建改进AC-GAN模型,AC-GAN模型在G的输入端加入不带噪声的故障样本类别标签 提高多分类场景下生成数据针对性;生成器中加入Dropout层,防
止过拟合导致生成重复数据;判别器中添加卷积层提取更多细节特征,并引入噪声过渡模型,重定义损失函数,使D在不同场景下进行故障识别时均具有良好的性能,在G中加入Dropout层,保证故障样本生成质量,并用其生成大量故障类型样本数据进行D数据增强,在训练过程中,采用正则化Dropout方法随机忽略G部分神经元,使之在反向传播时不会更新权值参数,降低对神经元特定权值敏感性,提升模型的泛化能,此外,在D中加入卷积层,使其提取更多原始信号细节特征,通过权值共享,卷积层减少模型训练参数,提高训练效率;同时,以卷积核对故障样本进行区域动态特征提取,能提取出更多细节特征,从而提高D故障诊断能力,由于噪声的影响,真实故障样本的实际类别可能被误识别,为提高新模型抗噪性,在D中引入噪声过渡模型并重定义损失函数,将真实故障样本实际类别标签定义为不带噪声的样本标签 将真实故障样本被错误标记的标签定义为带噪声的样
本标签 如真实故障样本类别为第i类、则其可能被误标记为第j类的概率称为噪声过渡概率Ti,j为:
由此,噪声过渡模型T定义为:
T=(Ti,j),T∈[0,1]n×n且(∑i Ti,j=1)                       (7)
在此基础上,定义辅助分类损失函数 代替原AC-GAN中的正确类损失函数LC,以提高D抗噪能力, 定义为
式(8)中,xr表示真实故障样本, 表示将真实故障样本判别为带噪声的样本标签 的概率,表示将真实故障样本判别为不带噪声的样本标签 的概率,类似地,损失函数 代替原AC-GAN中的正确源损失函数LS, 如下:
式(9)中,改进AC-GAN通过 优化生成器 生成无噪声的故障样本,
基于重定义损失函数构建的改进AC-GAN目标函数,在博弈优化过程中向降低噪声导致故障误识别概率方向开展优化,提高了D的抗噪性能;
3)改进AC-GAN样本构建
滚动轴承状态分为10类,其中,正常状态为第1类,按照不同故障位置,即滚动体,内圈和外圈,不同损伤直径故障程度,即轻微,中度和重度,将故障状态分为第2类至第10类,即类1为正常状态,类2为滚动体轻微故障,类3滚动体中度故障,类4滚动体重度故障,类5为内圈轻微故障,类6为内圈中度故障,类7为内圈重度故障,类8为外圈轻微故障,类9为外圈中度故障,类10为外圈重度故障,采用CWRU数据集中12kHz采样频率下的驱动端轴承故障数据,轴承类型为6205-2RS JEM SKF,转速1750r/min,由于轴承旋转工作,其振动信号故障特征存在周期性,12kHz的采样率意味着每秒采样12000个数据点,轴承转速1750r/min,那么每运行一圈可以采样12000/(1750/60)≈411个点,为了更好的适应生成对抗神经网络的结构,舍去个别信号奇异点或飞升点,轴承每运行一圈,按照采样392个点,为保证信息完整性和故障特征有效性,每个故障样本采用两个旋转周期内784个采样点的振动信号构成,同时,为提高训练样本数量且保障样本差异性,训练样本通过重叠采样获取,为通过卷积层挖掘更多细节特征,将每个样本处理为28×28的二维矩阵,输入改进AC-GAN的判别器D;
4)风电机组轴承振动信号样本生成
采用改进AC-GAN通过带标签约束的生成器,生成兼具真实性与差异性的“生成样本”,训练初始阶段,MMD(Maximum Mean Discrepancy)值较大、MS(Mode Score)值较小,生成样本真实性低、多样性小,随着训练的进行,MMD值逐渐下降,MS逐渐增加,生成样本与真实样本的概率分布逐渐接近,而且生成样本的多样性提高,采用三种统计量平均值Mean、方差Std和最大值Max,分析生成样本和原始样本的概率统计特性,X(k)表示故障样本时间序列,平均值体现故障样本振动范围;方差体现故障样本离散程度;最大值体现故障样本振动幅值,并以PDF曲线展现生成数据集与真实数据集概率分布特性;
5)各场景下风电机组轴承故障诊断
(a)复杂噪声环境下风电机组轴承故障诊断
在不同噪声环境下验证改进AC-GAN复杂噪声环境下故障诊断准确性,每个故障类型训练集样本数为2000,测试集样本数为400,对改进AC-GAN模型进行抗噪性训练,当模型通过噪声,由生成器生成的样本与真实带噪声样本平均值Mean、最大值Max和方差Std概率分布相似时,判别器学习到各类故障的内部分布规律,改进AC-GAN模型训练完成,将训练完成的改进AC-GAN模型分别在信噪比为25dB、30dB、35dB和40dB的噪声环境下开展测试,在进行故障分类时,将实测信号输入判别器,判别器通过64个不同的卷积核提取故障特征,每个特征映子图均由故障样本卷积产生,高噪声环境下,各故障类型卷积特征图具有明显差异;
(b)小样本场景下风电机组轴承故障诊断
原始的每个故障类型为2000个训练样本,采用训练样本减少的方式模拟小样本场景,样本减少过程中采用随机减少样本方法,分别减少每类原始故障训练样本的20%、40%、
60%,构成不同规模训练样本集,将不同规模训练样本集输入判别器,判别器学习故障样本集的平均值Mean、方差Std和最大值Max分布规律,通过与生成器的生成样本与真实样本不断比较分析平均值Mean、方差Std和最大值Max分布规律,当生成样本集与真实样本集分布规律相似时,说明判别器学习到10类故障类型特征,最后在每个故障类型为500测试样本的测试集上测试不同训练样本数下新方法分类效果,验证改进AC-GAN在小样本场景下轴承机械故障诊断的有效性;
(c)非平衡场景下风电机组轴承故障诊断
平衡类的故障样本数为每类2000,非平衡类故障类样本数为每类1000,分别构建非平衡类为类1,类2,类6和类10的一类非平衡集,类6与类9,类3与类10的二类非平衡训练集,类
1、类4与类10的三类非平衡集,由此构建多种非平衡训练集,仿真实际环境下可能存在的样本非平衡场景,并分别训练改进AC-GAN模型,改进AC-GAN在训练过程中通过生成器不断学习非平衡故障类型的内部平均值Mean、最大值Max和方差Std概率分布规律,实现非平衡故障类自动填补,达到非平衡场景下的风电机组轴承故障诊断的目的。

说明书全文

非平衡小样本场景下轴承故障深度对抗诊断方法

[0001] 本发明涉及风机轴承故障诊断方法,具体地说,是一种非平衡小样本场景下风机轴承故障深度对抗诊断方法,应用于风电机组轴承机械故障状态的在线诊断。

背景技术

[0002] 轴承作为发电机传动系统的核心部件,持续受到交变冲击力和载荷作用影响,成为机械故障高发部位。轴承一旦损坏,风机停机时间长、修复成本高,经济损失严重。因此,准确诊断风机轴承故障对保障风电机组安全、可靠运行与风场经济性具有重要意义。
现有的风机轴承故障诊断一般基于轴承振动信号开展,诊断过程分为特征提取与模式识别两部分。主要是根据轴承发生故障时振动信号各频带能量变化识别轴承故障;通过时-频分析法,解析振动信号在时-频域能量分布,提取相关时-频信号特征。常用时-频分析方法包括小波变换、经验模态分解与变分模态分解。小波变换通过多分辨率时-频局部化,有效提取非线性暂态振动时-频信号特征;但在处理复杂振动信号时,需选择不同基函数才能获得最佳效果,且参数选取无统一标准。经验模态分解具有自适应信号处理能力,但存在端点效应和模态混叠等不足。变分模态分解是多分量信号自适应分解方法,在处理轴承滚动信号时具有良好的抗噪性能;但模态数需根据先验知识进行预估,如模态数选择不合理则易造成较大分解误差。采用盲源分离技术将故障信号分解为稳态和非稳态分量,最后对具有最大峭度值的非稳态分量进行包络谱分析,该方法能有效确定潜在故障特征频率,但其忽略了时间序列所造成的影响。现有特征提取方法虽取得较好的应用效果,但其过程复杂,且部分环节依赖专家经验。
[0003] 模式识别方法主要包括极限学习机(Extreme Learning Machine,ELM)、支持向量机(Support Vector Machine,SVM)、卷积神经网络(Convolutional Neural Networks,CNN)等。ELM学习速度快、所需训练样本少,能够实现快速故障诊断,但稳定性相对较弱。SVM能够高效的解决高维非线性决策问题,但核参数和样本参数选择困难,且受故障样本影响显著。CNN对原始故障数据进行网络层间学习,建立故障样本和故障类别之间的映射关系,不需要特征提取,并将待观测数据样本输送至已训练好的网络进行故障判定的有效技术手段,但故障样本数据较少场景下难以有效应用。现有研究已在实施例环境下,获得较好的故障诊断效果。但由于轴承故障振动实施例数据获取成本高、故障程度有限,缺乏故障训练数据时,支持向量机等多类分类器易将无训练故障样本误识别为错误的故障类型甚至正常状态,严重影响设备可靠性,且实测数据往往存在不同类型样本累积数据量不同导致的数据非平衡问题,导致现有方法在非平衡小样本故障诊断场景下识别准确率有限,甚至存在状态误识别问题。

发明内容

[0004] 本发明的目的在于克服现有技术的不足,提供一种科学合理,适应性强,实用价值高,能够在高噪声干扰、样本数量不足及不同类型样本训练集规模非平衡,且复杂场景下,具有较好的故障识别准确率的非平衡小样本场景下风机轴承故障深度对抗诊断方法。
[0005] 本发明的目的是通过以下技术手段实现的:一种非平衡小样本场景下风机轴承故障深度对抗诊断方法,其特征是,它包括以下步骤:
[0006] 1)风电机组轴承振动信号采集
[0007] 通过加速传感器采集风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号,并将采集的风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号由16通道的数据记录器记录,信号采样频率为12kHz;
[0008] 2)改进AC-GAN模型构建
[0009] 生成对抗网络(Generative Adversarial  Networks,GAN)包含生成器(Generator,G)和判别器(Discriminator,D)两部分;G将噪声信号z映射到样本空间,得到生成样本数据Xfake=G(z);将生成样本Xfake或真实样本Xreal输入判别器,由D判定并输出概率值(P(S|X)=D(X)),表示判别样本X属于S的概率,S为样本来源,其有两种可能:真实(real),生成(fake),GAN目标函数为:
[0010]
[0011] 含D目标函数和G目标函数两部分,
[0012] 其中,D目标函数为:
[0013]
[0014] GAN通过式(2)式优化D参数,其中,输入为真实样本Xreal时,D最大化“真实样本”判别概率;输入为生成样本Xfake时,D最大化“生成样本”判别概率,“真实样本”与“生成样本”判别概率的期望E相加,为D目标函数,G目标函数为:
[0015]
[0016] 由式(3)优化G时,与真实样本无关,故舍去GAN目标函数中的第1项,即舍去E[log P(S=real|Xreal)],仅保证最小化生成样本Xfake被判别为“生成样本”的概率,[0017] GAN训练过程中,模型的生成器G与判别器D交替优化,通过G与D相互博弈,最终使G生成样本符合真实样本概率分布,达到纳什均衡,GAN无需先验概率建模,就能学习真实样本的分布,通过生成样本提高小样本场景下故障诊断准确率,但是,为解决由于GAN无先验知识指导,使GAN对初始参数极其敏感,且存在训练不稳定与模式损失,导致在部分模式上生成样本缺乏多样性;同时,输入G的随机噪声信号无约束,导致生成样本概率分布与生成目标间差异大,且学习过程易发生崩溃的问题,采用含带标签辅助分类器的生成对抗网络AC-GAN,在GAN的基础上增加了噪声标签和多分类功能,使其根据标签生成指定类型样本,或利用其判别器直接实现样本多分类;AC-GAN中,G在输入随机噪声信号z同时输入生成样本对应类标签c,利用z和c,生成对应类别样本Xfake=G(c,z),判别器D同时输出样本X来源于S的概率P(S|X)和属于不同类别的概率P(C|X),即为:
[0018] [P(S|X),P(C|X)]=D(X)  (4)
[0019] 其中C=c,c∈{1,2,,n},n表示样本类数,
[0020] AC-GAN中,G目标函数为最大化LC-LS,D目标函数为最大化LC+LS,LS与LC与定义为:
[0021]
[0022] 其中,LS为正确源损失函数,衡量判别数据来源于真实样本的正确性;LC为正确类损失函数,衡量输出类别的正确性,AC-GAN通过内部博弈,最终实现有效生成与识别多类样本,为解决小样本非平衡及复杂噪声场景下,风机轴承故障诊断准确率不足问题,并提高信号特征提取效果,构建改进AC-GAN模型,AC-GAN模型在G的输入端加入不带噪声的故障样本类别标签 提高多分类场景下生成数据针对性;生成器中加入Dropout层,防止过拟合导致生成重复数据;判别器中添加卷积层提取更多细节特征,并引入噪声过渡模型,重定义损失函数,使D在不同场景下进行故障识别时均具有良好的性能,在G中加入Dropout层,保证故障样本生成质量,并用其生成大量故障类型样本数据进行D数据增强,在训练过程中,采用正则化Dropout方法随机忽略G部分神经元,使之在反向传播时不会更新权值参数,降低对神经元特定权值敏感性,提升模型的泛化能力,此外,在D中加入卷积层,使其提取更多原始信号细节特征,通过权值共享,卷积层减少模型训练参数,提高训练效率;同时,以卷积核对故障样本进行区域动态特征提取,能提取出更多细节特征,从而提高D故障诊断能力,由于噪声的影响,真实故障样本的实际类别可能被误识别,为提高新模型抗噪性,在D中引入噪声过渡模型并重定义损失函数,将真实故障样本实际类别标签定义为不带噪声的样本标签 将真实故障样本被错误标记的标签定义为带噪声的样
本标签 如真实故障样本类别为第i类、则其可能被误标记为第j类的概率称为噪声过渡概率Ti,j为:
[0023]
[0024] 由此,噪声过渡模型T定义为:
[0025] T=(Ti,j),T∈[0,1]n×n且(∑i Ti,j=1)  (7)
[0026] 在此基础上,定义辅助分类损失函数 代替原AC-GAN中的正确类损失函数LC,以提高D抗噪能力, 定义为
[0027]
[0028] 式(8)中,xr表示真实故障样本,表示将真实故障样本判别为带噪声的样本标签的概率,表示将真实故障样本判别为不带噪声的样本标签 的概率,类似地,损失函数代替原AC-GAN中的正确源损失函数LS, 如下:
[0029]
[0030] 式(9)中,改进AC-GAN通过 优化生成器 生成无噪声的故障样本,
[0031] 基于重定义损失函数构建的改进AC-GAN目标函数,在博弈优化过程中向降低噪声导致故障误识别概率方向开展优化,提高了D的抗噪性能;
[0032] 3)改进AC-GAN样本构建
[0033] 将滚动轴承状态分为10类,其中,正常状态为第1类,按照不同故障位置,即滚动体,内圈和外圈,不同损伤直径故障程度,即轻微,中度和重度,将故障状态分为第2类至第10类,即类1为正常状态,类2为滚动体轻微故障,类3滚动体中度故障,类4滚动体重度故障,类5为内圈轻微故障,类6为内圈中度故障,类7为内圈重度故障,类8为外圈轻微故障,类9为外圈中度故障,类10为外圈重度故障,采用CWRU数据集中12kHz采样频率下的驱动端轴承故障数据,轴承类型为6205-2RS JEM SKF,转速1750r/min,由于轴承旋转工作,其振动信号故障特征存在周期性,12kHz的采样率意味着每秒采样12000个数据点,轴承转速1750r/min,那么每运行一圈可以采样12000/(1750/60)≈411个点,为了更好的适应生成对抗神经网络的结构,舍去个别信号奇异点或飞升点,轴承每运行一圈,按照采样392个点,为保证信息完整性和故障特征有效性,每个故障样本采用两个旋转周期内784个采样点的振动信号构成,同时,为提高训练样本数量且保障样本差异性,训练样本通过重叠采样获取,为通过卷积层挖掘更多细节特征,将每个样本处理为28×28的二维矩阵,输入改进AC-GAN的判别器D;
[0034] 4)风电机组轴承振动信号样本生成
[0035] 采用改进AC-GAN通过带标签约束的生成器,生成兼具真实性与差异性的“生成样本”,训练初始阶段,MMD(Maximum Mean Discrepancy)值较大、MS(Mode Score)值较小,生成样本真实性低、多样性小,随着训练的进行,MMD值逐渐下降,MS逐渐增加,生成样本与真实样本的概率分布逐渐接近,而且生成样本的多样性提高,采用三种统计量平均值Mean、方差Std和最大值Max,分析生成样本和原始样本的概率统计特性,X(k)表示故障样本时间序列,平均值体现故障样本振动范围;方差体现故障样本离散程度;最大值体现故障样本振动幅值,并以PDF曲线展现生成数据集与真实数据集概率分布特性;
[0036] 5)各场景下风电机组轴承故障诊断
[0037] (a)复杂噪声环境下风电机组轴承故障诊断
[0038] 在不同噪声环境下验证改进AC-GAN复杂噪声环境下故障诊断准确性,每个故障类型训练集样本数为2000,测试集样本数为400,对改进AC-GAN模型进行抗噪性训练,当模型通过噪声,由生成器生成的样本与真实带噪声样本平均值Mean、最大值Max和方差Std概率分布相似时,判别器学习到各类故障的内部分布规律,改进AC-GAN模型训练完成,将训练完成的改进AC-GAN模型分别在信噪比为25dB、30dB、35dB和40dB的噪声环境下开展测试,在进行故障分类时,将实测信号输入判别器,判别器通过64个不同的卷积核提取故障特征,每个特征映子图均由故障样本卷积产生,高噪声环境下,各故障类型卷积特征图具有明显差异;
[0039] (b)小样本场景下风电机组轴承故障诊断
[0040] 原始的每个故障类型为2000个训练样本,采用训练样本减少的方式模拟小样本场景,样本减少过程中采用随机减少样本方法,分别减少每类原始故障训练样本的20%、40%、60%,构成不同规模训练样本集,将不同规模训练样本集输入判别器,判别器学习故障样本集的平均值Mean、方差Std和最大值Max分布规律,通过与生成器的生成样本与真实样本不断比较分析平均值Mean、方差Std和最大值Max分布规律,当生成样本集与真实样本集分布规律相似时,说明判别器学习到10类故障类型特征,最后在每个故障类型为500测试样本的测试集上测试不同训练样本数下新方法分类效果,验证改进AC-GAN在小样本场景下轴承机械故障诊断的有效性;
[0041] (c)非平衡场景下风电机组轴承故障诊断
[0042] 平衡类的故障样本数为每类2000,非平衡类故障类样本数为每类1000,分别构建非平衡类为类1,类2,类6和类10的一类非平衡集,类6与类9,类3与类10的二类非平衡训练集,类1、类4与类10的三类非平衡集,由此构建多种非平衡训练集,仿真实际环境下可能存在的样本非平衡场景,并分别训练改进AC-GAN模型,改进AC-GAN在训练过程中通过生成器不断学习非平衡故障类型的内部平均值Mean、最大值Max和方差Std概率分布规律,实现非平衡故障类自动填补,达到非平衡场景下的风电机组轴承故障诊断的目的。
[0043] 本发明的一种非平衡小样本场景下风机轴承故障深度对抗诊断方法,解决了基于振动信号的风机故障诊断存在的振动信号噪声干扰复杂、故障样本少且类别间样本数非平衡等问题,其优点在于:
[0044] (1)将AC-GAN引入风机轴承故障识别领域,实现了小样本非平衡场景下有效数据增强,提高了系统对非平衡故障类型识别能力;
[0045] (2)在生成器输入端加入可支持噪声过渡模型的真实故障样本类别标签,提高了多分类场景下数据生成能力;
[0046] (3)在生成器中加入Dropout层,提升了模型的泛化能力,防止了过拟合导致的生成重复数据,保证了故障样本生成质量;
[0047] (4)判别器中添加了卷积层,有效提取更多细节特征,并引入噪声过渡模型,重定义损失函数,提高了模型抗噪能力;
[0048] (5)在高噪声干扰、样本数量不足及不同类型样本训练集规模非平衡等复杂场景下该方法具有较好的故障识别准确率。具有科学合理,适应性强,实用价值高,可为风机研发、风电场运行维护、风机研究等相关人员提供参考。附图说明
[0049] 图1为风电机组轴承故障诊断改进AC-GAN模型结构图;
[0050] 图2为改进AC-GAN判别器的实施例样本集合构建图;
[0051] 图3为改进AC-GAN判别器实施例样本构成的矩阵图;
[0052] 图4为生成器训练过程MMD与MS指标变化图;
[0053] 图5为风电机组轴承不同信噪比故障信号图。

具体实施方式

[0054] 本发明的一种计及非平衡小样本场景下风机轴承故障深度对抗诊断方法,包括以下步骤:
[0055] 1)风电机组轴承振动信号采集
[0056] 通过加速度传感器采集风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号,并将上述信号由16通道的数据记录器记录,信号采样频率为12kHz;
[0057] 2)改进AC-GAN模型构建
[0058] 生成对抗网络(Generative Adversarial  Networks,GAN)包含生成器(Generator,G)和判别器(Discriminator,D)两部分;G将噪声信号z映射到样本空间,得到生成样本数据Xfake=G(z);将生成样本Xfake或真实样本Xreal输入判别器,由D判定并输出概率值(P(S|X)=D(X)),表示判别样本X属于S的概率,S为样本来源,其有两种可能:真实(real),生成(fake),GAN目标函数为:
[0059]
[0060] 含D目标函数和G目标函数两部分,
[0061] 其中,D目标函数为:
[0062]
[0063] GAN通过式(2)优化D参数,其中,输入为真实样本Xreal时,D最大化“真实样本”判别概率;输入为生成样本Xfake时,D最大化“生成样本”判别概率,“真实样本”与“生成样本”判别概率的期望E相加,为D目标函数,
[0064] G目标函数为:
[0065]
[0066] 由式(3)优化G时,与真实样本无关,故舍去GAN目标函数中的第1项,即舍去E[log P(S=real|Xreal)],仅保证最小化生成样本Xfake被判别为“生成样本”的概率,[0067] GAN训练过程中,模型的生成器G与判别器D交替优化,通过G与D相互博弈,最终使G生成样本符合真实样本概率分布,达到纳什均衡,GAN无需先验概率建模,就能学习真实样本的分布,通过生成样本提高小样本场景下故障诊断准确率,但由于GAN无先验知识指导,使GAN对初始参数极其敏感,且存在训练不稳定与模式损失,导致在部分模式上生成样本缺乏多样性;同时,输入G的随机噪声信号无约束,导致生成样本概率分布与生成目标间差异大,且学习过程易发生崩溃,为了解决以上问题,采用含带标签辅助分类器的生成对抗网络AC-GAN,在传统GAN基础上增加了噪声标签和多分类功能,使其根据标签生成指定类型样本,或利用其判别器直接实现样本多分类;
[0068] AC-GAN中,G在输入随机噪声信号z同时输入生成样本对应类标签c,利用z和c,生成对应类别样本Xfake=G(c,z),判别器D同时输出样本X来源于S的概率P(S|X)和属于不同类别的概率P(C|X),即为:
[0069] [P(S|X),P(C|X)]=D(X)  (4)
[0070] 其中C=c,c∈{1,2,,n},n表示样本类数,
[0071] AC-GAN中,G目标函数为最大化LC-LS,D目标函数为最大化LC+LS,LS与LC与定义为[0072]
[0073] 其中,LS为正确源损失函数,衡量判别数据来源于真实样本的正确性;LC为正确类损失函数,衡量输出类别的正确性,AC-GAN通过内部博弈,最终实现有效生成与识别多类样本,为解决小样本非平衡及复杂噪声场景下,风机轴承故障诊断准确率不足问题,并提高信号特征提取效果,构建如图1所示的改进AC-GAN模型,AC-GAN模型在G的输入端加入不带噪声的故障样本类别标签 提高多分类场景下生成数据针对性;生成器中加入Dropout层,防止过拟合导致生成重复数据;判别器中添加卷积层提取更多细节特征,并引入噪声过渡模型,重定义损失函数,使D在不同场景下进行故障识别时均具有良好的性能,在G中加入Dropout层,保证故障样本生成质量,并用其生成大量故障类型样本数据进行D数据增强,在训练过程中,采用正则化Dropout方法随机忽略G部分神经元,使之在反向传播时不会更新权值参数,降低对神经元特定权值敏感性,提升模型的泛化能力,此外,在D中加入卷积层,使其提取更多原始信号细节特征,通过权值共享,卷积层减少模型训练参数,提高训练效率;同时,以卷积核对故障样本进行区域动态特征提取,能提取出更多细节特征,从而提高D故障诊断能力,
[0074] 由于噪声的影响,真实故障样本的实际类别可能被误识别,为提高新模型抗噪性,在D中引入噪声过渡模型并重定义损失函数,将真实故障样本实际类别标签定义为不带噪声的样本标签 将真实故障样本被错误标记的标签定义为带噪声的样本标签 如真实故障样本类别为第i类、则其可能被误标记为第j类的概率称为噪声过渡概率Ti,j
[0075]
[0076] 由此,噪声过渡模型T定义如下
[0077] T=(Ti,j),T∈[0,1]n×n且(∑i Ti,j=1)  (7)
[0078] 在此基础上,定义辅助分类损失函数 代替原AC-GAN中的正确类损失函数LC,以提高D抗噪能力, 定义为
[0079]
[0080] 式(8)中,xr表示真实故障样本,表示将真实故障样本判别为带噪声的样本标签的概率,表示将真实故障样本判别为不带噪声的样本标签 的概率,类似地,损失函数代替原AC-GAN中的正确源损失函数LS, 如下:
[0081]
[0082] 式(9)中,改进AC-GAN通过 优化生成器 生成无噪声的故障样本,
[0083] 基于重定义损失函数构建的改进AC-GAN目标函数,在博弈优化过程中向降低噪声导致故障误识别概率方向开展优化,提高了D的抗噪性能;
[0084] 3)改进AC-GAN实施例样本构建
[0085] 实施例中,将滚动轴承状态分为10类。其中,正常状态为第1类,按照不同故障位置和不同故障程度将故障状态分为第2类至第10类,详见表1。
[0086] 表1轴承状态分类
[0087]
[0088] 实施例采用CWRU数据集中12kHz采样频率下的驱动端轴承故障数据。轴承类型为6205-2RS JEM SKF,转速1750r/min。由于轴承旋转工作,其振动信号故障特征存在周期性。
12kHz的采样率意味着每秒采样12000个数据点,轴承转速1750r/min。那么每运行一圈可以采样12000/(1750/60)≈411个点,为了更好的适应生成对抗神经网络的结构,舍去个别信号奇异点或飞升点,轴承每运行一圈,按照采样392个点,为保证信息完整性和故障特征有效性,每个故障样本采用两个旋转周期内784个采样点的振动信号构成。同时,为提高训练样本数量且保障样本差异性,训练样本通过重叠采样获取,判别器的训练与测试样本集合构建方式如图2所示。为通过卷积层挖掘更多细节特征,将每个样本处理为28×28的二维矩阵,输入改进AC-GAN的判别器D。改进AC-GAN判别器训练样本如图3所示。
[0089] 4)风电机组轴承振动信号样本生成
[0090] 单纯采用过采样等方法实现分类器增强,会增加数据集中样本间的相似性,导致训练后的分类器存在过拟合风险。改进AC-GAN通过带标签约束的生成器,生成兼具真实性与差异性的“生成样本”。现有生成器评估指标中,MMD(Maximum Mean Discrepancy)通过“生成样本”与“真实样本”概率分布距离评估样本真实性;MS(Mode Score)通过“生成样本”与“真实样本”间边际标签分布KL散度距离评估样本差异性。MMD值越小,真实性越高;MS值越大,差异性越高。
[0091] 在生成器训练中,每次迭代后,计算一次其生成样本与真实样本间MMD和MS值,200次迭代后,MMD和MS值变化趋势如图4所示。由图4可知,随迭代次数增加,MMD值逐渐降低,MS的值逐渐增加,最终达到了收敛。表明改进AC-GAN的生成器生成样本与真实样本概率分布趋向一致且具有差异性。训练初始阶段,MMD值较大、MS值较小,生成样本真实性低、多样性小。随着训练的进行,MMD值逐渐下降,MS逐渐增加,生成样本与真实样本的概率分布逐渐接近,而且生成样本的多样性提高。
[0092] 采用如表2所示的三种统计量平均值Mean、方差Std和最大值Max,分析生成样本和原始样本的概率统计特性。X(k)表示故障样本时间序列,平均值体现故障样本振动范围;方差体现故障样本离散程度;最大值体现故障样本振动幅值。并以PDF曲线展现生成数据集与真实数据集概率分布特性。
[0093] 表2样本统计量
[0094]
[0095] 5)各场景下风电机组轴承故障诊断
[0096] (a)复杂噪声环境下风电机组轴承故障诊断
[0097] 在不同噪声环境下实施例验证改进AC-GAN复杂噪声环境下故障诊断准确性。实施例中,每类训练集样本数为2000,测试集样本数为400。将训练完成模型分别在信噪比为25dB、30dB、35dB和40dB的噪声环境下开展测试。图5为4类样本不同信噪比下振动信号。
[0098] 在进行故障分类时,故障特征由64个不同的卷积核提取,每个特征映子图均由故障样本卷积产生。高噪声环境下,各故障类型卷积特征图仍具有明显差异。表明改进AC-GAN判别器具有良好的特征挖掘与抗噪能力。
[0099] 分别在信噪比为25dB、30dB、35dB和40dB的噪声环境下测试分类准确率,结果如表3。由表3可知,不同噪声程度下,新方法均保持良好的准确率。其中,类5和类7识别准确率始终保持100%。无噪声环境下,平均识别准确率达99.61%;信噪比最低的25dB高噪声环境下,平均识别准确率仍达97.59%;信噪比为30dB、35dB和40dB噪声环境下,故障的平均识别准确率分别达到98.71%、99.36%、99.45%。新方法发生误识别时,并未将故障类型误识别为正常或错误类型,仅存在故障程度识别错误。相比于将故障状态误识别为正常状态或错误故障位置类型,新方法能够保证正确判别系统状态、准确判定故障位置。有助于提高风机运行可靠性,降低检修成本。
[0100] 表3不同噪声下改进AC-GAN判别器的分类准确率
[0101]
[0102] (b)小样本场景下风电机组轴承故障诊断
[0103] 分别减少改进AC-GAN训练样本20%、40%、60%,并在相同测试集上测试不同训练样本数下新方法分类效果,以分析小样本场景下新方法故障诊断性能。训练集构建如表4所示。
[0104] 表4不同样本数训练集构建
[0105]
[0106] 以召回率(真正率)为y轴,以特异性(假正率)为x轴,可得到不同训练集规模下故障诊断ROC曲线。AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积,此面积的数值不大于1。分类器的AUC值等价于将随机选择的正样本排序在随机选择的负样本之前的概率,ROC曲线下面积越接近1,分类器性能越好。不同训练集下,识别10类故障的识别准确率如表5所示。
[0107] 由表5可知,改进AC-GAN在训练集减少比例达到60%的情况下,AUC面积仍达到了0.99以上,验证了改进AC-GAN在小样本场景下轴承机械故障诊断的有效性。
[0108] 表5不同训练集规模下改进AC-GAN分类AUC
[0109]
[0110] (c)非平衡场景下风电机组轴承故障诊断
[0111] 在故障诊断中,部分故障类型危害大但发生机率小,造成此类故障样本相对缺乏,难以挖掘内部规律、识别率低。当训练集非平衡时(部分故障类型样本较少),改进AC-GAN生成器能自动在训练时填补非平衡类,有助于提高非平衡训练数据场景下故障诊断准确率。构建多种非平衡训练集,仿真实际环境下可能存在的样本非平衡场景,并分别训练改进AC-GAN,以验证新方法解决非平衡问题能力。不同非平衡样本集如表6,其中,平衡类的样本数为每类2000,非平衡类样本数为每类1000。
[0112] 表6非平衡程度设置
[0113]
[0114] 非平衡场景下实施例结果如表7所示。从表7可知,不同非平衡场景下新方法依有良好的准确率。其中,类1和类7保持100%准确率。单类非平衡场景下,平均识别准确率达98.68%;2类非平衡场景下,平均识别准确率达98.30%;在3类非平衡场景下,平均识别准确率达98.19%。虽然部分故障类型的识别准确率略低于其他类别,但是仍然保持在98%以上,且无将故障状态误识别为正常状态情况。仅存在将同一故障位置不同故障程度识别错误。验证了新方法在非平衡场景下的可应用性。
[0115] 表7类别非平衡的情况下分类准确率
[0116]
[0117] 本发明的一种计及非平衡小样本场景下风机轴承故障深度对抗诊断方法,能够解决基于振动信号的风机故障诊断存在的振动信号噪声干扰复杂、故障样本少且类别间样本数非平衡等问题,具有以下优点:
[0118] (1)将AC-GAN引入风机轴承故障识别领域,实现了小样本非平衡场景下有效数据增强,提高了系统对非平衡故障类型识别能力。
[0119] (2)在生成器输入端加入可支持噪声过渡模型的真实故障样本类别标签,提高了多分类场景下数据生成能力。
[0120] (3)在生成器中加入Dropout层,提升了模型的泛化能力,防止了过拟合导致的生成重复数据,保证了故障样本生成质量。
[0121] (4)判别器中添加了卷积层,有效提取更多细节特征,并引入噪声过渡模型,重定义损失函数,提高了模型抗噪能力。
[0122] 本发明实施例中的计算条件、图表等仅用于对本发明作进一步的说明,并非穷举,并不构成对权利要求保护范围的限定,本领域技术人员根据本发明实施例获得的启示,不经过创造性劳动就能够想到其它实质上等同的替代,均在本发明保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈