首页 / 专利库 / 人工智能 / 线性分类器 / 基于生成式对抗网络的空气处理机组的故障诊断方法

基于生成式对抗网络的空气处理机组的故障诊断方法

阅读:1032发布:2020-09-02

专利汇可以提供基于生成式对抗网络的空气处理机组的故障诊断方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于生成式对抗网络的空气处理机组的故障诊断方法,包括以下步骤:数据预处理,通过对将缺失和重复的数据删除,将数据集进行归一化处理和特征选取,以加快样本生成模型的收敛速度,减少数据维度;故障样本生成模型构建,通过 采样 到的真实故障样本训练故障样本生成模型,学习真实故障样本的分布;样本评估模型构建,提出使用真实故障样本训练一个评估模型对生成样本进行挑选,用于训练故障诊断模型的生成的故障样本与真实样本的分布的接近程度,以评估生成样本的 质量 ;故障诊断模型构建,通过使用上述生成的样本训练故障诊断模型,对现实中空气处理机组运行时所产生数据进行检测,诊断设备是否发生故障。,下面是基于生成式对抗网络的空气处理机组的故障诊断方法专利的具体信息内容。

1.一种基于生成式对抗网络的空气处理机组的故障诊断方法,其特征在于:包括以下步骤:
数据预处理,通过对将缺失和重复的数据删除,将数据集进行归一化处理和特征选取,以加快样本生成模型的收敛速度,减少数据维度;
故障样本生成模型构建,通过采样到的真实故障样本训练故障样本生成模型,学习真实故障样本的分布;
样本评估模型构建,提出使用真实故障样本训练一个评估模型对生成样本进行挑选,用于训练故障诊断模型的生成的故障样本与真实样本的分布的接近程度,以评估生成样本的质量
故障诊断模型构建,通过使用上述生成的样本训练故障诊断模型,对现实中空气处理机组运行时所产生数据进行检测,诊断设备是否发生故障。
2.根据权利要求1所述的基于生成式对抗网络的空气处理机组的故障诊断方法,其特征在于:所述的特征选取是指,使用基于SVM分类器的代价敏感的序列前向特征选择算法进行特征选取,从一个预定的特征子集开始,直到选出最重要的特征为止。
3.根据权利要求1或2所述的基于生成式对抗网络的空气处理机组的故障诊断方法,其特征在于:生成大量故障样本用于故障诊断模型中,对空气处理机组的数据进行分类,使用支持向量机来实现使同一种故障分在一类中。
4.根据权利要求1所述的基于生成式对抗网络的空气处理机组的故障诊断方法,其特征在于:经样本评估模型评估后,挑选出的质量高的生成样本加入样本评估模型的训练集对评估模型进一步训练,再继续对生成样本进行挑选。
5.根据权利要求1-4任意一种所述的基于生成式对抗网络的空气处理机组的故障诊断方法,其特征在于:对数据集进行所述的归一化处理是指,使用=离差标准化,对原始数据进行线性变换,使用以下公式使结果值映射到[0,1]之间;
其中,Min=0,Max=1。
6.根据权利要求1-4任意一种所述的基于生成式对抗网络的空气处理机组的故障诊断方法,其特征在于:所述故障样本生成模型为条件Wasserstein生成对抗网络模型,通过将Wasserstein生成对抗网络与条件型生成对抗网络结合建立条件Wasserstein生成对抗网络模型,包括生成器和判别器;
将预处理好的数据作为条件Wasserstein生成对抗网络模型的训练集,设x和z分别是从训练集的分布Pdata(x)和一个先验噪声分布Pz(z)中采样出的真实样本和噪声;为了学习Pdata(x)的分布,由先验噪声分布Pz(z)构建了一个映射空间G(z;θg);相应的判别器的映射函数为D(x;θd),输出x为真实数据概率,目标函数表征获得最接近真实样本的生成样本,如下式所示;
其中,期望 中,D(x|c)表示判别器判断输入的样本x在c的条件下为真实样本的概率;在期望 中x表示生成网络生成的样本,D(x|c)表示判别器判断生成样本是真实样本的概率, 为惩罚项,λ为惩罚因子,生成器的最
终目标是让生成的样本无限接近真实样本;而判别器的目的是尽可能的将真实样本和生成样本区分开。

说明书全文

基于生成式对抗网络的空气处理机组的故障诊断方法

技术领域

[0001] 本发明涉及故障诊断技术领域,更具体的说,涉及一种基于生成式对抗网络的空气处理机组的故障诊断方法。

背景技术

[0002] 故障检测和诊断(Fault detection and diagnosis,FDD)技术作为工业上一种重要的技术,在保证工业设备正常、高效的运行上发挥着重要的作用。将机器学习大数据技术应用于故障检测和诊断技术,能够帮助维护工业设备的工作人员更有效的对设备的状态的监控,对工业设备维护也将变得更加简单。机器学习的算法主要分为三种分别是:有监督学习算法、半监督学习算法和无监督学习算法。在现实情况中由于现代工业技术的快速发展,许多设备不容易经常发生故障问题。因此,我们往往难以获取充足的故障数据训练一个有监督学习模型用于故障检测和诊断。
[0003] 生成对抗网络(Generative Adversarial Networks,GANs)作为2014年刚提出来的无监督学习模型,它在故障检测和诊断领域有着广阔的应用前景。作为一种机器学习算法,他具有以下几个优点:
[0004] 1、可以通过对少量的故障数据的分布进行学习,从而产生大量的故障样本。
[0005] 2、模型只用到了反向传播,而不需要尔科夫链。
[0006] 3、训练时不需要对隐变量做推断。
[0007] 4、可以和深度学习模型很好的结合。
[0008] 5、比传统的无监督学习算法效果更好。
[0009] GANs能够通过对少量的故障数据的分布进行学习,从而产生大量的故障样本的特点非常适合解决目前工业上对大型空调系统的故障进行检测和诊断时缺乏充足的故障样本的问题。由于目前GANs技术提出的时间较晚仍处于起步发展阶段,它还存在一些不足,比如训练比较困难,生成样本多样性不足,生成的样本与真实的样本还是有一些差距。

发明内容

[0010] 有鉴于此,本发明提出一种构建样本生成模型,并降低生成样本与真实样本之间的差距的基于生成式对抗网络的空气处理机组的故障诊断方法,用于解决现有技术存在的故障检测与诊断过程中故障样本不足、GANs训练较困难、生成样本多样性不足、生成的样本与真实的样本等技术问题。
[0011] 本发明提供了一种基于生成式对抗网络的空气处理机组的故障诊断方法,包括以下步骤:
[0012] 数据预处理,通过对将缺失和重复的数据删除,将数据集进行归一化处理和特征选取,以加快样本生成模型的收敛速度,减少数据维度;
[0013] 故障样本生成模型构建,通过采样到的真实故障样本训练故障样本生成模型,学习真实故障样本的分布;
[0014] 样本评估模型构建,提出使用真实故障样本训练一个评估模型对生成样本进行挑选,用于训练故障诊断模型的生成的故障样本与真实样本的分布的接近程度,以评估生成样本的质量
[0015] 故障诊断模型构建,通过使用上述生成的样本训练故障诊断模型,对现实中空气处理机组运行时所产生数据进行检测,诊断设备是否发生故障。
[0016] 可选的,所述的特征选取是指,使用基于SVM分类器的代价敏感的序列前向特征选择算法进行特征选取,从一个预定的特征子集开始,直到选出最重要的特征为止。
[0017] 可选的,生成大量故障样本用于故障诊断模型中,对空气处理机组的数据进行分类,使用支持向量机来实现使同一种故障分在一类中。
[0018] 可选的,经样本评估模型评估后,挑选出的质量高的生成样本加入样本评估模型的训练集对评估模型进一步训练,再继续对生成样本进行挑选。
[0019] 可选的,对数据集进行所述的归一化处理是指,使用=离差标准化,对原始数据进行线性变换,使用以下公式使结果值映射到[0,1]之间;
[0020]
[0021] 其中,Min=0,Max=1。
[0022] 可选的,所述故障样本生成模型为条件Wasserstein生成对抗网络模型,通过将Wasserstein生成对抗网络与条件型生成对抗网络结合建立条件Wasserstein生成对抗网络模型,包括生成器和判别器;
[0023] 将预处理好的数据作为条件Wasserstein生成对抗网络模型的训练集,设x和z分别是从训练集的分布Pdata(x)和一个先验噪声分布Pz(z)中采样出的真实样本和噪声;为了学习Pdata(x)的分布,由先验噪声分布Pz(z)构建了一个映射空间G(z;θg);相应的判别器的映射函数为D(x;θd),输出x为真实数据概率,目标函数表征获得最接近真实样本的生成样本,如下式所示;
[0024]
[0025] 其中,期望 中,D(x|c)表示判别器判断输入的样本x在c的条件下为真实样本的概率;在期望 中x表示生成网络生成的样本,D(xc)表示判别器判断生成样本是真实样本的概率, 为惩罚项,λ为惩罚因子,生成器的最终目标是让生成的样本无限接近真实样本;而判别器的目的是尽可能的将真实样本和生成样本区分开。
[0026] 采用本发明,与现有技术相比,具有以下优点:发明利用故障样本生成模型,生成了大量故障样本数据,并训练样本评估模型,挑选出质量高的生成样本用于训练故障诊断模型,实现了在故障样本较少的情况下训练出故障检测和诊断准确率较高的模型。附图说明
[0027] 图1为基于生成式对抗网络的空气处理机组的故障诊断方法的流程框图
[0028] 图2为样本生成模型的流程框图;
[0029] 图3为样本评估模型的流程框图;
[0030] 图4为代价敏感的特征选择的流程框图。

具体实施方式

[0031] 以下结合附图对本发明的优选实施例进行详细描述,但本发明并不仅仅限于这些实施例。本发明涵盖任何在本发明的精神和范围上做的替代、修改、等效方法以及方案。
[0032] 为了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。
[0033] 在下列段落中参照附图以举例方式更具体地描述本发明。需说明的是,附图均采用较为简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
[0034] 本发明提供一种基于生成式对抗网络的空气处理机组的故障诊断方法,包括以下步骤:
[0035] 数据预处理,通过对将缺失和重复的数据删除,将数据集进行归一化处理和特征选取,以加快样本生成模型的收敛速度,减少数据维度;
[0036] 故障样本生成模型构建,通过采样到的真实故障样本训练故障样本生成模型,学习真实故障样本的分布;
[0037] 样本评估模型构建,提出使用真实故障样本训练一个评估模型对生成样本进行挑选,用于训练故障诊断模型的生成的故障样本与真实样本的分布的接近程度,以评估生成样本的质量;
[0038] 故障诊断模型构建,通过使用上述生成的样本训练故障诊断模型,对现实中空气处理机组运行时所产生数据进行检测,诊断设备是否发生故障。
[0039] 可选的,所述的特征选取是指,使用基于SVM分类器的代价敏感的序列前向特征选择算法进行特征选取,从一个预定的特征子集开始,直到选出最重要的特征为止。
[0040] 可选的,生成大量故障样本用于故障诊断模型中,对空气处理机组的数据进行分类,使用支持向量机来实现使同一种故障分在一类中。
[0041] 可选的,经样本评估模型评估后,挑选出的质量高的生成样本加入样本评估模型的训练集对评估模型进一步训练,再继续对生成样本进行挑选。
[0042] 可选的,对数据集进行所述的归一化处理是指,使用=离差标准化,对原始数据进行线性变换,使用以下公式使结果值映射到[0,1]之间;
[0043]
[0044] 其中,Min=0,Max=1。
[0045] 可选的,所述故障样本生成模型为条件Wasserstein生成对抗网络模型,通过将Wasserstein生成对抗网络与条件型生成对抗网络结合建立条件Wasserstein生成对抗网络模型,包括生成器和判别器;
[0046] 将预处理好的数据作为条件Wasserstein生成对抗网络模型的训练集,设x和z分别是从训练集的分布Pdata(x)和一个先验噪声分布Pz(z)中采样出的真实样本和噪声;为了学习Pdata(x)的分布,由先验噪声分布Pz(z)构建了一个映射空间G(z;θg);相应的判别器的映射函数为D(x;θd),输出x为真实数据概率,目标函数表征获得最接近真实样本的生成样本,如下式所示;
[0047]
[0048] 其中,期望 中,D(x|c)表示判别器判断输入的样本x在c的条件下为真实样本的概率;在期望 中x表示生成网络生成的样本,D(xc)表示判别器判断生成样本是真实样本的概率, 为惩罚项,λ为惩罚因子,生成器的最终目标是让生成的样本无限接近真实样本;而判别器的目的是尽可能的将真实样本和生成样本区分开。
[0049] 所述生成样本评估模型构建:通过使用少量真实样本训练评估模型来评估生成样本挑选出质量较高的样本,然后,再将挑选出的质量高的生成样本加入评估模型的训练集对评估模型进一步训练,再继续对生成样本进行挑选,具体流程如图3所示。
[0050] 本发明的实施过程可以分为以下几个步骤进行:
[0051] 1、样本采集。从已有的数据库中下载了由ASHRAE project NO.1312-RP所提供的数据。该数据集中正常样本的数量为21600个,每种故障的样本数为1440个共17类数据。这里挑选了其中比较常见的6中故障作为实验数据。
[0052] 2、数据预处理。将获取到的数据进行取出缺失值和重复样本,然后进行归一化处理,来加快模型的训练速度,使网络更加容易收敛。
[0053] 3、特征选择。特征选择在进行机器学习任务中的一项重要的步骤,它可以减少数据维度,在保证机器学习模型性能的情况下尽可能的提高程序的运行效率。在原数据集中含有140多个特征,用如此高维的数据训练一个模型肯定是不合适的。因此,通过使用基于SVM分类器的代价敏感的序列前向特征选择算法对原数据集的特征进行挑选,如图4所示。
[0054] 4、生成故障样本。在这一中通过使用上述所提出的C-WGANs模型生成大量的故障样本,C-WGANs模型的训练样本使用的是上一步所处理好的样本。
[0055] 5、评估模型构建。评估模型的训练集同样使用的是第(3)步中所处理好的样本。然后,再将挑选出的质量高的生成样本加入评估模型的训练集对评估模型进一步训练,再继续对生成样本进行挑选。
[0056] 6、挑选出与真实样本相近的生成样本。使用上述所提出的样本评估模型对生成样本进行逐个评估,选出质量较高与真实样本相近的生成样本。
[0057] 7、故障诊断模型。在这一步中我们将构建一个支持向量机(Support Vector Machine,SVM)分类模型,将上一步挑选出的生成样本作为训练集训练出故障检测与诊断模型。这里采用的是有监督学习模型,可以选择SVM,随机深林或K-最近邻(k-NearestNeighbor,KNN)算法。
[0058] 虽然以上将实施例分开说明和阐述,但涉及部分共通之技术,在本领域普通技术人员看来,可以在实施例之间进行替换和整合,涉及其中一个实施例未明确记载的内容,则可参考有记载的另一个实施例。
[0059] 以上所述的实施方式,并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所作的修改、等同替换和改进等,均应包含在该技术方案的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈