首页 / 专利库 / 人工智能 / 人工神经网络 / 前馈神经网络 / 深度神经网络 / 卷积神经网络 / 基于迁移卷积神经网络的故障预测方法

基于迁移卷积神经网络的故障预测方法

阅读:599发布:2024-02-14

专利汇可以提供基于迁移卷积神经网络的故障预测方法专利检索,专利查询,专利分析的服务。并且本 发明 属于神经网络故障预测领域,并公开了基于迁移 卷积神经网络 的故障预测方法。该方法包括下列步骤:(a)将故障类型进行编号,采集待预测对象的时域 信号 并获取初始故障类型编号,将时域信号转化为RGB图像;(b)将深度残差网络模型的FC层初始化并添加分类器,获得改进的网络模型;(c)将RGB图像输入网络模型训练FC层和分类器,不断更新FC层的权重值,当获得的故障类型编号与初始故障类型编号相近时对应的权重值为所需的新的权重值,并完成网络模型的迁移;(d)将待预测对象的RGB图像输入迁移卷积神经网络模型中,输出预测故障类型编号。通过本发明,所采用的迁移卷积神经网络模型结构简单、预测速度快,预测结果准确。,下面是基于迁移卷积神经网络的故障预测方法专利的具体信息内容。

1.基于迁移卷积神经网络的故障预测方法,其特征在于,该方法包括下列步骤:
(a)将待预测对象的故障类型进行编号,然后采集待预测对象在已知故障类型期的特征指标的时域信号,并获取所述已知故障类型期的初始故障类型编号,同时将所述时域信号转化为RGB图像;
(b)选取深度残差网络模型ResNet-50作为预测模型,将该网络模型ResNet-50中的完全连接层FC层初始化使得该层的权重归零,然后在所述FC层后添加分类器,以此获得改进的网络模型ResNet-50;
(c)将步骤(a)中获得的RGB图像输入所述改进的网络模型ResNet-50中,获得表示该RGB图像的特征向量,将所述特征向量输入所述FC层和分类器中获得初始预测故障类型编号,将该初始预测故障类型编号与所述初始故障类型编号进行比较,通过训练所述FC层的权重值,使得二者的差值达到预设阈值,此时对应的FC层的权重值即为所述FC层所需的权重值,该包含所需的权重值的FC层对应的网络模型即为迁移卷积神经网络模型;
(d)采集待预测对象待预测期的特征指标的时域信号,并将该时域信号转化为待处理的RGB图像,将该待处理的RGB图像输入所述迁移卷积神经网络模型中获得待预测的特征向量,将该待预测的特征向量输入所述迁移卷积神经网络模型的FC层和分类器中,输出预测故障类型编号,由此完成故障的预测。
2.如权利要求1所述的基于迁移卷积神经网络的故障预测方法,其特征在于,在步骤(a)中,将所述时域信号转化为RGB图像优选按照下列步骤:
(a1)从所述时域信号中选取三个不同时间段内的时域信号,将每段时间内的信号点编号,三个时间段内编号相同的点对应的信号指标值构成一个3×1的向量,该向量对应RGB图像上的一个像素,以此完成一个像素的形成;
(a2)重复(a1),直至完成224×224个像素的形成,由此完成RGB图像上所有像素的形成,从而实现时域信号转化为RGB图像。
3.如权利要求1或2所述的基于迁移卷积神经网络的故障预测方法,其特征在于,在步骤(b)中,所述获得RGB图像的特征向量,该特征向量为2048×1的向量。
4.如权利要求1-3任一项所述的基于迁移卷积神经网络的故障预测方法,其特征在于,在步骤(b)中,所述分类器优选采用softmax分类器。
5.如权利要求1-4任一项所述的基于迁移卷积神经网络的故障预测方法,其特征在于,在步骤(b)中,所述深度残差网络模型ResNet-50中的FC层的神经元设置为128个。
6.如权利要求1-5任一项所述的基于迁移卷积神经网络的故障预测方法,其特征在于,在步骤(c)中,所述训练优选采用Dropout的方法和L2正则化。
7.如权利要求1-6任一项所述的基于迁移卷积神经网络的故障预测方法,其特征在于,在步骤(a)中,所述故障类型为10种。

说明书全文

基于迁移卷积神经网络的故障预测方法

技术领域

[0001] 本发明属于神经网络故障预测领域,更具体地,涉及基于迁移卷积神经网络的故障预测方法。

背景技术

[0002] 近年来许多研究人员对故障预测进行了研究,作为一种典型的故障预测方法,数据驱动故障预测可以利用历史数据建立故障模式,而不需要任何明确的模型或信号症状,这非常适合于复杂系统,随着智能制造业的快速发展,机器设备产生的数据得到了很好的提升和收集,机械大数据为制造业实现无故障过程带来了新的机遇,数据驱动的故障预测越来越受到研究人员和工程师的重视,要找到更强大的数据驱动的故障预测方法至关重要。
[0003] 从大量历史数据中进行学习是数据驱动故障预测方法提取特征的一个关键,主成分分析(PCA),偏最小二乘法(PLS)和独立分量相关(ICA)等统计分析方法越来越受到工业过程监测的重视,机器学习也是数据驱动故障预测领域最流行的方法之一,如支持向量机(SVM),模糊逻辑人工神经网络等,然而,机器学习方法的上限性能取决于手工特征,但是要预先设计好的手工特征是困难和耗尽的;深度学习(DL)作为机器学习领域的一个新兴领域,克服了上述缺点,可以自动学习到原始数据的分层表示特征,但由于故障预测领域标注样本数量的限制以及DL模型的巨大模型复杂度,故障预测DL模型的深度只能达到5个隐层,与具有数百个隐藏层的ImageNet的基准CNN模型相比,相对较浅,与ImageNet中的千万注释图像相比,制造中的样本量很小,没有大量的训练数据集,很难训练出类似于ImageNet的深度卷积神经网络,致使最终获得故障预测结果准确度低。

发明内容

[0004] 针对现有技术的以上缺陷或改进需求,本发明提供了基于迁移卷积神经网络的故障预测方法,该方法首先通过将时域信号转化为RGB图像,然后通过对卷积神经网络进行迁移,获得迁移后的卷积神经网络,然后利用该迁移卷积神经网络对故障进行预测,由此解决故障预测精度低的技术问题。
[0005] 为实现上述目的,按照本发明,提供了基于迁移卷积神经网络的故障预测方法,其特征在于,该方法包括下列步骤:
[0006] (a)将待预测对象的故障类型进行编号,然后采集待预测对象在已知故障类型期的特征指标的时域信号,并获取所述已知故障类型期的初始故障类型编号,同时将所述时域信号转化为RGB图像;
[0007] (b)选取深度残差网络模型ResNet-50作为预测模型,将该网络模型ResNet-50中的完全连接层FC层初始化使得该层的权重归零,然后在所述FC层后添加分类器,以此获得改进的网络模型ResNet-50;
[0008] (c)将步骤(a)中获得的RGB图像输入所述改进的网络模型ResNet-50中,获得表示该RGB图像的特征向量,将所述特征向量输入所述FC层和分类器中获得初始预测故障类型编号,将该初始预测故障类型编号与所述初始故障类型编号进行比较,通过训练所述FC层的权重值,使得二者的差值达到预设阈值,此时对应的FC层的权重值即为所述FC层所需的权重值,该包含所需的权重值的FC层对应的网络模型即为迁移卷积神经网络模型;
[0009] (d)采集待预测对象待预测期的特征指标的时域信号,并将该时域信号转化为待处理的RGB图像,将该待处理的RGB图像输入所述迁移卷积神经网络模型中获得待预测的特征向量,将该待预测的特征向量输入所述迁移卷积神经网络模型的FC层和分类层中,输出预测故障类型编号,由此完成故障的预测。
[0010] 进一步优选地,在步骤(a)中,所述将时域信号转化为RGB图像优选按照下列步骤:
[0011] (a1)从所述时域信号中选取三个不同时间段内的时域信号,将每段时间内的信号点编号,三个时间段内编号相同的点对应的信号指标值构成一个3×1的向量,该向量对应RGB图像上的一个像素,以此完成一个像素的形成;
[0012] (a2)重复(a1)的步骤,直至完成224×224个像素的形成,由此完成RGB图像上所有像素的形成,从而实现时域信号转化为RGB图像。
[0013] 进一步优选地,在步骤(b)中,所述获得RGB图像的特征向量,该特征向量为2048×1的向量。
[0014] 进一步优选地,在步骤(b)中,所述分类器优选采用softmax分类器。
[0015] 进一步优选地,在步骤(b)中,所述深度残差网络模型ResNet-50中的FC层的神经元设置为128个。
[0016] 进一步优选地,在步骤(c)中,所述训练优选采用Dropout的方法和L2正则化。
[0017] 进一步优选地,在步骤(a)中,所述故障类型为10种。
[0018] 总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
[0019] 1、本发明通过将时域信号转换为RGB格式图像,该转换过程简单,不需要任何预定义的参数,避免依靠专家经验而带来的误差,保持DL的特征表示能,使时域信号能够同图像信号一般进行处理,有助于特征自动提取与训练;
[0020] 2、本发明通过采用采用Dropout的方法和L2正则化的方法训练FC层的权重值,在训练过程中以一定概率随机地去激活神经元,防止过度配合,采用该Dropout方法训练的过程更好的泛化;
[0021] 3、本发明提供的故障预测方法,所采用的迁移卷积神经网络模型结构简单、只需将现有模型进行少部分改进就可以应用于不同的故障诊断领域,预测速度快,预测结果准确。附图说明
[0022] 图1是按照本发明的优选实施例所构建的迁移卷积神经网络故障预测方法的流程图
[0023] 图2是按照本发明的优选实施例所构建的将时域信号转化为RGB图像的过程示意图;
[0024] 图3是按照本发明的优选实施例所构建的迁移卷积神经网络模型构建的示意图;
[0025] 图4是按照本发明的优选实施例所构建的图像数量n取不同的值时不同的神经网络模型的准确率对比图;
[0026] 图5是按照本发明的优选实施例所构建的图像大小m取不同的值时不同的神经网络模型的准确率对比图;
[0027] 图6是按照本发明的优选实施例所构建的不同的神经网络预测的准确率的对比图。

具体实施方式

[0028] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0029] 图1是按照本发明的优选实施例所构建的迁移卷积神经网络故障预测方法的流程图,如图1所示,基于迁移卷积神经网络的故障预测方法,其特征在于,该方法包括下列步骤:
[0030] (a)将待预测对象的故障类型进行编号,故障类型为10种,然后采集待预测对象在已知故障类型期的特征指标的时域信号,已知故障期是指在该时期,待预测对象的故障类型已知,将该时期采集的时域特征作为现有已知数据,用于训练卷积神经网络,特征指标为用于衡量待预测对象的是否发生故障的性能指标,例如:电机轴承上驱动端的振动信号,并获取该时域信号对应的初始故障类型编号A,同时将时域信号转化为RGB图像,图2是按照本发明的优选实施例所构建的将时域信号转化为RGB图像的过程示意图,如图2所示,将时域信号转化为RGB图像优选按照下列步骤:从时域信号中选取三个不同时间段内的时域信号,将每段时间内的信号点编号,三个时间段内编号相同的点对应的信号指标值构成一个3×1的向量,该向量对应RGB图像上的一个像素,重复上述像素的形成过程直至完成224×224个像素,由此完成RGB图像上所有像素的形成,从而实现时域信号转化为RGB图像。
[0031] (b)图3是按照本发明的优选实施例所构建的迁移卷积神经网络模型构建的示意图,如图3所示,将50层深度残差网络模型ResNet-50中的完全连接层FC层初始化使得该层的权重归零(FC层的神经元设置为128个),然后在FC层后添加softmax分类器;
[0032] (c)将步骤(a)中获得的RGB图像输入网络模型ResNet-50中,获得表示该RGB图像的特征向量,该特征向量为2048×1的向量,将该特征向量输入FC层和分类器中获得一个故障类型编号B,将该故障类型编号B与初始故障类型编号A进行比较,通过训练FC层的权重值,使得A和B的差值达到预设阈值,此时对应的FC层的权重值即为FC层所需的新的权重值,该包含新的权重值的FC层对应的网络模型即为迁移卷积神经网络模型;
[0033] (d)将待预测对象待预测期的特征指标的时域信号转化为待处理的RGB图像,待预测期是该时期的待预测对象的故障类型未知,将该待处理的RGB图像输入迁移卷积神经网络模型中,输出预测故障类型编号。
[0034] 训练过程中优选采用Dropout的方法和L2正则化,Dropout的方法防止过度配合,其主要思想是在训练过程中以一定概率随机地去激活神经元,它可以被看作是从整个网络中抽取一个“细化”的网络,只更新“细化”网络的参数,用Dropout训练的网络会导致训练过程更好的泛化。
[0035] 下文结合附图和实施例对本发明做进一步说明。
[0036] 采用的数据集是电机轴承故障数据集,健康状况包含三种故障类型,分别由滚轮故障(RF),外环故障(OF)和内环故障(IF)表示。每种故障类型有三种不同的损坏尺寸,损坏尺寸分别为0.18mm,0.36mm和0.54mm。因此,共有十个状况,其中包括九个故障状态和正常状态。实验数据集在0,1,2,3hp四个负载条件下采集,将驱动端振动信号用于测试TCNN模型的性能。每个负载条件下的数据数量为n,从负载条件的数据中随机选择样本。其中负载条件数据中80%作为训练数据,剩下的作为测试样本。
[0037] 由于ResNet-50中FC层的上一层的维数为2048,将CNN的FC层设置为[2048,128,10],训练过程中,基础学习率为1e-03,学习率衰减为0.9。整个迭代步骤为32000,图像大小为72,样本数量为1000。
[0038] (一)TCNN模型与其他基于DL的方法的结果比较
[0039] 将所提出的TCNN模型与其他基于DL的方法如局部连接网络(NSAE-LCN),堆积稀疏自动编码器(SSAE),稀疏滤波器,进行比较,其比较结果在表1。由表1可以看出,TCNN方法取得了很好的效果,平均预测精度高达100%,NSAE-LCN,SSAE,稀疏滤波和DBN的预测结果分别达到了99.92%,99.85%,99.66%和99.03%。提出的TCNN略高于他们。
[0040] 表一
[0041] 与其他学习算法的结果比较(%)
[0042]
[0043] (二)TCNN模型与其他基于CNN的方法的结果比较
[0044] 将所提出的TCNN模型与其他基于CNN的方法,如深度CNN,自适应深度卷积神经网络(ADCNN),分层卷积网络(CNN-1)卷积神经网络和经验模式分解(CNN-2)以及多个传感器(CNN-3)的CNN进行比较,其比较结果在表2。由表2可以看出,TCNN方法取得了很好的效果,平均预测精度高达100%,Deep CNN,ADCNN,CNN-1,CNN-2和CNN-3的预测精度分别为99.71%,98.1%,92.60%,99.75%和99.41%。
[0045] 表二
[0046] 与其他卷积神经网络的结果对比(%)
[0047]
[0048] (三)将基于ResNet-50模型网络与基于其他几个著名的ImageNet CNN型号模型网络进行比较
[0049] 将本发明采用的ResNet-50模型网络模型与VGG-16,VGG-19和Google Inception-V3预测精度行比较。
[0050] 实验分两部分进行。在第一部分中,图像大小m设置为72,以研究不同数据量对ResNet-50,VGG-16,VGG-19和Inception-V3的影响。在第二部分中,将n的值设置为1000,以研究不同图像大小对ResNet-50,VGG-16,VGG-19和Inception-V3的影响。实验结果列于表三,表四,图4和图5中。
[0051] 表三
[0052] 不同数据量下,基于不同ImageNet CNN模型下的比较结果(%)
[0053]
[0054] 表四
[0055] 不同图片大小下,基于不同ImageNet CNN模型下的比较结果(%)
[0056]
[0057] 图4是按照本发明的优选实施例所构建的图像数量n不同的值时不同的神经网络模型的准确率对比图,从图4可以看出,ResNet-50是这四个著名的ImageNet CNN中准确率最高的。与VGG-16,VGG-19和Inception-V3相比,ResNet-50对数据集n的体积不太敏感,Inception-V3比VGG-16和VGG-19有更好的结果,但是比ResNet-50差。
[0058] 图5是按照本发明的优选实施例所构建的图像大小m取不同的值时不同的神经网络模型的准确率对比图,从图5可以看出,随着图像大小m的减小,Inception-V3的性能急剧恶化。VGG-16和VGG-19的结果也受图像大小的影响,更重要的是,ResNet-50在这四个CNN中也是最好的,展现了ResNet-50的潜力。
[0059] 图6是按照本发明的优选实施例所构建的不同的神经网络预测的准确率的对比图,如图6所示,VGG-16,VGG-19,Inception-V3和ResNet-50的收敛曲线(仅显示前10000步的结果),对于这种情况,m=72和n=1000,从结果可以看出,ResNet-50和Inception-V3的收敛速度很好。VGG-16和VGG-19具有相似的收敛速度。
[0060] 本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈