首页 / 专利库 / 数学与统计 / 超平面 / 一种基于批次图像化的卷积自编码故障监测方法

一种基于批次图像化的卷积自编码故障监测方法

阅读:156发布:2020-05-14

专利汇可以提供一种基于批次图像化的卷积自编码故障监测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种基于批次图像化的卷积自编码故障监测方法,属于间歇过程故障监测技术领域。包括离线建模和在线监测两个步骤。离线建模步骤首先将间歇过程三维数据归一化;之后将每个批次的二维数组作为图像直接输入卷积自 编码器 (convolutional autoencoder,CAE)中进行深度无监督特征学习;最后,利用一类 支持向量机 对CAE学到的特征构造统计量和相应的控制限。在线监测步骤将采集到的数据归一化,并进行批次填充;将归一化及填充后的批次图输入训练好的CAE中学习特征;计算在线统计量,并与离线控制限比较。相比于 现有技术 ,本发明的技术方案避免了数据展开导致的信息丢失,无需划分阶段减少建模工作量,深层地提取过程变量的变化特征,降低间歇过程监测的误报和漏报率。,下面是一种基于批次图像化的卷积自编码故障监测方法专利的具体信息内容。

1.一种基于批次图像化的卷积自编码故障监测方法,其特征在于:将批次数据进行图像化处理,建立卷积自编码器(CAE)模型并利用一类支持向量机法(OCSVM)进行故障监测,具体步骤如下:
A.离线建模阶段:
1)历史数据的采集:间歇生产按照一定的周期循环往复,单个周期结束后按批次获得批量产物;每个批次内采集K个过程变量J个时刻的数据得到一个二维矩阵X(K×J),其中K为采集的过程变量个数,J为采样点的个数,I个批次就组成了间歇过程典型的三维数据表示形式——X(I×K×J);
2)数据归一化:采用最大最小值归一化数据处理方法,消除不同过程变量间量纲的影响,将过程变量实际数据范围转化为满足计算机处理的灰度图的数据范围,即0到1之间的数字;计算公式如下:
具体步骤为:
a)将历史三维数据X(I×K×J)沿变量方向展开成二维数据X(IK×J);
b)求每个变量的最大值及最小值;
c)对每个变量进行归一化处理;
d)将二维数组重新折叠成三维数组;
e)所有训练批次求平均值,得到正常批次数据各个时刻的平均值;
3)设置CAE网络参数,并将数据输入CAE中训练;在CAE中,若干个卷积层、池化层及全连接层构成编码单元,与之近似为逆运算的全连接层、反池化层及反卷积层构成解码单元;损失函数采用均方误差函数,通过最小化损失函数,重构数据与输入数据的均方误差,采用反向传播算法调整各层的权重,实现特征的监督学习
4)设计统计量和控制限:引入OCSVM对CAE提取到的特征建模,求超平面的最优解,得到统计量计算公式;将监控统计量设计为到超平面距离的相反数,用D表示,如公式(2)所示:
0为所设计统计量的控制限,当D>0时,故障发生,否则正常;
B.在线监测阶段:
1)数据采集:采集当前时刻k所有变量的数据得到xnew,k(1×J);
2)数据归一化:按离线求得的每个变量的最大最小值进行归一化处理;
3)批次填充:将k时刻与1~k-1时刻归一化后的数据组合,后续未发生的k+1~K时刻数据用离线阶段求得的正常批次对应时刻平均值填充;
4)特征提取:填充完的一个批次数据输入到离线建模训练好的网络提取特征;
5)故障监测:将上一步中提取的特征代入公式(2)中,计算统计量D,若D>0,则判定当前时刻出现故障,并采取相应处理措施,否则就为正常状态,需要继续监测生产过程,直至批次结束。

说明书全文

一种基于批次图像化的卷积自编码故障监测方法

技术领域

[0001] 本发明属于故障监测技术领域,涉及基于数据驱动的间歇过程在线故障监测技术,特别是涉及一种基于批次图像化的卷积自编码故障监测方法。

背景技术

[0002] 目前,间歇生产过程正在向精细化、集约化发展,对生产全流程进行有效监控至关重要,因为这不仅可以保障间歇过程的生产安全,还能提高产品质量和生产效率,降低企业能耗和污染。
[0003] 间歇过程故障监测研究中最常用的方法是以多向主成分分析(multiway principal component analysis,MPCA)和多向偏最小二乘(multiway partial least squares,MPLS)为核心的多元统计方法,通过构造T2(Hotelling-T2)和SPE(平方预测误差)统计量,并与正常状态下历史数据建模得到的统计量控制限进行比较实现故障监测,T2统计量反映了每个主成分在变化趋势和幅值上偏离模型的程度,是对模型内部化的一种度量,它可以用来对多个主元同时进行监测;SPE统计量刻画了输入变量的测量值对主元模型的偏离程度,是对模型外部变化的一种度量。针对间歇过程典型的三维数组形式,多元统计方法无法直接对三维数据建模,常用的数据预处理方法是将三维数据沿变量或批次方向展开成二维矩阵,之后再进行数据分析建模等。但是,对三维数据进行二维展开会损失部分信息。针对间歇过程的多阶段性,通常是先将间歇过程分为不同的阶段,然后在各个阶段内分别建模进行故障监测。高学金等在文献“基于扩展核熵负载矩阵的发酵过程故障监测”中,提出将时间变量添加到核熵负载矩阵中,并利用模糊C-均值对间歇过程进行阶段划分。然而,如何合理分阶段是此类方法的一个难题,并且分阶段建模是将各个阶段数据独立建模,没有考虑不同阶段之间数据的相关性,即没有统筹考虑整个批次的全局特征信息,且阶段划分没有统一标准,建模步骤繁琐,更新困难。
[0004] 卷积自动编码器(convolutional autoencoder,CAE)是一种监督学习方法,将卷积神经网络中的卷积、池化等运算进行反向操作,对输入数据重构,并通过最小化输入数据与重构数据的均方差实现特征学习,保留卷积神经网络(convolutional neural network,CNN)的局部特征提取优势的同时,又无需数据标签。该方法最初被应用于图像识别,近年来逐步扩展应用到图像视频、晶圆等的异常检测上,但是在间歇过程的故障监测上应用还很少。

发明内容

[0005] 为弥补以上所述现有技术的不足,本发明提供了一种基于批次图像化的卷积自编码故障监测方法。将每个批次数据看作二维灰度图,无需对间歇过程的三维数组进行二维转换,避免了信息丢失;每个批次中数据变化可以看作图片的纹理变化,整体建模充分考虑变量相关关系的动态变化,相比分阶段建模极大地减少了计算量;二维灰度图直接输入CAE中提取间歇过程的特征,模型建立无需故障数据及标签;利用一类支持向量机(one-class support vector method,OCSVM)方法构造所提特征的监控统计量并确定其控制限,通过将当前采样时刻的监测统计量与控制限比较实现故障监测。
[0006] 本发明是对间歇过程的多阶段性、非线性和三维数据形式,将批次数据进行图像化处理,建立卷积自编码器模型并利用OCSVM进行故障监测,提高模型的精度和监测性能;采用了如下的技术方案及实现步骤:
[0007] 将批次数据进行图像化处理,建立卷积自编码器(CAE)模型并利用一类支持向量机法(OCSVM)进行故障监测,具体步骤如下:
[0008] A.离线建模阶段:
[0009] 1)历史数据的采集:间歇生产按照一定的周期循环往复,单个周期结束后按批次获得批量产物;每个批次内采集K个过程变量J个时刻的数据得到一个二维矩阵X(K×J),其中K为采集的过程变量个数,J为采样点的个数,I个批次就组成了间歇过程典型的三维数据表示形式——X(I×K×J);
[0010] 2)数据归一化:采用最大最小值归一化数据处理方法,消除不同过程变量间量纲的影响,将过程变量实际数据范围转化为满足计算机处理的灰度图的数据范围,即0到1之间的数字;计算公式如下:
[0011]
[0012] 具体步骤为:
[0013] a)将历史三维数据X(I×K×J)沿变量方向展开成二维数据X(IK×J);
[0014] b)求每个变量的最大值及最小值;
[0015] c)对每个变量进行归一化处理;
[0016] d)将二维数组重新折叠成三维数组;
[0017] e)所有训练批次求平均值,得到正常批次数据各个时刻的平均值;
[0018] 3)设置CAE网络参数,并将数据输入CAE中训练;在CAE中,若干个卷积层、池化层及全连接层构成编码单元,与之近似为逆运算的全连接层、反池化层及反卷积层构成解码单元;损失函数采用均方误差函数,通过最小化损失函数,重构数据与输入数据的均方误差,采用反向传播算法调整各层的权重,实现特征的无监督学习
[0019] 4)设计统计量和控制限:引入OCSVM对CAE提取到的特征建模,求超平面的最优解,得到统计量计算公式;将监控统计量设计为到超平面距离的相反数,用D表示,如公式(2)所示:
[0020]
[0021] 0为所设计统计量的控制限,当D>0时,故障发生,否则正常;
[0022] B.在线监测阶段:
[0023] 1)数据采集:采集当前时刻k所有变量的数据得到xnew,k(1×J);
[0024] 2)数据归一化:按离线求得的每个变量的最大最小值进行归一化处理;
[0025] 3)批次填充:将k时刻与1~k-1时刻归一化后的数据组合,后续未发生的k+1~K时刻数据用离线阶段求得的正常批次对应时刻平均值填充;
[0026] 4)特征提取:填充完的一个批次数据输入到离线建模训练好的网络提取特征;
[0027] 5)故障监测:将上一步中提取的特征代入公式(2)中,计算统计量D,若D>0,则判定当前时刻出现故障,并采取相应处理措施,否则就为正常状态,需要继续监测生产过程,直至批次结束。
[0028] 有益效果
[0029] 本发明将每个批次过程数据作为一个二维灰度图,直接输入卷积自编码器中进行无监督学习,并利用OCSVM对所提取特征设计统计量并确定控制限实现了故障监测。避免数据展开导致信息丢失,无需划分阶段减少建模工作量,深层地提取了过程变量的变化特征。本发明方法可以减少过程监测中误报、漏报的发生,提高故障监测的准确性。
附图说明
[0030] 图1为本发明CAE-OCSVM方法、多阶段MPCA及MPCA对故障批次1的监测结果,(a)-2 2
(e)依次为CAE-OCSVM、多阶段MPCA-T 、多阶段MPCA-SPE、MPCA-T、MPCA-SPE对故障批次1的监测曲线;
[0031] 图2为本发明CAE-OCSVM方法、多阶段MPCA及MPCA对故障批次1的监测结果,(a)-(e)依次为CAE-OCSVM、多阶段MPCA-T2、多阶段MPCA-SPE、MPCA-T2、MPCA-SPE对故障批次2的监测曲线。

具体实施方式

[0032] Pensim青霉素发酵仿真平台是由伊利诺科技学院Cinar教授等人开发的一个用于间歇过程故障监测有效性评估的标准平台。本实验共采集10个过程变量,变量名称如表1所示,采样间隔为1h,选取50个正常批次作为训练样本,2个故障批次作为测试样本。其中故障批次1为通速率在200h处发生的幅值为1的阶跃变化,故障批次2为搅拌功率在200h处发生的的斜率为0.003的斜坡变化。
[0033] 表1建立模型所用变量
[0034]
[0035] 基于上内容,将本发明应用到上述发酵过程仿真平台,具体实施步骤如下:
[0036] A.离线建模阶段:
[0037] 1):历史数据的采集
[0038] 2):对历史数据进行归一化,采用最大最小值归一化数据处理方法,消除不同过程变量间量纲的影响,将过程变量实际数据范围转化为满足计算机处理的灰度图的数据范围,即0到1之间的数字;计算公式如下:
[0039]
[0040] 具体步骤为:
[0041] a)将历史三维数据X(I×K×J)沿变量方向展开成二维数据X(IK×J);
[0042] b)求每个变量的最大值及最小值;
[0043] c)对每个变量进行归一化处理;
[0044] d)将二维数组重新折叠成三维数组;
[0045] e)所有训练批次求平均值,得到正常批次数据各个时刻的平均值;
[0046] 3):将归一化后的三维数据输入卷积自编码器中进行特征的无监督学习。本发明设计的CAE模型结构参数如表2所示,共包含两个卷积层、一个池化层、两个全连接层、一个反池化层和两个反卷积层。其中,conv(1,16,(11,5),(2,1),(5,2))指的是卷积层输入通道数为1,输出通道数为16,卷积核大小为11*5,步长为2*1,填充大小为5*2;maxpool(2,2)指最大池化层核大小为2*2,步长为2;linear(10)指输出特征层节点数为10。编码阶段与解码阶段的网络结构参数是相同的,对应的每一层特征维数也基本相同。每个卷积层及第一个反卷积层后的激活函数都使用tanh函数,而在第二个反卷积层后的激活函数使用sigmoid函数,这是为了将网络输出缩放到0-1范围内,以便与网络输入比较。对于发酵过程的变量数和采样点数不能被卷积核或池化核大小整除,导致编码阶段与解码阶段特征维数不同的情况,本发明在反卷积层添加output_padding参数来整合数据维数,使重构后数据与输入数据维数相同。网络训练参数中学习率设为0.0001,batch_size设为10,epoch设为10。
[0047] 表2CAE网络结构参数
[0048]
[0049] 4):利用OCSVM学习CAE提取特征的分布情况,求超平面最优解,并得到统计量计算公式,将监控统计量设计为到超平面距离的相反数,用D表示,如公式(2)所示:
[0050]
[0051] B.在线监测阶段:
[0052] 1):选择故障数据的第k时刻进行故障监测;
[0053] 2):对所有1~k时刻数据进行归一化处理;
[0054] 3):后续未发生的k+1~400时刻数据用正常批次对应时刻平均值填充。
[0055] 4):将填充完的一整个批次数据输入到离线建模阶段训练好的网络中提取特征;
[0056] 5):将上一步中提取的特征代入统计量计算公式(2)中,计算统计量D,若D>0,则判定当前时刻出现故障,并采取相应处理措施,否则就为正常状态,需要继续监测生产过程,直至批次结束。
[0057] 为验证所提方法故障监测的准确性及有效性,对阶跃、斜坡2种故障数据分别进行了实验,并与MPCA、多阶段MPCA方法作了对比。其中,MPCA算法先将三维数据按变量展开成二维,然后进行PCA降维,按85%的方差贡献率选取主元。多阶段MPCA直接采用高学金等在文献“基于扩展核熵负载矩阵的发酵过程故障监测”中划分阶段的结果,将青霉素发酵过程共划分为五个阶段,分别为(1~53)h,(79~185)h,(206~400)h三个稳定阶段和(54~78)h,(186~205)h两个过渡阶段,每个阶段内利用MPCA分别单独建模并监测故障。实验结果见图1和图2。
[0058] 图1和图2分别为MPCA、多阶段MPCA和CAE三种方法对故障批次1和2的监测结果。从监测图中可以看出,CAE方法能够检出故障1和故障2,且没有误报警,仅在故障批次2上有6%的漏报警;多阶段MPCA方法虽然也能检出故障1和故障2,但是在故障批次1发酵初期存在误报警,且在故障2上检出时间晚,漏报警率较高;MPCA在这两个故障批次生产初期(1-
5h)及阶段变化(45h)处均出现了误报警,并且故障2的漏报警率较高。
[0059] MPCA方法没有考虑阶段变化,因此在阶段变化附近出现了误报警。多阶段MPCA与MPCA方法均在生产初期出现了误报警,这是因为青霉素发酵不同批次的起始条件会有一定差异,这两种方法对此都较敏感,而CAE方法将批次数据图像化处理,能够在提取局部特征的同时,从全局把握每个批次整体的变化特征,更具鲁棒性,同时OCSVM方法描述了正常批次特征的分布特点,避免了CAE特征无法构造T2统计量的缺陷。总的来说,相比MPCA和多阶段MPCA,本文方法监测效果更好。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈