首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 人工神经网络 / 前馈神经网络 / 多层感知器 / 基于伪标签方法和弱监督学习的过程数据故障分类方法

基于伪标签方法和弱监督学习的过程数据故障分类方法

阅读:385发布:2020-05-08

专利汇可以提供基于伪标签方法和弱监督学习的过程数据故障分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于伪标签方法和弱 监督学习 的工业过程数据故障分类方法,它由多层 感知 器,BatchNormalization层,Dropout层和Softmax 输出层 组成的有监督分类网络和用于获取伪标签不准确情况的高斯混合模型组成; 多层感知器 能够从有标签数据中学习数据的特征表示,BatchNormalization层用于 加速 多层感知器模型的收敛,Dropout层用于防止多层感知器训练过拟合,Softmax输出层根据多层感知器提取的故障样本特征进行故障分类。本发明可以在获得有标签样本标签不准确且存在无标签样本场景进行建模,通过对有标签样本标签及基于伪标签方法给无标签样本预测的伪标签进行标签概率转移矩阵评估,并用于修正分类网络的损失函数,完成弱监督学习,从而提升模型对样本的分类 精度 。,下面是基于伪标签方法和弱监督学习的过程数据故障分类方法专利的具体信息内容。

1.一种基于伪标签方法和弱监督学习的故障分类方法,其特征在于,包括如下步骤:
步骤一:收集历史工业过程的有标签数据集和无标签数据集作为训练数据集,其中有标签数据集为含有故障类别标签的有标签数据集 无
标签数据集 其中,xr为有标签数据样本,yr为该样本的标
签,yr∈{1,2,...,K},Nl表示有标签数据集的样本个数,Nu表示无标签数据集的样本个数,K为样本类别数。
步骤二:将步骤一中收集到的有标签数据集Dl标准化,即将有标签样本集Xl每个变量映射为均值为0,方差为1的样本集Xl_std,并通过one-hot编码将标签集Yl每个样本转化为一维向量,得到标准化有标签数据集 无标签样本集
Du也进行同样的标准化,得到标准化无标签数据集
步骤三:根据伪标签方法,将标准化有标签数据集Dl_std作为输入,对MLP网络进行第一次有监督训练,训练好的网络对标准化无标签样本集Du_std推理得到无标签样本的伪标签集Yul,与无标签样本集Xu构成含伪标签集的无标签数据集;
步骤四:把有标签数据集和步骤三得到的含伪标签集的无标签数据集合并,得到Dn={[Xl,Xu],[Yl,Yul]},按照步骤二的标准化方法将合并的数据集[Xl,Xu]标准化,并且通过one-hot编码将合并的标签集[Yl,Yul]的每个样本转化为一维向量,得到
再使用步骤三训练得
到的MLP网络推理得到样本集X属于其标签 的后验概率;
步骤五:将步骤四得到的后验概率作为高斯混合模型的输入,对高斯混合模型进行弱监督学习训练,并用训练完成后高斯混合模型参数 来估计标签概率转移矩阵T,得到估计矩阵
步骤六:根据 修正步骤三得到的MLP网络的损失函数,以步骤四得到的数据集Dn_std作为输入,第二次有监督训练步骤三得到的MLP网络,完成弱监督学习,得到训练好的WS-MLP网络;
步骤七:收集新的未知故障类别的工业过程数据,按照步骤二的方法将过程数据标准化,得到标准化数据集dstd,输入到步骤六训练好的WS-MLP网络,求取样本对应每个故障类别的后验概率,把后验概率最大的类别,作为该样本类别,实现样本的故障分类。
2.根据权利要求1所述的故障分类方法,其特征在于,所述步骤三具体包括如下步骤:
(3.1)构建MLP网络,所述MLP网络由依次连接的第一层隐层、BatchNormalization层、Dropout层、第二层隐层、BatchNormalization层、Dropout层和Softmax层组成。其中,第一层隐层和第二层隐层的权重矩阵和偏置向量分别为W1,b1,W2,b2,第二层隐层到Softmax层的权重矩阵和偏置向量分别为W3,b3,将这些网络参数表示为θ={W1,b1,W2,b2,W3,b3}。
(3.2)有标签样本集Dl_std作为输入,对MLP网络进行有监督训练,其中使用交叉熵损失函数:
其中,(.)T代表转置操作, 是MLP网络的最后一层的表示。
损失函数通过反向传播算法(BP)对整个MLP网络进行参数调整,经过多次迭代损失收敛后,得到整个网络的较优参数,完成训练。
(3.3)用步骤(3.2)训练好的MLP网络对无标签样本集预测其类别,得到的标签称为伪标签:
c
其中,e ,c∈{1,2,…,K}表示在 空间上,第c个元素为1,其他元素为0的向量。
每个样本预测的伪标签 组合构成伪标签集Yul。
(3.4)将得到的伪标签集Yul与无标签样本集Xu构成含伪标签集的无标签数据集。
3.根据权利要求1所述的故障分类方法,其特征在于,所述步骤五具体包括如下步骤:
(5.1)MLP网络对无标签样本预测的伪标签存在预测错误的情况,因此每类样本是由标签准确的样本和标签错误的样本组成。作出以下假设:假设不准确标签的产生与输入独立,即某类样本标记成其他类别的概率相同。并且假设MLP网络具有感知一致性,即MLP网络对每个类别中标签准确的样本和标签错误的样本的特征表示分别服从高斯分布。
根据假设,可以得到:
其中, 是样本集Dn_std的一个样本表示,y是该样本潜在的真实标签,p(·)表示概率,ei,i∈{1,2,…,K}表示在 空间上,第i个元素为1,其他元素为0的向量,θ表示MLP网络中所有的权重矩阵和偏置向量参数,μ,Σ分别表示高斯分布未知的均值向量和协方差矩阵, 和 分别表示所有样本和类别为i样本的高斯分布密度,T表示标签概率转移矩阵,并且定义
(5.2)对于不同类别样本子集 使用高斯混合模型建模:
其中,xi表示属于数据集 的样本数据, 表示 表示除类别i外的
其他类别。
(5.3)建立两组分的高斯混合模型,使用最大期望化(EM)算法完成高斯混合模型的参数估计,求解出 即
期望步(E步)时,计算Q函数:
其中t为迭代次数。
计算模型对于观测数据 的责任度
其中, 表示xi的第n个样本。
极大步(M步)时,估计高斯分布平均值μm和混合系数αm。
其中,Si表示 样本个数。
E步和M步交替迭代到模型参数收敛或者预设的最大迭代次数。求解出 即
(5.4)根据公式 求解得到混合系数 并用此来得到标签概
率转移矩阵T的估计值
其中, 表示估计矩阵 的第i行第k列的元素。
4.根据权利要求1所述的故障分类方法,其特征在于,所述步骤六中,MLP第二次训练使用修正损失函数为:
其中,T代表真实的标签概率转移矩阵,并且真实训练时使用估计矩阵 代替式中T。通过损失通过反向传播算法(BP)对整个MLP网络进行参数调整,经过多次迭代损失收敛后,得到整个网络的较优参数,完成训练。

说明书全文

基于伪标签方法和弱监督学习的过程数据故障分类方法

技术领域

[0001] 本发明属于工业过程故障诊断和分类领域,涉及一种基于伪标签方法和弱监督学习的故障分类方法。

背景技术

[0002] 在工业过程监测中,当检测到故障发生后,需要对故障信息进行进一步分析,而故障分类是其中的一个重要环节,获得发生故障类别,有利于进行工业过程的恢复。
[0003] 在传统的故障分类中,都需要样本具有标签,从而进行模型训练,然而,工业过程数据中,存在有标签样本的标签可能不准确,且样本标签缺失的情况,即部分样本是无标签的。伪标签方法是一种同时利用有标签样本和无标签样本的一种有效方法。但是伪标签方法没有考虑给无标签样本打上标签(伪标签)的准确性,把含伪标签样本放入网络进行建模,可能给模型带来噪声。因此,在实际建模中考虑有标签样本标签以及无标签样本伪标签的不准确性,对这种样本标签不准确的弱监督信息进行弱监督学习建模,能有利提高模型对故障样本的分类精度

发明内容

[0004] 针对目前工业过程中获得的有标签样本的标签可能并不准确及伪标签方法给无标签样本打的伪标签可能错标等问题,本发明提出了一种基于伪标签方法和弱监督学习的故障分类方法,该方法基于MLP,BatchNormalization层,Dropout层和Softmax输出层组成的分类网络和高斯混合模型,实现了对工业过程中故障样本的精确分类。
[0005] 本发明具体技术方案如下:
[0006] 一种基于伪标签方法和弱监督学习的故障分类方法,包括如下步骤:
[0007] 步骤一:收集历史工业过程的有标签数据集和无标签数据集作为训练数据集,其中有标签数据集为含有故障类别标签的有标签数据集无标签数据集 其中,xr为有标签数据样本,yr为该样本的
标签,yr∈{1,2,...,K},Nl表示有标签数据集的样本个数,Nu表示无标签数据集的样本个数,K为样本类别数。
[0008] 步骤二:将步骤一中收集到的有标签数据集Dl标准化,即将有标签样本集Xl每个变量映射为均值为0,方差为1的样本集Xl_std,并通过one-hot编码将标签集Yl每个样本转化为一维向量,得到标准化有标签数据集 无标签样本集Du也进行同样的标准化,得到标准化无标签数据集
[0009] 步骤三:根据伪标签方法,将标准化有标签数据集Dl_std作为输入,对MLP网络进行第一次有监督训练,训练好的网络对标准化无标签样本集Du_std推理得到无标签样本的伪标签集Yul,与无标签样本集Xu构成含伪标签集的无标签数据集;
[0010] 步骤四:把有标签数据集和步骤三得到的含伪标签集的无标签数据集合并,得到Dn={[Xl,Xu],[Yl,Yul]},按照步骤二的标准化方法将合并的数据集[Xl,Xu]标准化,并且通过one-hot编码将合并的标签集[Yl,Yul]的每个样本转化为一维向量,得到再使用步骤三训练得
到的MLP网络推理得到样本集X属于其标签 的后验概率;
[0011] 步骤五:将步骤四得到的后验概率作为高斯混合模型的输入,对高斯混合模型进行弱监督学习训练,并用训练完成后高斯混合模型参数 来估计标签概率转移矩阵T,得到估计矩阵
[0012] 步骤六:根据 修正步骤三得到的MLP网络的损失函数,以步骤四得到的数据集Dn_std作为输入,第二次有监督训练步骤三得到的MLP网络,完成弱监督学习,得到训练好的WS-MLP网络;
[0013] 步骤七:收集新的未知故障类别的工业过程数据,按照步骤二的方法将过程数据标准化,得到标准化数据集dstd,输入到步骤六训练好的WS-MLP网络,求取样本对应每个故障类别的后验概率,把后验概率最大的类别,作为该样本类别,实现样本的故障分类。
[0014] 进一步地,所述步骤三具体包括如下步骤:
[0015] (3.1)构建MLP网络,所述MLP网络由依次连接的第一层隐层、BatchNormalization层、Dropout层、第二层隐层、BatchNormalization层、Dropout层和Softmax层组成。其中,第一层隐层和第二层隐层的权重矩阵和偏置向量分别为W1,b1,W2,b2,第二层隐层到Softmax层的权重矩阵和偏置向量分别为W3,b3,将这些网络参数表示为θ={W1,b1,W2,b2,W3,b3}。
[0016] (3.2)有标签样本集Dl_std作为输入,对MLP网络进行有监督训练,其中使用交叉熵损失函数:
[0017]
[0018] 其中,(.)T代表转置操作, 是MLP网络的最后一层的表示。
[0019] 损失函数通过反向传播算法(BP)对整个MLP网络进行参数调整,经过多次迭代损失收敛后,得到整个网络的较优参数,完成训练。
[0020] (3.3)用步骤(3.2)训练好的MLP网络对无标签样本集预测其类别,得到的标签称为伪标签:
[0021]
[0022] 其中,ec,c∈{1,2,…,K}表示在 空间上,第c个元素为1,其他元素为0的向量。
[0023] 每个样本预测的伪标签 组合构成伪标签集Yul。
[0024] (3.4)将得到的伪标签集Yul与无标签样本集Xu构成含伪标签集的无标签数据集。
[0025] 进一步地,所述步骤五具体包括如下步骤:
[0026] (5.1)MLP网络对无标签样本预测的伪标签存在预测错误的情况,因此每类样本是由标签准确的样本和标签错误的样本组成。作出以下假设:假设不准确标签的产生与输入独立,即某类样本标记成其他类别的概率相同。并且假设MLP网络具有感知一致性,即MLP网络对每个类别中标签准确的样本和标签错误的样本的特征表示分别服从高斯分布。
[0027] 根据假设,可以得到:
[0028]
[0029]
[0030]
[0031]
[0032] 其中, 是样本集Dn_std的一个样本表示,y是该样本潜在的真实标签,p(·)表示概率,ei,i∈{1,2,…,K}表示在 空间上,第i个元素为1,其他元素为0的向量,θ表示MLP网络中所有的权重矩阵和偏置向量参数,μ,Σ分别表示高斯分布未知的均值向量和协方差矩阵,和 分别表示所有样本和类别为i样本的高斯分布密度,T表示标签概率转移矩阵,并且定义
[0033] (5.2)对于不同类别样本子集 使用高斯混合模型建模:
[0034]
[0035]
[0036] 其中,xi表示属于数据集 的样本数据, 表示 表示除类别i外的其他类别。
[0037] (5.3)建立两组分的高斯混合模型,使用最大期望化(EM)算法完成高斯混合模型的参数估计,求解出 即
[0038] 期望步(E步)时,计算Q函数:
[0039]
[0040] 其中t为迭代次数。
[0041] 计算模型对于观测数据 的责任度
[0042]
[0043] 其中, 表示xi的第n个样本。
[0044] 极大步(M步)时,估计高斯分布平均值μm和混合系数αm。
[0045]
[0046]
[0047]
[0048] 其中,Si表示 样本个数。
[0049] E步和M步交替迭代到模型参数收敛或者预设的最大迭代次数。求解出 即[0050] (5.4)根据公式 求解得到混合系数 并用此来得到标签概率转移矩阵T的估计值
[0051]
[0052]
[0053] 其中, 表示估计矩阵 的第i行第k列的元素。
[0054] 进一步地,所述步骤六中,MLP第二次训练使用修正损失函数为:
[0055]
[0056] 其中,T代表真实的标签概率转移矩阵,并且真实训练时使用估计矩阵 代替式中T。
[0057] 通过损失通过反向传播算法(BP)对整个MLP网络进行参数调整,经过多次迭代损失收敛后,得到整个网络的较优参数,完成训练。
[0058] 本发明的有益效果是,本发明可以在获得有标签样本标签不准确且存在无标签样本场景进行建模,通过对有标签样本标签及基于伪标签方法给无标签样本预测的伪标签进行标签概率转移矩阵评估,并用于修正分类网络的损失函数,完成弱监督学习,从而提升模型对样本的分类精度。附图说明
[0059] 图1是基于伪标签方法和弱监督学习的流程图
[0060] 图2是Tennessee Eastman(TE)过程流程图;
[0061] 图3是MLP网络、基于伪标签方法的MLP网络和基于伪标签方法和弱监督学习的MLP网络对5类TE过程故障情况在有标签比例分别为0.05,0.1,0.2,0.3下的分类精度对比图。

具体实施方式

[0062] 下面结合具体实施方式对本发明基于弱监督学习的故障分类方法作进一步的详述。
[0063] 一种基于伪标签方法和弱监督学习的故障分类方法,该方法基于伪标签方法和弱监督学习的训练过程可以分为二个阶段:
[0064] (1)基于伪标签方法的MLP有标签样本学习阶段
[0065] MLP网络对有标签样本集Dl_std进行有监督训练,并使用交叉熵损失函数:
[0066]
[0067] 其中,(.)T代表转置操作, 是MLP网络的最后一层的表示,θ为MLP网络参数。
[0068] 损失通过反向传播算法(BP)对整个MLP网络进行参数调整,经过多次迭代损失收敛后,得到整个网络的较优参数,完成训练。
[0069] 用训练好的MLP网络对无标签样本集预测其类别,得到的标签称为伪标签:
[0070]
[0071] 其中,ec,c∈{1,2,…,K}表示在 空间上,第c个元素为1,其他元素为0的向量。
[0072] 每个样本预测的伪标签 组合构成伪标签集Yul。
[0073] (2)弱监督学习阶段
[0074] 弱监督学习将考虑有标签样本的标签及无标签样本的伪标签不准确的情况,并把有标签样本和含伪标签的无标签样本统一称作不准确标签样本集Dn={[Xl,Xu],[Yl,Yul]}。弱监督学习阶段包含估计标签概率转移矩阵T和MLP模型第二次训练。具体做法为:
[0075] 由于模型对无标签样本预测的伪标签存在预测错误的情况,每类样本是由标签准确的样本和标签错误的样本组成,作出以下假设:假设不准确标签的产生与输入独立,即某类样本标记成其他类别的概率相同;并且假设模型具有感知一致性,即模型对每个类别中标签准确的样本和标签错误的样本的特征表示分别服从高斯分布。
[0076] 根据假设,可以得到:
[0077]
[0078]
[0079]
[0080]
[0081] 其中, 是样本集Dn_std的一个样本表示,y是该样本潜在的真实标签,ei,i∈{1,2,…,K}表示在 空间上,第i个元素为1,其他元素为0的向量,θ表示MLP网络中所有的权重矩阵和偏置向量参数,μ,Σ分别表示高斯分布未知的均值向量和协方差矩阵,和 分别表示所有样本和类别为i样本的高斯分布密度,T表示标签概率转移矩阵,并且定义[0082] 对于不同类别样本子集 使用高斯混合模型建模:
[0083]
[0084]
[0085] 其中,xi表示属于数据集 的样本数据, 表示 表示除类别i外的其他类别。
[0086] 建立两组分的高斯混合模型,使用最大期望化(EM)算法完成高斯混合模型的参数估计,求解出 即
[0087] 期望步(E步)时,计算Q函数:
[0088]
[0089] 其中t为迭代次数。
[0090] 计算模型对于观测数据 的责任度
[0091]
[0092] 其中, 表示xi的第n个样本。
[0093] 极大步(M步)时,估计高斯分布平均值μm和混合系数αm。
[0094]
[0095]
[0096]
[0097] 其中,Si表示 样本个数。
[0098] E步和M步交替迭代到模型参数收敛或者得到预设的最大迭代次数求得 即最后根据公式 求解得到混合系数 并用此来得到标签概率转移矩阵T的估计值
[0099]
[0100]
[0101] 其中, 表示估计矩阵 的第i行第k列的元素。
[0102] MLP第二次训练使用修正损失函数为:
[0103]
[0104] 其中,T代表真实的标签概率转移矩阵,并且真实训练时使用估计矩阵 代替式中T。
[0105] 通过损失通过反向传播算法(BP)对整个MLP网络进行参数调整,经过多次迭代损失收敛后,得到整个网络的较优参数,完成训练。
[0106] 基于上述伪标签方法和弱监督学习的故障分类方法建模流程如图1所示,步骤如下:
[0107] 步骤一:收集历史工业过程的有标签数据集和无标签数据集作为训练数据集,其中有标签数据集为含有故障类别标签的有标签数据集无标签数据集 其中,xr为有标签数据样本,yr为该样本的
标签,yr∈{1,2,...,K},Nl表示有标签数据集的样本个数,Nu表示无标签数据集的样本个数,K为样本类别数。
[0108] 步骤二:将步骤一中收集到的有标签数据集Dl标准化,即Xl每个变量映射为成均值为0,方差为1的样本集Xl_std,并通过one-hot编码将标签集Yl每个样本转化为一维向量,得到标准化后的有标签数据集 无标签样本集Du也进行同样的标准化,得到标准化后的无标签数据集
[0109] 步骤三:根据伪标签方法,将标准化有标签数据集Dl_std作为输入,对MLP网络进行第一次有监督训练,训练好的网络对标准化无标签样本集Du_std推理得到无标签样本的伪标签集Yul,与无标签样本集Xu构成含伪标签集的无标签数据集;
[0110] 步骤四:把有标签数据集和步骤三得到的含伪标签集的无标签数据集合并,得到Dn={[Xl,Xu],[Yl,Yul]},按照步骤二的标准化方法将合并的数据集[Xl,Xu]标准化,并且通过one-hot编码将合并的标签集[Yl,Yul]的每个样本转化为一维向量,得到再使用步骤三训练得
到的MLP网络推理得到样本集X属于其标签 的后验概率;
[0111] 步骤五:将步骤四得到的后验概率作为高斯混合模型的输入,对高斯混合模型进行弱监督学习训练,并用训练完成后高斯混合模型参数 来估计标签概率转移矩阵T,得到估计矩阵
[0112] 步骤六:根据 修正步骤三得到的MLP网络的损失函数,以步骤四得到的数据集Dn_std作为输入,第二次有监督训练步骤三得到的MLP网络,完成弱监督学习,得到训练好的WS-MLP网络;
[0113] 步骤七:收集新的未知故障类别的工业过程数据,按照步骤二的方法将过程数据标准化,得到数据dstd,输入到步骤六训练好的WS-MLP网络,求取样本对应每个故障类别的后验概率,把后验概率最大的类别,作为该样本类别,实现样本的故障分类。
[0114] 以下结合一个具体的TE过程的例子来说明基于伪标签方法和弱监督学习的故障分类方法的性能。TE过程是故障诊断与故障分类领域常用的标准数据集,整个数据集包括53个过程变量,其工艺流程如图2所示。该流程由气液分离塔,连续搅拌式反应釜,分凝器,离心式压缩机再沸器等5个操作单元组成。
[0115] 选取TE过程中的9种故障,表1给出了选取的这9类故障的具体情况。
[0116] 表1:TE过程故障列表
[0117]
[0118]
[0119] 针对该过程,将22种过程测量变量和12种控制变量共34个变量作为建模变量,在5类故障工况数据上测试分类性能。
[0120] 其中MLP网络由依次连接的第一层隐层、BatchNormalization层、Dropout层、第二层隐层、BatchNormalization层、Dropout层和Softmax层组成。MLP网络的的输入节点数为34,两个隐含层节点数分别为200,150,最后Softmax层节点数为5,BatchNormalization层的动量值均设为0.5,Dropout层节点丢失的比例均为0.5,使用初始学习率为0.001的Adam优化器,批次大小为110,迭代次数为30次。
[0121] 每类故障有4800个样本,总共24000个样本。其中,训练集样本和测试集样本个数比例为3:1,即测试集有6000个样本。其中,训练集采取有标签比例分别为0.05,0.1,0.2,0.3进行建模。
[0122] 为了评价该故障分类模型的分类效果,定义某类故障对应的分类F1指标,计算公式如下:
[0123]
[0124] precision=TP/(TP+FP)
[0125] recall=TP/(TP+FN)
[0126] 其中,TP为该类故障样本分类正确的样本数;FP为将其他类别样本误分为该类故障的样本数,FN为该类故障样本分类错误的样本数。
[0127] 图3为只使用MLP网络、基于伪标签方法的MLP网络(Semi-MLP)和基于伪标签方法和弱监督学习的MLP网络(WS-MLP)的故障分类根据F1指标计算得到的分类精度的对比图。可以看出在不同有标签比例下,基于伪标签方法和弱监督学习的MLP网络都比MLP网络的分类精度高,而且,本发明的基于伪标签方法和弱监督学习的MLP网络分类效果都是更好的。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈