基于伪标签方法和弱监督学习的过程数据故障分类方法专利检索-多层感知器前馈神经网络人工神经网络机器学习人工智能人工智能专利检索查询-专利查询网

基于伪标签方法和弱 监督学习的过程数据故障分类方法

阅读：385发布：2020-05-08

专利汇可以提供基于伪标签方法和弱监督学习的过程数据故障分类方法专利检索，专利查询，专利分析的服务。并且本发明公开了一种基于伪标签方法和弱监督学习的工业过程数据故障分类方法，它由多层感知器，BatchNormalization层，Dropout层和Softmax 输出层组成的有监督分类网络和用于获取伪标签不准确情况的高斯混合模型组成；多层感知器能够从有标签数据中学习数据的特征表示，BatchNormalization层用于加速多层感知器模型的收敛，Dropout层用于防止多层感知器训练过拟合，Softmax输出层根据多层感知器提取的故障样本特征进行故障分类。本发明可以在获得有标签样本标签不准确且存在无标签样本场景进行建模，通过对有标签样本标签及基于伪标签方法给无标签样本预测的伪标签进行标签概率转移矩阵评估，并用于修正分类网络的损失函数，完成弱监督学习，从而提升模型对样本的分类精度。，下面是基于伪标签方法和弱监督学习的过程数据故障分类方法专利的具体信息内容。

权利要求

1.一种基于伪标签方法和弱监督学习的故障分类方法，其特征在于，包括如下步骤：
步骤一：收集历史工业过程的有标签数据集和无标签数据集作为训练数据集，其中有标签数据集为含有故障类别标签的有标签数据集无
标签数据集其中，xr为有标签数据样本，yr为该样本的标
签，yr∈{1,2,...,K}，Nl表示有标签数据集的样本个数,Nu表示无标签数据集的样本个数，K为样本类别数。
步骤二：将步骤一中收集到的有标签数据集Dl标准化，即将有标签样本集Xl每个变量映射为均值为0，方差为1的样本集Xl_std，并通过one-hot编码将标签集Yl每个样本转化为一维向量，得到标准化有标签数据集无标签样本集
Du也进行同样的标准化，得到标准化无标签数据集
步骤三：根据伪标签方法，将标准化有标签数据集Dl_std作为输入，对MLP网络进行第一次有监督训练，训练好的网络对标准化无标签样本集Du_std推理得到无标签样本的伪标签集Yul，与无标签样本集Xu构成含伪标签集的无标签数据集；
步骤四：把有标签数据集和步骤三得到的含伪标签集的无标签数据集合并，得到Dn＝{[Xl,Xu],[Yl,Yul]}，按照步骤二的标准化方法将合并的数据集[Xl,Xu]标准化，并且通过one-hot编码将合并的标签集[Yl,Yul]的每个样本转化为一维向量，得到
再使用步骤三训练得
到的MLP网络推理得到样本集X属于其标签的后验概率；
步骤五：将步骤四得到的后验概率作为高斯混合模型的输入，对高斯混合模型进行弱监督学习训练，并用训练完成后高斯混合模型参数来估计标签概率转移矩阵T，得到估计矩阵
步骤六：根据修正步骤三得到的MLP网络的损失函数，以步骤四得到的数据集Dn_std作为输入，第二次有监督训练步骤三得到的MLP网络，完成弱监督学习，得到训练好的WS-MLP网络；
步骤七：收集新的未知故障类别的工业过程数据，按照步骤二的方法将过程数据标准化，得到标准化数据集dstd,输入到步骤六训练好的WS-MLP网络，求取样本对应每个故障类别的后验概率，把后验概率最大的类别，作为该样本类别，实现样本的故障分类。
2.根据权利要求1所述的故障分类方法，其特征在于，所述步骤三具体包括如下步骤：
(3.1)构建MLP网络，所述MLP网络由依次连接的第一层隐层、BatchNormalization层、Dropout层、第二层隐层、BatchNormalization层、Dropout层和Softmax层组成。其中，第一层隐层和第二层隐层的权重矩阵和偏置向量分别为W1,b1,W2,b2,第二层隐层到Softmax层的权重矩阵和偏置向量分别为W3,b3，将这些网络参数表示为θ＝{W1,b1,W2,b2,W3,b3}。
(3.2)有标签样本集Dl_std作为输入，对MLP网络进行有监督训练，其中使用交叉熵损失函数：
其中，(.)T代表转置操作，是MLP网络的最后一层的表示。
损失函数通过反向传播算法(BP)对整个MLP网络进行参数调整，经过多次迭代损失收敛后，得到整个网络的较优参数，完成训练。
(3.3)用步骤(3.2)训练好的MLP网络对无标签样本集预测其类别，得到的标签称为伪标签：
c
其中，e ,c∈{1,2,…,K}表示在空间上，第c个元素为1，其他元素为0的向量。
每个样本预测的伪标签组合构成伪标签集Yul。
(3.4)将得到的伪标签集Yul与无标签样本集Xu构成含伪标签集的无标签数据集。
3.根据权利要求1所述的故障分类方法，其特征在于，所述步骤五具体包括如下步骤：
(5.1)MLP网络对无标签样本预测的伪标签存在预测错误的情况，因此每类样本是由标签准确的样本和标签错误的样本组成。作出以下假设：假设不准确标签的产生与输入独立，即某类样本标记成其他类别的概率相同。并且假设MLP网络具有感知一致性，即MLP网络对每个类别中标签准确的样本和标签错误的样本的特征表示分别服从高斯分布。
根据假设，可以得到：
其中，是样本集Dn_std的一个样本表示，y是该样本潜在的真实标签，p(·)表示概率，ei,i∈{1,2,…,K}表示在空间上，第i个元素为1，其他元素为0的向量，θ表示MLP网络中所有的权重矩阵和偏置向量参数，μ,Σ分别表示高斯分布未知的均值向量和协方差矩阵，和分别表示所有样本和类别为i样本的高斯分布密度，T表示标签概率转移矩阵，并且定义
(5.2)对于不同类别样本子集使用高斯混合模型建模：
其中，xi表示属于数据集的样本数据，表示表示除类别i外的
其他类别。
(5.3)建立两组分的高斯混合模型，使用最大期望化(EM)算法完成高斯混合模型的参数估计，求解出即
期望步(E步)时，计算Q函数：
其中t为迭代次数。
计算模型对于观测数据的责任度
其中，表示xi的第n个样本。
极大步(M步)时，估计高斯分布平均值μm和混合系数αm。
其中，Si表示样本个数。
E步和M步交替迭代到模型参数收敛或者预设的最大迭代次数。求解出即
(5.4)根据公式求解得到混合系数并用此来得到标签概
率转移矩阵T的估计值
其中，表示估计矩阵的第i行第k列的元素。
4.根据权利要求1所述的故障分类方法，其特征在于，所述步骤六中，MLP第二次训练使用修正损失函数为：
其中，T代表真实的标签概率转移矩阵，并且真实训练时使用估计矩阵代替式中T。通过损失通过反向传播算法(BP)对整个MLP网络进行参数调整，经过多次迭代损失收敛后，得到整个网络的较优参数，完成训练。

说明书全文

基于伪标签方法和弱监督学习的过程数据故障分类方法

技术领域

[0001] 本发明属于工业过程故障诊断和分类领域，涉及一种基于伪标签方法和弱监督学习的故障分类方法。

背景技术

[0002] 在工业过程监测中，当检测到故障发生后，需要对故障信息进行进一步分析，而故障分类是其中的一个重要环节，获得发生故障类别，有利于进行工业过程的恢复。

[0003] 在传统的故障分类中，都需要样本具有标签，从而进行模型训练，然而，工业过程数据中，存在有标签样本的标签可能不准确，且样本标签缺失的情况，即部分样本是无标签的。伪标签方法是一种同时利用有标签样本和无标签样本的一种有效方法。但是伪标签方法没有考虑给无标签样本打上标签(伪标签)的准确性，把含伪标签样本放入网络进行建模，可能给模型带来噪声。因此，在实际建模中考虑有标签样本标签以及无标签样本伪标签的不准确性，对这种样本标签不准确的弱监督信息进行弱监督学习建模，能有利提高模型对故障样本的分类精度。

发明内容

[0004] 针对目前工业过程中获得的有标签样本的标签可能并不准确及伪标签方法给无标签样本打的伪标签可能错标等问题，本发明提出了一种基于伪标签方法和弱监督学习的故障分类方法，该方法基于MLP，BatchNormalization层，Dropout层和Softmax 输出层组成的分类网络和高斯混合模型，实现了对工业过程中故障样本的精确分类。

[0005] 本发明具体技术方案如下：

[0006] 一种基于伪标签方法和弱监督学习的故障分类方法，包括如下步骤：

[0007] 步骤一：收集历史工业过程的有标签数据集和无标签数据集作为训练数据集，其中有标签数据集为含有故障类别标签的有标签数据集无标签数据集其中，xr为有标签数据样本，yr为该样本的
标签，yr∈{1,2,...,K}，Nl表示有标签数据集的样本个数,Nu表示无标签数据集的样本个数，K为样本类别数。

[0008] 步骤二：将步骤一中收集到的有标签数据集Dl标准化，即将有标签样本集Xl每个变量映射为均值为0，方差为1的样本集Xl_std，并通过one-hot编码将标签集Yl每个样本转化为一维向量，得到标准化有标签数据集无标签样本集Du也进行同样的标准化，得到标准化无标签数据集

[0009] 步骤三：根据伪标签方法，将标准化有标签数据集Dl_std作为输入，对MLP网络进行第一次有监督训练，训练好的网络对标准化无标签样本集Du_std推理得到无标签样本的伪标签集Yul，与无标签样本集Xu构成含伪标签集的无标签数据集；

[0010] 步骤四：把有标签数据集和步骤三得到的含伪标签集的无标签数据集合并，得到Dn＝{[Xl,Xu],[Yl,Yul]}，按照步骤二的标准化方法将合并的数据集[Xl,Xu]标准化，并且通过one-hot编码将合并的标签集[Yl,Yul]的每个样本转化为一维向量，得到再使用步骤三训练得
到的MLP网络推理得到样本集X属于其标签的后验概率；

[0011] 步骤五：将步骤四得到的后验概率作为高斯混合模型的输入，对高斯混合模型进行弱监督学习训练，并用训练完成后高斯混合模型参数来估计标签概率转移矩阵T，得到估计矩阵

[0012] 步骤六：根据修正步骤三得到的MLP网络的损失函数，以步骤四得到的数据集Dn_std作为输入，第二次有监督训练步骤三得到的MLP网络，完成弱监督学习，得到训练好的WS-MLP网络；

[0013] 步骤七：收集新的未知故障类别的工业过程数据，按照步骤二的方法将过程数据标准化，得到标准化数据集dstd,输入到步骤六训练好的WS-MLP网络，求取样本对应每个故障类别的后验概率，把后验概率最大的类别，作为该样本类别，实现样本的故障分类。

[0014] 进一步地，所述步骤三具体包括如下步骤：

[0015] (3.1)构建MLP网络，所述MLP网络由依次连接的第一层隐层、BatchNormalization层、Dropout层、第二层隐层、BatchNormalization层、Dropout层和Softmax层组成。其中，第一层隐层和第二层隐层的权重矩阵和偏置向量分别为W1,b1,W2,b2,第二层隐层到Softmax层的权重矩阵和偏置向量分别为W3,b3，将这些网络参数表示为θ＝{W1,b1,W2,b2,W3,b3}。

[0016] (3.2)有标签样本集Dl_std作为输入，对MLP网络进行有监督训练，其中使用交叉熵损失函数：

[0017]

[0018] 其中，(.)T代表转置操作，是MLP网络的最后一层的表示。

[0019] 损失函数通过反向传播算法(BP)对整个MLP网络进行参数调整，经过多次迭代损失收敛后，得到整个网络的较优参数，完成训练。

[0020] (3.3)用步骤(3.2)训练好的MLP网络对无标签样本集预测其类别，得到的标签称为伪标签：

[0021]

[0022] 其中，ec,c∈{1,2,…,K}表示在空间上，第c个元素为1，其他元素为0的向量。

[0023] 每个样本预测的伪标签组合构成伪标签集Yul。

[0024] (3.4)将得到的伪标签集Yul与无标签样本集Xu构成含伪标签集的无标签数据集。

[0025] 进一步地，所述步骤五具体包括如下步骤：

[0026] (5.1)MLP网络对无标签样本预测的伪标签存在预测错误的情况，因此每类样本是由标签准确的样本和标签错误的样本组成。作出以下假设：假设不准确标签的产生与输入独立，即某类样本标记成其他类别的概率相同。并且假设MLP网络具有感知一致性，即MLP网络对每个类别中标签准确的样本和标签错误的样本的特征表示分别服从高斯分布。

[0027] 根据假设，可以得到：

[0028]

[0029]

[0030]

[0031]

[0032] 其中，是样本集Dn_std的一个样本表示，y是该样本潜在的真实标签，p(·)表示概率，ei,i∈{1,2,…,K}表示在空间上，第i个元素为1，其他元素为0的向量，θ表示MLP网络中所有的权重矩阵和偏置向量参数，μ,Σ分别表示高斯分布未知的均值向量和协方差矩阵，和分别表示所有样本和类别为i样本的高斯分布密度，T表示标签概率转移矩阵，并且定义

[0033] (5.2)对于不同类别样本子集使用高斯混合模型建模：

[0034]

[0035]

[0036] 其中，xi表示属于数据集的样本数据，表示表示除类别i外的其他类别。

[0037] (5.3)建立两组分的高斯混合模型，使用最大期望化(EM)算法完成高斯混合模型的参数估计，求解出即

[0038] 期望步(E步)时，计算Q函数：

[0039]

[0040] 其中t为迭代次数。

[0041] 计算模型对于观测数据的责任度

[0042]

[0043] 其中，表示xi的第n个样本。

[0044] 极大步(M步)时，估计高斯分布平均值μm和混合系数αm。

[0045]

[0046]

[0047]

[0048] 其中，Si表示样本个数。

[0049] E步和M步交替迭代到模型参数收敛或者预设的最大迭代次数。求解出即[0050] (5.4)根据公式求解得到混合系数并用此来得到标签概率转移矩阵T的估计值

[0051]

[0052]

[0053] 其中，表示估计矩阵的第i行第k列的元素。

[0054] 进一步地，所述步骤六中，MLP第二次训练使用修正损失函数为：

[0055]

[0056] 其中，T代表真实的标签概率转移矩阵，并且真实训练时使用估计矩阵代替式中T。

[0057] 通过损失通过反向传播算法(BP)对整个MLP网络进行参数调整，经过多次迭代损失收敛后，得到整个网络的较优参数，完成训练。

[0058] 本发明的有益效果是，本发明可以在获得有标签样本标签不准确且存在无标签样本场景进行建模，通过对有标签样本标签及基于伪标签方法给无标签样本预测的伪标签进行标签概率转移矩阵评估，并用于修正分类网络的损失函数，完成弱监督学习，从而提升模型对样本的分类精度。附图说明

[0059] 图1是基于伪标签方法和弱监督学习的流程图；

[0060] 图2是Tennessee Eastman(TE)过程流程图；

[0061] 图3是MLP网络、基于伪标签方法的MLP网络和基于伪标签方法和弱监督学习的MLP网络对5类TE过程故障情况在有标签比例分别为0.05,0.1,0.2,0.3下的分类精度对比图。

具体实施方式

[0062] 下面结合具体实施方式对本发明基于弱监督学习的故障分类方法作进一步的详述。

[0063] 一种基于伪标签方法和弱监督学习的故障分类方法，该方法基于伪标签方法和弱监督学习的训练过程可以分为二个阶段：

[0064] (1)基于伪标签方法的MLP有标签样本学习阶段

[0065] MLP网络对有标签样本集Dl_std进行有监督训练，并使用交叉熵损失函数：

[0066]

[0067] 其中，(.)T代表转置操作，是MLP网络的最后一层的表示，θ为MLP网络参数。

[0068] 损失通过反向传播算法(BP)对整个MLP网络进行参数调整，经过多次迭代损失收敛后，得到整个网络的较优参数，完成训练。

[0069] 用训练好的MLP网络对无标签样本集预测其类别，得到的标签称为伪标签：

[0070]

[0071] 其中，ec,c∈{1,2,…,K}表示在空间上，第c个元素为1，其他元素为0的向量。

[0072] 每个样本预测的伪标签组合构成伪标签集Yul。

[0073] (2)弱监督学习阶段

[0074] 弱监督学习将考虑有标签样本的标签及无标签样本的伪标签不准确的情况，并把有标签样本和含伪标签的无标签样本统一称作不准确标签样本集Dn＝{[Xl,Xu],[Yl,Yul]}。弱监督学习阶段包含估计标签概率转移矩阵T和MLP模型第二次训练。具体做法为：

[0075] 由于模型对无标签样本预测的伪标签存在预测错误的情况，每类样本是由标签准确的样本和标签错误的样本组成，作出以下假设：假设不准确标签的产生与输入独立，即某类样本标记成其他类别的概率相同；并且假设模型具有感知一致性，即模型对每个类别中标签准确的样本和标签错误的样本的特征表示分别服从高斯分布。

[0076] 根据假设，可以得到：

[0077]

[0078]

[0079]

[0080]

[0081] 其中，是样本集Dn_std的一个样本表示，y是该样本潜在的真实标签，ei,i∈{1,2,…,K}表示在空间上，第i个元素为1，其他元素为0的向量，θ表示MLP网络中所有的权重矩阵和偏置向量参数，μ,Σ分别表示高斯分布未知的均值向量和协方差矩阵，和分别表示所有样本和类别为i样本的高斯分布密度，T表示标签概率转移矩阵，并且定义[0082] 对于不同类别样本子集使用高斯混合模型建模：

[0083]

[0084]

[0085] 其中，xi表示属于数据集的样本数据，表示表示除类别i外的其他类别。

[0086] 建立两组分的高斯混合模型，使用最大期望化(EM)算法完成高斯混合模型的参数估计，求解出即

[0087] 期望步(E步)时，计算Q函数：

[0088]

[0089] 其中t为迭代次数。

[0090] 计算模型对于观测数据的责任度

[0091]

[0092] 其中，表示xi的第n个样本。

[0093] 极大步(M步)时，估计高斯分布平均值μm和混合系数αm。

[0094]

[0095]

[0096]

[0097] 其中，Si表示样本个数。

[0098] E步和M步交替迭代到模型参数收敛或者得到预设的最大迭代次数求得即最后根据公式求解得到混合系数并用此来得到标签概率转移矩阵T的估计值

[0099]

[0100]

[0101] 其中，表示估计矩阵的第i行第k列的元素。

[0102] MLP第二次训练使用修正损失函数为：

[0103]

[0104] 其中，T代表真实的标签概率转移矩阵，并且真实训练时使用估计矩阵代替式中T。

[0105] 通过损失通过反向传播算法(BP)对整个MLP网络进行参数调整，经过多次迭代损失收敛后，得到整个网络的较优参数，完成训练。

[0106] 基于上述伪标签方法和弱监督学习的故障分类方法建模流程如图1所示，步骤如下：

[0107] 步骤一：收集历史工业过程的有标签数据集和无标签数据集作为训练数据集，其中有标签数据集为含有故障类别标签的有标签数据集无标签数据集其中，xr为有标签数据样本，yr为该样本的
标签，yr∈{1,2,...,K}，Nl表示有标签数据集的样本个数,Nu表示无标签数据集的样本个数，K为样本类别数。

[0108] 步骤二：将步骤一中收集到的有标签数据集Dl标准化，即Xl每个变量映射为成均值为0，方差为1的样本集Xl_std，并通过one-hot编码将标签集Yl每个样本转化为一维向量，得到标准化后的有标签数据集无标签样本集Du也进行同样的标准化，得到标准化后的无标签数据集

[0109] 步骤三：根据伪标签方法，将标准化有标签数据集Dl_std作为输入，对MLP网络进行第一次有监督训练，训练好的网络对标准化无标签样本集Du_std推理得到无标签样本的伪标签集Yul，与无标签样本集Xu构成含伪标签集的无标签数据集；

[0110] 步骤四：把有标签数据集和步骤三得到的含伪标签集的无标签数据集合并，得到Dn＝{[Xl,Xu],[Yl,Yul]}，按照步骤二的标准化方法将合并的数据集[Xl,Xu]标准化，并且通过one-hot编码将合并的标签集[Yl,Yul]的每个样本转化为一维向量，得到再使用步骤三训练得
到的MLP网络推理得到样本集X属于其标签的后验概率；

[0111] 步骤五：将步骤四得到的后验概率作为高斯混合模型的输入，对高斯混合模型进行弱监督学习训练，并用训练完成后高斯混合模型参数来估计标签概率转移矩阵T，得到估计矩阵

[0112] 步骤六：根据修正步骤三得到的MLP网络的损失函数，以步骤四得到的数据集Dn_std作为输入，第二次有监督训练步骤三得到的MLP网络，完成弱监督学习，得到训练好的WS-MLP网络；

[0113] 步骤七：收集新的未知故障类别的工业过程数据，按照步骤二的方法将过程数据标准化，得到数据dstd,输入到步骤六训练好的WS-MLP网络，求取样本对应每个故障类别的后验概率，把后验概率最大的类别，作为该样本类别，实现样本的故障分类。

[0114] 以下结合一个具体的TE过程的例子来说明基于伪标签方法和弱监督学习的故障分类方法的性能。TE过程是故障诊断与故障分类领域常用的标准数据集，整个数据集包括53个过程变量，其工艺流程如图2所示。该流程由气液分离塔，连续搅拌式反应釜，分凝器，离心式压缩机，再沸器等5个操作单元组成。

[0115] 选取TE过程中的9种故障，表1给出了选取的这9类故障的具体情况。

[0116] 表1：TE过程故障列表

[0117]

[0118]

[0119] 针对该过程，将22种过程测量变量和12种控制变量共34个变量作为建模变量，在5类故障工况数据上测试分类性能。

[0120] 其中MLP网络由依次连接的第一层隐层、BatchNormalization层、Dropout层、第二层隐层、BatchNormalization层、Dropout层和Softmax层组成。MLP网络的的输入节点数为34，两个隐含层节点数分别为200,150，最后Softmax层节点数为5，BatchNormalization层的动量值均设为0.5，Dropout层节点丢失的比例均为0.5，使用初始学习率为0.001的Adam优化器，批次大小为110，迭代次数为30次。

[0121] 每类故障有4800个样本，总共24000个样本。其中，训练集样本和测试集样本个数比例为3:1，即测试集有6000个样本。其中，训练集采取有标签比例分别为0.05,0.1,0.2,0.3进行建模。

[0122] 为了评价该故障分类模型的分类效果，定义某类故障对应的分类F1指标，计算公式如下：

[0123]

[0124] precision＝TP/(TP+FP)

[0125] recall＝TP/(TP+FN)

[0126] 其中，TP为该类故障样本分类正确的样本数；FP为将其他类别样本误分为该类故障的样本数，FN为该类故障样本分类错误的样本数。

[0127] 图3为只使用MLP网络、基于伪标签方法的MLP网络(Semi-MLP)和基于伪标签方法和弱监督学习的MLP网络(WS-MLP)的故障分类根据F1指标计算得到的分类精度的对比图。可以看出在不同有标签比例下，基于伪标签方法和弱监督学习的MLP网络都比MLP网络的分类精度高，而且，本发明的基于伪标签方法和弱监督学习的MLP网络分类效果都是更好的。

标题	发布/更新时间	阅读量
一种基于安全态势感知的传感云双层网络防御系统及方法	2020-05-15	506
预测自动语音识别系统中的短语识别质量	2020-05-19	561
一种GIS隔离开关触头温度预测方法、装置及可读存储介质	2020-05-16	873
一种基于三维空间时序建模的深度视频人体行为识别方法	2020-05-19	456
基于伪标签方法和弱监督学习的过程数据故障分类方法	2020-05-08	385
一种三维点云的处理方法、装置及设备	2020-05-11	190
一种基于三维立体视觉和点云深度学习的机器人上料系统	2020-05-12	653
一种文本分类方法及系统	2020-05-13	822
一种基于对抗生成网络的人脑效应连接识别方法	2020-05-16	365
用于监测车辆盲区的方法和装置	2020-05-12	964

基于伪标签方法和弱监督学习的过程数据故障分类方法

基于伪标签方法和弱监督学习的过程数据故障分类方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：