首页 / 专利库 / 人工智能 / 人工神经网络 / 玻尔兹曼机 / 基于深度信念网络的计量装置故障溯源方法

基于深度信念网络的计量装置故障溯源方法

阅读:146发布:2020-05-16

专利汇可以提供基于深度信念网络的计量装置故障溯源方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 深度信念网络 的计量装置故障溯源方法,综合智能电表的台账数据和故障电表用电特征数据构建样本库,使用深度信念网络模型对离线台账数据样本库进行学习;对训练完成的深度信念网络模型输入在线台账数据样本库所包含的属性数据,实现对计量装置运行状态正常与故障的判断;将检测出故障的电表通过用电曲线故障特征样本库进行进一步故障溯源,最终得到精确的计量装置故障溯源结果。本发明提供的基于深度信念网络的计量装置故障溯源方法,为计量装置轮换周期及检修策略提供科学合理的指导。,下面是基于深度信念网络的计量装置故障溯源方法专利的具体信息内容。

1.一种基于深度信念网络的计量装置故障溯源方法,其特征在于:包括如下步骤:
使用卷积神经网络对已知故障电表的用电特征数据进行特征提取,构建用电曲线故障特征样本库;
使用待测运行电表的台账数据构建在线台账数据样本库;
使用深度信念网络模型对在线台账数据样本库的待测运行电表进行故障溯源,选取判断出故障的待测运行电表;
对故障的待测运行电表的用电特征数据使用卷积神经网络进行特征提取,得到运行曲线特征数据;
比对运行曲线特征数据与用电曲线故障特征样本库中故障曲线特征数据的相似度,当所有相似度超过设置阈值时,则待测运行电表最终故障溯源结果为故障。
2.根据权利要求1所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:所述卷积神经网络采用离线台账数据样本库进行学习;所述离线台账数据样本库包括已故障电表和正常电表台账数据的使用地区、表记类别、生产厂家、行业类别、标定电流的属性数据;
所述深度信念网络是由多个受限玻尔兹曼机堆叠组成的神经网络模型,其核心是RBM单元;每一个RBM都包括一个隐含层和可见层;此结构中层内神经元之间没有连接,层间所有神经元通过权重全部互相连接;RBM是一种基于能量的模型,对于状态(v,h)确定的RBM系统所具有的能量表示为:
式中:θ=(wij,ai,bj)为RBM参数,n、m分别为可见层与隐含层神经元数量;v为可见层输入,其表示异常电表的台账信息输入;vi表示可见层神经元i的状态,设定其偏置值为ai;h为隐含层输出,输出为0或1,表示电表未发生故障或电表发生故障;hj表示隐含层神经元j的状态,设定偏置值为bj;神经元i和j连接权重定义为wij;
由能量函数E,可得到(v,h)的联合概率分布为:
上式中Z(θ)为归一化因子,其表达式如下式:
当学习样本的数量为N时,参数θ通过学习样本的最大对数似然函数得到,公式如下:
上式中n为学习样本,p(v|θ)为观测数据v的似然函数,其表达式如下式:
从可见层计算隐含层,再反馈到可见层;重建后的可见层神经元再一次计算隐含层神经元的实际状态;根据可见层神经元状态计算隐含层第j个神经元,激活概率为:
由隐含层重建可见层第i个神经元,设定p为激活的概率,公式如下:
由随机梯度上升法求解最大对数似然函数值,得到深度信念网络参数变化量计算准则为:
式中:Δwij、Δai、Δbj分别为wij、ai、bj的变化量,<·>data为原始观测数据模型定义的分布;<·>recon为重构后模型定义的分布;
考虑学习率ε的深度信念网络参数更新准则为:
其中,k代表模型迭代计算的次数。
3.根据权利要求1所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:所述在线台账数据样本库包括待测运行电表台账数据的使用地区、表记类别、生产厂家、行业类别、标定电流的属性数据。
4.根据权利要求1所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:所述用电特征数据包括:电流、功率曲线。
5.根据权利要求1所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:卷积神经网络对用电特征数据进行特征提取的步骤如下:
步骤1:在输入层设置96个输入节点,并接收输入为一天96点的电流或功率序列;
步骤2:在卷积层使用一个1维卷积核进行特征提取,提取后的特征为一条24点的特征序列;
步骤3:在输出层将上一层的特征序列通过全连接方式连接到输出层,并且输出一条96点的序列,用于实现对原始电流或功率序列的重构;
步骤4:计算重构误差函数值;
重构误差函数为:
式中:yi为实际标签,其表示原始的96点中第i点电流或功率序列;oi为卷积神经网络输出,代表卷积神经网络重构的96点中第i点电流或功率序列;
步骤5:当重构误差函数值小于设置阈值时,将卷积层提取到的特征输出,设置为电流曲线或功率曲线24点的故障曲线特征数据或运行曲线特征数据的序列。
6.根据权利要求5所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:所述重构误差函数的阈值设置为万分之一。
7.根据权利要求5所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:所述故障曲线特征数据、运行曲线特征数据,均包括电流特征和功率特征,电流特征和功率特征分别包括两类特征簇,一类是序列首段集中为负值,另一类是序列首段集中为较大的正值。
8.根据权利要求5所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:所述输入层输入为电表故障后,前一天的电流或功率序列
9.根据权利要求7所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:运行曲线特征数据与故障曲线特征数据相似度计算的步骤如下:
步骤1:获取故障曲线特征数据的序列首段集中为负值的电流特征序列,序列首段集中为较大的正值的电流特征序列;序列首段集中为负值的功率特征序列,序列首段集中为较大的正值的功率特征序列;
步骤2:获取运行曲线特征数据的序列首段集中为负值的电流特征序列,序列首段集中为较大的正值的电流特征序列;序列首段集中为负值的功率特征序列,序列首段集中为较大的正值的功率特征序列;
步骤3:求取电流特征和功率特征两类特征簇的四个相似度值;
相似度计算公式如下:
式中:m为用电曲线特征向量长度;xk、yk分别为故障曲线特征数据和运行曲线特征数据第k个点的特征分量。
10.根据权利要求7所述的基于深度信念网络的计量装置故障溯源方法,其特征在于:
所述m=24,相似度阈值设置为80%-90%。

说明书全文

基于深度信念网络的计量装置故障溯源方法

技术领域

[0001] 本发明涉及一种基于深度信念网络的计量装置故障溯源方法,属于电系统配变数据处理技术领域。

背景技术

[0002] 目前,电力系统在实际运行过程中产生海量的数据,这些数据的高效采集及使用是智能电网大数据亟待解决的一个重要问题。截止2018年1月,国家电网公司智能电表及用电信息采集已经覆盖经营范围内99%的电力用户,智能电表所采集到的时间序列数据中包含了电力用户丰富的用电行为信息和特征,从而为电力系统用户负荷预测、计划停电管理、电气设备检修、优化调度、合理应对大用户电力负荷变化对电网造成破坏性冲击、控制电网稳定、经济高效运行等工作的建模与预测工作提供了科学的数据基础与指导依据,有助于实现电网企业为电力用户提供个性化可靠供电服务。
[0003] 随着用采数据的层层传输,如果不及时对异常数据进行清洗,最终用户的电量数据与实际电量数据产生巨大差额。供电企业通过对用户电量的测量、采集和汇总来进行抄核收工作。若不能及时处理用户电量异常数据,会产生极其严重的后果。监察人员在用电监察中没有对用户的实际用电量认真的核对,那么在收取电费时则会出现误收,给供电企业和用电用户必然有一方会遭受损失,甚至引发两者之间的矛盾,影响企业的社会形象。在当前的故障溯源算法方面,人工神经网络要优化的目标函数复杂,处理电网大数据存在效率问题;支持向量等传统机器学习方法数据训练时间较长,处理海量数据样本同样面临严峻挑战,尤其对高维特征数据会出现维度灾难。

发明内容

[0004] 目的:为了克服现有技术中存在的不足,通过深度学习作为机器学习神经网络算法的扩展与延伸,能有效处理海量数据分类与回归处理时的高维场景问题。针对传统方法在处理海量数据时的处理速度慢、占用内存大、难以处理高维特征等问题,本发明提供一种基于深度信念网络的计量装置故障溯源方法。
[0005] 技术方案:为解决上述技术问题,本发明采用的技术方案为:
[0006] 一种基于深度信念网络的计量装置故障溯源方法,其特征在于:包括如下步骤:
[0007] 使用卷积神经网络对已知故障电表的用电特征数据进行特征提取,构建用电曲线故障特征样本库;
[0008] 使用待测运行电表的台账数据构建在线台账数据样本库;
[0009] 使用深度信念网络模型对在线台账数据样本库的待测运行电表进行故障溯源,选取判断出故障的待测运行电表;
[0010] 对故障的待测运行电表的用电特征数据使用卷积神经网络进行特征提取,得到运行曲线特征数据;
[0011] 比对运行曲线特征数据与用电曲线故障特征样本库中故障曲线特征数据的相似度,当所有相似度均超过设置阈值时,则待测运行电表最终故障溯源结果为故障。
[0012] 作为优选方案,所述卷积神经网络采用离线台账数据样本库进行学习;所述离线台账数据样本库包括已故障电表和正常电表台账数据的使用地区、表记类别、生产厂家、行业类别、标定电流的属性数据;
[0013] 所述深度信念网络是由多个受限玻尔兹曼机堆叠组成的神经网络模型,其核心是RBM单元;每一个RBM都包括一个隐含层和可见层;此结构中层内神经元之间没有连接,层间所有神经元通过权重全部互相连接;RBM是一种基于能量的模型,对于状态(v,h)确定的RBM系统所具有的能量表示为:
[0014]
[0015] 式中:θ=(wij,ai,bj)为RBM参数,n、m分别为可见层与隐含层神经元数量;v为可见层输入,其表示异常电表的台账信息输入;vi表示可见层神经元i的状态,设定其偏置值为ai;h为隐含层输出,输出为0或1,表示电表未发生故障或电表发生故障;hj表示隐含层神经元j的状态,设定偏置值为bj;神经元i和j连接权重定义为wij;
[0016] 由能量函数E,可得到(v,h)的联合概率分布为:
[0017]
[0018] 上式中Z(θ)为归一化因子,其表达式如下式:
[0019]
[0020] 当学习样本的数量为N时,参数θ通过学习样本的最大对数似然函数得到,公式如下:
[0021]
[0022] 上式中n为学习样本,p(v|θ)为观测数据v的似然函数,其表达式如下式:
[0023]
[0024] 从可见层计算隐含层,再反馈到可见层;重建后的可见层神经元再一次计算隐含层神经元的实际状态;根据可见层神经元状态计算隐含层第j个神经元,激活概率为:
[0025]
[0026] 由隐含层重建可见层第i个神经元,设定p为激活的概率,公式如下:
[0027]
[0028] 由随机梯度上升法求解最大对数似然函数值,得到深度信念网络参数变化量计算准则为:
[0029]
[0030] 式中:Δwij、Δai、Δbj分别为wij、ai、bj的变化量,<·>data为原始观测数据模型定义的分布;<·>recon为重构后模型定义的分布;
[0031] 考虑学习率ε的深度信念网络参数更新准则为:
[0032]
[0033] 其中,k代表模型迭代计算的次数。
[0034] 作为优选方案,所述在线台账数据样本库包括待测运行电表台账数据的使用地区、表记类别、生产厂家、行业类别、标定电流的属性数据。
[0035] 作为优选方案,所述用电特征数据包括:电流、功率曲线。
[0036] 作为优选方案,卷积神经网络对用电特征数据进行特征提取的步骤如下:
[0037] 步骤1:在输入层设置96个输入节点,并接收输入为一天96点的电流或功率序列;
[0038] 步骤2:在卷积层使用一个1维卷积核进行特征提取,提取后的特征为一条24点的特征序列;
[0039] 步骤3:在输出层将上一层的特征序列通过全连接方式连接到输出层,并且输出一条96点的序列,用于实现对原始电流或功率序列的重构;
[0040] 步骤4:计算重构误差函数值;
[0041] 重构误差函数为:
[0042]
[0043] 式中:yi为实际标签,其表示原始的96点中第i点电流或功率序列;oi为卷积神经网络输出,代表卷积神经网络重构的96点中第i点电流或功率序列;
[0044] 步骤5:当重构误差函数值小于设置阈值时,将卷积层提取到的特征输出,设置为电流曲线或功率曲线24点的故障曲线特征数据或运行曲线特征数据的序列。
[0045] 作为优选方案,所述重构误差函数的阈值设置为万分之一。
[0046] 作为优选方案,所述故障曲线特征数据、运行曲线特征数据,均包括电流特征和功率特征,电流特征和功率特征分别包括两类特征簇,一类是序列首段集中为负值,另一类是序列首段集中为较大的正值。
[0047] 作为优选方案,所述输入层输入为电表故障后,前一天的电流或功率序列[0048] 作为优选方案,运行曲线特征数据与故障曲线特征数据相似度计算的步骤如下:
[0049] 步骤1:获取故障曲线特征数据的序列首段集中为负值的电流特征序列,序列首段集中为较大的正值的电流特征序列;序列首段集中为负值的功率特征序列,序列首段集中为较大的正值的功率特征序列;
[0050] 步骤2:获取运行曲线特征数据的序列首段集中为负值的电流特征序列,序列首段集中为较大的正值的电流特征序列;序列首段集中为负值的功率特征序列,序列首段集中为较大的正值的功率特征序列;
[0051] 步骤3:求取电流特征和功率特征两类特征簇的四个相似度值;
[0052] 相似度计算公式如下:
[0053]
[0054] 式中:m为用电曲线特征向量长度;xk、yk分别为故障曲线特征数据和运行曲线特征数据第k个点的特征分量。
[0055] 作为优选方案,所述m=24,相似度阈值设置为80%-90%。
[0056] 有益效果:本发明提供的基于深度信念网络的计量装置故障溯源方法,综合智能电表的台账数据和故障电表用电特征数据构建样本库,使用深度信念网络模型对离线台账数据样本库进行学习;对训练完成的深度信念网络模型输入在线台账数据样本库所包含的属性数据,实现对计量装置运行状态正常与故障的判断;将检测出故障的电表通过用电曲线故障特征样本库进行进一步故障溯源,最终得到精确的计量装置故障溯源结果。
[0057] 本发明采用异常故障样本、营销数据及用采系统数据训练深度信念网络结构参数,基于训练完成的深度信念网络结构,实现了计量装置状态初步判断,再利用卷积神经网络提取曲线故障特征,并对运行曲线特征数据与故障曲线特征数据的相似度进行计算,进一步判断计算装置状态,从而可为计量装置轮换周期及检修策略提供科学合理的指导。附图说明
[0058] 图1为本发明方法实施例中智能电表故障分类DBN网络结构模型。
[0059] 图2为本发明方法实施例中计量装置故障溯源实现流程图
[0060] 图3为本发明方法实施例中卷积神经网络结构图。
[0061] 图4为本发明方法实施例中卷积网络提取的特征结果。

具体实施方式

[0062] 下面结合附图对本发明作更进一步的说明。
[0063] 1、深度信念网络模型基本原理:
[0064] 深度信念网络(deep  belief network,DBN)是由多个受限玻尔兹曼机(restricted Boltzmann machine,RBM)堆叠组成的神经网络模型,其核心是RBM单元。DBN是在传统BP神经网络基础上进行改进,使用多个RBM堆叠组成的神经网络模型。第一步,在预训练过程中采用无监督贪心算法对每一层RBM进行单独训练,一个较为合理的预训练过程可以为整个DBN网络提供良好的权重初值,也为后续的训练提供了便利。第二步,再使用传统的前馈BP反向传播改变数值,从而可得到局部收敛最优位置
[0065] 图1表示由3层RBM组成的简单DBN网络结构。图1中V1为连接观测数据的可见层,H1是用于提取输入数据有效特征的隐含层,W1为可见层与隐含层的连接权重。
[0066] 图1中每一个RBM(如RBM1)都包括一个隐含层和可见层。此结构中层内神经元之间没有连接,层间所有神经元通过权重全部互相连接。RBM是一种基于能量的模型,对于状态(v,h)确定的RBM系统所具有的能量可表示为:
[0067]
[0068] 式中:θ=(wij,ai,bj)为RBM参数,n、m分别为可见层与隐含层神经元数量;v为可见层输入,其表示异常电表的台账信息输入;vi表示可见层神经元i的状态,设定其偏置值为ai;h为隐含层输出,输出为0/1,表示电表未发生故障或电表发生故障;hj表示隐含层神经元j的状态,设定偏置值为bj;神经元i和j连接权重定义为wij。其余变量均为模型的中间变量和参数。
[0069] 由能量函数E,可得到(v,h)的联合概率分布为:
[0070]
[0071] 上式中Z(θ)为归一化因子,其表达式如下式:
[0072]
[0073] 当学习样本的数量为N时,参数θ通过学习样本的最大对数似然函数得到,公式如下:
[0074]
[0075] 上式中n为学习样本,p(v|θ)为观测数据v的似然函数,其表达式如下式:
[0076]
[0077] 在实际的训练过程中,Z(θ)计算繁琐,大大降低了计算的效率。为了提高计算效率,考虑采用近似获得归一化因子Z(θ)的方法,一般采用Gibbs等采样方法进行重新构建。即从可见层计算隐含层,再反馈到可见层。重建后的可见层神经元再一次计算隐含层神经元的实际状态。根据可见层神经元状态计算隐含层第j个神经元,激活概率为:
[0078]
[0079] 由隐含层重建可见层第i个神经元,设定p为激活的概率,公式如下:
[0080]
[0081] 由随机梯度上升法求解最大对数似然函数值,各参数变化量计算准则为:
[0082]
[0083] 式中:Δwij、Δai、Δbj分别为wij、ai、bj的变化量,<·>data为原始观测数据模型定义的分布;<·>recon为重构后模型定义的分布。
[0084] 考虑学习率ε的参数更新准则为:
[0085]
[0086] 其中,k代表模型迭代计算的次数。
[0087] 2计量装置故障溯源流程
[0088] 利用智能电表的台账数据和故障电表用电特征数据分别构建离线台账数据样本库和用电曲线故障特征样本库,使用深度信念网络模型对台账数据样本库进行学习。对训练完成的深度信念网络模型输入在线台账数据样本库的属性数据,实现对计量装置运行状态正常与故障的判断。将检测出故障的电表通过用电曲线故障特征样本库进行进一步故障溯源,最终得到精确的计量装置故障溯源结果。
[0089] 为验证基于深度信念网络故障溯源模型的准确性,利用离线台账数据样本库中一定比例的样本作为训练集,剩下的样本作为测试集。在深度信念网络模型完成对训练集的学习后,输入测试集的属性数据,将溯源结果与实际结果进行比对。在此基础上,将上述思路与深度信念网络模型用于实际运行数据,从而实现装置的故障溯源。具体实现流程为:
[0090] (1)选取已故障电表和正常电表的使用地区、表记类别、生产厂家、行业类别、标定电流台账数据,对台账数据进行属性筛选,构建离线台账数据样本库,利用离线台账数据样本库对深度信念网络模型进行学习。
[0091] (2)使用卷积神经网络对故障电表用电特征数据进行特征提取,故障电表用电特征数据包括:历史运行曲线的电流、功率曲线,构建用电曲线故障特征样本库。
[0092] (3)使用深度信念网络模型进行在线台账数据样本库的电表故障溯源,判断电表是否故障。
[0093] (4)利用卷积神经网络对步骤(3)中判定为故障电表的运行曲线特征进行提取,得到运行曲线特征数据。
[0094] (5)比对运行曲线特征数据与用电曲线故障特征样本库中故障曲线特征数据的相似度,当相似度超过设置阈值时,阈值优选80-90%,则最终故障溯源结果为故障。
[0095] 具体实现流程如图2所示。
[0096] 3计量装置样本库构建
[0097] 首先需要对计量装置正常工作的影响因素进行分析,确定数据挖掘的维度。主要考虑用电环境与气象因素、智能电表的不同类型、运行时长、工程质量、历史用电曲线数据共计5个方面。前4个方面属于台账数据,历史用电曲线数据属于用电信息采集系统实时数据,为了使模型有充足的样本进行学习,曲线长度取3个月,每日96点。
[0098] 3.1离线台账数据样本库
[0099] 用电环境与气象因素会对计量装置产生显著影响,外界环境会引起电表的故障。具体来说是指在运输、安装和操作环节中排除人为因素的影响,包括在安装过程中出现运行信号操作指令不明确、地区超负荷电量等所造成的故障等。以及运行环境中含氯化物盐的大气的腐蚀,导致电能表不能正常工作、运行中外力损毁、雷击等。不同类型的计量装置在分析时不能一概而论,由于计量装置供应商较多,不同计量装置的内部设计和零件也有所区别,因此计量装置的故障往往呈现出家族性缺陷。同一厂家同一批次的计量装置发生相同类型的故障可能性较大。运行时长的增加时的计量装置的运行可靠性下降,计量装置有一定的预期寿命,随着运行时长的增加,其零部件的老化和电池的损耗都会导致电表更加容易发生故障。例如误差超差、电容损坏、电池损坏等硬件部分的损坏。工程质量问题也会影响电表的运行状况,工程质量问题分为电表质量和安装质量问题。包括虚焊、表内存在异物、焊点短路、参数设置不正确、进出线反接或相别错误。
[0100] 基于上述对计量装置故障影响因素的分析,选择多种台账属性作为特征向量,数据由以下2类组成:
[0101] (1)用电环境与气象因素分量:
[0102] 针对用电环境与气象因素可选取2个维度,分别为使用地区、行业类别维度。
[0103] (2)智能电表的不同类型、运行时长、工程质量分量:
[0104] 针对不同类型智能电表分量可选择3个维度,分别为表记类别,生产厂商,标定电流。
[0105] 选取营销业务系统及用电信息采集系统的6688条智能电表数据作为样本。其中样本数据包括正常电表和故障电表的各项属性值,并对表1中列出的台账属性进行数据采集整理
[0106] 表1离线台账数据样本库属性列表
[0107]
[0108] 3.2用电曲线故障特征样本库
[0109] 计量装置的历史运行数据反映了电表的运行健康程度,对于正常运行的智能电表,计量部能够正常采集到其电流、电压、有功功率、无功功率、抄表电量等数据,这些运行数据反映了装置的运行状态。而具有较大潜在故障发生可能性的装置,往往处于较隐蔽的不正常运行状态,其运行数据与原本正常运行数据存在差异,但区别较小,不能达到计量中心故障诊断标准。因此,对实时运行数据的异常指标提取可以作为对计量装置运行状态健康程度的评价。
[0110] 为了使卷积神经网络有充足的样本进行学习,曲线长度取1个月,每日96点,曲线类别为电流、功率。由于计量装置采集的电流、功率数据量大,若将曲线数据直接作为神经网络属性会导致维度过大,直接影响神经网络的运算时长与溯源精度。同时,短期曲线数据不能反映装置在较长时间内的运行状态。为了尽可能得到用电曲线数据的整体情况,便于神经网络对特征进行深度提取,采用卷积神经网络对电流与功率进行特征提取。
[0111] 一个典型的特征提取卷积神经网络如图3所示。其包含三层网络结构:输入层,卷积层和输出层,特征选取步骤如下:
[0112] (1)在输入层设置96个输入节点,并接收输入为一天96点的电流或功率序列。特别地,对于故障电表,输入的电流或功率为故障前一天的序列。
[0113] (2)在卷积层使用一个1维卷积核进行特征提取,提取后的特征为一条24点的特征序列。卷积核的特征提取具有局部稀疏连接及位移不变性的特点,可以很好地反映原始序列的关键特征。
[0114] (3)在输出层将上一层的特征序列通过全连接方式连接到输出层,并且输出一条96点的序列,以实现对原始电流或功率序列的重构。
[0115] 如果卷积提取的特征能够较好地反映原始电流或功率序列,则重构误差较小。因此,特征提取神经网络使用重构的均方误差作为目标函数,使用反向传播进行神经网络的参数训练,重构误差函数为:
[0116]
[0117] 式中:yi为实际标签,其表示原始的96点中第i点电流或功率序列;oi为模型输出,代表神经网络重构的96点中第i点电流或功率序列。
[0118] 神经网络训练完毕后,重构误差小于设置阈值,阈值优选万分之一,认为此时提取的特征具有典型性;将卷积层提取到的特征输出,即将历史电流曲线、功率曲线浓缩成两条24点的特征序列。
[0119] 通过卷积神经网络提取故障电表故障前的故障曲线特征数据,包括电流特征和功率特征,电流特征和功率特征分别包括两类特征簇,一类是序列首段集中为负值,另一类是序列首段集中为较大的正值。如图4所示,左侧的特征序列簇1为在序列首段集中为负值的故障前的电流特征,左侧的特征序列簇2为在序列首段集中为较大的正值的电流特征;右侧的特征序列簇1为在序列首段集中为负值的故障前的功率特征,右侧的特征序列簇2为在序列首段集中为较大的正值的功率特征,所述较大的正值优选大于等于1的值。
[0120] 综上,将故障电表的电流特征与功率特征分别归结为两类特征簇,构建用电曲线故障特征样本库。
[0121] 将需要再次进行故障溯源的目标电表的运行曲线特征数据与用电曲线故障特征样本库中的故障曲线特征数据进行比对,使用余弦相似度分别对两类特征簇的电流特征、功率特征进行相似性评价,当四个相似度均超过设置阈值时,则目标电表最终故障溯源结果为故障。余弦相似度Dcosi反映了故障曲线特征数据x和目标电表的运行曲线特征数据y的变化趋势间的相似性,其值越接近1表示越相似。
[0122]
[0123] 式中:m为用电曲线特征向量长度,本发明中m=24;xk、yk分别为故障曲线特征数据和运行曲线特征数据第k个点的特征分量。
[0124] 4计量装置故障溯源测试
[0125] 4.1实际电表测试
[0126] (1)电流与功率测试
[0127] 对电流和功率数据进行异常值检测研究,表2和表3分别为部分测试电流和功率异常点列表,测试电表包括已知故障电表和未发现故障电表。
[0128] 表2部分测试电流异常点列表
[0129]
[0130] 表3部分测试功率异常点列表
[0131]
[0132] 4.2离线台账数据样本库溯源测试
[0133] 本部分进行测试分析的第二部分工作,使用DBN模型对离线台账数据样本库进行学习,输出测试集电表的运行状态,实现离线台账数据样本库溯源。将通过离线台账数据样本库判定为故障的电表进行特征提取,将提取的运行曲线特征数据输入用电曲线故障特征样本库,计算测试集电表的运行曲线特征数据与故障曲线特征数据的相似度,根据结果最终判定电表是否发生故障,实现计量装置故障特征溯源。根据最终溯源判定结果检测该方法的准确度。
[0134] (1)离线台账数据样本库溯源:使用DBN模型学习离线台账数据样本库,按照十折交叉验证的方法随机抽取测试集进行测试。设置参数如下:建立由RBM1和RBM2组成的双隐含层DBN网络结构,如下表4所示。
[0135] 表4 DBN参数
[0136]
[0137] 采用相关指标比较DBN算法与常见分类算法贝叶斯(Bayes)、决策树(Decision tree)、随机森林(Random forest)、决策树提升算法(Adaboost)、逻辑分类(Logistic)进行比较,比较方法和指标如下。
[0138] 针对分类验证方式采用十折交叉验证,其主要目的是为了防止模型出现过度拟合训练样本,而失去对其他数据的拟合和预测能力。从而通过交叉验证选出最好的分类模型,减少模型的过拟合,增强模型的对于未知数据的适应能力。具体实现流程为:
[0139] a)将数据集随机平分为10份。
[0140] b)依次将其中9份作为训练数据,剩下的1份作为测试数据,进行试验。
[0141] c)对将10次的结果的正确率求平均值。
[0142] d)进行多次10折交叉验证,以其结果的平均值作为对算法准确性的估计。
[0143] 此外,其评价指标有分类正确率、kappa系数、均方根误差、相对绝对误差以及模型训练时间等。各指标计算方式如下:
[0144] kappa系数:是一种衡量分类精度的指标。计算公式如下:
[0145]
[0146] P0是各种样本数值总与总数的除法数值,假定各种真值样本数分别为a1,a2,……,ac。而预测出来的各种样本数分别为b1,b2,……,bc。
[0147] 总样本数为n,则有:
[0148]
[0149] 均方根误差:公式如下:
[0150]
[0151] 式中:n为测试电表总数目;yi、分别为第i个测试电表的的真实分类情况和预测分类情况。的值为0/1,即电表故障/非故障。
[0152] 观测者操作特性曲线(receiver operating characteristic curve,ROC)曲线反映敏感性和特异性连续变量的综合指标,曲线下面积越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。它的横坐标:FPR假正类率,纵坐标:TPR真正类率。测试结果如表5所示。
[0153] 表5多种算法分类结果比较
[0154]
[0155]
[0156] 在分类算法评价中,Kappa系数越接近1代表效果越好;均方根误差越小,代表分类结果更加精确;ROC曲线值越大代表模型在不同数据下的表现更稳定。综合来看,DBN算法的正确率高于其余算法,其Kappa系数、均方根误差以及ROC曲线值具有明显更加良好的数值。因此,DBN算法与贝叶斯(Bayes)、决策树(Decision tree)、随机森林(Random forest)、决策树提升算法(Adaboost1)、逻辑分类(Logistic)算法相比,在计量装置故障溯源方面更具有工程实用性。在此基础上,将需要进行故障判定的电表在线台账数据样本库中的属性数据输入到DBN模型中,输出电表是否故障,以此作为故障溯源的第一阶段。
[0157] (2)用电曲线故障特征样本库溯源:选取40个未故障电表、40个异常电表的台账数据作为在线台账数据样本库,通过DBN对上述在线台账数据样本库电表进行测试。提取判定为故障电表的用电特征数据,得到运行曲线特征数据,将其输入用电曲线故障特征样本库,进行故障溯源的第二阶段。运行曲线特征数据、故障曲线特征数据包括电流、功率特征序列。使用余弦相似度进行相似度计算,将运行曲线特征数据与故障曲线特征数据电流、功率特征相似度均高于0.8的电表最终确定为故障。测试电表ID及故障溯源结果如表6所示。
[0158] 表6电表溯源测试结果
[0159]
[0160]
[0161] 由表6的测试结果可知,对于4.1节中已经测试出有异常点的智能电表,故障溯源测试正确率为85.7%,具有较高的检测精度。
[0162] 以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈