技术领域
[0001] 本
发明涉及电力设备局部放电检测领域,更具体地,本发明涉及一种基于数据增强和神经网络的电力设备局部放电诊断方法。
背景技术
[0002] 随着
电网规模的快速发展和电网智能化的不断推进,电力设备运行的可靠性和安全性要求也不断提高,电力设备的绝缘性能是恒量设备状态的关键指标,对电力设备的局部放电进行有效、准确的检测和评估,是保障电力设备安全可靠运行的
基础。
[0003] 电力设备投入运行后,由于设计
缺陷、表面污秽和
接触不良等原因会引起设备发生局部放电现象,发生放电时故障点会产生磁、电、光、声、热等物理
信号和气体浓度变化等化学信号,放电产生的各种现象是局部放电检测的依据。电力公司开展了大量
开关柜、GIS、
变压器等电力设备的局部放电检测工作,包括带电检测、
重症监护、在线监测、离线试验等形式,历年来发现并解体验证了一些案例,积累了故障数据样本。局部放电故障数据样本部分存储在电力生产管理系统中,另一部分以离散的形式存储。近年来
大数据、
云计算和
人工智能技术得到了飞速发展,并在各行各业中进行大规模应用,通过分布式计算、
数据挖掘等手段给企业提供了关键决策
支撑。而样本数据的数量、
质量、可用性是保障分析结果关键所在。
[0004] 目前电力行业处在智能化发展的初级阶段,诸多电力公司均开始探索人工智能
算法和大数据技术在数据智能识别、设备状态智能分析的高级应用,取得了小幅成效。但存在的以下问题制约了智能算法的进一步发展:
[0005] 1、由于局部放电受电力设备的结构设计、制造工艺、运行环境、运维检修情况等多方面因素的影响,历年来积累的解体故障样本数据量少,难以
覆盖局部放电的全部种类;
[0006] 2、各种神经网络算法由于其实现的思路不同,准确率、模型大小、训练/预测的执行效率差异较大,而各神经网络更适应于哪种应用场景需要大量的试验、探索;
发明内容
[0007] 为了克服
现有技术中的上述缺陷,本发明提出一种基于数据增强和神经网络的电力设备局部放电诊断方法,针对电力设备在缺陷时检测的局部放电数据,通过使用多种数据增强方法丰富样本量并建立样本库,针对不同电力设备类型和缺陷类型的特点,采用不同的神经网络进行训练,得到诊断模型,进行放电诊断。
[0008] 进一步地,所述方法包括以下步骤:
[0009] S1:收集历年积累的电力设备在缺陷时检测的局部放电数据,形成原始数据集;
[0010] S2:针对所述原始数据集中的样本数据,随机使用有监督和无监督的数据增强方法两种形式下的多种数据增强方法中的一种,进行数据增强,将电力系统历年积累的局部放电数据与通过数据增强生成的新样本进行汇总,构建电力设备局部放电样本库;
[0011] S3:搭建基于GPU的训练平台,构建AlexNet、VGG、GoogLeNet、ResNet神经网络,采用所述放电样本库中数据增强后的样本数据,分别训练各个神经网络预测方法;
[0012] S4:根据电力设备局部放电的应用场景需求,设定各个神经网络预测方法在不同场景下进行预测的评价指标,进而针对不同的局部放
电场景适配不同的神经网络预测方法,得到相应的诊断模型;
[0013] S5:采集电力设备缺陷时检测的局部放电数据,进行
采样步骤S2中所述的数据增强方法进行增强后,输入步骤S4得到的诊断模型,进行故障诊断,并输出相应的诊断结论。
[0014] 进一步地,所述步骤S1中,
[0015] 采集变电站现场一次设备的历史检测数据、一次设备历史解体案例数据和实验室数据,通过人工专家结合变电站环境、检测数据形态、相关检测报告,对数据的有效性和局部放电缺陷的代表性进行分析、筛选,形成原始数据集。
[0016] 进一步地,步骤S2中,
[0017] 有监督的数据增强方法包含噪声
叠加方法、模糊处理方法和多样本合成方法。
[0018] 进一步地,所述噪声叠加方法具体包括:
[0019] 步骤1:定义待增强样本数据为dstImage[x][y],定义增强后样本数据为EnhDstImage[x][y],定义增加高斯随机变量rv后的值为val,通过下式计算val:
[0020] val=dstImage[x][y]+rv
[0021] 步骤2:对val的范围进行修正:
[0022] if(val<0){val=0;}
[0023] if(val>255){val=255;}
[0024] 步骤3:对样本数据值重新定义:
[0025] EnhDstImage[x][y]=val
[0026] 对dstImage数组中所有数据经过上述处理后,形成增强后的样本数据EnhDstImage。
[0027] 进一步地,所述高斯随机变量rv的计算方式如下:
[0028] rv=s)rt(-2.0*log(U1))*cos(2*π*U2)
[0029] 其中随机变量U1和U2表示为:
[0030]
[0031]
[0032] 式中,假设随机变量U1、U2相互独立,且均服从(0,1)之间的均匀分布;随机变量Z0,Z1服从标准高斯分布且满足正态分布,均值为0,方差为1。
[0033] 进一步地,所述模糊处理方法包括:
[0034] 步骤1:对原始数据进行噪声耦合,生成图片文件;
[0035] 步骤2:输入步骤1转换后的图片文件,提取所述的图片文件的RGB(Red,Green,Blue)值;
[0036] 步骤3:分别取图片文件中图片的中心点为零点,绘制横纵坐标轴,以二维高斯分布函数计算图片中各
像素点的权重,形成权重矩阵,并进一步得到归一化的权重矩阵;
[0037] 步骤4:以归一化后的权重更新图片文件的RGB值;
[0038] 步骤5:存储更新RGB值后的图片文件,作为新的样本。
[0039] 进一步地,所述多样本合成方法包括:
[0040] 步骤1:局部放电特高频检测单次采集1秒钟的数据,每个周期20ms,将20ms分为60个时间片,取每个时间片中的最大值,得到50×60的二维数组;
[0041] 步骤2:根据每个局部放电类型在数组中的特征值不一样,通过合并多个样本数据数组的相同下标的值,形成新的样本。
[0042] 进一步地,所述无监督的数据增强方法包含随机生成与
训练数据集分布一致的图谱的数据增强方法、以已有数据为基础学习出适合当前任务的数据增强方法。
[0043] 进一步地,随机生成与训练数据集分布一致的图谱的数据增强方法具体包括:
[0044] 依据局部放电特高频检测数据为50×60的二维数组,且数值范围处于0-70dB之间的整数,通过使用随机函数,动态生成3600个数值,依次存储到50×60的二维数组中,形成增强后的样本数据;其中随机数生成代码实现如下:
[0045] rand()%(b-a+1)+a
[0046] 式中,a为随机数的下限即为0,b为随机数的上限即为70。
[0047] 进一步地,以已有数据为基础学习出适合当前任务的数据增强方法具体包括:
[0048] 通过准备13种数据增强操作,从13种数据增强操作方法中,随机产生使用该操作的概率,定义为概率组合,共产生5个概率组合,使用该5个概率组合进行增强样本,分别训练AlexNet、VGG、GoogLeNet、ResNet四种神经网络,训练后检查其泛化能力,根据泛化能力排序保留前三种概率组合,将前三种概率组合串接,从而进行数据增强。
[0049] 进一步地,所述数据增强操作包括放大或减小幅值、平移
相位、叠加随机分布噪声和随机稀疏脉冲,通过对这些操作设置不同的数值,来设置13种数据增强操作方法。
[0050] 进一步地,步骤S4具体包括:
[0051] S41:根据电力设备局部放电带电检测、重症监护、在线监测、离线试验的应用场景对诊断算法的诊断准确率、执行效率、运行条件的要求,选择适合应用场景的神经网络诊断预测方法;
[0052] S42:根据实际应用效果,调整各应用场景下的神经网络诊断模型选择及优化。
[0053] 进一步地,所述步骤S41具体包括:
[0054] 步骤1:计算AlexNet、VGG、GoogLeNet、ResNet四种神经网络训练得出的四种诊断模型,在不同应用场景下的准确率Accuracy;
[0055] 步骤2:计算四种诊断模型在不同应用场景下的指标F1;
[0056] 步骤3:制定诊断模型计分标准,根据计分标准的规则计算总分,每个神经网络得出一个总分;
[0057] 步骤4:根据总分来选择适合不同应用场景的相应诊断模型。
[0058] 进一步地,所述准确率Accuracy的计算公式如下:
[0059]
[0060] 式中TP是指标签为正样本,诊断为正样本的数目;FN是指标签为正样本,诊断为负样本的数目;FP是指标签为负样本,诊断为正样本的数目;TN是指标签为负样本,诊断为负样本的数目;
[0061] 其中,标签是对样本数据进行标注时的分类,局部放电数据根据放电类型分为“正常、电晕、悬浮、气隙、沿面、微粒、噪声、其它”8个类别,对标签A而言,所有标注为A的数据均为正样本,标注非A的数据均为负样本。
[0062] 进一步地,定义精确度为Precision,其计算公式如下:
[0063]
[0064] 定义召回率Recall,其计算公式如下:
[0065]
[0066] 则所述指标F1的计算公式如下:
[0067]
[0068] 本发明的有益技术效果为:
[0069] 1、提出了多种数据增强方法,通过在多种数据增强方法中随机选择,构建了全面的样本库,可覆盖不同电力设备不同缺陷。
[0070] 2、采用数据增强后的样本数据对神经网络预测方法进行训练,提高了
预测模型的准确性和灵敏度。
[0071] 3、根据不同应用场景使用不同神经网络算法,提高了电力设备局部放电检测数据诊断的针对性和准确性。
附图说明
[0073] 图2是本发明中ResNet网络使用的残差单元结构图。
[0074] 图3是本发明中ResNet网络
输出层架构图。
具体实施方式
[0075] 为使本发明
实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0076] 参照附图1所示的
流程图,本发明采取的技术方案是,一种基于数据增强和神经网络的电力设备局部放电诊断方法,包括以下步骤:
[0077] (1)局部放电检测数据收集
[0078] 局部放电检测数据的数据来源主要包含变电站现场的变压器、开关柜、GIS等一次设备的历史检测数据、一次设备历史解体案例数据、实验室数据等。
[0079] 通过人工专家结合变电站环境、检测数据形态、相关检测报告,对数据的有效性和局部放电缺陷的代表性进行分析、筛选,形成原始数据集。
[0080] (2)局部放电检测数据增强
[0081] 通过随机采用下述有监督数据增强和无监督数据增强两种形式下的多种数据增强方法,对局部放电检测数据集进行数据增强。
[0082] 1)有监督数据增强:
[0083] ①噪声叠加方法:
[0084] 本实施例通过使用高斯噪声来实现,其函数如下:
[0085]
[0086]
[0087] 式中,根据Box-Muller变换原理,假设随机变量U1、U2相互独立,且均服从(0,1)之间的均匀分布,则经过下面两个式子产生的随机变量Z0,Z1服从标准高斯分布,Z0,Z1满足正态分布,其中均值为0,方差为1,变量U1和U2可以
修改为下式:
[0088]
[0089]
[0090] 在得出随机变量U1和U2后,通过下式计算得出高斯随机变量rv:
[0091] rv=sqrt(-2.0*log(U1))*cos(2*π*U2)
[0092] 进一步地,
[0093] 通过对待增强样本数据的二维数组进行枚举,在原值上增加高斯随机变量rv,并控制增加rv后的值范围在0到255之间。定义待增强样本数据为dstImage[x][y],定义增强后样本数据为EnhDstImage[x][y],定义增加高斯随机变量rv后的值为val,则val的计算方式如下:
[0094] val=dstImage[x][y]+rv
[0095] 对val的范围进行修正:
[0096] if(val<0){val=0;}
[0097] if(val>255){val=255;}
[0098] 对样本数据值重新定义:
[0099] EnhDstImage[x][y]=val
[0100] 经过上述步骤,对dstImage数组中所有值增加高斯随机变量后,形成增强后的样本数据EnhDstImage。
[0101] ②模糊处理方法:
[0102] 本实施例通过使用高斯模糊方法来实现,实现步骤如下:
[0103] 步骤1:对原始数据进行噪声耦合,生成图片文件;具体包括:
[0104] 输入数据为采集前端采集到的局部放电原始数据;
[0105] 将输入数据转成以相位为x轴,周期为y轴,幅值为z轴的三维数据;
[0106] 按照雷达噪声、手机噪声、
微波硫灯干扰的数据特征,分别生成各噪声对应的三维数据;
[0107] 对输入数据和噪声数据的三维数据进行累加,得到噪声耦合后的数据;
[0108] 将噪声耦合后的数据转换成图片文件。
[0109] 步骤2:输入步骤1转换后的图片文件,提取所述的图片文件的RGB(Red,Green,Blue)值。
[0110] 步骤3:分别取图片文件中图片的中心点为零点,绘制横纵坐标轴;
[0111] 以二维高斯分布函数计算图片中各像素点的权重,形成权重矩阵,并进一步得到归一化的权重矩阵。
[0112] 所述二维高斯分布函数如下:
[0113]
[0114] 式中,x,y分别为图中各像素点距离零点的横纵坐标,G(x,y)为该点到零点的权重值,π为圆周率,e为自然常数,σ为正态分布的标准差,σ通常取1至3之间,取值越大图像越平滑。
[0115] 进一步地,
[0116] 得到归一化的权重矩阵具体包括:
[0117] 计算权重矩阵中所有权重数值之和m,对权重矩阵中的每个权重值乘以1/m,得到归一化后的权重矩阵。
[0118] 步骤4:以归一化后的权重更新图片文件的RGB值。
[0119] 以权重更新图片的RGB值具体包括:
[0120] 对每一个零点的权重矩阵,以各归一化后的权重矩阵的权重值乘以该权重值
位置的像素值,并求和,作为该零点的新的像素值,以该种权重更新方法对RGB值分别更新,得到更新后的三色像素值。
[0121] 步骤5:存储更新RGB值后的图片文件,作为新的样本。
[0122] ③多样本合成方法:
[0123] 局部放电特高频检测单次采集1秒钟的数据,我国电网
频率为50Hz,每个周期20ms,将20ms分为60个时间片,取每个时间片中的最大值,得到50×60的二维数组。在进行样本合成时,每个局部放电类型在数组中的特征值不一样,通过合并多个样本数据数组的相同下标的值,根据不同情况进行分别处理,形成新的样本。设第一个样本数据数组为A,第二个样本数据数组为B,合并后的数组为C,当前对[x][y]下标的数值进行合并,合并策略如下:
[0124] 当A[x][y]>0、B[x][y]=0时,则C[x][y]=A[x][y];
[0125] 当A[x][y]=0、B[x][y]>0时,则C[x][y]=A[x][y];
[0126] 当A[x][y]>0、B[x][y]>0时,则C[x][y]=max(A[x][y],B[x][y]);
[0127] 当对50×60的二维数组所有下标进行合并后,得到新样本数据C。
[0128] 2)无监督数据增强
[0129] ①随机生成与训练数据集分布一致的图谱:
[0130] 依据局部放电特高频检测数据为50×60的二维数组,且数值范围处于0-70dB之间(因
传感器的有效量程在0-70dB)的整数,通过使用随机函数,动态生成3600个数值,依次存储到50×60的二维数组中,随机数生成代码实现如下:
[0131] rand()%(b-a+1)+a
[0132] 式中,a为随机数的下限即为0,b为随机数的上限即为70。
[0133] ②以已有数据为基础学习出适合当前任务的数据增强方法:
[0134] 通过准备13种数据增强操作,从13种数据增强操作方法中,随机产生使用该操作的概率,定义为概率组合,共产生5个概率组合,使用该5个概率组合进行增强样本,训练算法后检查其泛化能力,根据情况泛化能力排序保留前三种概率组合,将前三种概率组合串接,作为数据增强的一种方式。
[0135] 进一步地,
[0136] 13种数据增强操作定义为:幅值放大5%、幅值放大10%、幅值减少5%、幅值减少10%、相位左移10度、相位左移20度、相位右移10度、相位右移20度、叠加5dB随机分布噪声、叠加10dB随机分布噪声、随机稀疏相位60的脉冲、随机稀疏相位270的脉冲、随机稀疏相位
340的脉冲。
[0137] 进一步地,
[0138] 本实施例在实现时,产生了如表1所示的5个概率组合:
[0139] 表1
[0140]
[0141] 进一步地,
[0142] 本实施例在实现时,5个概率组合所产生的样本数据,在测试集上的泛化能力如表2所示:
[0143] 表2
[0144] 概率组合 在测试集的泛化能力概率组合1 89%
概率组合2 72%
概率组合3 91%
概率组合4 87%
概率组合5 93%
[0145] 本实施例中最终选择了概率组合5、概率组合3、概率组合1三种组合形式用于数据样本的增强。
[0146] (3)建立局部放电检测数据样本库
[0147] 使用主流的B/S系统开发框架,使用MySql
数据库、Java语言、SpringCloud开发框架、Bootstrap前端开发框架,开发样本库功能。
[0148] MySql数据库:根据局放数据需求,设计数据表,数据表包含变电站档案表、一次设备档案表、局放缺陷分类枚举表、检测案例表、样本数据表等;
[0149] 服务端功能开发:Java语言、SpringCloud开发框架,开发变电站、一次设备、检测案例、样本数据等功能的新建、删除、查询、管理等后台服务,向下与MySql数据库交互,向上为前端功能提供逻辑服务支撑。
[0150] 前端功能开发:使用Bootstrap前端开发框架,包含变电站、一次设备、检测案例、样本数据等功能模
块,通过调用服务端功能与数据库实现交互,实现对检测数据的样本管理。
[0151] (4)训练神经网络
[0152] 针对AlexNet、VGG、GoogLeNet、ResNet四种神经网络算法的训练,其训练步骤一致,本实施例中以ResNet算法训练为例进行说明。
[0153] 搭建
硬件训练平台:使用“CPU:E5-1607v3、内存:64GB DDR4、显卡:GTX 1080Ti、
硬盘:960GB SSD企业级固态硬盘”的配置,搭建硬件训练平台;
[0154] 搭建训练平台的
操作系统:安装CentOS7.0操作系统及硬件驱动;
[0155] ResNet算法训练:部署ResNet算法模型,将数据增强后的检测数据样本传输到训练
服务器中,对算法模型进行训练。本发明中根据局部放电数据的实际应用,对ResNet的卷积部分进行了调优,网络包含输入部分、中间卷积部分、输出部分三部分组成:
[0156] 1)输入部分
[0157] 输入数据为224*224的图片数据,共有RGB三个通道,所以
输入层规格为(224,224,3)。继输入层之后,对图像数据进行7*7卷积和3*3
池化,将数据转换为56*56大小的特征图。
输入部分的处理降低了数据的大小,为卷积层的特征提取奠定基础。
[0158] 2)卷积部分
[0159] 与ResNet网络的原结构不同,本发明使用的残差单元由三层卷积构成,卷积核大小分别为1*1,3*3,1*1。架构参照图2。
[0160] 与原版残差单元相比,本发明使用的残差单元创新地引入了1*1卷积结构。对于256维的输入特征,以1*1、3*3、1*1三层卷积拼接成的卷积层参数总量为69632个,而使用两个3*3的原版残差单元的参数总量为1179648个,使用1*1卷积结构可以将计算量简化为原版的5.9%。本发明使用1*1卷积结构的卷积层大大
加速了网络的训练,保证了在堆积较多层数的同时维持较低的训练速度。
[0161] 本发明使用16个上述残差单元结构,共计48层卷积层,构成50层深度的残差神经网络。
[0162] 3)输出部分
[0163] 在本发明的应用场景中,诊断结论包括电晕、悬浮、沿面、气隙、微粒、噪声、正常、其他等八类,因此输出层的输出通道数取8,参照图3。
[0164] (5)诊断算法应用
[0165] 使用Java的SpringCloud开发框架,以微服务的形式对算法模型进行封装,部署在
应用服务器中,为业务系统提供局部放电检测数据诊断服务。
[0166] 基于AlexNet、VGG、GoogLeNet、ResNet四种神经网络训练得出的四种诊断模型,在针对“变压器检测数据诊断、GIS检测数据诊断、开关柜检测数据诊断”三种应用场景下,依据“准确率Accuracy、F1 Score”两个指标进行择优选择。实现步骤如下:
[0167] 步骤1:计算四种诊断模型在三种应用场景下的准确率Accuracy。
[0168] 计算一些基于二分类任务的基本指标:
[0169] 标签为正样本,分类为正样本的数目为True Positive,简称TP;
[0170] 标签为正样本,分类为负样本的数目为False Negative,简称FN;
[0171] 标签为负样本,分类为正样本的数目为False Positive,简称FP;
[0172] 标签为负样本,分类为负样本的数目为True Negative,简称TN。
[0173] 其中,标签是对样本数据进行标注时的分类,局部放电数据根据放电类型分为“正常、电晕、悬浮、气隙、沿面、微粒、噪声、其它”8个类别,对标签A而言,所有标注为A的数据均为正样本,标注非A的数据均为负样本。
[0174] 准确率Accuracy的计算公式如下:
[0175]
[0176] 对于变压器、开关柜、GIS三种应用场景,各使用10000条测试样本验证后,记录准确率统计数据如表3所示:
[0177] 表3
[0178] AlexNet VGG GoogLeNet ResNet
变压器检测数据 0.83 0.96 0.82 0.85
开关柜检测数据 0.81 0.79 0.95 0.88
GIS检测数据 0.84 0.83 0.83 0.95
[0179] 步骤2:计算四种诊断模型在三种应用场景下的F1 Score。
[0180] 定义精确度为Precision,其计算公式如下:
[0181]
[0182] 定义召回率Recall,其计算公式如下:
[0183]
[0184] F1 Score的计算公式如下:
[0185]
[0186] 对于变压器、开关柜、GIS三种应用场景,各使用10000条测试样本验证后,记录F1 Score统计数据如表4所示:
[0187] 表4
[0188] AlexNet VGG GoogLeNet ResNet
变压器检测数据 0.89 0.88 0.87 0.84
开关柜检测数据 0.83 0.77 0.96 0.87
GIS检测数据 0.81 0.83 0.82 0.95
[0189] 步骤3:制定模型计分标准。
[0190] 制定的计分标准如表5所示:
[0191] 表5
[0192]
[0193] 步骤4:选择适合应用场景的模型。
[0194] 根据上述计分标准,变压器、开关柜、GIS三种应用场景的得分如表6所示:
[0195] 表6
[0196]
[0197] 依据上表,本实施例中的AlexNet、VGG、GoogLeNet、ResNet四种诊断模型,在实际应用时,VGG适应于变压器检测数据诊断,GoogLeNet适应于开关柜检测数据诊断,ResNet适应于GIS检测数据诊断。
[0198]
申请人结合
说明书附图对本发明的实施例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。