首页 / 专利库 / 数学与统计 / 聚类算法 / 一种基于YOLO的输电塔鸟巢故障检测方法

一种基于YOLO的输电塔巢故障检测方法

阅读:126发布:2020-05-08

专利汇可以提供一种基于YOLO的输电塔巢故障检测方法专利检索,专利查询,专利分析的服务。并且一种基于YOLO的输电塔 鸟 巢故障检测方法,属于 计算机视觉 技术领域。本 发明 的检测方法包括以下步骤:数据获取,无人机拍摄电 力 杆塔的图像,涵盖不同 角 度;将采集到的数据集进行标记,并按照8:2:1随机划分为训练集、验证集、测试集;通过K-means 算法 对标记得到的目标框进行聚类,得到改进后的 锚点 ;通过YOLO神经网络对训练集、验证集进行训练,获取YOLO神经网络的最终模型;利用步骤四获取的YOLO神经网络检测模型对测试集进行检测。本发明相对于传统的YOLO分类网络,识别效率和准确率都更突出;检测速度快,能够满足电力线路无人机常态化巡检的应用需求;检测准确率高、鲁棒性强、速度快。,下面是一种基于YOLO的输电塔巢故障检测方法专利的具体信息内容。

1.一种基于YOLO的输电塔巢故障检测方法,其特征在于包括以下步骤:
步骤一:数据获取,无人机拍摄电杆塔的图像,涵盖不同度角度;
步骤二:将采集到的数据集进行标记,并按照8:2:1随机划分为训练集、验证集、测试集;
步骤三:通过K-means算法对标记得到的目标框进行聚类,得到改进后的锚点
步骤四:通过YOLO神经网络对训练集、验证集进行训练,获取YOLO神经网络的检测模型;
步骤五:利用步骤四获取的YOLO神经网络检测模型对测试集进行检测。
2.根据权利要求1所述的基于YOLO的输电塔鸟巢故障检测方法,其特征在于上述步骤一无人机拍摄的图像包括杆塔的全体、地线、上中下三相的角度。
3.根据权利要求1所述的基于YOLO的输电塔鸟巢故障检测方法,其特征在于上述步骤二包含以下步骤:
2.1使用LabelImg标注软件,人工标定鸟巢、杆塔数据;
2.2将标记框的类别、宽高存于txt文件中;
2.3将数据集随机划分为训练集、验证集、测试集。
4.据权利要求1所述的基于YOLO的输电塔鸟巢故障检测方法,其特征在于上述步骤三采用K-means算法,基于欧式距离公式,对标记框进行聚类,获得改进后锚点集合。
5.根据权利要求1所述的基于YOLO的输电塔鸟巢故障检测方法,其特征在于上述步骤四包含的训练参数设定为:迭代次数20000,学习率更新策略为step,更新步长1000、5000、
15000、20000,初始学习率0.001,batch=32,decay为0.0005。
6.根据权利要求1所述的基于YOLO的输电塔鸟巢故障检测方法,其特征在于上述步骤五包含以下步骤:
6.1将测试集的数据输入步骤四已经训练好的神经网络,进行检测;
6.2神经网络检测完成后,返回识别类别和框的坐标;
6.3显示框好的检测结果。

说明书全文

一种基于YOLO的输电塔巢故障检测方法

技术领域

[0001] 本发明属于计算机视觉技术领域,特别涉及一种基于yolo神经网络的鸟巢故障检测方法。

背景技术

[0002] 截止2018年底,全国35kV以上输电线路回路长度已达到189.2万千米,鸟类在给人类带来恬静和愉悦的同时,也给电系统带来很多困扰与危害。根据运行经验和统计数据,鸟类活动引发的电力故障频率,仅次于雷击和外力破坏。鸟害具体包括:鸟类身体短路故障、鸟类筑巢、鸟类捕食、鸟粪闪络、鸟类天敌身体短路、鸟类啄食复合绝缘子故障等。塔远比电杆的鸟害故障率更高,发生在铁塔的故障占90%,原因在于铁塔高大、稳定,鸟类视野开阔,适宜鸟类停留、筑巢。直线塔多为横担与导线短接;而耐张塔鸟害接地故障多发生在横担与引流线间空气间隙出。近些年来,各地电网公司越来越多地将无人机(Unmanned Aerial Vehicle,UAV)应用到线路巡检当中,但无人机采集的数据量大,单纯依赖人工识别效率低下,并且容易发生误判或者漏判,故采用智能化目标检测算法很有必要。
[0003] 针对电力线路的目标检测算法需要配合无人机,以期在5G应用场合,实现智能化程度更高的无人机实时巡线,因此需要采用一种检测速度快、同时检测精度较高的算法。本发明提出了一种基于YOLO深度学习算法的目标检测模型,可应用于处理无人机巡检输电线路的数据,自动识别检测出鸟巢异常情况,有助于评估输电线路鸟害的严重程度,并且对研究鸟类生活习性和规律、进一步科学性防范治理、提升线路输电可靠性提供了技术和数据支持。

发明内容

[0004] 为解决上述问题,本发明提供一种基于YOLO的输电塔鸟巢故障检测方法,其借助巡检无人机对电力杆塔巡检拍摄的图像数据进行自动识别鸟巢,提高电力巡检的智能化程度,保障电力系统稳定运行。
[0005] 本发明的检测方法包括以下步骤:
[0006] 步骤一:数据获取,无人机拍摄电力杆塔的图像,涵盖不同度角度;
[0007] 步骤二:将采集到的数据集进行标记,并按照8:2:1随机划分为训练集、验证集、测试集;
[0008] 步骤三:通过K-means算法对标记得到的目标框进行聚类,得到改进后的锚点
[0009] 步骤四:通过YOLO神经网络对训练集、验证集进行训练,获取YOLO神经网络的检测模型;
[0010] 步骤五:利用步骤四获取的YOLO神经网络检测模型对测试集进行检测。
[0011] 进一步的,本发明的步骤二包含以下步骤:
[0012] 2.1使用LabelImg标注软件,人工标定鸟巢、杆塔数据;
[0013] 2.2将标记框的类别、宽高存于txt文件中;
[0014] 2.3将照片(约5500张)随机划分为训练集、验证集、测试集。
[0015] 进一步的,本发明的步骤四包含的训练参数设定为:迭代次数20000,学习率更新策略为step,更新步长1000、5000、15000、20000,初始学习率0.001,batch=32,decay为0.0005;
[0016] 进一步的,本发明的步骤五包含以下步骤:
[0017] 4.1将测试集的数据输入步骤四已经训练好的神经网络,进行检测;
[0018] 4.2神经网络检测完成后,返回识别类别和框的坐标;
[0019] 4.3显示框好的检测结果。
[0020] 与传统人工查看巡检图片的方式相比,本发明具有以下优点和有益效果:
[0021] 1、本发明采用端到端的设计,节省人力,识别效率和准确率都更突出。
[0022] 2、检测速度快,能够满足电力线路无人机常态化巡检的应用需求。
[0023] 3、本发明的检测准确率高、鲁棒性强、速度快。
[0024] 本发明在训练过程中采用K-means算法对anchor聚类,增强了对鸟巢检测效果。附图说明
[0025] 图1是本发明基于YOLO的鸟巢故障检测的整体流程图
[0026] 图2是本发明基于YOLO的鸟巢故障检测采用K-means聚类效果示意图。

具体实施方式

[0027] 如图1所示,本发明的检测方法包括以下步骤:
[0028] 步骤一:数据获取,无人机拍摄电力杆塔的图像,涵盖不同角度角度;
[0029] 步骤二:将采集到的数据集进行标记,并按照8:2:1随机划分为训练集、验证集、测试集;
[0030] 步骤三:通过K-means算法对标记得到的目标框进行聚类,得到改进后的锚点;
[0031] 步骤四:通过YOLO神经网络对训练集、验证集进行训练,获取YOLO神经网络的检测模型;
[0032] 步骤五:利用步骤四获取的YOLO神经网络检测模型对测试集进行检测。
[0033] 本发明步骤一无人机拍摄的图像至少应包括杆塔的全体、地线、上中下三相等角度。
[0034] 本发明步骤二所述的训练集、验证集、测试集彼此之间相互独立。由于采取的是监督性的学习方式检测鸟巢,所以需要人工用LabelImg软件手动标记数据集中的杆塔和鸟巢两类目标,获得目标的类别及位置框信息,保存为格式是txt的标签文件。
[0035] 本发明步骤三采用K-means算法,采用距离作为相似性的评价指标,即两个对象距离越近,相似度越高。K-means认为簇是距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。基于欧式距离公式,处理步骤二标记过的标签文件,对位置框的中心点进行聚类,将中心点分成9簇,每簇求得一个锚点。欧式距离公式定义为:
[0036]
[0037] 其中d12为点1与点2之间的距离,(x1,y1)、(x2,y2)分别为点1与点2的二维坐标。
[0038] 在每簇内的数据,到其簇内的锚点距离比到另一个簇的中心点更近。以样本数据集处理为例,K-means聚类所得的锚点值为(19,20)、(26,91)、(47,42)、(45,168)、(82,80)、(72,294)、(113,357)、(259,395)、(160,386),如图2所示,三角形为初始锚点位置,五角星为所得的新锚点。大包围框采用欧式距离聚类获得的Anchor会比小包围框的误差更大,而聚类是为了提高预测的目标框和真实目标框的重叠率,获得更好的交并比(Intersection over Union,IoU),即检测结果(Detection Result)与真实值(Ground Truth)的交集比并集,公式定义为:
[0039]
[0040] 本发明步骤四将步骤二处理后的训练集和验证集以及步骤三获取的锚点集合输入YOLO神经网络进行训练。获取基于YOLO神经网络的检测模型的过程为:将训练集中的图像进行归一化处理,并将归一化后的图像输入至YOLO神经网络的backbone部分,得到感受野最小而尺度最大、感受野中等且尺度中等和感受野最大而尺度最小的三种不同尺度的特征图,分别对三种不同尺度的特征图输入至YOLO神经网络的head部分,进行上采样和特征融合后分别得到最大尺度下的张量数据、中等尺度下的张量数据和最小尺度下的张量数据,通过损失函数对张量数据相对于真实值进行计算,并经过反向传播求取梯度,进行权重更新,同时利用验证集进行验证,得到最终基于YOLO神经网络的检测模型。
[0041] 本发明YOLO神经网络的backbone部分包含以下步骤:
[0042] (1)训练集的原始图像经归一化成416*416的图像,先经2个3*3卷积成208*208,再依次经1个残差模、一个3*3卷积、2个残差模块、1个3*3卷积、8个残差模块后,获得感受野最小而尺度最大的特征图;
[0043] (2)从(1)获得的感受野最小而尺度最大的特征图再依次经过1个3*3卷积、8个残差模块后,获得感受野中等且尺度中等的特征图;
[0044] (3)从(2)获得的感受野中等且尺度中等的特征图再依次经过1个3*3卷积、8个残差模块后,获得感受野最大且尺度最小的特征图。
[0045] 进一步的,残差模块一个运算过程,依次为1个1*1的卷积、1个3*3的卷积和残差操作。
[0046] 本发明YOLO神经网络的head部分包含以下步骤:
[0047] (1)在感受野最大而尺度最小的特征图上初始生成三种不同尺度的锚点框,随后依次经过一个3*3卷积、一个CONV模块、一个3*3卷积和一个1*1卷积得到最小尺度下的张量数据;
[0048] (2)对感受野最大而尺度最小的特征图依次经过一个3*3卷积、一个CONV模块和一个1*1卷积后进行上采样,将上采样得到的特征图与YOLO网络的backbone部分得到的感受野中等和尺度中等的特征图通过concatenate方法进行特征融合,在特征融合后得到的特征图上初始生成三种不同尺度的锚点框,随后依次经过一个CONV模块、一个3*3卷积和1*1卷积后得到中等尺度下的张量数据;
[0049] (3)对感受野中等尺度中等的特征图进行特征融合后得到的特征图经过一个CONV模块和1*1卷积后进行上采样,将上采样得到的特征图与YOLO网络的backbone部分得到的感受野最小尺度最大的特征图通过concatenate方法进行特征融合,在特征融合后得到的特征图上初始生成三种不同尺度的锚点框,随后依次经过一个CONV模块、一个3*3卷积和1*1卷积后得到最大尺度下的张量数据。
[0050] 本发明的一个CONV模块是指依次经历1*1卷积、3*3卷积、1*1卷积、3*3卷积、1*1卷积的运算过程。
[0051] 本发明的YOLO神经网络的head部分,在经过一系列卷积和池化之后,针对三种尺度,在feature map层预测3个anchor box。9个anchor的值通过K-means聚类获得,按照大小均分给三种尺度。通过损失函数,来使训练网络得到目标与标签anchor的偏离值,并且使得偏离值接近真实值。
[0052] 损失函数主要分为三个部分:目标置信度损失Lconf(o,c)、目标分类损失Lcla(O,C)、目标定位偏移量损失Lloc(l,g),其中λ1、λ2、λ3为平衡系数,定义为:
[0053] L(O,o,C,c,l,g)=λ1Lconf(o,c)+λ2Lcla(O,C)+λ3Lloc(l,g)
[0054] 其中,目标置信度损失Lconf(o,c)预测目标框内存在目标的概率,采用二至交叉熵损失函数,是由Sigmoid函数求得,表示目标框i内存在目标的Sigmoid概率:
[0055]
[0056]
[0057] 目标类别损失Lcla(O,C)预测目标类别,也是采用二值交叉熵损失函数计算,Oij∈{0,1}表示目标框i中是否存在第j类目标, 同样通过Sigmoid函数求得,表示目标框i中存在第j类目标的Sigmoid概率:
[0058]
[0059]
[0060] 目标定位偏移量损失Lloc(l,g)求的是真实偏差值与预测偏差值差的平方和,表示预测框坐标偏移量,表示对应预测标记框与实际标记框之间的坐标偏移量:
[0061]
[0062] 本发明通过损失函数计算每个预测的修正框的类别得分、置信度得分、框的中心坐标和宽高相对于真实的标定框类别、中心坐标和宽高的损失,经过反向传播求取梯度进行权重更新,得到更新后的权重参数,按照所述方法,设置学习速率为0.1进行迭代1000轮后得到训练1000轮下的模型,记录的损失曲线损失值震荡剧烈,同时在验证集下进行验证,发现精度低,选择降低学习速率到0.01;继续观察损失曲线并每迭代500轮在验证集上验证一次,根据损失曲线和验证集上的检测效果调整学习率。最终的学习率情况如下:0-1000为0.1,1000-5000为0.01,5000-15000为0.001,15000-20000为0.0001,20000次时模型收敛,训练停止,得到迭代20000次后最终的基于YOLO神经网络的检测模型。
[0063] 本发明的步骤五中利用检测模型对测试集中的图片进行检测,经过YOLO神经网络的backbone部分和head部分处理后,得到多个预测张量值,所述固定尺寸大小通常选择为416*416大小,每个预测张量值包括中心坐标值tx、ty,宽高值tw、th以及置信度和类别数,将获得的预测张量值的中心坐标值tx、ty,宽高值tw、th代入以下转换公式反向计算得到预测矩形框的中心坐标值bx、by,宽高值bw、bh以及置信度,预测边框数据的类别数与预测张量值的类别数相同,所述转换公式为:
[0064]
[0065] 其中cx、cy为预测网格,pw、ph为预先确定的anchor值。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈