首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 半监督学习 / 一种基于半监督学习的光伏面板故障检测方法

一种基于半监督学习的光伏面板故障检测方法

阅读:942发布:2020-05-18

专利汇可以提供一种基于半监督学习的光伏面板故障检测方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于半 监督学习 的光伏面板故障检测方法,包括以下步骤:S1、构建半监督 异常检测 模型并定义目标函数L;S2、将正样例的光伏面板图像作为正样例原图图像输入半监督异常检测模型,进行模型训练;S3、将待测光伏面板图像作为待测原图图像输入训练完成的半监督异常检测模型;S4、半监督异常检测模型生成待测原图图像对应的待测重建图像,并计算待测原图图像和待测重建图像之间的误差;S5、判断误差是否小于自适应 阈值 ,若是,则待测光伏面板正常,若否,则待测光伏面板异常。与 现有技术 相比,本发明适应光伏面板图像缺少负样例 训练数据 的特点,且具有计算简单等优点。,下面是一种基于半监督学习的光伏面板故障检测方法专利的具体信息内容。

1.一种基于半监督学习的光伏面板故障检测方法,其特征在于,包括以下步骤:
S1、构建半监督异常检测模型并定义目标函数L;
S2、将正样例的光伏面板图像作为正样例原图图像输入半监督异常检测模型,进行模型训练;
S3、将待测光伏面板图像作为待测原图图像输入训练完成的半监督异常检测模型;
S4、半监督异常检测模型生成待测原图图像对应的待测重建图像,并计算待测原图图像和待测重建图像之间的误差;
S5、判断误差是否小于自适应阈值,若是,则待测光伏面板正常,若否,则待测光伏面板异常。
2.根据权利要求1所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,所述的半监督异常检测模型包括生成器网络G和判别器网络D,所述的步骤S2具体包括:
21)将正样例原图图像输入生成器网络G;
22)生成器网络G学习正样例原图图像的正样例图像数据分布,进行图像重建,判别器网络D对图像重建过程中生成的正样例重建图像进行真伪判别,生成器网络G与判别器网络D做对抗训练,以迭代的方式不断更新,直至目标函数L的值达到最小,完成迭代;
23)在迭代完成的半监督异常检测模型中输入正样例的光伏面板图像和负样例的光伏面板图像,测试该迭代完成的半监督异常检测模型是否可以检测出负样例的光伏面板图像,若是,则完成训练,若否,则执行步骤21)。
3.根据权利要求2所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,所述的生成器网络G包括依次设置的第一编码器子网络GE1、解码器子网络GD和第二编码器子网络GE2,所述的判别器网络D包括类编码器子网络DE,所述的第一编码器子网络GE1和解码器子网络GD的结构相互对称,所述的第一编码器子网络GE1和第二编码器子网络GE2的结构相同。
4.根据权利要求3所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,所述的目标函数L的表达式为:
L=Ladv+λLcon+Lenc
其中,Ladv为对抗损失函数,λ为调整重建图像锐度的参数,Lcon为上下文损失函数,Lenc为编码器损失函数,px为正样例图像数据分布,X为正样例原图图像, 为正样例重建图像,为正样例原图图像X在判别器D中间层的特征输出, 为正样例重建图像 在判别器D中间层的特征输出,ZX为正样例原图隐空间向量, 为正样例重建隐空间向量。
5.根据权利要求4所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,所述的步骤22)具体包括:
221)第一编码器子网络GE1输入正样例原图图像,输出正样例原图隐空间向量;
222)解码器子网络GD输入正样例原图隐空间向量,输出正样例重建图像;
223)类编码器子网络DE输入正样例原图图像和正样例重建图像,分别输出正样例原图图像的中间层特征和正样例重建图像的中间层特征;
224)第二编码器子网络GE2输入正样例重建图像,输出正样例重建隐空间向量;
225)根据目标函数L更新第一编码器子网络GE1、解码器子网络GD、第二编码器子网络GE2和类编码器子网络DE的参数;
226)重复执行步骤221)~步骤225),直至目标函数L的值减为最小。
6.根据权利要求5所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,所述的正样例原图隐空间向量和正样例重建隐空间向量均为一维向量,所述的正样例原图隐空间向量表征正样例原图图像的数据分布,所述的正样例重建隐空间向量表征正样例重建图像的数据分布。
7.根据权利要求6所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,步骤S4的具体步骤包括:
41a)训练完成的生成器网络G根据输入的待测原图图像,依次生成待测原图隐空间向量、待测重建图像和待测重建隐空间向量;
42a)计算待测原图隐空间向量和待测重建隐空间向量之间的待测隐空间向量损失LZM,作为待测原图图像和待测重建图像之间的误差;
所述的待测隐空间向量损失LZM的表达式为:
其中,ZM为待测原图隐空间向量, 为待测重建隐空间向量。
8.根据权利要求3所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,在光伏面板故障检测过程中,当输入的光伏面板图像为正常时,训练完成的第一编码器子网络GE1和解码器子网络GD将该输入的待测原图图像以正样例图像数据分布的方式生成待测重建图像,待测原图图像和待测重建图像之间的误差小于自适应阈值,半监督异常检测模型判断该输入的光伏面板图像为正常;当输入的光伏面板图像为异常时,训练完成的第一编码器子网络GE1和解码器子网络GD将输入的待测原图图像以正样例图像数据分布的方式生成待测重建图像,此时正样例图像数据分布与该将待测原图图像的数据分布存在差异,待测原图图像和待测重建图像之间的误差大于自适应阈值,半监督异常检测模型判断输入的光伏面板图像为异常。
9.根据权利要求6所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,在训练半监督异常检测模型之前,对每张正样例的光伏面板图像进行分割,形成多张正样例特征图,将正样例特征图作为正样例原图图像输入半监督异常检测模型进行模型训练;
在进行光伏面板故障检测时,对待测的光伏面板图像进行分割,形成多张待测特征图,将同一幅待测光伏面板的待测特征图批量输入训练完成的半监督异常检测模型进行故障检测。
10.根据权利要求9所述的一种基于半监督学习的光伏面板故障检测方法,其特征在于,当待测原图图像为批量输入的待测特征图时,步骤S4具体包括:
41b)训练完成的生成器网络G对同一批次输入的所有待测原图图像,分别依次生成待测原图隐空间向量、待测重建图像和待测重建隐空间向量;
42b)分别计算同一批次所有待测原图隐空间向量的均值和待测重建隐空间向量的均值;
43b)计算待测原图隐空间向量均值和待测重建隐空间向量均值之间的均值隐空间向量损失Lmx,作为待测原图图像和待测重建图像之间的误差;
所述的均值隐空间向量损失Lmx的表达式为:
其中,mx为同一批次特征图的待测原图隐空间向量均值, 为同一批次特征图的待测重建隐空间向量均值。

说明书全文

一种基于半监督学习的光伏面板故障检测方法

技术领域

[0001] 本发明涉及电系统自动化领域,尤其是涉及一种基于半监督学习的光伏面板故障检测方法。

背景技术

[0002] 在全球推进清洁低能源转型的进程中,光伏面板在清洁能源中的地位日益升高。我国新能源行业发展迅速,截止2018年底,太阳能发电装机容量达到1.74亿千瓦。我国已成为全球光伏电站装机容量最大的国家。为了增加光伏面板的受光时间,大型光伏发电场厂往往位于偏远地区,如平原、丘陵或没有明显遮阳区域的大型厂房屋顶。长时间运行在紫外线、高温、潮湿的环境中会加速光伏面板的化和失效,严重的密封剂分层会增加反射,降低辐照度,使分在模中下沉,加速细胞氧化。粉尘的积累会直接降低透光率,影响光伏发电系统的效率,有时可达50%左右,甚至更糟到80%。虽然蜗纹路对发电效率没有直接影响,但看不见的细胞裂纹,通常会降低输出。光伏产业的兴起和部署地理位置的险峻提高了其故障检测的难度,如此大的地理规模和分散的位置,显然给系统故障检测带来了挑战。由于光伏发电在全球推广清洁能源中有广泛的应用,解决该技术难题的要求显得越来越突出。
[0003] 传统的人工检查通过目视评估单个光伏组件,该方法成本高、错误率高且效率低下。近年来提出的利用机载摄像机和微处理器的无人机巡检系统,可以对大型光伏电站进行无损、可靠的巡检。尽管该巡检系统需要对大量采集的航拍图像进行处理和分析,这种基于无人机的检测系统还是能够有效地进行实时状态检测和故障诊断。无人机巡检系统的出现解决了可见光伏组件缺陷的诊断问题,且验证了基于故障分析的图像处理的有效性,然而,由于效应等多种原因导致获取的图像分辨率较低,因此检测的性能会明显下降。此外,传统的模式识别算法往往无法实现对获取的航拍图像进行复杂程度可接受的故障特征提取。随着深度卷积神经网络性能的提高,将深度学习算法引入到智能巡检系统中,可提高系统的健壮性和可靠性。现有技术中运用一种基于深度卷积神经网络(Convolutional Neural Network,CNN)的航拍光伏组件图像缺陷智能诊断方法。该方法利用CNN进行多种深度特征和状态分类,与传统方法相比,可以灵活可靠地解决光伏组件图像质量低、失真的问题。但仍然存在一些不足:现有的光伏面板故障检测方法都采用监督学习训练模型,在进行模型训练的过程中,需要大量的正例样本和负例样本,但是光伏故障检测中,由于缺乏大量的负例样本,使得监督学习在光伏面板故障检测问题上不太适用。

发明内容

[0004] 本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于半监督学习的光伏面板故障检测方法。
[0005] 本发明的目的可以通过以下技术方案来实现:
[0006] 一种基于半监督学习的光伏面板故障检测方法,包括以下步骤:
[0007] S1、构建半监督异常检测模型并定义目标函数L;
[0008] S2、将正样例的光伏面板图像作为正样例原图图像输入半监督异常检测模型,进行模型训练;
[0009] S3、将待测光伏面板图像作为待测原图图像输入训练完成的半监督异常检测模型;
[0010] S4、半监督异常检测模型生成待测原图图像对应的待测重建图像,并计算待测原图图像和待测重建图像之间的误差;
[0011] S5、判断误差是否小于自适应阈值,若是,则待测光伏面板正常,若否,则待测光伏面板异常。
[0012] 进一步地,构建半监督异常检测模型生成对抗网络,所述的半监督异常检测模型包括生成器网络G和判别器网络D,所述的步骤S2具体包括:
[0013] 21)将正样例原图图像输入生成器网络G;
[0014] 22)生成器网络G学习正样例原图图像的正样例图像数据分布,进行图像重建,判别器网络D对图像重建过程中生成的正样例重建图像进行真伪判别,生成器网络G与判别器网络D做对抗训练,以迭代的方式不断更新,直至目标函数L的值达到最小,使得生成器网络D生成的图像与原图图像无限接近,而判别器网络D无法判断正样例重建图像的真伪,完成迭代;
[0015] 23)在迭代完成的半监督异常检测模型中输入正样例的光伏面板图像和负样例的光伏面板图像,测试该迭代完成的半监督异常检测模型是否可以检测出负样例的光伏面板图像,若是,则完成训练,若否,则执行步骤21),该测试步骤可以提高半监督异常检测模型的准确性和可信度,。
[0016] 进一步地,本发明将对抗式自动编码器和深度卷积生成对抗网络相结合,加快半监督异常检测模型的收敛速度和稳定性,所述的生成器网络G包括依次设置的第一编码器子网络GE1、解码器子网络GD和第二编码器子网络GE2,所述的判别器网络D包括类编码器子网络DE,所述的第一编码器子网络GE1和解码器子网络GD的结构相互对称,所述的第一编码器子网络GE1和第二编码器子网络GE2的结构相同。
[0017] 进一步地,为了实现对抗训练的目的,使生成器网络D生成既真实又与原图图像上下文有关的重建图像,定义目标函数L的表达式为:
[0018] L=Ladv+λLcon+Lenc
[0019]
[0020]
[0021]
[0022]
[0023]
[0024]
[0025] 其中,Ladv为对抗损失函数,λ为调整重建图像锐度的参数,Lcon为上下文损失函数,Lenc为编码器损失函数,px为正样例图像数据分布,X为正样例原图图像, 为正样例重建图像, 为正样例原图图像X在判别器D中间层的特征输出, 为正样例重建图像 在判别器D中间层的特征输出,ZX为正样例原图隐空间向量, 为正样例重建隐空间向量。
[0026] 进一步地,所述的步骤22)具体包括:
[0027] 221)第一编码器子网络GE1输入正样例原图图像,输出正样例原图隐空间向量;
[0028] 222)解码器子网络GD输入正样例原图隐空间向量,输出正样例重建图像;
[0029] 223)类编码器子网络DE输入正样例原图图像和正样例重建图像,分别输出正样例原图图像的中间层特征和正样例重建图像的中间层特征;
[0030] 224)第二编码器子网络GE2输入正样例重建图像,输出正样例重建隐空间向量;
[0031] 225)根据目标函数L更新第一编码器子网络GE1、解码器子网络GD、第二编码器子网络GE2和类编码器子网络DE的参数;
[0032] 226)重复执行步骤221)~步骤225),直至目标函数L的值减为最小。
[0033] 进一步地,所述的正样例原图隐空间向量和正样例重建隐空间向量均为一维向量,所述的正样例原图隐空间向量表征正样例原图图像的数据分布,所述的正样例重建隐空间向量表征正样例重建图像的数据分布,利用隐空间向量可以简化计算机计算原图图像和重建图像之间的误差。
[0034] 进一步地,步骤S4的具体步骤包括:
[0035] 41a)训练完成的生成器网络G根据输入的待测原图图像,依次生成待测原图隐空间向量、待测重建图像和待测重建隐空间向量;
[0036] 42a)计算待测原图隐空间向量和待测重建隐空间向量之间的待测隐空间向量损失LZM,作为待测原图图像和待测重建图像之间的误差;
[0037] 所述的待测隐空间向量损失LZM的表达式为:
[0038]
[0039] 其中,ZM为待测原图隐空间向量, 为待测重建隐空间向量。
[0040] 进一步地,在光伏面板故障检测过程中,当输入的光伏面板图像为正常时,训练完成的第一编码器子网络GE1和解码器子网络GD将该输入的待测原图图像以正样例图像数据分布的方式生成待测重建图像,此时待测重建图像可以很好地还原待测重建图像,待测原图图像和待测重建图像之间的误差小于自适应阈值,半监督异常检测模型判断该输入的光伏面板图像为正常;当输入的光伏面板图像为异常时,训练完成的第一编码器子网络GE1和解码器子网络GD将输入的待测原图图像仍然以正样例图像数据分布的方式生成待测重建图像,此时由于正样例图像数据分布与该将待测原图图像的数据分布存在差异,使得待测重建图像无法很好地还原原图图像,待测原图图像和待测重建图像之间的误差大于自适应阈值,半监督异常检测模型判断输入的光伏面板图像为异常。在模型训练过程中,只学习正样例的光伏面板图像,使得该半监督异常检测模型只能以正样例图像数据分布的方式对输入的原图图像生成重建图像,从而只能还原正样例原图图像。
[0041] 进一步地,为了加快模型训练和故障检测过程中的效率,在训练半监督异常检测模型之前,对每张正样例的光伏面板图像进行分割,形成多张正样例特征图,将正样例特征图作为正样例原图图像输入半监督异常检测模型进行模型训练;在进行光伏面板故障检测时,对待测的光伏面板图像进行分割,形成多张待测特征图,将同一幅待测光伏面板的待测特征图批量输入训练完成的半监督异常检测模型进行故障检测。
[0042] 进一步地,当待测原图图像为批量输入的待测特征图时,通过计算特征图对应隐空间向量的均值来判断误差,步骤S4具体包括:
[0043] 41b)训练完成的生成器网络G对同一批次输入的所有待测原图图像,分别依次生成待测原图隐空间向量、待测重建图像和待测重建隐空间向量;
[0044] 42b)分别计算同一批次所有待测原图隐空间向量的均值和待测重建隐空间向量的均值;
[0045] 43b)计算待测原图隐空间向量均值和待测重建隐空间向量均值之间的均值隐空间向量损失Lmx,作为待测原图图像和待测重建图像之间的误差;
[0046] 所述的均值隐空间向量损失Lmx的表达式为:
[0047]
[0048] 其中,mx为同一批次特征图的待测原图隐空间向量均值, 为同一批次特征图的待测重建隐空间向量均值。
[0049] 与现有技术相比,本发明具有以下优点:
[0050] (1)本发明提供的方法采用半监督异常检测模型SSADM,相较于监督学习,训练样本中只需大量无标签的正样例数据,而无需有标签数据和大量负样例数据,使得当且仅当输入的待测光伏面板原图图像为正常时,重建图像才能还原原图图像,从而使原图图像和重建图像之间的误差小于自适应阈值,解决了光伏面板图像中缺少负样例数据而无法训练异常检测模型的问题,提高训练过程的可行性和适应性;
[0051] (2)本发明提供的方法将对抗式自动编码器和深度卷积生成对抗网络相结合,加入的深度卷积生成对抗网络加速了训练模型的收敛,使训练模型更加稳定和健壮,经过模型评估,该方法可代替传统的人工巡检,实现光伏面板故障检测的自动化;
[0052] (3)本发明在训练半监督异常检测模型时和实际检测光伏面板故障过程中,都采用将光伏面板图片分割成特征图后输入生成器网络G,通过将一张大图分割成若干张小图,加快训练的迭代速度以及故障检测时的计算速度;
[0053] (4)在本发明的半监督异常检测模型中,第一编码器子网络GE1和解码器子网络GD后还设有第二编码器子网络GE2,将第一编码器子网络GE1和解码器子网络GD输出的重建图数据输入第二编码器子网络GE2中,得到重建隐空间向量,比较原图隐空间向量和重建隐空间向量的距离来表征原图图像和重建图像之间的误差,用较为简单的一维向量来代替复杂的高维向量,简化计算机计算过程的空间和时间复杂度。附图说明
[0054] 图1为本发明中半监督异常检测模型的架构图;
[0055] 图2为正负样例的数据分布图,其中,图(2a)为正样例的数据分布图,图(2b)为负样例的数据分布图;
[0056] 图3为模型训练流程图
[0057] 图4为异常检测流程图。

具体实施方式

[0058] 下面结合附图和具体实施例对本发明进行详细说明。显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
[0059] 本发明涉及一种基于半监督学习的光伏面板故障检测方法,该方法使用训练完成的半监督异常检测模型,对光伏面板进行故障检测,检测过程中,训练完成的半监督异常检测模型对输入的待测光伏面板的原图图像进行重建,生成重建图像,根据原图图像和重建图像之间误差的大小来判断输入的待测光伏面板图像是否为故障图像。而该半监督异常检测模型训练的目的就是使得当且仅当输入图像为正样例图像,即正常光伏面板图像时,生成的重建图像与输入的原图图像无限接近,该目的通过生成器网络G和判别器网络D之间的对抗训练来实现,使得最终生成器网络G生成既真实又与原图图像上下文有关的重建图像。
[0060] 本实施例中,实施本发明技术方案总体包括以下四大步骤:
[0061] (一)准备训练数据
[0062] 本发明采用半监督异常检测模型,在训练时只让半监督异常检测模型学习正样例数据,因此需要收集原始光伏面板的正样例图像,制作正样例的训练数据集。同时为了使训练完成后的半监督异常检测模型的准确性更高,在训练步骤中加入测试环节,因此还需要制作测试数据集,测试数据集中则同时需要正样例图像和负样例图像,以此来测试半监督异常检测模型的检测效果。
[0063] 首先制作训练总样本,由于现有公开的数据集中缺少光伏面板图像,本实施例中的训练样本数据通过无人机拍摄采集正样例的光伏面板图像,拍摄的原始数据图像大小为3840×2048。通过观察光伏面板图像可以发现,其图像的颜色和形状是单一且规则的,依次将一张大图分割成若干张小图后,不仅对模型无负面影响,而且可以加快训练的迭代速度。
因此将拍摄的原始图像按行切8块、按列切15块,得到8×15张256×256大小的正方形图。同时为了加速网络训练,本实施例对图像进一步分割特征,将256×256大小的图像分割成8×
8张32×32大小的特征,通过分割500张256×256的图像,最终得到32000张32×32分割特征图。
[0064] 从训练总样本中随机抽取80%的样本放入训练数据集,训练集大小为25600。从训练总样本中随机抽取20%的样本放入测试数据集,测试集大小为6400,然后再对从测试数据集中随机抽取的50%的样本进行人工制作负样例,最终得到的测试数据集中正样例和负样例大小均为3200。
[0065] (二)构建半监督异常检测模型及定义目标函数
[0066] 半监督异常检测模型SSADM的整体架构如图1所示,该模型为基于半监督学习的生成对抗网络,采用将对抗式自动编码器和深度卷积生成对抗网络相结合的方式,主要由生成器网络G和判别器网络D两部分组成,其中生成器网络G包括依次设置的第一编码器子网络GE1和解码器子网络GD,判别器网络D包括类编码器子网络DE。本发明中生成器网络和判别器网络的搭建是关键,以下说明本实施例中第一编码器子网络GE1、解码器子网络GD和类编码器子网络DE的结构以及原理。
[0067] 第一编码器子网络GE1设有四层卷积,前三层卷积边缘填充个数为1,卷积核步长为2,并在卷积层后加入批量标准化层和LeakyReLU激活函数层。最后一层卷积采用无填充无步长卷积后直接输出大小为1×1×100的隐空间向量。由于制作的训练数据集和测试数据集中的特征图大小为32×32,而彩色图像为三通道,因此第一编码器子网络GE1第一层卷积的输入大小设为32×32×3。第一编码器子网络GE1各层的详细参数如下表1所示:
[0068] 表1 第一编码器子网络参数表
[0069]
[0070] 解码器子网络GD是结构与第一编码器子网络GE1的结构是对称的,第一层转置卷积无填充和步长,输入大小为1×1×100的隐空间向量,后三层转置卷积填充为1,步长为2。前三层转置卷积层后加批量标准化层和ReLU激活函数层,最后一层转置卷积直接输出大小为32×32×3的重建图。解码器子网络GD各层的详细参数如下表2所示:
[0071] 表2 解码器子网络参数表
[0072]
[0073] 本发明采用由第一编码器子网络GE1和解码器子网络GD构成的,形似蝴蝶结的网络对原图图像进行图像重建。第一编码器子网络GE1和解码器子网络GD通过输入原图图像,在第一编码器子网络GE1和解码器子网络GD的输出层分别得到原图图像对应的原图隐空间向量和重建图像。其中,隐空间向量可以表征其对应图像的数据分布,换言之,高维度的图像数据可以用一维隐空间向量表示。
[0074] 图像重建的过程具体为:
[0075] a1)第一编码器子网络GE1输入原图图像,原图图像经过第一编码器子网络GE1的卷积层、批量标准化层及泄露线性整流激活函数层多次向下缩小后,原图图像被压缩成原图隐空间向量,原图隐空间向量为包含原图图像最佳表示的最小维度的向量;
[0076] a2)原图图像被压缩成原图隐空间向量后,将原图隐空间向量输入解码器子网络GD,原图隐空间向量在解码器子网络GD中经过转置卷积层、批量标准化层及线性整流激活函数层多次向上放大后,原图隐空间向量被重建为与原图图像对应的重建图像。
[0077] 判别器网络中的类编码器子网络DE与第一编码器子网络GE1结构类似,区别点在于类编码器子网络DE的第三层输出大小为4×4×256的中间特征,同时在第四层的卷积核数量由100变为1,大小不变,以实现二分类的目的,完成判别器的判别功能。
[0078] 至此,通过捕获原图图像和重建图像之间的误差可以实现光伏面板异常检测,但是彩色图像的三通道是以数组的形式被存储在矩阵中的,直接计算误差两幅图像之间的误差对于计算机来的空间和时间复杂度来说都是难以接受的,因此为了保证以最小的代价完成高效且准确的光伏面板异常检测任务,简化图像数据的处理,同时充分利用第一编码器子网络GE1生成的原图隐空间向量,构建该半监督异常检测模型时,在解码器子网络GD后再设置一个第二编码器子网络GE2,该第二编码器子网络GE2的结构与第一编码器子网络GE1相同,其输入为重建图像,输出为与重建图像相对应的重建隐空间向量,从而可以通过捕获一维的原图隐空间向量和重建隐空间向量之间的误差来实现光伏面板的异常检测。
[0079] 为了使模型训练过程中达到相应目的,使生成器网络G在输入为正常图像时,产生既真实又与原图图像上下文有关的重建图像,定义三个损失函数,并将这三个损失函数的结合作为异常检测模型的目标函数。每个损失函数都对子网络进行相应优化。
[0080] 三个损失函数包括对抗损失函数Adversarial Loss、上下文损失函数Contextual Loss和编码器损失函数Encoder Loss:
[0081] (1)对抗损失函数Adversarial Loss
[0082] 在半监督异常检测模型中,生成器网络G需要根据判别器网络D的分类情况,即判别器网络D对输入的重建图像判定是原图还是生成图的情况,来更新参数。定义对抗损失函数Ladv为正样例原图图像X在判别器网络D中间层的特征输出 和正样例重建图像 在判别器网络D中间层的特征输出 之间的L2距离,自变量X和 都服从正样例图像数据分布px。对抗损失函数Ladv的表达式为:
[0083]
[0084]
[0085] 其中,px为正样例图像数据分布,X为正样例原图图像, 为正样例重建图像,为正样例原图图像X在判别器D中间层的特征输出, 为正样例重建图像 在判别器D中间层的特征输出。
[0086] (2)上下文损失函数Contextual Loss
[0087] 本发明通过优化对抗损失函数Ladv,第一编码器子网络GE1和解码器子网络GD能够产生出足够真实的图像使得判别器网络D无法判别真伪。然而就重建任务来说,对抗损失函数Ladv只能使第一编码器子网络GE1和解码器子网络GD产生服从正样例数据分布px的正样例重建图像 与正样例原图图像X可能无法对应,也就无法实现重建的目的。
[0088] 因此定义针对原图的上下文损失函数Lcon,计算正样例重建图像 与正样例原图图像X之间的L1距离。上下文损失函数Lcon的表达式为:
[0089]
[0090] (3)编码器损失函数Encoder Loss
[0091] 对抗损失函数Ladv和上下文损失函数Lcon的定义可以帮助生成器网络G产生既真实又与原图上下文有关的重建图。但本发明中提出用隐空间向量替代原图图像作为检测异常的数据依据。因此本发明还定义了编码器损失函数Lenc以优化第一编码器子网络GE1和第二编码器子网络GE2,缩小输出的正样例原图隐空间向量与正样例重建隐空间向量之间的距离。编码器损失函数Lenc的表达式为:
[0092]
[0093]
[0094]
[0095] 其中,ZX为正样例原图隐空间向量, 为正样例重建隐空间向量。
[0096] 结合三个损失函数,定义半监督异常检测模型的目标函数L为:
[0097] L=Ladv+λLcon+Lenc
[0098] 其中,λ为调整重建图像锐度的参数。
[0099] (三)训练半监督异常检测模型
[0100] 训练半监督异常检测模型的目的为:通过对正样例图像数据分布px的学习,使得当且仅当输入图像为正样例原图图像X时,第一编码器子网络GE1和解码器子网络GD以服从正样例图像数据分布px的方式将其编码并解码后生成对应正样例重建图像 该正样例重建图像 与输入的正样例原图图像X无限接近,从而使得对应的正样例原图隐空间向量与正样例重建隐空间向量之间差异很小。即训练半监督异常检测模型的目的是使得上述定义的目标函数L的值尽可能的小。
[0101] 将训练数据集中的数据输入生成器网络G中,生成器网络G和判别器网络D之间进行对抗训练,以迭代的方式不断更新,使目标函数L达到最小,以此来达到训练半监督异常检测模型的目的,对抗训练具体过程包括:
[0102] 221)第一编码器子网络GE1输入正样例原图图像,输出正样例原图隐空间向量;
[0103] 222)解码器子网络GD输入正样例原图隐空间向量,输出正样例重建图像;
[0104] 223)类编码器子网络DE输入正样例原图图像和正样例重建图像,分别输出正样例原图图像的中间层特征和正样例重建图像的中间层特征;
[0105] 224)第二编码器子网络GE2输入正样例重建图像,输出正样例重建隐空间向量;
[0106] 225)根据目标函数L更新第一编码器子网络GE1、解码器子网络GD、第二编码器子网络GE2和类编码器子网络DE的参数;
[0107] 226)重复执行步骤221)~步骤225),直至目标函数L的值减为最小。
[0108] 如图3所示,迭代完成后,为了保证半监督异常检测模型的效果,将测试数据集中的数据输入迭代完成的半监督异常检测模型中,测试该迭代完成的半监督异常检测模型半监督是否可以检测出负样例图像,若是,则完成训练,若否,则再次进行对抗训练,进行新一轮的迭代过程。
[0109] 本实施例中,训练网络使用Tensorflow搭建,训练整体流程如图3,可以分为如下几个步骤:
[0110] b1)读取训练数据集:在训练数据集存储路径下,读取所有图像数据,并以float32的形式保存在array类型的X_train里;
[0111] b2)迭代训练:生成器网络G与判别器网络D以迭代的方式不断更新,直到目标函数L值降为最小,迭代完成;
[0112] b3)读取测试数据集:测试数据集路径下有两个文件夹,分别存储正样例图像和负样例图像,将正样例图像和负样例图像依次以float32形式存储在array类型的X_test中,再创建一个array类型的Y_label,用于存储正样例图像和负样例图像对应的标签;
[0113] b4)模型评估及保存:每次迭代完成后,读取测试数据X_test和Y_label,通过AUC计算模型的准确率,判断是否训练完成,若是,则将生成图像数据和模型保存,若否,则再次进行迭代训练。
[0114] 经过模型的训练,由于只喂给第一编码器子网络GE1和解码器子网络GD正样例图像数据,其只能学习到正样例图像数据分布,对异常图像的数据分布是未知的,因此在测试阶段,会出现两种情况:
[0115] (1)输入正样例原图图像X时:已经训练的第一编码器子网络GE1和解码器子网络GD将其以服从正样例图像数据分布px的方式编码成正样例原图隐空间向量后,再解码成正样例重建图像 此时,正样例重建图像 是无限接近正样例原图图像X的,如图(2a)所示;
[0116] (2)输入负样例原图图像Y时:已经训练的第一编码器子网络GE1和解码器子网络GD仍然将其以服从正样例图像数据分布px的方式编码成负样例原图隐空间向量后再解码成负样例重建图像 因为正样例图像数据分布px与负样例图像数据分布py之间存在差异,所以负样例原图图像Y与负样例重建图像 是不同的,如图(2b)所示。
[0117] (四)光伏面板故障检测
[0118] 光伏面板故障检测过程中,使用经过上述部分训练完成的半监督异常检测模型,将待测光伏面板的图像作为待测原图图像输入半监督异常检测模型,生成器网络G对输入的待测光伏面板图像进行图像重建,并输出对应的待测原图隐空间向量和待测重建隐空间向量,通过计算待测原图隐空间向量和待测重建隐空间向量之间的误差,并判断其是否小于自适应阈值,来确定所测光伏面板图像是否存在故障。
[0119] 待测原图隐空间向量和待测重建隐空间向量之间的误差通过计算待测隐空间向量损失LZM得到,待测隐空间向量损失LZM的表达式为:
[0120]
[0121] 其中,ZM为待测原图隐空间向量, 为待测重建隐空间向量。
[0122] 自适应阈值通过计算得到,自适应阈值的计算公式为:
[0123] Thre_hold=(mean_error)*100+(mean_lamda*(20/std_error)),本实施例中,自适应阈值通过计算后得到的值在16左右。
[0124] 与模型训练中的测试过程类似,在光伏面板故障检测过程中,也会出现两种情况:
[0125] (1)当输入的待测光伏面板图像为正常时,第一编码器子网络GE1和解码器子网络GD将该输入图像以服从正样例图像数据分布px的方式编码成原图隐空间向量后,再解码成与原图图像相当接近的重建图像,第二编码器子网络GE2再将该重建图像编码成重建隐空间向量,此时,该输入图像的原图隐空间向量和重建隐空间向量之间的误差很小,即测隐空间向量损失LZM的值小于自适应阈值,半监督异常检测模型计算该误差并与自适应阈值比较后作出判断,判定该输入图像为正常图像;
[0126] (2)当输入的待测光伏面板图像为异常时,第一编码器子网络GE1和解码器子网络GD仍然将该输入图像以服从正样例图像数据分布px的方式将其编码成原图隐空间向量后,再解码生成对应的重建图像,第二编码器子网络GE2再将该重建图像编码成重建隐空间向量,此时,由于在解码过程中异常区域的特征被解码器子网络GD丢失,导致该重建图像无法复原回输入图像,该输入图像的原图隐空间向量与重建隐空间向量之间产生很大误差,即待测隐空间向量损失LZM的值大于自适应阈值,半监督异常检测模型捕获该误差并与自适应阈值比较后作出判断,判定该输入图像为异常图像。
[0127] 即当待测隐空间向量损失LZM的值小于自适应阈值时,半监督异常检测模型判断所测光伏面板图像为正常图像;当待测隐空间向量损失LZM的值大于自适应阈值时,半监督异常检测模型判断所测光伏面板图像为异常图像。
[0128] 为了在进行检测时加快检测速度,首先将待测的光伏面板图片分割成32×32的待测特征图x后批量输入训练好的半监督异常检测模型,生成器网络G输出对应待测特征图的隐空间向量zx和待测重建特征图的隐空间向量 分别计算同一批次所有待测原图隐空间向量的均值mx和待测重建隐空间向量的均值 再计算两者的均值隐空间向量损失Lmx,将均值隐空间向量损失Lmx作为待测原图图像和待测重建图像之间的误差。相关表达式如下:
[0129]
[0130]
[0131] 其中,x∈R32×32为输入特征图,mx∈R64×1为同一批次特征图的待测原图隐空间向量均值, 为同一批次特征图的待测重建隐空间向量均值,Lmx∈R64为均值隐空间向量损失。
[0132] 实际运用半监督异常检测模型进行光伏面板检测时,用户不能自己手动分割特征图,所以当输入图像大小为256×256时,将其分割成8×8个大小为32×32的特征图后,组成一个批次Batch输入半监督异常检测模型进行检测,检测流程图如图4所示。如上所述,生成器网络G计算均值隐空间向量损失Lmx。此时图像异常检测被转化为异常点检测的问题,即在均值隐空间向量损失Lmx中找到离群点,将离群点对应的特征图框选出来,以拼图的方式将8×8个大小为32×32的重建特征图拼回成原图对应的大小为256×256的重建图。
[0133] 本发明采用半监督异常检测模型SSADM,训练样本中只需大量无标签的正样例数据,而无需有标签数据和大量负样例数据,使得当且仅当输入的待测光伏面板原图图像为正常时,重建图像才能还原原图图像,从而使原图图像和重建图像之间的误差小于自适应阈值,解决了光伏面板图像中缺少负样例数据而无法训练异常检测模型的问题,提高了训练过程的可行性和适应性。
[0134] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的工作人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈