首页 / 专利库 / 专利权 / 形式要求 / 缺陷 / 一种电力变压器缺陷的预测方法及装置

一种电变压器缺陷的预测方法及装置

阅读:971发布:2022-10-02

专利汇可以提供一种电变压器缺陷的预测方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 实施例 提供了一种电 力 变压器 缺陷 的预测方法及装置,该方法包括:获得第一时间段内目标电力变压器的多维数据,并对所述多维数据进行分类 降维 ;预处理分类降维后所获得的多维数据;在已存储的 数据库 中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量;将所述第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷 预测模型 ,得到目标电力变压器缺陷的概率值;根据所述概率值,确定出所述目标电力变压器缺陷的预测结果。本方案提高了预测电力变压器缺陷的准确性。,下面是一种电变压器缺陷的预测方法及装置专利的具体信息内容。

1.一种电变压器缺陷的预测方法,其特征在于,包括:
获得第一时间段内目标电力变压器的多维数据,并对所述多维数据进行分类降维;所述多维数据包括:目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据;所述第一时间段为当前时刻之前第一预设时长的时间区间;
预处理分类降维后所获得的多维数据;
在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量;
将所述第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值;所述电力变压器缺陷预测模型为:预先根据多个采样时刻中的每个采样时刻对应的一个电力变压器设备参数数据、一个电力变压器缺陷状态值及每个采样时刻之前第二预设时长的时间区间内电力变压器缺陷总数量,进行训练获得的,每个采样时刻分别对应不同的电力变压器;
根据所述概率值,确定出所述目标电力变压器缺陷的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述多维数据进行分类降维,包括:
按照所述多维数据随时间变化的特性,将所述多维数据分类为实时电力数据和非实时电力数据;其中,所述目标电力变压器运行时的环境气象数据为所述实时电力数据,所述电力变压器设备参数数据为所述非实时电力数据;
采用特征选择法,对所述目标电力变压器运行时的环境气象数据及所述目标电力变压器设备参数数据进行降维。
3.根据权利要求2所述的方法,其特征在于,所述采用特征选择法,对所述目标电力变压器运行时的环境气象数据及所述目标电力变压器设备参数数据进行降维,包括:
针对所述目标电力变压器设备参数数据,采用第一特征选择法,获得每两个参数数据之间的线性相关性;所述第一特征选择法包括:线性相关系数法、直接观察数据重复方法;
针对所述目标电力变压器运行时的环境气象数据,采用第二特征选择法,获得每两个环境气象数据之间的线性相关性;所述第二特征选择法包括:矩阵散点图法、线性相关系数法;
其中,所述特征选择法包括:第一特征选择法及第二特征选择法;
针对目标电力变压器多维数据中,具有线性相关性的每两个参数数据及具有线性相关性的每两个环境气象数据,删除所述每两个参数数据中的任一参数数据,及删除所述每两个环境气象数据中的任一环境气象数据。
4.根据权利要求1所述的方法,其特征在于,所述预处理分类降维后所获得的多维数据,包括:
采用最近邻算法,填补所述分类降维后所获得的多维数据,得到填补后的多维数据,其中,所述最近邻算法包括缺失值填补法;
采用聚类法,将所述填补后的多维数据进行聚类,并确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据,其中,所述聚类法包括基于划分的聚类法。
5.根据权利要求1所述的方法,其特征在于,所述在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量,包括:
在已存储的数据库中,采用动态时间规整法,获得与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量。
6.根据权利要求1所述的方法,其特征在于,所述根据所述概率值,确定出所述目标电力变压器缺陷的预测结果,包括:
当所述概率值大于阈值时,确定所述目标电力变压器存在缺陷。
7.一种电力变压器缺陷的预测装置,其特征在于,包括:
获取单元,用于获得第一时间段内目标电力变压器的多维数据,并对所述多维数据进行分类降维;所述多维数据包括:目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据;所述第一时间段为当前时刻之前第一预设时长的时间区间;
处理单元,用于预处理分类降维后所获得的多维数据;
查找单元,用于在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量;
输入单元,用于将所述第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值;所述电力变压器缺陷预测模型为:预先根据多个采样时刻中的每个采样时刻对应的一个电力变压器设备参数数据、一个电力变压器缺陷状态值及每个采样时刻之前第二预设时长的时间区间内电力变压器缺陷总数量,进行训练获得的,每个采样时刻分别对应不同的电力变压器;
确定单元,用于根据所述概率值,确定出所述目标电力变压器缺陷的预测结果。
8.根据权利要求7所述的装置,其特征在于,所述获取单元包括:
分类子单元,用于按照所述多维数据随时间变化的特性,将所述多维数据分类为实时电力数据和非实时电力数据;其中,所述目标电力变压器运行时的环境气象数据为所述实时电力数据,所述目标电力变压器设备参数数据为所述非实时电力数据;
降维子单元,用于采用特征选择法,对所述目标电力变压器运行时的环境气象数据及所述电力变压器设备参数数据进行降维。
9.根据权利要求8所述的装置,其特征在于,所述降维子单元用于:
针对所述目标电力变压器设备参数数据,采用第一特征选择法,获得每两个参数数据之间的线性相关性;所述第一特征选择法包括:线性相关系数法、直接观察数据重复方法;
针对所述目标电力变压器运行时的环境气象数据,采用第二特征选择法,获得每两个环境气象数据之间的线性相关性;所述第二特征选择法包括:矩阵散点图法、线性相关系数法;
其中,所述特征选择法包括:第一特征选择法及第二特征选择法;
针对目标电力变压器多维数据中,具有线性相关性的每两个参数数据及具有线性相关性的每两个环境气象数据,删除所述每两个参数数据中的任一参数数据,及删除所述每两个环境气象数据中的任一环境气象数据。
10.根据权利要求7所述的装置,其特征在于,所述处理单元,包括:
填补子单元,用于采用最近邻算法,填补所述分类降维后所获得的多维数据,得到填补后的多维数据,其中,所述最近邻算法包括缺失值填补法;
聚类子单元,用于采用聚类法,将所述填补后的多维数据进行聚类,并确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据,其中,所述聚类法包括基于划分的聚类法。

说明书全文

一种电变压器缺陷的预测方法及装置

技术领域

[0001] 本发明涉及电力变压器技术领域,特别是涉及一种电力变压器缺陷的预测方法及装置。

背景技术

[0002] 随着电力系统的发展,电力系统中的输变电设备的安全问题越来越受到人们的重视。电力变压器是电力系统中重要的能量枢纽,当电力变压器发生缺陷时,会严重影响到居民的日常生活,并且有可能造成巨大的经济损失。如何在电力变压器发生缺陷之前,预测电力变压器可能发生缺陷,已经成为电网安全领域中急需解决的一个难题。
[0003] 目前,针对电力变压器的缺陷预测方法主要包括两种:第一种,获取多个月份的电力变压器实际缺陷率,根据实际缺陷率进行模式分解及建模,将各个模式的预测值总和作为当月变压器缺陷数量的预测值。第二种,使用电力变压器厂家、型号设备管理信息和设备缺陷信息,建立电力变压器家族性缺陷预警模型,对运行在高险年限的电力变压器进行预警。
[0004] 可见,上述两种电力变压器的缺陷预测方法都可以预测电力变压器缺陷,但是,第一种方法,是针对电力变压器整体缺陷数量的预测,不适用于针对个别电力变压器的缺陷进行预测;而第二种方法,从电力变压器家族性的缺陷产生原因预测电力变压器的缺陷,具有局限性。可见,现有技术没有针对具体电力变压器考虑多方面影响因素,对电力变压器缺陷进行预测,从而导致预测电力变压器缺陷的准确性不高。

发明内容

[0005] 本发明实施例的目的在于提供一种电力变压器缺陷的预测方法及装置,以提高预测电力变压器缺陷的准确性。具体技术方案如下:
[0006] 一方面,本发明实施例公开了一种电力变压器缺陷的预测方法,包括:
[0007] 获得第一时间段内目标电力变压器的多维数据,并对所述多维数据进行分类降维;所述多维数据包括:目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据;所述第一时间段为当前时刻之前第一预设时长的时间区间;
[0008] 预处理分类降维后所获得的多维数据;
[0009] 在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量;
[0010] 将所述第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值;所述电力变压器缺陷预测模型为:预先根据多个采样时刻中的每个采样时刻对应的一个电力变压器设备参数数据、一个电力变压器缺陷状态值及每个采样时刻之前第二预设时长的时间区间内电力变压器缺陷总数量,进行训练获得的,每个采样时刻分别对应不同的电力变压器;
[0011] 根据所述概率值,确定出所述目标电力变压器缺陷的预测结果。
[0012] 可选的,所述对所述多维数据进行分类降维,包括:
[0013] 按照所述多维数据随时间变化的特性,将所述多维数据分类为实时电力数据和非实时电力数据;其中,所述目标电力变压器运行时的环境气象数据为所述实时电力数据,所述电力变压器设备参数数据为所述非实时电力数据;
[0014] 采用特征选择法,对所述目标电力变压器运行时的环境气象数据及所述目标电力变压器设备参数数据进行降维。
[0015] 可选的,所述采用特征选择法,对所述目标电力变压器运行时的环境气象数据及所述电力变压器设备参数数据进行降维,包括:
[0016] 针对所述目标电力变压器设备参数数据,采用第一特征选择法,获得每两个参数数据之间的线性相关性;所述第一特征选择法包括:线性相关系数法、直接观察数据重复方法;
[0017] 针对所述目标电力变压器运行时的环境气象数据,采用第二特征选择法,获得每两个环境气象数据之间的线性相关性;所述第二特征选择法包括:矩阵散点图法、线性相关系数法;
[0018] 其中,所述特征选择法包括:第一特征选择法及第二特征选择法;
[0019] 针对目标电力变压器多维数据中,具有线性相关性的每两个参数数据及具有线性相关性的每两个环境气象数据,删除所述每两个参数数据中的任一参数数据,及删除所述每两个环境气象数据中的任一环境气象数据。
[0020] 可选的,所述预处理分类降维后所获得的多维数据,包括:
[0021] 采用最近邻算法,填补所述分类降维后所获得的多维数据,得到填补后的多维数据,其中,所述最近邻算法包括缺失值填补法;
[0022] 采用聚类法,将所述填补后的多维数据进行聚类,并确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据,其中,所述聚类法包括基于划分的聚类法。
[0023] 可选的,所述在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量,包括:
[0024] 在已存储的数据库中,采用动态时间规整法,获得与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量。
[0025] 可选的,所述根据所述概率值,确定出所述目标电力变压器缺陷的预测结果,包括:
[0026] 当所述概率值大于阈值时,确定所述目标电力变压器存在缺陷。
[0027] 另一方面,本发明实施例还公开了一种电力变压器缺陷的预测装置,包括:
[0028] 获取单元,用于获得第一时间段内目标电力变压器的多维数据,并对所述多维数据进行分类降维;所述多维数据包括:目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据;所述第一时间段为当前时刻之前第一预设时长的时间区间;
[0029] 处理单元,用于预处理分类降维后所获得的多维数据;
[0030] 查找单元,用于在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量;
[0031] 输入单元,用于将所述第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值;所述电力变压器缺陷预测模型为:预先根据多个采样时刻中的每个采样时刻对应的一个电力变压器设备参数数据、一个电力变压器缺陷状态值及每个采样时刻之前第二预设时长的时间区间内电力变压器缺陷总数量,进行训练获得的,每个采样时刻分别对应不同的电力变压器;
[0032] 确定单元,用于根据所述概率值,确定出所述目标电力变压器缺陷的预测结果。
[0033] 可选的,所述获取单元包括:
[0034] 分类子单元,用于按照所述多维数据随时间变化的特性,将所述多维数据分类为实时电力数据和非实时电力数据;其中,所述目标电力变压器运行时的环境气象数据为所述实时电力数据,所述目标电力变压器设备参数数据为所述非实时电力数据;
[0035] 降维子单元,用于采用特征选择法,对所述目标电力变压器运行时的环境气象数据及所述电力变压器设备参数数据进行降维。
[0036] 可选的,所述降维子单元用于:
[0037] 针对所述目标电力变压器设备参数数据,采用第一特征选择法,获得每两个参数数据之间的线性相关性;所述第一特征选择法包括:线性相关系数法、直接观察数据重复方法;
[0038] 针对所述目标电力变压器运行时的环境气象数据,采用第二特征选择法,获得每两个环境气象数据之间的线性相关性;所述第二特征选择法包括:矩阵散点图法、线性相关系数法;
[0039] 其中,所述特征选择法包括:第一特征选择法及第二特征选择法;
[0040] 针对目标电力变压器多维数据中,具有线性相关性的每两个参数数据及具有线性相关性的每两个环境气象数据,删除所述每两个参数数据中的任一参数数据,及删除所述每两个环境气象数据中的任一环境气象数据。
[0041] 可选的,所述处理单元,包括:
[0042] 填补子单元,用于采用最近邻算法,填补所述分类降维后所获得的多维数据,得到填补后的多维数据,其中,所述最近邻算法包括缺失值填补法;
[0043] 聚类子单元,用于采用聚类法,将所述填补后的多维数据进行聚类,并确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据,其中,所述聚类法包括基于划分的聚类法。
[0044] 本发明实施例提供了一种电力变压器缺陷的预测方法及装置,获得目标电力变压器的多维数据,并对多维数据进行分类降维;预处理分类降维所获得的多维数据;在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得第二时间段内所有电力变压器缺陷总数量;将第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值;根据概率值,确定出所述目标电力变压器缺陷的预测结果。
[0045] 本方案中,可以针对具体的电力变压器缺陷进行预测,在预测目标电力变压器缺陷时,根据第一时间段内的环境气象数据匹配度最高的环境气象数据获得第二时间段内所有电力变压器缺陷总数量,既考虑了目标电力变压器设备参数数据,也考虑了目标电力变压器运行时的环境气象数据,提高了预测电力变压器缺陷的准确性。附图说明
[0046] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047] 图1为本发明实施例提供的电力变压器缺陷的预测方法的一种流程图
[0048] 图2为本发明实施例提供的采用缺失值添补法填补目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据的流程图;
[0049] 图3为本发明实施例提供的采用基于划分的聚类法,聚类目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据的流程图;
[0050] 图4为本发明实施例提供的针对聚类后的每个类,确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据的流程图;
[0051] 图5为本发明实施例提供的电力变压器缺陷的预测装置的结构示意图。

具体实施方式

[0052] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053] 为了提高预测电力变压器缺陷的准确性,本发明实施例提供了一种电力变压器缺陷的预测方法及装置。
[0054] 需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0055] 下面首先对本发明实施例所提供的一种电力变压器缺陷的预测方法进行介绍。
[0056] 其中,本发明实施例所提供的一种电力变压器缺陷的预测方法应用于终端设备(例如,计算机),并且,本发明实施例所提供的一种电力变压器缺陷的预测方法的执行主体可以为一种电力变压器缺陷的预测装置。
[0057] 如图1所示,本发明实施例所提供的电力变压器缺陷的预测方法,可以包括如下步骤:
[0058] S101,获得第一时间段内目标电力变压器的多维数据,并对所述多维数据进行分类降维。
[0059] 其中,所述第一时间段为当前时刻之前第一预设时长的时间区间。
[0060] 例如,当前时刻为2017年1月24日14:00时,第一预设时长可以为24小时,则第一时间段可以为2017年1月23日14:00时至2017年1月24日14:00时之间的时间区间。
[0061] 其中,所述多维数据包括:目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据。
[0062] 目标电力变压器的数量可以为一个或者多个。终端设备可以获得一个目标电力变压器的多维数据,或者获得多个目标电力变压器的多维数据。并且,对所获得的一个目标电力变压器或者多个目标电力变压器的多维数据进行分类降维。
[0063] 其中,目标电力变压器设备参数数据中的大部分数据是离散型的数据,并且重复性较高。目标电力变压器运行时的环境气象数据为连续型的数据。所以,本发明实施例中,可以对目标电力变压器的多维数据进行分类,并且将分类后所获得多维数据进行降维。
[0064] 具体的,所述对所述多维数据进行分类降维,包括:
[0065] 按照所述多维数据随时间变化的特性,将所述多维数据分类为实时电力数据和非实时电力数据;其中,所述目标电力变压器运行时的环境气象数据为所述实时电力数据,所述电力变压器设备参数数据为所述非实时电力数据。
[0066] 采用特征选择法,对所述环境气象数据及所述电力变压器设备参数数据进行降维。
[0067] 因为目标电力变压器设备参数数据可以不随时间的变化而变化,所以目标电力变压器设备参数数据可以分类为非实时电力数据。而目标电力变压器运行时的环境气象数据可以随时间的变化而变化,可以将环境气象数据分类为实时电力数据。
[0068] 其中,目标电力变压器设备参数数据可以包括:投运日期、生产厂家、型号、制造国家、电压等级、使用环境、绝缘介质、绕组型式、结构型式、冷却方式、调压方式、额定电流短路阻抗、空载损耗、负载损耗、额定容量、中压侧容量、低压侧容量、额定频率。目标电力变压器运行时的环境气象数据可以包括:监测站点地理位置、风向、风速、阵风风向、阵风风速、降量、相对湿度温度、气压、能见度、观测时间。
[0069] 具体的,采用特征选择法,对所述环境气象数据及所述电力变压器设备参数数据进行降维,包括:
[0070] 针对所述电力变压器设备参数数据,采用第一特征选择法,获得每两个参数数据之间的线性相关性;所述第一特征选择法包括:线性相关系数法、直接观察数据重复方法。
[0071] 针对所述环境气象数据,采用第二特征选择法,获得每两个环境气象数据之间的线性相关性;所述第二特征选择法包括:矩阵散点图法、线性相关系数法。
[0072] 其中,所述特征选择法包括:第一特征选择法及第二特征选择法。
[0073] 针对具有线性相关性的每两个参数数据及具有线性相关性的每两个环境气象数据,删除所述每两个参数数据中的任一电力变压器设备参数数据,及删除所述每两个环境气象数据中的任一环境气象数据。
[0074] 本发明实施例中,可以针对所述电力变压器设备参数数据,采用线性相关系数法,或者直接观察数据重复方法,获得每两个电力变压器设备参数数据之间的线性相关性。例如,针对目标电力变压器设备参数数据中的投运日期及型号这两个参数数据,采用线性相关系数法,获得投运日期和型号这个两个参数数据的线性相关系性,如果投运日期及型号这两个参数数据具有线性相关性,则删除投运日期及型号这两个参数数据中的任一参数数据。
[0075] 例如,本发明实施例中,可以针对目标电力变压器设备参数数据:投运日期、生产厂家、型号、制造国家、电压等级、使用环境、绝缘介质、绕组型式、结构型式、冷却方式、调压方式、额定电流、短路阻抗、空载损耗、负载损耗、额定容量、中压侧容量、低压侧容量、额定频率,采用线性相关系数法或者直接观察数据重复法,计算每两个参数数据的线性相关性,并删除具有线性相关性的每两个参数数据中的任一参数数据,可以得到剩余目标电力变压器设备参数数据包括:生产厂家、电压等级、投运日期、绕组型式、冷却方式、调压方式。
[0076] 又如,可以针对目标电力变压器运行时的环境气象数据:监测站点地理位置、风向、风速、阵风风向、阵风风速、降水量、相对湿度、温度、气压、能见度、观测时间,采用矩阵散点图法或者线性相关系数法,计算每两个环境气象数据的线性相关性,并删除具有线性相关性的每两个环境气象数据中的任一环境气象数据,可以得到剩余的目标电力变压器运行时的环境气象数据包括:监测站点地理位置、风向、风速、阵风风向、阵风风速、降水量、温度、气压及观测时间。
[0077] 其中,采用线性相关系数法,计算每两个参数数据的线性相关性及每两个环境气象数据的线性相关性属于现有技术,此处不再赘述。
[0078] 需要说明的是,计算每两个参数数据的线性相关性及每两个环境气象数据的线性相关性的过程,还可以采用其他现有技术,此处不再赘述。
[0079] S102,预处理分类降维后所获得的多维数据。
[0080] 由于目标电力变压器设备参数数据中的大部分数据为离散型数据,目标电力变压器运行时的环境气象数据为连续型数据。在对目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据分类降维后,可以对分类降维后的目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据进行处理。
[0081] 具体的,所述预处理分类降维后所获得的多维数据,包括:
[0082] 采用最近邻算法,填补所述分类降维后所获得的多维数据,得到填补后的多维数据,其中,所述最近邻算法包括缺失值填补法。
[0083] 采用聚类法,将所述填补后的多维数据进行聚类,并确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据,其中,所述聚类法包括基于划分的聚类法。
[0084] 本发明实施例中,可以采用缺失值添补法,对分类降维后所获得的目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据中离散型数据及连续型数据进行填补。其中,如图2所示,采用缺失值添补法填补目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据的步骤可以包括:
[0085] S201,针对分类降维后所获的目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据,在任一样本数据中选择包含缺失数据的样本数据作为目标样本数据;
[0086] 其中,任一样本数据可以为第一时间段内任一时刻所对应的目标电力变压设备参数数据或者目标电力变压器运行时的环境气象数据。包含缺失数据的样本数据可以为目标电力变压设备参数数据或者目标电力变压器运行时的环境气象数据中缺少至少一个参数数据的样本数据。例如,目标样本数据可以为包含生产厂家、电压等级、投运日期、绕组型式及冷却方式的目标电力变压设备参数数据,这里,缺少了调压方式这一参数数据。又例如,目标样本数据可以为包含监测站点地理位置、风向、风速、阵风风向、阵风风速、降水量及温度目标电力变压器运行时的环境气象数据,这里,缺少了气压及观测时间这两个环境气象数据。
[0087] S202,针对目标电力变压设备参数数据,计算目标样本数据与非目标样本数据之间的欧氏距离值。
[0088] 其中,非目标样本数据为所有目标样本数据中,除了目标样本数据外的其他样本数据。例如,针对目标电力变压设备参数数据,在确定目标样本数据后,计算目标样本数据与其他样本数据的值,得到至少一个欧氏距离值。其中,计算目标样本数据与其他样本数据的欧氏距离值的过程,可以采用现有技术,此处不再赘述。
[0089] S203,在至少一个欧氏距离值中,选择第一预设个数欧氏距离值,并确定第一预设个数欧氏距离值对应的第一预设个数样本数据。
[0090] 其中,预设个数欧氏距离值为至少一个欧氏距离值中的欧氏距离值最接近的值。
[0091] 例如,至少一个欧氏距离值包括:a1、a2、a3、a4、a5、a6、a7、a8、a9及a10,第一预设个数K为3,则在10个欧氏距离值中选择3个最接近欧式距离值。
[0092] S204,若目标样本数据中缺失数据为离散型数据时,计算该缺失数据在每个第一预设个数样本数据中对应数据的加权得分值,将加权得分值最高的数据填补到目标样本数据中的缺失数据。
[0093] 判断目标样本数据中缺失数据是否为离散型数据,当缺失数据为离散型数据时,计算该缺失数据在每个第一预设个数样本数据中对应数据的加权得分值,将加权得分值最高的数据填补到目标样本数据中的缺失数据。
[0094] S205,若目标样本数据中缺失数据为连续型数据时,则计算该缺失数据在每个第一预设个数样本数据中对应数据的加权得分值的平均值,将该平均值填补到目标样本数据中的缺失数据。
[0095] 当目标样本数据中缺失数据不是离散型数据时,则判定该缺失数据为连续型数据。
[0096] 进一步,根据公式: 计算目标样本数据中的缺失数据在每个第一预设个数样本数据中对应数据的加权得分。其中,wi为加权得分值,d(i)为目标样本与第i个第一预设个数样本数据的欧氏距离值。
[0097] 本发明实施例中,采用缺失值添补法,对分类降维后所获得的目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据进行填补后,可以采用基于划分的聚类法,对目标电力变压器多维数据进行聚类,并确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据。其中,如图3所示,采用基于划分的聚类法,聚类目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据的步骤可以包括:
[0098] S301,获取第一时间段内第二预设个数时刻的目标电力变压器设备参数数据或者目标电力变压器运行时的环境气象数据,将第二预设个数时刻中每个时刻的目标电力变压器设备参数数据或者目标电力变压器运行时的环境气象数据确定为聚类中心,得到第二预设个数聚类中心。
[0099] 本发明实施例中,可以在第一时间内任一选择第二预设个数时刻的目标电力变压器的多维数据,并将每个时刻的目标电力变压器的多维数据作为聚类中心。需要强调的是,分别采用基于划分的聚类法,对目标电力变压器设备参数数据和目标电力变压器运行时的环境气象数据进行聚类,得到目标电力变压器设备参数数据的聚类中心和目标电力变压器运行时的环境气象数据聚类中心。
[0100] S302,计算第一时间段内任一时刻的目标电力变压器设备参数数据或者目标电力变压器运行时的环境气象数据与每个聚类中心的欧氏距离值,并将任一时刻的目标电力变压器设备参数数据或者目标电力变压器运行时的环境气象数据归类至最小欧氏距离值所对应的聚类中心。
[0101] 分别针对目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据,计算第一时间段内任一时刻的目标电力变压器设备参数数据与目标电力变压器设备参数数据的每个聚类中心的欧氏距离值,确定最小欧氏距离值,并将该时刻目标电力变压器设备参数数据归类至该最小欧氏距离值所对应的聚类中心所在的类,及计算第一时间段内任一时刻的目标电力变压器运行时的环境气象数据与目标电力变压器运行时的环境气象数据的每个聚类中心的欧氏距离值,确定最小欧氏距离值,并将该时刻目标电力变压器运行时的环境气象数据归类至该最小欧氏距离值所对应的聚类中心所在的类。
[0102] S303,获取每个聚类中心所在类内的每个样本数据在欧氏空间的坐标值,计算每个聚类中心所在类内所有样本数据的坐标值的平均值,将该平均值确定为该聚类中心所在类内的聚类中心。其中,样本数据为任一时刻的目标电力变压器设备参数数据或者目标电力变压器运行时的环境气象数据。
[0103] 针对聚类后每个类内的所有样本数据,每个样本数据对应欧氏空间的一个坐标值,计算一个类内所有样本数据的坐标值的平均值。这样,将该平均值作为新的聚类中心。这样,对每个类内的聚类中心进行了更新。
[0104] S304,迭代执行S302和S303,直到两次迭代的所获得聚类中心相同时,确定对目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据聚类完成。
[0105] S305,在对目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据聚类完成之后,针对聚类后的每个类,确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据。
[0106] 如图4所示,本发明实施例中,针对聚类后的每个类,确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据的具体步骤可以包括:
[0107] S401,针对聚类后的每个类,计算类内的各样本数据到该类内的聚类中心的欧氏距离值的平均值,该平均值可以表示为Di-avg。
[0108] S402,统计与类内的聚类中心的欧氏距离值大于平均值Di-avg的样本个数的第一百分比Pg,以及统计与类内的聚类中心的欧氏距离值小于或者等于平均值Di-avg的样本个数的第二百分比Pl。
[0109] S403,当|Pg-Pl|>10%时,则将每个类内,距离聚类中心的欧氏距离值大于预设距离的样本数据删除;当|Pg-Pl|≤10%时,针对其他聚类中心所在的类,删除与聚类中心的距离大于预设距离的多维数据,直至遍历所有聚类中心所在的类。
[0110] S103,在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量。
[0111] 数据库中已经存储了目标电力变压器运行时的环境气象数据,可以查找与第一时间段内的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据,获得匹配度最高的环境气象数据所对应的第二时间段,并且在数据库中获得再第二时间段内所有电力变压器缺陷的总数量。可见,由第一时间段内目标电力变压器运行时的环境气象数据,得到第二时间段内的所有电力变压器缺陷的总数量,将目标电力变压器运行时的环境气象数据考虑到预测目标电力变压器缺陷的过程中,增加了预测目标电力变压器缺陷过程中的影响因素,提高预测目标电力变压器缺陷的准确性。
[0112] 具体的,所述在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量,包括:
[0113] 在已存储的数据库中,采用动态时间规整法,获得与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量。
[0114] 本发明实施例中,动态时间规整法可以衡量两个时间段内的环境气象数据之间相似度的方法。在确定第一时间段内的目标电力变压器运行时的环境气象数据时,采用动态时间规整法,分别计算第一时间段内的目标电力变压器运行时的环境气象数据与已存储的数据库中的各时间段内的环境气象数据的相似度,将与第一时间段内环境气象数据的相似度最高的环境气象数据所对应的时间段作为第二时间段,并获取第二时间段内的所有电力变压器的缺陷总数。
[0115] 例如,第一时间段可以为2016年1月2日0点至2016年1月8日24点,在数据库中查找获得2015年3月2日0点至2015年3月8日24点的环境气象数据与第一时间段内的环境气象数据的匹配度最高,则可以将2015年3月2日0点至2015年3月8日24点的时间段作为第二时间段,并获得该第二时间段内所有电力变压器缺陷总数量。其中,电力变压器缺陷可以用数值“0”或“1”来表示,数值“0”可以表示电力变压器不存在缺陷,数值“1”可以表示电力变压器存在缺陷。
[0116] S104,将所述第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值。
[0117] 每个电力变压器在第二时间段内可以出现缺陷,也可以不出现缺陷。每个电力变压器在第二时间段内出现缺陷或者不出现缺陷的情况已经在数据库中有记录。所以统计每个电力变压器在第二时间段内是否出现缺陷,并获得第二时间段内所有电力变压器出现缺陷的总数量。同时,将该总数量及预处理所获得的目标电力变压器设备参数数据输入至已经训练的电力变压器缺陷预测模型,使得该电力变压器缺陷预测模型输出目标电力变压器缺陷的概率值。
[0118] 其中,所述电力变压器缺陷预测模型为:预先根据多个采样时刻中的每个采样时刻对应的一个电力变压器设备参数数据、一个电力变压器缺陷状态值及每个采样时刻之前第二预设时长的时间区间内电力变压器缺陷总数量,进行训练获得的,每个采样时刻分别对应不同的电力变压器。
[0119] 本发明实施例中,可以选择预设数量的采样时刻,针对每个采样时刻,任一选择一个电力变压器,并获得该电力变压器设备参数数据及缺陷状态值。其中,电力变压器的缺陷状态值可以表示为“0”或者“1”。“0”可以表示电力变压器在对应采样时刻不存在缺陷,“1”可以表示电力变压器在对应采样时刻存在缺陷。同时,获得每个采样时刻之前的第二预设时长的时间区间内电力变压器缺陷总数量,也就是获得每个采样时刻之前的第二预设时长的时间区间内电力变压器缺陷状态值为“1”的总数量。例如,选择100个采样时刻,针对第5个采样时刻,选择电力变压器A,并获得电力变压器A设备参数数据及缺陷状态值。第5采样时刻可以为2014年2月3日0点,第二预设时长的时间区间可以为第5采样时刻之前的一周,即第二预设时长的时间区间可以为2014年1月27日0点2014年2月2日24点。其中,针对预设数量的采样时刻,采用逻辑回归算法,对每个采样时刻的电力变压器设备参数数据及缺陷状态值以及第二预设时长的时间区间内的电力变压器缺陷总数量进行训练,获得电力变压器缺陷预测模型。
[0120] S105,根据所述概率值,确定出所述目标电力变压器缺陷的预测结果。
[0121] 在将第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据输入至电力变压器缺陷预测模型后,得到该电力变压器缺陷预测模型输出的目标电力变压器缺陷的概率值,该概率值可以作为判定目标电力变压器是否存在缺陷的预测结果,或者判定目标电力变压器在未来某一时间段内发生缺陷的预测结果。
[0122] 具体的,所述根据所述概率值,确定出所述目标电力变压器缺陷的预测结果,包括:
[0123] 当所述概率值大于阈值时,确定所述目标电力变压器存在缺陷。
[0124] 当概率值大于阈值时,可以判定目标电力变压器未来某一段时间内发生缺陷的可能性较大,需要对目标电力变压器进行检修。
[0125] 其中,可以根据电力变压器所处的实际环境或者运行情况,变更阈值的大小。当概率值小于阈值时,可以确定目标电力变压器在未来某一段时间内发生缺陷的可能性非常小,或者可以确定目标电力变压器在未来某一段时间内不发生缺陷。
[0126] 本发明实施例中,可以针对目标电力变压器,获得目标电力变压器在第一时间段内的环境气象数据匹配度最高的环境气象数据获得第二时间段内所有电力变压器缺陷总数量,将第二时间段内所有电力变压器缺陷总数量和目标电力变压器设备参数数据,输入到电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值。可见,本方案中,既考虑了目标电力变压器设备参数数据,也考虑了目标电力变压器运行时的环境气象数据,提高了预测电力变压器缺陷的准确性。
[0127] 相应于上述电力变压器缺陷的预测方法实施例,本发明实施例还提供了一种电力变压器缺陷的预测装置,如图5所示,该装置500可以包括:
[0128] 获取单元510,用于获得第一时间段内目标电力变压器的多维数据,并对所述多维数据进行分类降维;所述多维数据包括:目标电力变压器设备参数数据及目标电力变压器运行时的环境气象数据;所述第一时间段为当前时刻之前第一预设时长的时间区间。
[0129] 处理单元520,用于预处理分类降维后所获得的多维数据。
[0130] 查找单元530,用于在已存储的数据库中,查找与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量。
[0131] 输入单元540,用于将所述第二时间段内所有电力变压器缺陷总数量,及预处理所获得的目标电力变压器设备参数数据,输入至电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值;所述电力变压器缺陷预测模型为:预先根据多个采样时刻中的每个采样时刻对应的一个电力变压器设备参数数据、一个电力变压器缺陷状态值及每个采样时刻之前第二预设时长的时间区间内电力变压器缺陷总数量,进行训练获得的,每个采样时刻分别对应不同的电力变压器。
[0132] 确定单元550,用于根据所述概率值,确定出所述目标电力变压器缺陷的预测结果。
[0133] 可选的,所述获取单元510包括:
[0134] 分类子单元511,用于按照所述多维数据随时间变化的特性,将所述多维数据分类为实时电力数据和非实时电力数据;其中,所述目标电力变压器运行时的环境气象数据为所述实时电力数据,所述电力变压器设备参数数据为所述非实时电力数据。
[0135] 降维子单元512,用于采用特征选择法,对所述目标电力变压器运行时的环境气象数据及所述电力变压器设备参数数据进行降维。
[0136] 可选的,所述降维子单元512用于:
[0137] 针对所述目标电力变压器设备参数数据,采用第一特征选择法,针对目标电力变压器,获得每两个参数数据之间的线性相关性;所述第一特征选择法包括:线性相关系数法、直接观察数据重复方法。
[0138] 针对所述目标电力变压器运行时的环境气象数据,采用第二特征选择法,获得每两个环境气象数据之间的线性相关性;所述第二特征选择法包括:矩阵散点图法、线性相关系数法。
[0139] 其中,所述特征选择法包括:第一特征选择法及第二特征选择法。
[0140] 针对目标电力变压器多维数据中,具有线性相关性的每两个参数数据及具有线性相关性的每两个环境气象数据,删除所述每两个参数数据中的任一参数数据,及删除所述每两个环境气象数据中的任一环境气象数据。
[0141] 可选的,所述处理单元520,包括:
[0142] 填补子单元521,用于采用最近邻算法,填补所述分类降维后所获得的多维数据,得到填补后的多维数据,其中,所述最近邻算法包括缺失值填补法。
[0143] 聚类子单元522,用于采用聚类法,将所述填补后的多维数据进行聚类,并确定每类的聚类中心,删除与所述聚类中心的距离大于预设距离的多维数据,其中,所述聚类法包括基于划分的聚类法。
[0144] 可选的,所述查找单元530,具体用于在已存储的数据库中,采用动态时间规整法,获得与所述第一时间段内,预处理后的目标电力变压器运行时的环境气象数据匹配度最高的环境气象数据所对应的第二时间段,并获得所述第二时间段内所有电力变压器缺陷总数量。
[0145] 可选的,所述确定单元550,具体用于当所述概率值大于阈值时,确定所述目标电力变压器存在缺陷。
[0146] 本发明实施例中,可以针对目标电力变压器,获得目标电力变压器在第一时间段内的环境气象数据匹配度最高的环境气象数据获得第二时间段内所有电力变压器缺陷总数量,将第二时间段内所有电力变压器缺陷总数量和目标电力变压器设备参数数据,输入到电力变压器缺陷预测模型,得到目标电力变压器缺陷的概率值。可见,本方案中,既考虑了目标电力变压器设备参数数据,也考虑了目标电力变压器运行时的环境气象数据,提高了预测电力变压器缺陷的准确性。
[0147] 对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0148] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0149] 本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0150] 以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
相关专利内容
标题 发布/更新时间 阅读量
缺陷检查方法 2020-05-12 222
去除缺陷的方法 2020-05-12 108
缺陷检查系统 2020-05-13 806
缺陷检测装置、缺陷检测系统及缺陷检测方法 2020-05-12 776
缺陷检测机 2020-05-11 411
耐缺陷冗余 2020-05-11 342
缺陷检测方法 2020-05-13 522
AGSE缺陷菌株 2020-05-11 605
缺陷分析仪 2020-05-11 989
级联缺陷检查 2020-05-12 581
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈