首页 / 专利库 / 资料储存系统 / 挖矿 / 数据挖掘 / 一种基于大数据挖掘的用户专用变压器用电监测方法

一种基于大数据挖掘的用户专用变压器用电监测方法

阅读:1022发布:2020-08-19

专利汇可以提供一种基于大数据挖掘的用户专用变压器用电监测方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于 大数据 挖掘的用户专用 变压器 用电监测方法,包括如下步骤:从计量系统中获取待检测的专用变压器每个 相位 上的 电流 数据集进行数据预处理;画出相应的电流曲线,根据电流曲线分析电流大小是否合理,若发现电流存在不合理的情况,则找出不合理情况区域以及该区域对应的时间段;以设定的时间 节点 为单位分割监测数据,计算每相电流之间的相关系数,以时间节点和相关系数为两个变量建立坐标轴,画出相关系数的变化曲线;根据相关系数的变化曲线画出专用变压器计量电流的健康度柱形图;分析判断专用变压器的用电状态。该方法能减轻人工实地检查负担,并为检测专用变压器的计量装置工作状态和可能存在的窃电现象识别提供 支撑 。,下面是一种基于大数据挖掘的用户专用变压器用电监测方法专利的具体信息内容。

1.一种基于大数据挖掘的用户专用变压器用电监测方法,其特征在于,包括如下步骤:
S1:从计量系统中获取待检测的专用变压器每个相位上的电流数据集进行数据预处理,所述数据预处理包括删除数据集中的无关数据、处理数据集中的缺失数据和异常数据;
S2:根据处理后的电流数据集,在以专用变压器被监测的时间点和电流大小为两个变量建立坐标轴,画出相应的电流曲线,根据电流曲线分析电流大小是否合理,若发现电流存在不合理的情况,则找出不合理情况区域以及该区域对应的时间段;
S3:以设定的时间节点为单位分割监测数据,根据设定的公式计算每相电流之间的相关系数,以时间节点和相关系数为两个变量建立坐标轴,画出相关系数的变化曲线;
S4:根据相关系数的变化曲线画出专用变压器计量电流的健康度柱形图;
S5:结合健康度柱形图、相关系数的变化曲线和电流曲线分析判断专用变压器电能计量的状态。
2.如权利要求1所述的一种基于大数据挖掘的用户专用变压器用电监测方法,其特征在于,所述处理数据集中的缺失数据的方法包括删除记录、数据插补和不处理。
3.如权利要求2所述的一种基于大数据挖掘的用户专用变压器用电监测方法,其特征在于,所述数据插补可采用均值/中位数/众数插补、固定值插补、最近临数值插补、回归方法和插值法,所述均值/中位数/众数插补是根据数据集的平均数或中位数或众数进行插补;所述固定值插补是将缺失的数据用一个固定常量替换;所述最近临数值插补是在数据集中找到与缺失数据最接近的数据值进行插补,所述回归方法是根据已有数据建立拟合模型预测缺失的数据;所述插值法是根据已有数据建立插值函数,缺失数据由对应点求出近似的函数值替代。
4.如权利要求2所述的一种基于大数据挖掘的用户专用变压器用电监测方法,其特征在于,所述异常数据处理方法包括删除含有异常值的记录、视为缺失值和平均值修正,所述删除含有异常数据的记录是指直接将含有异常值的记录删除,所述视为缺失数据是指将异常数据视为缺失数据,利用缺失数据的处理方法进行处理,所述平均值修正是指利用异常数据前后两个数据的平均值修正该异常数据。
5.如权利要求1所述的一种基于大数据挖掘的用户专用变压器用电监测方法,其特征在于,所述相关系数的计算公式为:
式中:ρ代表所求相关系数,Im,In分别为相邻相位上的电流集,cov(Im,In)分别表示Im,In的协方差,var(Im)var(In)分别表示Im,In的方差。
6.如权利要求5所述的一种基于大数据挖掘的用户专用变压器用电监测方法,其特征在于,所述专用变压器计量电流的健康度的计算公式包括:
对于只安装A、C两相电流互感器的专用变压器,其健康度的计算公式如下:
对于A、B、C三相都安装电流互感器的专用变压器,其健康度的计算公式如下:
式中,H代表所求电流的健康度,IA、IB、IC分别代表A、B、C相位上的电流,i=1,2,3……,N。

说明书全文

一种基于大数据挖掘的用户专用变压器用电监测方法

技术领域

[0001] 本发明涉及电系统领域,尤其是涉及一种基于大数据挖掘的用户专用变压器用电监测方法。

背景技术

[0002] 目前,很多供电公司需要通过现场用电检查去发现用户专用变压器可能存在的计量故障、窃电现象,但是这种方法需要耗费大量的人力物力和财力,且很难以及时发现相关的问题,少计、漏计电量影响供电公司的收益。
[0003] 为了及时准确地监控用户专用变压器的计量状态并及时发现可能存在的用户窃电现象,可以利用大数据挖掘技术对用户专用变压器附近装设的计量设备采集到的数据进行挖掘,判断专用变压器的用电计量状况,及时发现计量异常。

发明内容

[0004] 本发明所要解决的技术问题是针对现有技术存在的问题提供一种基于大数据挖掘的用户专用变压器用电监测方法。
[0005] 本发明解决上述技术问题所采用的技术方案为:一种基于大数据挖掘的专用变压器用电监测方法,其特征在于,包括如下步骤:
[0006] S1:从计量系统中获取待检测的专用变压器每个相位上的电流数据集进行数据预处理,所述数据预处理包括删除数据集中的无关数据、处理数据集中的缺失数据和异常数据;
[0007] S2:根据处理后的电流数据集,在以专用变压器被监测的时间点和电流大小为两个变量建立坐标轴,画出相应的电流曲线,根据电流曲线分析电流大小是否合理,若发现电流存在不合理的情况,则找出不合理情况区域以及该区域对应的时间段;
[0008] S3:以设定的时间节点为单位分割监测数据,根据设定的公式计算每相电流之间的相关系数,以时间节点和相关系数为两个变量建立坐标轴,画出相关系数的变化曲线;
[0009] S4:根据相关系数的变化曲线画出专用变压器计量电流的健康度柱形图;
[0010] S5:结合健康度柱形图、相关系数的变化曲线和电流曲线分析判断专用变压器电能计量的状态。
[0011] 进一步地,所述处理数据集中的缺失数据的方法包括删除记录、数据插补和[0012] 不处理。
[0013] 进一步地,所述数据插补可采用均值/中位数/众数插补、固定值插补、最近临数值插补、回归方法和插值法,所述均值/中位数/众数插补是根据数据集的平均数或中位数或众数进行插补;所述固定值插补是将缺失的数据用一个固定常量替换;所述最近临数值插补是在数据集中找到与缺失数据最接近的数据值进行插补,所述回归方法是根据已有数据建立拟合模型预测缺失的数据;所述插值法是根据已有数据建立插值函数,缺失数据由对应点求出近似的函数值替代。
[0014] 进一步地,所述异常数据处理方法包括删除含有异常值的记录、视为缺失值和平均值修正,所述删除含有异常数据的记录是指直接将含有异常值的记录删除,所述视为缺失数据是指将异常数据视为缺失数据,利用缺失数据的处理方法进行处理,所述平均值修正是指利用异常数据前后两个数据的平均值修正该异常数据。
[0015] 进一步地,所述相关系数的计算公式为:
[0016]
[0017] 式中:ρ代表所求相关系数,Im,In分别为相邻相位上的电流集,cov(Im,In)分别表示Im,In的协方差,var(Im)var(In)分别表示Im,In的方差。
[0018] 进一步地,所述专用变压器计量电流的健康度的计算公式包括:
[0019] 对于只安装A、C两相电流互感器的专用变压器,其健康度的计算公式如下:
[0020]
[0021] 对于A、B、C三相都安装电流互感器的专用变压器,其健康度的计算公式如下:
[0022]
[0023] 式中,H代表所求电流的健康度,IA、IB、IC分别代表A、B、C相位上的电流,i=1,2,3……,N。
[0024] 与现有技术相比,本发明的有益效果如下:该方法能减轻人工实地检查负担,实现远程控制,并为检测专用变压器的用电计量状态和可能存在的窃电现象识别提供支撑,节省了人力资源的和财力,通过远程监控分析能及时发现专用变压器计量装置的故障或存在的问题,而且能实时掌握用电情况,且通过快速的运算能更准确的确定故障原因,即使派人员检查。附图说明
[0025] 图1为一种基于大数据挖掘的专用变压器用电监测方法的流程图
[0026] 图2为实施例一中的电流变化图。
[0027] 图3为图2左侧的放大图。
[0028] 图4为图2中侧的放大图。
[0029] 图5为图2右侧的放大图。
[0030] 图6为实施例一中的专变电流散点及频数图。
[0031] 图7为实施例一中的电流相关系数变化趋势图。
[0032] 图8为实施例一中的电流健康度柱状图。
[0033] 图9为实施例二中的的电流变化图。
[0034] 图10为图9左侧的放大图。
[0035] 图11为图9中侧的放大图。
[0036] 图12为图9右侧的放大图。
[0037] 图13为实施例二中的专变电流散点及频数图。
[0038] 图14为实施例二中的电流相关系数变化趋势图。
[0039] 图15为实施例三中的的电流变化图。
[0040] 图16为图15左侧的放大图。
[0041] 图17为图15中侧的放大图。
[0042] 图18为图15右侧的放大图。
[0043] 图19为实施例三中的专变电流散点及频数图。
[0044] 图20为实施例三中的电流相关系数变化趋势图。

具体实施方式

[0045] 以下结合附图实施例对本发明作进一步详细描述。
[0046] 如图1所示,一种基于大数据挖掘的专用变压器用电监测方法,包括步骤如下:
[0047] S1:从计量系统中获取待检测的专用变压器每个相位上的电流数据集进行数据预处理,所述数据预处理包括删除数据集中的无关数据、处理数据集中的缺失数据和异常数据;
[0048] S2:根据处理后的电流数据集,在以专用变压器被监测的时间点和电流大小为两个变量建立坐标轴,画出相应的电流曲线,根据电流曲线分析电流大小是否合理,若发现电流存在不合理的情况,则找出不合理情况区域以及该区域对应的时间段;
[0049] S3:以设定的时间节点为单位分割监测数据,根据设定的公式计算每相电流之间的相关系数,以时间节点和相关系数为两个变量建立坐标轴,画出相关系数的变化曲线;
[0050] S4:根据相关系数的变化曲线画出专用变压器计量电流的健康度柱形图;
[0051] S5:结合健康度柱形图、相关系数的变化曲线和电流曲线分析判断专用变压器电能计量的状态。
[0052] 在本实施例中,从计量系统中获取的专用变压器电流数据为A、B、C三相电流数据或A、C两项电流数据。
[0053] 处理数据集中的缺失数据的方法可以分为三类:删除记录、数据插补和不处理。其中常用的数据插补方法有均值/中位数/众数插补,根据数据集的平均数或中位数或众数进行插补;固定值插补,固定值插补是将缺失的数据用一个固定常量替换;最近临数值插补,最近临数值插补是在数据集中找到与缺失数据最接近的数据值进行插补;回归方法,回归方法是根据已有数据建立拟合模型预测缺失的数据;插值法,插值法是根据已有数据建立插值函数,缺失数据由对应点求出近似的函数值替代。
[0054] 本申请主要使用拉格朗日插值法和顿插值法进行插值填补空数据,其中[0055] 拉格朗日插值法:根据数学知识可知,对于平面上已知的n个点可以找到一个n-1次多项式,使此多项式曲线过这n个点。
[0056] 求已知的过n个点的n-1次多项式
[0057] y=a0+a1x+a2x2+…+an-1xn-1
[0058] 将n个点的坐标(x1,y1),(x2,y2),…,(xn,yn)代入多项式,可以得到
[0059]
[0060]
[0061]
[0062]
[0063] 解出拉格朗日插值多项式为:
[0064]
[0065] 上述式中的a为多项式系数,i=j=1,2,3……,n。
[0066] 将缺失的数据值对应的点x代入插值多项式得到缺失值的近似值L(x)。
[0067] 拉格朗日插值公式结构紧凑,在理论分析中很方便,但是当插值节点增减时,插值多项式就会随之变化。
[0068] 牛顿插值法:求已知的n个点对(x1,y1),(x2,y2),…,(xn,yn)的所有阶差商公式[0069]
[0070]
[0071]
[0072]
[0073]
[0074] 联立以上差商公式建立如下插值多项式f(x)
[0075] f(x)=f(x1)+(x-x1)f[x2,x1]+(x-x1)(x-x2)f[x3,x2,x1]+
[0076] (x-x1)(x-x2)(x-x3)f[x4,x3.x2,x1]+…+
[0077] (x-x1)(x-x2)…(x-xn-1)f[xn,xn-1,…,x2,x1]+
[0078] (x-x1)(x-x2)…(x-xn)f[xn,xn-1,…,x2,x1]
[0079] =P(x)+R(x)
[0080] 式中:
[0081] P(x)=f(x1)+(x-x1)f[x2,x1]+(x-x1)(x-x2)f[x3,x2,x1]+
[0082] (x-x1)(x-x2)(x-x3)f[x4,x3.x2,x1]+…+
[0083] (x-x1)(x-x2)…(x-xn-1)f[xn,xn-1,…,x2,x1]
[0084] R(x)=(x-x1)(x-x2)…(x-xn)f[xn,xn-1,…,x2,x1]
[0085] P(x)是牛顿插值逼近函数;R(x)是误差函数。将缺失的函数值对应的点x代入插值多项式即可得到缺失值的近似值f(x)。
[0086] 在数据预处理时,异常值是否剔除,需视具体情况而定,因为有些异常值可能蕴含着有用的信息。
[0087] 异常数据处理方法包括删除含有异常值的记录、视为缺失值和平均值修正,所述删除含有异常数据的记录是指直接将含有异常值的记录删除,所述视为缺失数据是指将异常数据视为缺失数据,利用缺失数据的处理方法进行处理,所述平均值修正是指利用异常数据前后两个数据的平均值修正该异常数据。
[0088] 将含有异常值的记录直接删除这种方法简单易行,但缺点也很明显。在观测值很少的情况下,删除会造成样本量不足,可能会改变变量的原有分布,从而造成分析结果的不准确。视为缺失值处理的好处是可以利用现有变量的信息,对异常值进行填补。在很多情况下,分析异常值出现的可能原因,判断异常值是否应该舍弃,如果是正确的数据,可以直接在具有异常值的数据集上进行数据分析。
[0089] 本实施例中专用变压器的电流大小是一组时间序列,其时间采样间隔设定为15分钟,一天中共96个采集点。
[0090] 时间序列的变化受许多因素的影响,有些起着长期的、决定性的作用,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。
[0091] 在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去做精确分析但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。
[0092] 影响时间序列的构成因素可归纳为以下四种:
[0093] 1)趋势性,指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。这一变化通常是许多长期因素的结果;
[0094] 2)周期性,指时间序列表现为循环于趋势线上方和下方的点序列并持续一段时间以上的有规则变动。这种因素具有周期性的变动,比如高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增趋势线的上下方;
[0095] 3)季节性变化,指现象受季节性影响,按一固定周期呈现出的周期波动变化。尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日电量数据表现出为期1天的“季节性”变化,即高峰期有功功率到达高峰平,而其他时期有功功率较小,从午夜到次日清晨最小;
[0096] 4)不规则变化,指现象受偶然因素的影响而呈现出不规则波动。这种因素包括时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。不规则因素是由短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。时间序列一般是以上几种变化形式的叠加或组合出现。
[0097] 根据不同的标准,时间序列有不同的分类方法,常用的标准及分类方法有:
[0098] 1)按所研究对象的多少来分,有一元时间序列和多元时间序列。
[0099] 2)按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种;如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列;如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。
[0100] 3)按序列的统计特性分,有平稳时间序列和非平稳时间序列两类。所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。平稳序列的时序图直观上应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征;相对地,时间序列的非平稳性,是指时间序列的统计规律随着时间的推移而发生变化。
[0101] 4)按序列的分布规律分,有高斯型和非高斯型时间序列两类。
[0102] 本实施例中,以天为单位分割监测数据,计算每相电流之间的相关系数并画出相关系数的变化曲线以及专变计量电流健康度柱形图。
[0103] 建立电流检测矩阵:
[0104]
[0105] 式中:N为采样点的个数。
[0106] 计算A、B、C三相电流之间的相关系数的计算公式如下:
[0107]
[0108]
[0109]
[0110] 式中:ρ代表所求相关系数,cov(IA,IB)、cov(IA,IC)、cov(IB,IC)分别表示IA、IB、IC的协方差,var(IA)、var(IB)、var(IC)分别表示IA、IB、IC的方差。
[0111] 专用变压器计量电流的健康度的计算公式如下:
[0112] 对于只安装A、C两相电流互感器的专用变压器,其健康度的计算公式如下:
[0113]
[0114] 对于A、B、C三相都安装电流互感器的专用变压器,其健康度的计算公式如下:
[0115]
[0116] 式中,H代表所求电流的健康度,IA、IB、IC分别代表A、B、C相位上的电流,i=1,2,3……,N。
[0117] 实施例一:
[0118] 专用变压器的数据采集时间为同年的9月1日00:00至11月10日23:45,理论每隔15分钟为1个采样点,实际共6675个采样点,共有A、B、C三相的电流数据,其变化趋势如图2、3、4、5所示,其中图3、4、5分别是图2位于左侧、中侧和右侧的局部放大图,可以从图3中看出刚开始A、B、C三相电流的大小基本上是同趋势变化的,在图4中A相电流突然发生了转变,在图
5中A相电流又恢复正常的大小,与B、C相电流同趋势变化,为了更好地分析专用变压器可能存在的故障或窃电情况,画出专用变压器A、B、C三相电流变化的散点图、频数图,如图6所示,以一天为时间窗口画出A、B、C三相电流的相关系数变化趋势如图7所示。
[0119] 结合图6和图7可以看出,B、C两相电流的相关系数一直很高并且接近于1,而A相电流与B相电流、A相电流与C相电流在第25-56天左右数值均很低并且接近于-1,故可判断该专用变压器在中途可能发生了A相接线接反的故障,并在第56天左右修复了该故障。从专变计量电流健康度柱状图,即图8中可以看出:在9月23日之前该专用变压器的计量电流健康度一直很高,9月24日至10月28日该专用变压器的计量电流健康度为负值,10月29日之后该专用变压器的计量电流健康度又恢复到较高数值,据此可以判断该专用变压器在2016年9月24日至2016年10月28日发生了不正常的运行状态,如果以天为单位进行检测,采用本发明的方法可以在9月24日当天的数据采集完成后及时发现。
[0120] 实施例二:
[0121] 专用变压器的数据采集时间为同年的5月17日00:00至6月10日23:45,理论每隔15分钟为1个采样点,实际共2272个采样点,共有A、B、C三相的电流数据,其变化趋势如图9、10、11、12所示,其中图10、11、12分别是图9位于左侧、中侧和右侧的局部放大图,可以从图
10中看出刚开始A、B、C三相电流的大小基本上是同趋势变化的,在图11中C相电流突然变成了0,在图12中A相电流又恢复正常的大小,与A、B相电流同趋势变化,为了更好地分析专用变压器可能存在的故障或窃电情况,画出专用变压器A、B、C三相电流变化的散点图、频数图,如图13所示,以一天为时间窗口画出A、B、C三相电流的相关系数变化趋势如图14所示。
[0122] 结合图13和图14可以看出,A、B两相电流的相关系数一直很高并且接近于1,而C相电流与A相电流、C相电流与B相电流在第12-18天左右数值均很低并且接近于0,故可判断该专用变压器在中途可能发生了C相接线脱落的故障,并在第18天左右修复了该故障。
[0123] 实施例三:
[0124] 专用变压器的数据采集时间为同年4月1日00:00至5月31日23:45,理论每隔15分钟为1个采样点,实际共5855个采样点,共有A、B、C三相的电流数据,其变化趋势如图15、16、17、18所示,其中图16、17、18分别是图15位于左侧、中侧和右侧的局部放大图。可以从图16中看出刚开始B相电流与A、C两相电流的大小相差很大,在图17和图18中B相电流又恢复正常的大小并基本同趋势变化,为了更好地分析专用变压器可能存在的故障或窃电情况,画出专用变压器A、B、C三相电流变化的散点图、频数图,如图19所示,以一天为时间窗口画出A、B、C三相电流的相关系数变化趋势如图20所示。
[0125] 结合图16、19和图20可以看出,B相电流与A、C两相电流虽然刚开始数值相差很大,但是其相关系数也很高并且接近于1,因此考虑B相接线高低压侧接反的可能性;结合图17、18、19、20可以发现A、B、C变化趋势基本相同,但是相关性系数有较大波动,因此考虑中途有用户窃电的可能性。
[0126] 本实施例中的方法能减轻人工实地检查负担,实现远程控制,并为检测专用变压器的计量装置工作状态和可能存在的窃电现象识别提供支撑,节省了人力资源的和财力,通过远程监控分析能及时发现专用变压器的计量故障或存在的问题,而且能实时掌握用电情况,且通过快速的运算能更准确的确定故障原因,即使派人员检查。
[0127] 以上所述仅为本发明的优选实施方式,应当指出,对于本领域普通技术人员而言,在不脱离本发明的原理前提下,可以对本发明进行多种改型或改进,这些均被视为本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈