首页 / 专利库 / 电信 / 跟踪 / 基于大数据与机器学习的电力用户窃电行为分析方法

基于大数据机器学习的电用户窃电行为分析方法

阅读:109发布:2024-02-20

专利汇可以提供基于大数据机器学习的电用户窃电行为分析方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 大数据 与 机器学习 的电 力 用户窃电行为分析方法,所述方法为:1、 抽取 大量用户用电数据使用聚类 算法 建立用电行为模式图谱;2、对聚类结果进行分析,结合业务经验和实际数据得到正常用电行为模式和窃电用户所属行为模式;3、以窃电用户所属行为模式为 基础 ,提取此类模式用户的用电行为特征,建立算法分析模型;4、使用测试数据集和 训练数据 集对模型进行训练与评估获取最优模型;5、结合台区线损和计量异常等对用户异动进行监控;6、对高疑似窃电用户进行 跟踪 监测或生成现场巡查工单及处理系统。本发明公开了相应的分析处理系统。,下面是基于大数据机器学习的电用户窃电行为分析方法专利的具体信息内容。

1.基于大数据机器学习的电用户窃电行为分析方法,其特征在于:所述方法包括如下步骤:
步骤1、抽取大量用户用电数据使用聚类算法建立用电行为模式图谱;
步骤2、对聚类结果进行分析,结合业务经验和实际数据得到正常用电行为模式和窃电用户所属行为模式;
步骤3、以窃电用户所属行为模式为基础,提取此类模式用户的用电行为特征,建立算法分析模型;
步骤4、使用测试数据集和训练数据集对模型进行训练与评估获取最优模型;
步骤5、结合台区线损和计量异常等对用户异动进行监控;
步骤6、对高疑似窃电用户进行跟踪监测或生成现场巡查工单;
所述的步骤1具体为:抽取用户近1年电量数据、用户档案、电表档案、电表综合倍率、计量异常数据、采集异常数据等,为消除不同电压等级用户用电习惯不同的影响,对不同电压等级的用户进行分别聚类,使用用电量与合同容量比值为基础数据,采用了谱聚类和视觉聚类进行多次聚类,消除聚类算法对初始值敏感的影响,最终得到所有用户用电量的聚类图;
所述的步骤2具体为:对聚类结果进行分析,结合业务经验和已经查实的窃电情况,对所得的聚类结果进行划分,识别出正常的用电行为模式、已查实窃电用户所属的用电行为模式、以及可能存在窃电行为的用电行为模式;
所述的步骤3具体为:重点对已查实窃电用户所属的用电行为模式和可能存在窃电行为的用电行为模式的用户进行分析,提取此类用电行为模式用户的用电特征,特征值包括日用电特征(最大值、最小值、平均值、方差、偏度、峰度、迷你距、中位数、上四分位数、下四分位数、四分位差)、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征、空值特征、随机性特征、正态性特征;用提取的特征值建立K-Means聚类算法模型、Apriori算法模式、线性回归算法模型;
所述的步骤4具体为:将已有的大量数据样本分为测试集和训练集对建立的算法模型进行训练,根据模型计算的窃电用户清单和已知的窃电用户清单进行比对,根据准确率对算法模型的进行评估,将准确率高的模型保留,准确率低的模型进行参数调整和再训练,从而获得最终算法模型;
所述的步骤5具体为:对于算法分析得到的疑似窃电用户,提取用户所在台区的线损数据,结合线损数据与用户用电异常发生节点进行综合分析,如果用户电量变化和台区线损变化不符合正常的逻辑,依次可辅助判断用户窃电嫌疑;
所述的步骤6具体为:根据用电量正态分布的假设,用户用电量应该集中分布在一定区间内,对疑似窃电用户的历史用电量进行分析,制定相应的阈值,如果某疑似窃电用户用电量持续低于阈值,对该用户生成现场巡查工单,并有专责人员进行现场检查。
2.基于大数据与机器学习的电力用户窃电行为分析处理系统,其特征在于:所述系统包括:聚类模、图谱分类模块、窃电特征提取模块、窃电分析模块、异动监测模块、工单派工模块;
所述聚类模块,用于抽取大量用户用电数据使用聚类算法建立用电行为模式图谱;
所述图谱分类模块,用于对聚类结果进行分析,结合业务经验和实际数据得到正常用电行为模式和窃电用户所属行为模式;
所述窃电特征提取模块,用于以窃电用户所属行为模式为基础,提取此类模式用户的用电行为特征;
所述窃电分析模块,用于建立算法分析模型并使用测试数据集和训练数据集对模型进行训练与评估获取最优模型;
所述异动监测模块,用于结合台区线损和计量异常等对用户异动进行监控;
所述工单派工模块,用于对高疑似窃电用户进行跟踪监测或生成现场巡查工单;
所述聚类模块抽取用户近1年电量数据、用户档案、电表档案、电表综合倍率、计量异常数据、采集异常数据等,为消除不同电压等级用户用电习惯不同的影响,对不同电压等级的用户进行分别聚类,使用用电量与合同容量比值为基础数据,采用了谱聚类和视觉聚类进行多次聚类,消除聚类算法对初始值敏感的影响,最终得到所有用户用电量的聚类图;
所述图谱分类模块对聚类结果进行分析,结合业务经验和已经查实的窃电情况,对所得的聚类结果进行划分,识别出正常的用电行为模式、已查实窃电用户所属的用电行为模式、以及可能存在窃电行为的用电行为模式;
所述窃电特征提取模块重点对已查实窃电用户所属的用电行为模式和可能存在窃电行为的用电行为模式的用户进行分析,提取此类用电行为模式用户的用电特征,特征值包括日用电特征:最大值、最小值、平均值、方差、偏度、峰度、迷你距、中位数、上四分位数、下四分位数、四分位差,周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征、空值特征、随机性特征、正态性特征;
所述窃电分析模块用提取的特征值建立K-Means聚类算法模型、Apriori算法模式、线性回归算法模型;将已有的大量数据样本分为测试集和训练集对建立的算法模型进行训练,根据模型计算的窃电用户清单和已知的窃电用户清单进行比对,根据准确率对算法模型的进行评估,将准确率高的模型保留,准确率低的模型进行参数调整和再训练,从而获得最终算法模型;
所述异动监测模块对于算法分析得到的疑似窃电用户,提取用户所在台区的线损数据,结合线损数据与用户用电异常发生节点进行综合分析,如果用户电量变化和台区线损变化不符合正常的逻辑,依次可辅助判断用户窃电嫌疑;
所述工单派工模块根据用电量正态分布的假设,用户用电量应该集中分布在一定区间内,对疑似窃电用户的历史用电量进行分析,制定相应的阈值,如果某疑似窃电用户用电量持续低于阈值,对该用户生成现场巡查工单,并有专责人员进行现场检查。

说明书全文

基于大数据机器学习的电用户窃电行为分析方法

技术领域

[0001] 本发明涉及基于大数据与机器学习的电力用户窃电行为分析方法与处理系统。

背景技术

[0002] 近年来,随着市场经济的日益发展,电能作为一种清洁能源被广泛使用于国民经济的各个领域和人民的生产、生活中,由于电能费用占企业成本比重较大,一些不法经营者、个体私营业主为谋取暴利,置国家法律、法规于不顾,不择手段地窃取国家电能。猖狂的窃电行为严重损害了企业和个人的合法权益,扰乱了正常的供用电秩序,阻碍了电力事业的发展,给安全用电带来了严重威胁。窃电已经上升为一个不容忽视的社会问题。窃电类别目前主要分为以下3类:Ø        攻击计量装置窃电;
Ø        外部信号干扰窃电;
Ø        攻击计量/供电线路。
[0003] 为此,本发明人一直在研究一种基于大数据与机器学习的电力用户窃电行为分析方法及处理系统。

发明内容

[0004] 本发明的目的是提供一种基于大数据与机器学习的电力用户窃电行为分析方法及处理系统,本发明是通过如下技术方案来实现的:本发明的基于大数据与机器学习的电力用户窃电行为分析方法,所述方法包括如下步骤:
步骤1、抽取大量用户用电数据使用聚类算法建立用电行为模式图谱;
步骤2、对聚类结果进行分析,结合业务经验和实际数据得到正常用电行为模式和窃电用户所属行为模式;
步骤3、以窃电用户所属行为模式为基础,提取此类模式用户的用电行为特征,建立算法分析模型;
步骤4、使用测试数据集和训练数据集对模型进行训练与评估获取最优模型;
步骤5、结合台区线损和计量异常等对用户异动进行监控;
步骤6、对高疑似窃电用户进行跟踪监测或生成现场巡查工单;
所述的步骤1具体为:抽取用户近1年电量数据、用户档案、电表档案、电表综合倍率、计量异常数据、采集异常数据等,为消除不同电压等级用户用电习惯不同的影响,对不同电压等级的用户进行分别聚类,使用用电量与合同容量比值为基础数据,采用了谱聚类和视觉聚类进行多次聚类,消除聚类算法对初始值敏感的影响,最终得到所有用户用电量的聚类图。
[0005] 所述的步骤2具体为:对聚类结果进行分析,结合业务经验和已经查实的窃电情况,对所得的聚类结果进行划分,识别出正常的用电行为模式、已查实窃电用户所属的用电行为模式、以及可能存在窃电行为的用电行为模式。
[0006] 所述的步骤3具体为:重点对已查实窃电用户所属的用电行为模式和可能存在窃电行为的用电行为模式的用户进行分析,提取此类用电行为模式用户的用电特征,特征值包括日用电特征(最大值、最小值、平均值、方差、偏度、峰度、迷你距、中位数、上四分位数、下四分位数、四分位差)、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征、空值特征、随机性特征、正态性特征等。用提取的特征值建立K-Means聚类算法模型、Apriori算法模式、线性回归算法模型等。
[0007] 所述的步骤4具体为:将已有的大量数据样本分为测试集和训练集对建立的算法模型进行训练,根据模型计算的窃电用户清单和已知的窃电用户清单进行比对,根据准确率对算法模型的进行评估,将准确率高的模型保留,准确率低的模型进行参数调整和再训练,从而获得最终算法模型。
[0008] 所述的步骤5具体为:对于算法分析得到的疑似窃电用户,提取用户所在台区的线损数据,结合线损数据与用户用电异常发生节点进行综合分析,如果用户电量变化和台区线损变化不符合正常的逻辑,依次可辅助判断用户窃电嫌疑。
[0009] 所述的步骤6具体为:根据用电量正态分布的假设,用户用电量应该集中分布在一定区间内,对疑似窃电用户的历史用电量进行分析,制定相应的阈值,如果某疑似窃电用户用电量持续低于阈值,对该用户生成现场巡查工单,并有专责人员进行现场检查。
[0010] 本发明要解决的技术之二,在于提供一种基于大数据与机器学习的电力用户窃电行为分析处理系统,通过对海量样本数据挖掘,提取正常用户用电行为特征、窃电用户用电行为特征,建立反窃电大数据分析模型和机器学习模型,实现在营销大数据在反窃电方面的大数据应用。
[0011] 本发明问题之二是这样实现的:基于大数据与机器学习的电力用户窃电行为分析处理系统包括:聚类模、图谱分类模块、窃电特征提取模块、窃电分析模块、异动监测模块、工单派工模块;所述聚类模块,用于抽取大量用户用电数据使用聚类算法建立用电行为模式图谱;
所述图谱分类模块,用于对聚类结果进行分析,结合业务经验和实际数据得到正常用电行为模式和窃电用户所属行为模式;
所述窃电特征提取模块,用于以窃电用户所属行为模式为基础,提取此类模式用户的用电行为特征;
所述窃电分析模块,用于建立算法分析模型并使用测试数据集和训练数据集对模型进行训练与评估获取最优模型;
所述异动监测模块,用于结合台区线损和计量异常等对用户异动进行监控;
所述工单派工模块,用于对高疑似窃电用户进行跟踪监测或生成现场巡查工单;
所述聚类模块抽取用户近1年电量数据、用户档案、电表档案、电表综合倍率、计量异常数据、采集异常数据等,为消除不同电压等级用户用电习惯不同的影响,对不同电压等级的用户进行分别聚类,使用用电量与合同容量比值为基础数据,采用了谱聚类和视觉聚类进行多次聚类,消除聚类算法对初始值敏感的影响,最终得到所有用户用电量的聚类图。
[0012] 所述图谱分类模块对聚类结果进行分析,结合业务经验和已经查实的窃电情况,对所得的聚类结果进行划分,识别出正常的用电行为模式、已查实窃电用户所属的用电行为模式、以及可能存在窃电行为的用电行为模式。
[0013] 所述窃电特征提取模块重点对已查实窃电用户所属的用电行为模式和可能存在窃电行为的用电行为模式的用户进行分析,提取此类用电行为模式用户的用电特征,特征值包括日用电特征(最大值、最小值、平均值、方差、偏度、峰度、迷你距、中位数、上四分位数、下四分位数、四分位差)、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征、空值特征、随机性特征、正态性特征等。
[0014] 所述窃电分析模块用提取的特征值建立K-Means聚类算法模型、Apriori算法模式、线性回归算法模型等。将已有的大量数据样本分为测试集和训练集对建立的算法模型进行训练,根据模型计算的窃电用户清单和已知的窃电用户清单进行比对,根据准确率对算法模型的进行评估,将准确率高的模型保留,准确率低的模型进行参数调整和再训练,从而获得最终算法模型。
[0015] 所述异动监测模块对于算法分析得到的疑似窃电用户,提取用户所在台区的线损数据,结合线损数据与用户用电异常发生节点进行综合分析,如果用户电量变化和台区线损变化不符合正常的逻辑,依次可辅助判断用户窃电嫌疑。
[0016] 进一步地,所述工单派工模块根据用电量正态分布的假设,用户用电量应该集中分布在一定区间内,对疑似窃电用户的历史用电量进行分析,制定相应的阈值,如果某疑似窃电用户用电量持续低于阈值,对该用户生成现场巡查工单,并有专责人员进行现场检查。
[0017] 与现有技术比较,本发明基于用电采集大数据管理与应用平台为技术支撑,依托用电信息采集系统、营销系统等相关系统所产生的海量数据,通过对海量样本数据挖掘,提取正常用户用电行为特征、窃电用户用电行为特征,建立反窃电大数据分析模型和机器学习模型,实现在营销大数据在反窃电方面的大数据应用。本发明基于大数据与机器学习的电力用户窃电行为分析处理系统,通过对海量样本数据挖掘,提取正常用户用电行为特征、窃电用户用电行为特征,建立反窃电大数据分析模型和机器学习模型,实现在营销大数据在反窃电方面的大数据应用。
[0018] 总之,本发明通过对海量用户历史电量数据样本进行挖掘,获取用户用电行为模式,对窃电用户的行为模式提取用电行为特征,建立分析模型,采用机器学习的思想对模型进行训练与评估,不断的优化算法模型,并辅助以异动监测和派工处理的功能。附图说明
[0019] 图1为本发明方法流程示意图。
[0020] 图2为本发明系统的原理框图

具体实施方式

[0021] 下面参照附图结合实例对本发明作进一步的说明。
[0022] 参阅图1所示,一种基于大数据与机器学习的电力用户窃电行为分析方法,所述方法包括如下步骤:步骤1、抽取大量用户用电数据使用聚类算法建立用电行为模式图谱;
步骤2、对聚类结果进行分析,结合业务经验和实际数据得到正常用电行为模式和窃电用户所属行为模式;
步骤3、以窃电用户所属行为模式为基础,提取此类模式用户的用电行为特征,建立算法分析模型;
步骤4、使用测试数据集和训练数据集对模型进行训练与评估获取最优模型;
步骤5、结合台区线损和计量异常等对用户异动进行监控;
步骤6、对高疑似窃电用户进行跟踪监测或生成现场巡查工单;
其中,所述的步骤1具体为:抽取用户近1年电量数据、用户档案、电表档案、电表综合倍率、计量异常数据、采集异常数据等,为消除不同电压等级用户用电习惯不同的影响,对不同电压等级的用户进行分别聚类,使用用电量与合同容量比值为基础数据,采用了谱聚类和视觉聚类进行多次聚类,消除聚类算法对初始值敏感的影响,最终得到所有用户用电量的聚类图。
[0023] 所述的步骤2具体为:对聚类结果进行分析,结合业务经验和已经查实的窃电情况,对所得的聚类结果进行划分,识别出正常的用电行为模式、已查实窃电用户所属的用电行为模式、以及可能存在窃电行为的用电行为模式。
[0024] 所述的步骤3具体为:重点对已查实窃电用户所属的用电行为模式和可能存在窃电行为的用电行为模式的用户进行分析,提取此类用电行为模式用户的用电特征,特征值包括日用电特征(最大值、最小值、平均值、方差、偏度、峰度、迷你距、中位数、上四分位数、下四分位数、四分位差)、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征、空值特征、随机性特征、正态性特征等。用提取的特征值建立K-Means聚类算法模型、Apriori算法模式、线性回归算法模型等。
[0025] 所述的步骤4具体为:将已有的大量数据样本分为测试集和训练集对建立的算法模型进行训练,根据模型计算的窃电用户清单和已知的窃电用户清单进行比对,根据准确率对算法模型的进行评估,将准确率高的模型保留,准确率低的模型进行参数调整和再训练,从而获得最终算法模型。
[0026] 所述的步骤5具体为:对于算法分析得到的疑似窃电用户,提取用户所在台区的线损数据,结合线损数据与用户用电异常发生节点进行综合分析,如果用户电量变化和台区线损变化不符合正常的逻辑,依次可辅助判断用户窃电嫌疑。
[0027] 所述的步骤6具体为:根据用电量正态分布的假设,用户用电量应该集中分布在一定区间内,对疑似窃电用户的历史用电量进行分析,制定相应的阈值,如果某疑似窃电用户用电量持续低于阈值,对该用户生成现场巡查工单,并有专责人员进行现场检查。
[0028] 参阅图2所示,本发明的一种基于大数据与机器学习的电力用户窃电行为分析方法的处理系统,所述处理系统包括:聚类模块、图谱分类模块、窃电特征提取模块、窃电分析模块、异动监测模块、工单派工模块;所述聚类模块,用于抽取大量用户用电数据使用聚类算法建立用电行为模式图谱;
所述图谱分类模块,用于对聚类结果进行分析,结合业务经验和实际数据得到正常用电行为模式和窃电用户所属行为模式;
所述窃电特征提取模块,用于以窃电用户所属行为模式为基础,提取此类模式用户的用电行为特征;
所述窃电分析模块,用于建立算法分析模型并使用测试数据集和训练数据集对模型进行训练与评估获取最优模型;
所述异动监测模块,用于结合台区线损和计量异常等对用户异动进行监控;
所述工单派工模块,用于对高疑似窃电用户进行跟踪监测或生成现场巡查工单;
(1)聚类模块,抽取用户近1年电量数据、用户档案、电表档案、电表综合倍率、计量异常数据、采集异常数据等,为消除不同电压等级用户用电习惯不同的影响,对不同电压等级的用户进行分别聚类,使用用电量与合同容量比值为基础数据,采用了谱聚类和视觉聚类进行多次聚类,消除聚类算法对初始值敏感的影响,最终得到所有用户用电量的聚类图。
[0029] (2)图谱分类模块,对聚类结果进行分析,结合业务经验和已经查实的窃电情况,对所得的聚类结果进行划分,识别出正常的用电行为模式、已查实窃电用户所属的用电行为模式、以及可能存在窃电行为的用电行为模式。
[0030] (3)窃电特征提取模块,重点对已查实窃电用户所属的用电行为模式和可能存在窃电行为的用电行为模式的用户进行分析,提取此类用电行为模式用户的用电特征,特征值包括日用电特征(最大值、最小值、平均值、方差、偏度、峰度、迷你距、中位数、上四分位数、下四分位数、四分位差)、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征、空值特征、随机性特征、正态性特征等。
[0031] (4)窃电分析模块,用提取的特征值建立K-Means聚类算法模型、Apriori算法模式、线性回归算法模型等。将已有的大量数据样本分为测试集和训练集对建立的算法模型进行训练,根据模型计算的窃电用户清单和已知的窃电用户清单进行比对,根据准确率对算法模型的进行评估,将准确率高的模型保留,准确率低的模型进行参数调整和再训练,从而获得最终算法模型。
[0032] (5)异动监测模块,对于算法分析得到的疑似窃电用户,提取用户所在台区的线损数据,结合线损数据与用户用电异常发生节点进行综合分析,如果用户电量变化和台区线损变化不符合正常的逻辑,依次可辅助判断用户窃电嫌疑。
[0033] (6)工单派工模块,根据用电量正态分布的假设,用户用电量应该集中分布在一定区间内,对疑似窃电用户的历史用电量进行分析,制定相应的阈值,如果某疑似窃电用户用电量持续低于阈值,对该用户生成现场巡查工单,并有专责人员进行现场检查。
[0034] 虽然以上描述了发明的具体实施步骤,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是对于本发明的范围的限定,熟悉本领域的数据人员在依照本发明的精神所作的等效的修饰以及变化,都应该包含在本发明的权利要求所保护的范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈