首页 / 专利库 / 电脑编程 / 别名 / Hadoop框架下的电力系统短期负荷预测方法

Hadoop框架下的电系统短期负荷预测方法

阅读:1082发布:2020-05-29

专利汇可以提供Hadoop框架下的电系统短期负荷预测方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种Hadoop 框架 下的电 力 系统短期负荷预测方法,利用变分模态分解方法VMD将原始历史负荷数据分解为具有不同特征的模态函数分量;利用互信息理论,从历史负荷、 温度 和日期类型中选取相关性最高的变量作为输入变量;将所得不同特征的模态函数分量数据样本作为Hadoop框架下的深度置信网络 预测模型 输入,同时输入随机产生的深度置信网络各层权值、 阈值 ,进入Hadoop框架下的深度置信负荷预测模型进行当前样本的权值、阈值的修正、 迭代 、优化,训练出最佳的权值阈值,并存储;将待预测日的输入变量输入预测模型,得出预测结果。本发明方法具有更高的预测 精度 以及时效性。,下面是Hadoop框架下的电系统短期负荷预测方法专利的具体信息内容。

1.一种Hadoop框架下的电系统短期负荷预测方法,其特征在于,具体包括如下步骤:
1)利用变分模态分解方法VMD将原始历史负荷数据分解为具有不同特征的模态函数分量;
2)利用互信息理论,从历史负荷、温度和日期类型中选取相关性最高的变量作为输入变量;
3)将步骤1)所得不同特征的模态函数分量数据样本作为Hadoop框架下的深度置信网络预测模型输入,同时输入随机产生的深度置信网络各层权值、阈值,进入Hadoop框架下的深度置信负荷预测模型进行当前样本的权值、阈值的修正、迭代、优化,训练出最佳的权值阈值,并存储;
4)将待预测日的步骤2)确认的输入变量输入预测模型,得出预测结果。
2.根据权利要求1所述Hadoop框架下的电力系统短期负荷预测方法,其特征在于,所述步骤2)中相关性选取方法如下:
离散型随机变量X、Y之间的互信息定义为:
式中:n,m分别表示随机变量X、Y的样本数量,P(xi,yi)为X和Y的联合概率分布函数;P(xi)为X的边缘概率分布函数;P(yi)为Y的边缘概率分布函数;
两随机变量间的互信息越大,表示变量之间的相关性越强;信息量越小或为0时,则表示变量间的相关性越弱或两变量相互独立。
3.根据权利要求1所述Hadoop框架下的电力系统短期负荷预测方法,其特征在于,所述步骤3)中Hadoop框架下的深度置信负荷预测模型建立包括如下步骤:
3.1)Map阶段:
将存储于Hadoop分布式文件系统HDFS的各层权值、阈值的数据集合划分为若干个数据子集,数据子集用键值对表示;Key值为该行的首字符对于文本发明件的首地址的偏移量,value值将被解析成当前深度置信网络各层权值、阈值;权值、阈值的修正量对应着Map阶段输出键值对的value,而key值即为各层权值、阈值的别名;生成权值、阈值修正量的Map阶段的关键要点如下:
输入:当前模态分量数据样本、随机产生的深度置信网络各层权值、阈值;
输出:当前样本的权值、阈值的修正量;
方法:计算获取权值、阈值的修正量,具体如下:
3A:Setup函数:
按照存储原则、顺序从HDFS中解析出深度置信网络单钱迭代下各层权值(wi,j)、阈值量(ai,bj);
3B:权值、阈值的修正:
引入动量因子后,各层权值、阈值的更新公式更新为:
[Δwij]k+1=m[Δwij]k+γ(data-recon)
[Δαi]k+1=m[Δαi]k+γ(data-recon)
[Δbj]k+1=m[Δbj]k+γ(data-recon)
其中,<·>data代表原始观测数据模型定义的分布;<·>recon代表重构后模型定义的分布;k代表RBM迭代的次数;m代表动量因子,取值为[0,1];γ代表学习率,取值为[0,1];
3.2)Reduce阶段:
依据Map阶段输出键值对中的key值,遍历value值以累加网络各层权值、阈值的整体更新量;值得注意两点:①value为Iterable集合,集合维度为P,因此在修正前需遍历取得正量字符串Text;②此阶段对应网络权值、阈值的整体更新。进一步,将表示权值、阈值修正量的字符串文本解析成数值形式;累加权值、阈值修正量的Reduce阶段关键点如下:
输入:Map阶段输出的键值对;
输出:MapReduce-DBN模型的权值、阈值整体更新量;
方法:按照键值对的key值,分别统计权值、阈值的整体更新量;
3.3)驱动函数:
驱动函数为MapReduce作业的配置文件,完成作业参数的设置,有三部分组成:
3.3.1)生成初始深度置信网络的权值、阈值文本后,上传至分布式文件系统HDFS中;
3.3.2)设置Mapper类的map函数及其输出键值对的数据类型,和Reducer类的reduce函数及其输出键值对的数据类型;
3.3.3)设定作业类型为迭代MapReduce计算任务,最大迭代次数和训练的误差容限。

说明书全文

Hadoop框架下的电系统短期负荷预测方法

技术领域

[0001] 本发明涉及一种电力系统负荷预测技术,特别涉及一种Hadoop框架下的变分模态分解VMD和深度置信网络DBN结合运用的电力系统短期负荷预测方法。

背景技术

[0002] 电力系统负荷预测是指从电力系统负荷自身的变化情况以及气象、经济等因素的影响规律出发,通过对历史数据研究分析,探索负荷及影响因素之间的内在联系和发展变化规律,以未来的气象、经济等因素的发展趋势为依据,对电力需求做出预测。其中,短期预测是电力系统负荷预测中的一项研究重点,其预测精度直接影响到电力系统安全经济稳定运行、实现电网科学管理和调度。近年来,大规模的可再生能源逐步接入电网,其在电网中的比重逐渐增加,一方面实现了可再生能源的有效利用,一定程度上缓解能源危机矛盾,另一方面也对电网的安全稳定运行提出了新的挑战。因此,有必要研究新技术和新方法来提高电力系统短期负荷预测的精度和效率,满足工程实际要求。
[0003] 电力系统负荷预测是指从电力系统负荷自身的变化情况以及气象、经济等因素的影响规律出发,通过对历史数据研究分析,探索负荷及影响因素之间的内在联系和发展变化规律,以未来的气象、经济等因素的发展趋势为依据,对电力需求做出预测。其中,短期预测是电力系统负荷预测中的一项研究重点,其预测精度直接影响到电力系统安全经济稳定运行、实现电网科学管理和调度。近年来,大规模的可再生能源逐步接入电网,其在电网中的比重逐渐增加,一方面实现了可再生能源的有效利用,一定程度上缓解能源危机矛盾,另一方面也对电网的安全稳定运行提出了新的挑战。因此,有必要研究新技术和新方法来提高电力系统短期负荷预测的精度和效率,满足工程实际要求。

发明内容

[0004] 本发明是针对提高电力系统短期负荷预测精度和效率必要性的问题,提出了一种Hadoop框架下的电力系统短期负荷预测方法,提高预测精度和效率。
[0005] 本发明的技术方案为:一种Hadoop框架下的电力系统短期负荷预测方法,具体包括如下步骤:
[0006] 1)利用变分模态分解方法VMD将原始历史负荷数据分解为具有不同特征的模态函数分量;
[0007] 2)利用互信息理论,从历史负荷、温度和日期类型中选取相关性最高的变量作为输入变量;
[0008] 3)将步骤1)所得不同特征的模态函数分量数据样本作为Hadoop框架下的深度置信网络预测模型输入,同时输入随机产生的深度置信网络各层权值、阈值,进入Hadoop框架下的深度置信负荷预测模型进行当前样本的权值、阈值的修正、迭代、优化,训练出最佳的权值阈值,并存储;
[0009] 4)将待预测日的步骤2)确认的输入变量输入预测模型,得出预测结果。
[0010] 所述步骤2)中相关性选取方法如下:
[0011] 离散型随机变量X、Y之间的互信息定义为:
[0012]
[0013] 式中:n,m分别表示随机变量X、Y的样本数量,P(xi,yi)为X和Y的联合概率分布函数;P(xi)为X的边缘概率分布函数;P(yi)为Y的边缘概率分布函数;
[0014] 两随机变量间的互信息越大,表示变量之间的相关性越强;信息量越小或为0时,则表示变量间的相关性越弱或两变量相互独立。
[0015] 所述步骤3)中Hadoop框架下的深度置信负荷预测模型建立包括如下步骤:
[0016] 3.1)Map阶段:
[0017] 将存储于Hadoop分布式文件系统HDFS的各层权值、阈值的数据集合划分为若干个数据子集,数据子集用键值对表示;Key值为该行的首字符对于文本发明件的首地址的偏移量,value值将被解析成当前深度置信网络各层权值、阈值;权值、阈值的修正量对应着Map阶段输出键值对的value,而key值即为各层权值、阈值的别名;生成权值、阈值修正量的Map阶段的关键要点如下:
[0018] 输入:当前模态分量数据样本、随机产生的深度置信网络各层权值、阈值;
[0019] 输出:当前样本的权值、阈值的修正量;
[0020] 方法:计算获取权值、阈值的修正量,具体如下:
[0021] 3A:Setup函数:
[0022] 按照存储原则、顺序从HDFS中解析出深度置信网络单钱迭代下各层权值(wi,j)、阈值量(ai,bj);
[0023] 3B:权值、阈值的修正:
[0024] 引入动量因子后,各层权值、阈值的更新公式更新为:
[0025] [Δwij]k+1=m[Δwij]k+γ(data-recon)
[0026] [Δαi]k+1=m[Δαi]k+γ(data-recon)
[0027] [Δbj]k+1=m[Δbj]k+γ(data-recon)
[0028] 其中,<·>data代表原始观测数据模型定义的分布;<·>recon代表重构后模型定义的分布;k代表RBM迭代的次数;m代表动量因子,取值为[0,1];γ代表学习率,取值为[0,1];
[0029] 3.2)Reduce阶段:
[0030] 依据Map阶段输出键值对中的key值,遍历value值以累加网络各层权值、阈值的整体更新量;值得注意两点:①value为Iterable集合,集合维度为P,因此在修正前需遍历取得正量字符串Text;②此阶段对应网络权值、阈值的整体更新。进一步,将表示权值、阈值修正量的字符串文本解析成数值形式;累加权值、阈值修正量的Reduce阶段关键点如下:
[0031] 输入:Map阶段输出的键值对;
[0032] 输出:MapReduce-DBN模型的权值、阈值整体更新量;
[0033] 方法:按照键值对的key值,分别统计权值、阈值的整体更新量;
[0034] 3.3)驱动函数:
[0035] 驱动函数为MapReduce作业的配置文件,完成作业参数的设置,有三部分组成:
[0036] 3.3.1)生成初始深度置信网络的权值、阈值文本后,上传至分布式文件系统HDFS中;
[0037] 3.3.2)设置Mapper类的map函数及其输出键值对的数据类型,和Reducer类的reduce函数及其输出键值对的数据类型;
[0038] 3.3.3)设定作业类型为迭代MapReduce计算任务,最大迭代次数和训练的误差容限。
[0039] 本发明的有益效果在于:本发明Hadoop框架下的电力系统短期负荷预测方法,利用变分模态分解方法VMD能够有效地处理电力系统负荷的时间序列,降低其非平稳特性,提升预测精度;Hadoop架构下的深度置信网络具有更快的运行效率,减少运行时间;采用互信息理论筛选出相关性最大的因素作为输入变量,能有效提升预测的精度。附图说明
[0040] 图1为本发明Hadoop框架下的VMD和DBN的电力系统短期负荷预测模型流程图
[0041] 图2为吉安市原始负荷数据集;
[0042] 图3为宜春市原始负荷数据集;
[0043] 图4为抚州市原始负荷数据集;
[0044] 图5为鹰潭原始负荷数据集;
[0045] 图6为吉安市VMD分解结果;
[0046] 图7为宜春市VMD分解结果;
[0047] 图8为抚州市VMD分解结果;
[0048] 图9为鹰潭市VMD分解结果;
[0049] 图10为吉安市包括本发明在内的三种模型短期预测结果对比图;
[0050] 图11为宜春市本发明在内的三种模型短期预测结果对比图;
[0051] 图12为抚州市本发明在内的三种模型短期预测结果对比图;
[0052] 图13为鹰潭市本发明在内的三种模型短期预测结果对比图。

具体实施方式

[0053] 如图1所示为本发明一种Hadoop框架下的VMD-DBN电力系统短期负荷预测方法的具体流程示意图,包括以下步骤:步骤1:利用变分模态分解方法VMD将原始历史负荷数据分解为具有不同特征的模态函数分量;步骤2:利用互信息理论,从历史负荷、温度和日期类型中选取相关性最高的变量作为输入变量;步骤3:将步骤1所得不同特征的模态函数分量数据样本作为Hadoop框架下的深度置信网络DBN预测模型输入,同时输入随机产生的深度置信网络各层权值、阈值,进入Hadoop框架下的深度置信网络进行当前样本的权值、阈值的修正、迭代、优化,训练出最佳的权值阈值,并存储;步骤四:将待预测日的步骤2确认的输入变量输入预测模型,得出预测结果。
[0054] 1、变分模态分解VMD的分解步骤为:
[0055] 1.1):变分问题的构造:假设原始负荷序列为f(t),这变分问题等效于寻找k个模态函数uk(t),使每个模态的估计带宽之和最小,约束条件为每个模态相加之和等于原始负荷序列f(t),具体步骤为:
[0056] 1A:通过Hilbert变换得到每个模态函数的解析信号,目的是得到它的单边频谱
[0057]
[0058] δ(t)代表狄利克雷函数;
[0059] 1B:给各个模态的解析信号加入一个预估中心频率 并将每个模态的频谱调制到相应的基频带:
[0060]
[0061] 1C:通过高斯平滑估计出模态信号带宽,受约束的最优化变分模型为:
[0062]
[0063] 其中K为分量个数,{uk}={u1,u2,...,uk},{wk}={w1,w2,...,wk}为{uk}的频率中心。
[0064] 1.2)变分问题的求解:
[0065] 2A:引入二次惩罚因子α和拉格朗日乘法算子λ(t),将约束性变分问题变为非约束性变分问题,其中α可以在高斯噪声存在的情况下保证信号的重构精度,而λ(t)使得约束条件保持严格性,扩展拉格朗日表达式如下:
[0066]
[0067] 表示对后面的式子求t的偏微分。
[0068] 2B:利用乘法算子交替方向法,交替迭代更新 和λn+1,计算扩展拉格朗日表达式的“鞍点”。其中, 的取值问题可表述为:
[0069]
[0070] 式中:wk等同于 ∑iui(t)等同于∑i≠kui(t)n+1,利用Parseval/Plancherel傅里叶等距离变换,将上式变换到频域,得到个模态的频域更新:
[0071]
[0072] 2C:根据同样的计算过程,将中心频率取值问题转换到频域,得到中心频率的更新:
[0073]
[0074] 式中: 相当于当前剩余量 的维纳滤波; 为当前模态函数功率谱的中心;对 进行傅里叶变换,得到实部为{uk(t)}。
[0075] 利用变分模态分解,将原始负荷序列f(t)分解为k个模态分量uk(t)。
[0076] 相关参数选择为:惩罚系数α=1000;模态函数个数K=6;初始中心频率w=0;收敛判据tol=1e-6。
[0077] 2、根据互信息理论从历史负荷、温度和日期类型中选取输入变量的方法为:
[0078] 离散型随机变量X、Y之间的互信息定义为:
[0079]
[0080] 式中:n,m分别表示随机变量X、Y的样本数量,P(xi,yi)为X和Y的联合概率分布函数;P(xi)为X的边缘概率分布函数;P(yi)为Y的边缘概率分布函数。
[0081] 两随机变量间的互信息越大,表示变量之间的相关性越强;信息量越小或为0时,则表示变量间的相关性越弱或两变量相互独立。
[0082] 3、建立Hadoop框架下深度置信网络预测模型包含以下步骤:
[0083] 3.1)Map阶段
[0084] 将存储于Hadoop分布式文件系统HDFS的各层权值、阈值的数据集合(权值、阈值是深度置信网络的,其初始值是随机产生的,后面不断地更新修正)划分为若干个数据子集,数据子集用键值对表示。Key值为该行的首字符对于文本发明件的首地址的偏移量,value值将被解析成当前深度置信网络各层权值、阈值。权值、阈值的修正量对应着Map阶段输出键值对的value,而key值即为各层权值、阈值的别名。生成权值、阈值修正量的Map阶段的关键要点如下:
[0085] 输入:当前模态分量数据样本、随机产生的深度置信网络各层权值、阈值。
[0086] 输出:当前样本的权值、阈值的修正量。
[0087] 方法:计算获取权值、阈值的修正量,具体如下:
[0088] 3A:Setup函数:
[0089] 按照存储原则、顺序从HDFS中解析出深度置信网络单钱迭代下各层权值(wi,j)、阈值量(ai,bj)。
[0090] 3B:权值、阈值的修正。
[0091] 引入动量因子后,各层权值、阈值的更新公式更新为:
[0092] [Δwij]k+1=m[Δwij]k+γ(data-recon)
[0093] [Δαi]k+1=m[Δαi]k+γ(data-<vi>recon)
[0094] [Δbj]k+1=m[Δbj]k+γ(data-recon)其中,<·>data代表原始观测数据模型定义的分布;<·>recon代表重构后模型定义的分布;k代表RBM迭代的次数;m代表动量因子,取值为[0,1];γ代表学习率,取值为[0,1]。
[0095] 3.2)Reduce阶段
[0096] 依据Map阶段输出键值对中的key值,遍历value值以累加网络各层权值、阈值的整体更新量。值得注意两点:①value为Iterable集合,集合维度为P,因此在修正前需遍历取得正量字符串Text;②此阶段对应网络权值、阈值的整体更新。进一步,将表示权值、阈值修正量的字符串文本解析成数值形式。累加权值、阈值修正量的Reduce阶段关键点如下:
[0097] 输入:Map阶段输出的键值对。
[0098] 输出:MapReduce-DBN模型的权值、阈值整体更新量。
[0099] 方法:按照键值对的key值,分别统计权值、阈值的整体更新量。
[0100] 3.3)驱动函数
[0101] 驱动函数为MapReduce作业的配置文件,完成作业参数的设置,有三部分组成:1)生成初始深度置信网络的权值、阈值文本后,上传至HDFS分布式文件系统中;2)设置Mapper类的map函数及其输出键值对的数据类型,和Reducer类的reduce函数及其输出键值对的数据类型;3)设定作业类型为迭代MapReduce计算任务,最大迭代次数和训练的误差容限。
[0102] 实验室Hadoop集群由六个节点组成,包括三个具有相同配置的PC,每个PC配置有两个虚拟机,并且安装了Ubuntu 14.10.X32位。主节点通过Na.de进程负责文件系统的命名空间的管理和维护,数据节点通过Datanode进程管理存储的数据。Hadoop集群可以使用MapReduce框架来集成要处理的数据,并将集成的数据存储到数据节点中,并且块信息元数据由主节点管理。客户端首先连接节点,然后使用数据节点资源进行分布式计算。最后,使用HDFS将结果存储在数据节点中。每个节点的具体信息如表1所示集群的配置表:
[0103] 表1
[0104]
[0105] 为了更好地验证本发明所提出的预测模型的有效性和普适性,如图2-5本发明采集了江西省的吉安市,宜春市,抚州市和鹰潭市四个地级市的负荷数据和温度数据,每个设备的采样时间间隔为1h。实验室数据虽然没有达到大数据的规模,但可以以此数据进行正确性的验证实验,其结果可为大数据环境下的负荷预测思路提供参考。训练数据的时间范围为2015年1月1日至2015年3月31日。预测目标为2015年4月1日24个整点时刻的电力负荷.[0106] 从图6-9可以看出,组分U1的波动最大,没有明显的规律性。组分U2和U3具有良好的周期性和规律性。分量U4和U5具有最大的平均振幅和最好的周期性。然后,针对五个分量中的每一个分量建立DBN预测模型,并将五个分量的预测结果相加,得到最终的预测结果。
[0107] 预测结果如图10-13所示。MAPE、RMSE和三的计算时间预测模型在表2中给出。结果表明:
[0108] (1)图10-13描述了本发明提出的VMD-MapReduce-DBN预测模型的预测结果明显地比其他两种方法(VMD-DBN、DBN)更接近实际负荷(Actual)曲线,这证明了提出的VMD-MapReduce-DBN预测模型的精度在三种模型中是最高的。同时,VMD-MapReduce-DBN模型在负荷曲线的峰谷处比其他两种模型具有更好的适应性,尤其是DBN。但是,对于单条曲线的拟合,峰谷的拟合误差要比其他点的拟合误差大得多,这主要归因于曲线的高变化率太大或在这些位置出现负载趋势的反转。
[0109] (2)表2中描述了针对VMD-MapReduce-DBN,VMD-DBN和DBN三种方法在四个不同电网负荷中预测结果的MAPE,RMSE和计算时间三项指标情况,其中MAPE和RMSE能够有效反映预测模型的精度,而计算时间则是反映预测模型的运行效率。具体的,VMD-MapReduce-DBN模型的MAPE值较VMD-DBN和DBN模型低,特别是DBN模型,其中在吉安,宜春,抚州和鹰潭四个电网负荷中,VMD-MapReduce-DBN模型较DBN模型的MAPE值分别提高了5.6%,6.06%,583%和7.46%,同时VMD-MapReduce-DBN模型较VMD-DBN模型也有1%-2%左右的提升。另外,三模型中的RMSE值的变化情况与MAPE类似。这意味着VMD-MapReduce-DBN模型的精度是三者中最高的。结果显示,VMD-MapReduce-DBN模型的计算时间是三个模型中最少的,DBN模型次之,VMD-DBN模型所耗时间最长。具体的是,VMD-MapReduce-DBN模型比DBN模型分别提升178.35s,175.37s,198.28s和219.04s,而VMD-MapReduce-DBN模型比VMD-DBN模型提升了
366.29s,360.40s,358.09和350.25s.综上所述,VMD-DBN模型较DBN模型的精度更高,但耗时却更长,而本发明提出的VMD-MapReduce-DBN模型在保证预测精度的同时也降低了计算耗时,提升了运行效率。
[0110] (3)通过对三种不同电网短期负荷预测结果的比较,发现本发明提出的预测模型具有一定的通用性和有效性,可以为电网用户的负荷预测提供实用的参考。
[0111] 表2
[0112]
[0113] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈