首页 / 专利库 / 人工智能 / 机器学习 / 监督学习 / 基于长短期记忆网络的梯级水电站发电量预测方法

基于长短期记忆网络的梯级电站发电量预测方法

阅读:517发布:2020-05-11

专利汇可以提供基于长短期记忆网络的梯级电站发电量预测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了基于长短期记忆网络的 梯级 水 电 站发电量预测方法,包括对水电站发电量时间序列进行平稳性检验;对发电量时间序列进行相关性检验;将发电量时间序列数据转换成 监督学习 数据;建立基于长短期记忆网络的发电量 预测模型 ;对发电量数据进行集成经验模态分解,得到训练集和测试集;利用训练集对发电量预测模型进行训练,采用改进离散差分进化 算法 进行模型超参数优化,得到最优模型参数;采用发电量预测模型对梯级水电站进行发电量预测。本发明的方法可适用于大中型梯级电站发电量的预测;基于LSTM神经网络的发电量预测模型对多年调节电站发电量预测更有优势,且对模型的超参数优化,提高了模型的拟合 精度 。,下面是基于长短期记忆网络的梯级电站发电量预测方法专利的具体信息内容。

1.基于长短期记忆网络的梯级电站发电量预测方法,其特征在于,包括以下步骤,步骤1:对特征工程的数据预处理,对水电站发电量时间序列进行平稳性检验;
步骤2:对发电量时间序列进行相关性检验,选取相关性高的发电量影响因子;
步骤3:将发电量时间序列数据转换成监督学习数据;
步骤4:建立基于长短期记忆网络的发电量预测模型
步骤5:对步骤3的发电量数据进行集成经验模态分解,得到训练集和测试集;
步骤6:利用训练集对发电量预测模型进行训练,采用改进离散差分进化算法进行模型超参数优化,得到最优模型参数;
步骤7:使用测试集对基于长短期记忆网络的发电量预测模型进行测试;
步骤8:采用基于长短期记忆网络的发电量预测模型对梯级水电站进行发电量预测。
2.根据权利要求1所述的基于长短期记忆网络的梯级水电站发电量预测方法,其特征在于,步骤1中,所述对水电站发电量时间序列进行平稳性检验,采用单位根检验的方法。
3.根据权利要求1所述的基于长短期记忆网络的梯级水电站发电量预测方法,其特征在于,步骤2中,所述对发电量时间序列进行相关性检验,包括计算Pearson相关系数、Spearman相关系数。
4.根据权利要求1所述的基于长短期记忆网络的梯级水电站发电量预测方法,其特征在于,步骤3中,所述将发电量时间序列数据转换成监督学习数据,时间序列数据的维度为N_features,时间序列的长度为l,X_timesteps为时间窗口长度,对应样本数据;Y_timesteps为预见期长度,对应数据标签数据;对发电量时序序列依次进行滑动分割,每次取出长度为X_timesteps+Y_timesteps的序列,得到多个子序列,子序列的数量N_samples=l-X_timesteps-Y_timesteps+1。
5.根据权利要求1所述的基于长短期记忆网络的梯级水电站发电量预测方法,其特征在于,步骤5中,所述对步骤3的发电量数据进行集成经验模态分解,具体包括:
1)导入数据集X,数据集的容量为N,标准差为std;
2)初始化附加噪声与标准差之比Nstd以及集成数量NE;
3)对N取对数取整后减1,得到IMF分量个数M;
4)对序列添加噪声;
5)进行经验模态分解得到IMF分量以及残差,当分解次数小于M时进入步骤4);
6)输出IMF分量及残差。
6.根据权利要求1所述的基于长短期记忆网络的梯级水电站发电量预测方法,其特征在于,步骤6中,所述采用改进离散差分进化算法进行模型超参数优化,对深度学习中的超参数学习率、迭代次数、优化器、激活函数、时间窗、神经元数量进行独热编码,再进行差分进化。
7.根据权利要求1-6任意一项所述的基于长短期记忆网络的梯级水电站发电量预测方法,其特征在于,所述采用改进离散差分进化算法进行模型超参数优化的过程利用分布式并行计算方法,分布式并行计算方法包括以下步骤:
(1)主节点加载集群计算节点列表,并对优化算法的种群初始化;
(2)主节点根据节点列表向所有计算节点广播确认信息,若有节点无响应则将该节点从节点列表移除;当节点列表为空,即所有节点均无法工作,则提示用户检查节点信息,计算终止;
(3)如果有可用节点,主节点将开启多线程,将种群的计算任务均衡到各计算节点,然后开启线程等待,并设定超时时间,等待各计算节点返回计算结果;当有节点计算超时,放弃该节点计算结果,将该节点移除;
(4)当所有节点计算完毕,判断是否达到终止条件,如果没有达到终止条件,则更新种群与最优值,执行步骤(3);如果达到终止条件后,使用最优参数进行模型训练,并输出训练好的模型。

说明书全文

基于长短期记忆网络的梯级电站发电量预测方法

技术领域

[0001] 本发明属于水电能源优化领域,具体涉及基于长短期记忆网络的梯级水电站发电量预测方法。

背景技术

[0002] 随着我国电网建设的高速发展和电网规模的不断扩大,电网安全稳定经济运行的需求越来越高,日益增长的用电需求和调峰能之间的矛盾,给水电运营带来极大挑战。然而,水电作为我国电网中的主要调峰电源,出力过程需充分考虑各受电电网调峰要求,这对挖掘水电站基于多约束情形下发电量预测提出更高要求。水电站发电量预测以水电站过去一段时间的发电量、入库流量、出库流量、坝上水位、坝下水位、水头、蓄能值等与水电站发电存在相关关系的数据来预测未来一段时间水电站的发电量,从而方便调度计划制作。
[0003] 现有发电量预测的研究主要面向无调节能力的小水电站,发电量预测主要采用以下几类方法,最常用的是灰色预测模型,该方法对通过较少的输入信息进行变换,建立微分灰色系统,对事物的发展做出解释;动态神经网络类模型也常用于径流式水电站发电量预测,包括BP神经网络、小波神经网络以及人工神经网络ANN等。但是此类径流式水电站发电量基本取决于来水,人工可操作空间较小。现有研究方法鲜有提及大中型梯级电站发电量的预测,这给调度计划的编制带来了困难,且当前研究尚未考虑到发电量时间序列的长期依赖性。

发明内容

[0004] 本发明的技术问题是现有的发电量预测方法鲜有提及大中型梯级电站发电量的预测,且未考虑到发电量时间序列的长期依赖性。
[0005] 本发明的目的是解决上述问题,提供基于长短期记忆网络的梯级水电站发电量预测方法,利用长短期记忆网络(Long Short-Term Memory,LSTM)构建发电量预测模型,对水电站发电量数据进行集成经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)得到发电量预测模型的训练集和测试集,同时针对LSTM神经网络参数种类多、非连续以及人工调参难度大的特点,采用改进的离散差分进化算法(Modified Discrete Differential Evolution Algorithms,MDDE)对发电量预测模型超参数优化,更加精确地对梯级水电站发电量做出预测。
[0006] 本发明的技术方案是基于长短期记忆网络的梯级水电站发电量预测方法,包括以下步骤,步骤1:对特征工程的数据预处理,对水电站发电量时间序列进行平稳性检验;
[0007] 步骤2:对发电量时间序列进行相关性检验,选取相关性高的发电量影响因子;
[0008] 步骤3:将发电量时间序列数据转换成监督学习数据;
[0009] 步骤4:建立基于长短期记忆网络的发电量预测模型;
[0010] 步骤5:对步骤3的发电量数据进行集成经验模态分解,得到训练集和测试集;
[0011] 步骤6:利用训练集对发电量预测模型进行训练,采用改进离散差分进化算法进行模型超参数优化,得到最优模型参数;
[0012] 步骤7:使用测试集对基于长短期记忆网络的发电量预测模型进行测试;
[0013] 步骤8:采用基于长短期记忆网络的发电量预测模型对梯级水电站进行发电量预测。
[0014] 优选地,步骤1中,所述对水电站发电量时间序列进行平稳性检验,采用单位根检验的方法,当序列不存在单位根时则认为序列具有平稳性,否则认为该序列是非平稳时间序列。
[0015] 优选地,步骤2中,所述对发电量时间序列进行相关性检验,包括计算Pearson相关系数、Spearman相关系数。
[0016] 进一步地,步骤3中,所述将发电量时间序列数据转换成监督学习数据,时间序列数据的维度为N_features,时间序列的长度为l,X_timesteps为时间窗口长度,对应样本数据;Y_timesteps为预见期长度,对应数据标签数据;对发电量时序序列依次进行滑动分割,每次取出长度为X_timesteps+Y_timesteps的序列,得到多个子序列,子序列的数量N_samples=l-X_timesteps-Y_timesteps+1。
[0017] 进一步地,步骤5中,所述对步骤3的发电量数据进行集成经验模态分解,具体包括:
[0018] 1)导入数据集X,数据集的容量为N,标准差为std;
[0019] 2)初始化附加噪声与标准差之比Nstd以及集成数量NE;
[0020] 3)对N取对数取整后减1,得到IMF分量个数M;
[0021] 4)对序列添加噪声;
[0022] 5)进行经验模态分解得到IMF分量以及残差,当分解次数小于M时进入步骤4);
[0023] 6)输出IMF分量及残差。
[0024] 进一步地,步骤6中,所述采用改进离散差分进化算法进行模型超参数优化,对深度学习中的超参数学习率、迭代次数、优化器、激活函数、时间窗、神经元数量进行独热编码,再进行差分进化。
[0025] 优选地,所述采用改进离散差分进化算法进行模型超参数优化的过程利用分布式并行计算方法,分布式并行计算方法包括以下步骤:
[0026] (1)主节点加载集群计算节点列表,并对优化算法的种群初始化;
[0027] (2)主节点根据节点列表向所有计算节点广播确认信息,若有节点无响应则将该节点从节点列表移除;当节点列表为空,即所有节点均无法工作,则提示用户检查节点信息,计算终止;
[0028] (3)如果有可用节点,主节点将开启多线程,将种群的计算任务均衡到各计算节点,然后开启线程等待,并设定超时时间,等待各计算节点返回计算结果;当有节点计算超时,放弃该节点计算结果,将该节点移除;
[0029] (4)当所有节点计算完毕,判断是否达到终止条件,如果没有达到终止条件,则更新种群与最优值,执行步骤(3);如果达到终止条件后,使用最优参数进行模型训练,并输出训练好的模型。
[0030] 相比现有技术,本发明的有益效果:
[0031] 1)本发明的基于长短期神经网络的梯级短期发电量预测方法可适用于大中型梯级电站发电量的预测;
[0032] 2)通过相关分析和主成分分析,提取了对发电量影响显著的因子,同时使用集成经验模态分解技术将时间序列进行特征提取,有利于模型从不同尺度上的数据学习调度规则,提高了模型的泛化能力和稳定性
[0033] 3)基于LSTM神经网络的发电量预测模型能够处理长期依赖,对多年调节电站发电量预测更有优势;
[0034] 4)采用改进离散差分进化算法对发电量预测模型的超参数优化,提高了基于长短期神经网络的发电量预测模型的拟合精度附图说明
[0035] 下面结合附图和实施例对本发明作进一步说明。
[0036] 图1为基于长短期记忆网络的梯级水电站发电量预测方法的流程图
[0037] 图2为集成经验模态分解的流程示意图。
[0038] 图3为时间序列转换成监督学习数据的示意图。
[0039] 图4为独热编码与自然编码的对比示意图。
[0040] 图5为分布式并行计算方法的流程示意图。
[0041] 图6为水布垭电站日发电量时序图。
[0042] 图7为隔河岩电站日发电量时序图。
[0043] 图8-1为水布垭电站发电量时间序列自相关分析图。
[0044] 图8-2为水布垭电站发电量时间序列偏自相关分析图。
[0045] 图8-3为隔河岩电站发电量时间序列自相关分析图。
[0046] 图8-4为隔河岩电站发电量时间序列偏自相关分析图。
[0047] 图9-1为水布垭电站发电量影响因素相关分析的Pearson相关系数图。
[0048] 图9-2为水布垭电站发电量影响因素相关分析的Spearman相关系数图。
[0049] 图10-1为隔河岩电站发电量影响因素相关分析的Pearson相关系数图。
[0050] 图10-2为隔河岩电站发电量影响因素相关分析的Spearman相关系数图。
[0051] 图11为水布垭日发电量序列EEMD分解结果。
[0052] 图12为本发明的MDDE-EEMD-LSTM模型与LSTM模型预测效果对比图。
[0053] 图13为本发明的MDDE-EEMD-LSTM模型与LR模型预测效果对比图。
[0054] 图14为本发明的MDDE-EEMD-LSTM模型与SVR模型预测效果对比图。
[0055] 图15为本发明的MDDE-EEMD-LSTM模型与RF模型预测效果对比图。
[0056] 图16为本发明的MDDE-EEMD-LSTM模型与MA模型预测效果对比图。
[0057] 图17为LSTM网络的结构示意图。

具体实施方式

[0058] 如图1所示,基于长短期记忆网络的梯级水电站发电量预测方法,包括以下步骤,[0059] 步骤1:对特征工程的数据预处理,使用单位根检验的方法对水电站发电量时间序列进行平稳性检验,当序列不存在单位根时则认为序列具有平稳性,否则认为该序列是非平稳时间序列;
[0060] 步骤2:对发电量时间序列进行相关性检验,计算Pearson相关系数、Spearman相关系数,选取相关性高的发电量影响因子;
[0061] 步骤3:将发电量时间序列数据转换成监督学习数据;
[0062] 步骤4:建立基于长短期记忆网络的发电量预测模型;
[0063] 步骤5:对步骤3的发电量数据进行集成经验模态分解,得到训练集和测试集;
[0064] 步骤6:利用训练集对发电量预测模型进行训练,采用改进离散差分进化算法进行模型超参数优化,得到最优模型参数;
[0065] 步骤7:使用测试集对基于长短期记忆网络的发电量预测模型进行测试;
[0066] 步骤8:采用基于长短期记忆网络的发电量预测模型对梯级水电站进行发电量预测。
[0067] 步骤1采用期刊《Economics Letters》1997年57期刊登的论文“The power of the ADF test”公开的单位根检验方法。
[0068] 本发明的利用集成经验模态分解EEMD、改进离散差分进化算法MDDE,基于长短期记忆网络LSTM建立的发电量预测模型,记为MDDE-EEMD-LSTM。
[0069] 步骤3中,将多变量时间序列转换为监督学习数据,序列维度为N_features,长度为l,X_timesteps为时间窗口长度,对应样本数据;Y_timesteps为预见期长度,对应数据标签数据。对该序列依次进行滑动分割,取出长度为(X_timesteps+Y_timesteps)的序列,得到多个子序列,N_samples为得到的子序列的数量。如图3所示,以N_features=2,l=10的时间序列为例进行转换,取X_timesteps=6,Y_timesteps=2,即以历史6个时段的序列数据预测未来2个时段的数据,对于每个特征,整个时间序列可生成N_samples=3个新子序列。对于任意维度和长度的时间序列均可按此方式进行处理。
[0070] 步骤5中,对发电量数据进行集成经验模态分解得到训练集,流程如图2所示,包括:
[0071] 1)导入数据集X,其容量为N,标准差为std;
[0072] 2)初始化附加噪声与标准差之比Nstd以及集成数量NE;
[0073] 3)对N取对数取整后减1,得IMF分量个数M;
[0074] 4)对序列添加噪声,X=X+rand*Nstd,其中rand为随机数,且0≤rand≤1;
[0075] 5)进行经验模态分解得到IMF分量以及残差,当分解次数小于M时进入步骤4);
[0076] 6)输出IMF分量及残差。
[0077] 步骤6的改进离散差分进化算法对现有的离散差分进化算法进行改进,现有的离散差分进化算法为Tasgetiren M F于2010发表的论文“An ensemble of discrete differential evolutionalgorithms for solving the generalized traveling salesman problem”所公开的算法。改进离散差分进化算法对模型参数进行独热编码,再进行差分进化,个体交叉策略和变异策略与现有的离散差分进化算法的差分进化一致,差别在于对种群个体分量操作之后要进行规范化。
[0078] 使用改进离散差分进化算法进行模型超参数优化,得到最优模型参数:对深度学习中的超参数学习率、迭代次数、优化器、激活函数、时间窗、神经元数量进行独热编码,独热编码方式如图4所示,再进行差分进化,个体交叉策略和变异策略与传统差分进化一致,差别在于对种群个体分量操作之后要进行规范化。举例说明,对种群中第i个个体的第j个分量 而言,假如初始值 经过交叉变异操作之后变为此时将分量中最大值变为1,其余值置为0,即规范化之后的结果为 当存在多个分量均为最大值,则在其中随机选择一位将其变为1,其余置0;当所有的分量均为0时,则将随机将其中一个分量置为1。此过程采用分布式并行训练方案对模型进行训练,流程如图5所示,包括以下步骤:(1)主节点加载集群计算节点列表,并对优化算法的种群初始化;
(2)主节点根据节点列表向所有计算节点广播确认信息,若有节点无响应则将该节点从节点列表移除。当节点列表为空,即所有节点均无法工作,则提示用户检查节点信息,计算终止;(3)如果有可用节点,主节点将开启多线程,将种群的计算任务均衡到各计算节点,然后开启线程等待,并设定超时时间,等待各计算节点返回计算结果。当有节点计算超时,放弃该节点计算结果,将该节点移除;(4)当所有节点计算完毕,判断是否达到终止条件,如果没有达到终止条件,则更新种群与最优值,执行步骤(3);如果达到终止条件后,使用最优参数进行模型训练,并输出训练好的模型。
[0079] 实施例中,以清江梯级水布垭和隔河岩两级电站作为对象进行发电量预测,选取的时间序列如表1所示。
[0080] 表1梯级电站系列选取统计表
[0081]
[0082] 分析发电量时间序列的特点。为保证时间序列的完整性,首先对数据集的缺失值进行处理。然后绘制清江梯级水布垭和隔河岩电站历史发电量时序图,如图6和图7所示。已知水布垭、隔河岩电站日满发电量分别为4416万KW·h和2909万KW·h,观察时序图极值可知,序列值均在合理范围内,无异常点出现。由于有零值出现,影响MAPE指标的计算,而为了保证序列连续性,不剔除零值点,而是将该值处理为1。观察序列总体特征易知该电站多年发电量过程无明显趋势性和周期性,初步判断发电量时间序列为平稳时间序列。
[0083] 分析发电量序列平稳性,对水布垭、隔河岩发电量时间序列进行单位根检验,检验结果如表2所示。单位根检验的原假设为检验对象无单位根,而两座电站的p-value均小于Critical Value(5%),证明有单位根,拒绝原假设,即两座电站的发电量时间序列都是平稳时间序列,为下一步时间序列分析提供依据。
[0084] 表2水布垭、隔河岩电站发电量单位根检验检验结果
[0085]
[0086] 发电量时间序列的自相关和偏自相关分析结果如图8-1、图8-2、图8-3、图8-4所示。首先研究自相关性,图8-1、图8-3分别为水布垭电站、隔河岩电站发电量时间序列的自相关图,钟形区域为95%置信区间,两座电站相关系数分别为60阶和50阶截尾;然后研究发电量时间序列的偏自相关性,由图8-2和图8-4可知,两座电站的偏自相关图呈拖尾趋势。综上可判定两座电站可采用移动自回归模型(Moving Average,MA)来建模,其中水布垭电站可用MA(60)来建模,而隔河岩电站采用模型MA(50)。相关分析的结果为MA模型的应用定阶。
[0087] 为全面对选取的发电量影响因子进行相关性分析,分别计算Spearman相关系数、Pearson相关系数,并将结果进行对比。已知相关系数取值范围为[-1,1],表示相关性的强弱,大于0表示正相关,小于0表示负相关,等于0则表示不相关。如图9-1和图9-2所示,在两种方法中,水布垭电站的发电量与出库流量的相关度最高,达到0.92,入库径流相关度位列其次,初步分析是由于水布垭水库调节能力较强。从Spearman相关系数、Pearson相关系数结果来看,相关度均较高的共同因素为出库流量和入库流量,然而进一步分析发现,出库流量和入库流量二者本身存在较强相关关系,为避免引入冗余因素影响模型泛化性能,只选择出库流量作为水布垭电站的影响因素;对于隔河岩电站,如图10-1和图10-2所示,Spearman相关系数、Pearson相关系数结果均表明入库流量和发电量的相关度最高,因此选择入库流量作为影响隔河岩电站发电量的关键因子。
[0088] 实施例中,采用一个LSTM层堆叠一个全连接层的结构来搭建发电量预测模型的主体结构,LSTM结构如图17所示,并使用MDDE算法对各层进行超参数优化,参数优选结果如表3所示。
[0089] 表3超参数优化结果表
[0090]
[0091] 为验证发电量预测模型性能,先进行单步预测。首先将原始发电量数据信号采用EEMD算法进行分解,以水布垭电站为例,输入4047天的发电量数据、附加噪声与发电量标准差比值为0.2,以及EEMD集合数取值为70。通过分解,将原始发电量序列Original分解为一个残差Residual和10个本征模函数IMF。如图11所示,通过观察可发现EEMD算法将原始信号进行了分解,将不同时间尺度的信号逐级分解开来。以前3600天作为训练集,后417天作为测试集,分别采用MDDE-EEMD-LSTM、LSTM、SVR、LR以及RF模型进行训练和测试,各项指标结果如表4所示,表中MAE表示平均绝对误差,MAPE表示平均绝对百分比误差,RMSE表示均方根2
误差,R表示确定系数,单站单步预测情况下本发明的模型在各项指标上均最优,现有LSTM神经网络拟合效果较优,但与最优值仍有一定差距,表明本发明提出的改进措施提高了LSTM模型的拟合精度。
[0092] 为直观展示预测效果,绘制各模型发电量预测100个点的对比图,如图12~16所示。与现有LSTM模型相比,本发明的发电量预测模型很好地跟踪了发电量趋势,且拟合精度较高。而LSTM模型尚未学习到足够的数据特征,仅仅将过去一天的发电量当做当前发电量,从图中可直观看出,LSTM的预测曲线相当于将实测曲线跟随时间平移了一步;对于LR、RF以及SVR等模型来说,仅仅学习到了数据的总体变化趋势,预测值在实际值附近振荡幅度较大,不具备参考性;而对于MA(60)模型,随着时间的延长,预测值趋势逐渐平滑,新数据的加入对均值影响不大,无法实现预测。
[0093] 表4单步预测各模型性能比较表
[0094]
[0095] 为进一步评价MDDE-EEMD-LSTM模型的有效性,分别进行了3步和7步的预测,并与基本LSTM模型做比较。如表5和表6所示,随着预见期的延长,各模型的各项评价指标都有所下降,且波动幅度因模型而异。而本发明的模型在增加预测步长时,虽然预测精度有所下降,但与其他常规方法相比仍具有较高精度,可为工程实际提供参考。
[0096] 表5预测3步各模型性能比较表
[0097]
[0098] 表6预测7步各模型性能比较表
[0099]
[0100] 进一步研究梯级发电量整体预测模式,将水布垭、隔河岩的发电量、出入库流量作为输入,采用MDDE-EEMD-LSTM模型进行发电量预测。连续预测200天并计算各项指标并与单站预测相比较。如表7所示,以梯级为单位进行预测的精度稍逊于单站预测。进行梯级水电站发电量预测时,以单站预测方式预测,然后累加得到梯级发电量预测结果,可提高预测精度。
[0101] 表7单站预测与梯级预测对比表
[0102]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈