首页 / 专利库 / 数学与统计 / 超平面 / 基于自适应分类策略和混合优化SVR的光功率预测方法

基于自适应分类策略和混合优化SVR的光功率预测方法

阅读:203发布:2020-05-08

专利汇可以提供基于自适应分类策略和混合优化SVR的光功率预测方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种基于自适应分类策略和混合优化SVR的光功率预测方法,包括以下步骤:S1.数据预处理,采用无量纲化处理方法和基于 密度 的离群点 算法 剔除历史样本中的异常样本,并采用插值算法对缺失数据进行重构或直接删除;S2.样本帅选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本;S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练 预测模型 ,输入预测时刻气象数据,得到功率预测值。本发明能够降低错误数据和缺失数据对预测 精度 的不利影响,能根据预测时刻气象数据筛选出与预测时刻气象数据高度相似的历史样本,并采用量子粒子群与网格法混合优化SVR算法的超参数,提高模型的泛化能 力 。,下面是基于自适应分类策略和混合优化SVR的光功率预测方法专利的具体信息内容。

1.一种基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,包括以下步骤:
S1.数据预处理,采用无量纲化处理方法和基于密度的离群点算法剔除历史样本中的异常样本,并采用插值算法对缺失数据进行重构或直接删除;
S2.样本筛选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本;
S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练预测模型,输入预测时刻气象数据,得到功率预测值。
2.根据权利要求1所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S1中,对多种数据进行分别预处理:
S11.针对原始数据,进行无量纲化处理方法处理;
S12.针对异常数据,进行删除处理或插值算法重构处理。
3.根据权利要求2所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S12中,针对不同气象因素的变化特点及其对光伏功率的影响程度,采用不同的异常数据预处理策略:
A1.删除所有处于夜间时段的样本数据;
A2.对于太阳辐照度数据,若连续超过预设次数的采样数据没有变化,则认为该时段内太阳辐照度数据是死数,若连续缺失点/死数不超过规定个数,则采用插值算法重构,否则删除相应样本;
A3.对于温度、湿度、压强这三类气象数据,以时间为因变量采用插值算法重构;
A4.对于资源,只对风速、风向数据做校验。
4.根据权利要求3所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,步骤S2中,自适应分类策略包括:
B1.结合PA和GRA算法自适应确定影响光伏输出功率的主要气象特征及其决定系数,进而筛选出与预测时刻气象特征高度相似的历史样本;
B2.基于分布因子和预测模型适应度函数值的负反馈策略自适应调整时间窗函数中心点和窗长,辅助筛选高度相似的历史样本。
5.根据权利要求4所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B1中,先排除日照时长和季节的影响,然后基于PA原理分析计算出各气象特征对光伏输出功率的决定系数,根据决定系数阈值确定主要气象特征;
以标准化后的自变量x1、x2、…、xn及因变量y为例阐述通径分析计算方法,其中,自变量x1、x2、…、xn两两之间相关。xi与y的相关系数用riy表示,将riy按式(7)分解式中,piy表示xi对y的通径系数;pjy表示xj对y的通径系数;rij表示xi与xj的相关系数;
rijpjy表示xi通过xj对y的间接作用分量,则自变量x1、x2、…、xn与y的相关系数可按式(8)分解
其中,rii=1。单自变量xi对y的决定系数di可以表示为
根据标准化的偏回归系数的特性可知,di反应了该自变量对因变量的解释能,di越大,解释能力越强。
6.根据权利要求5所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B1中,将各个气象因素对光伏功率的决定系数作为权重,计算各个历史样本的气象数据与预测时刻气象数据的加权灰色关联度:
将预测时刻气象数据无量纲化后作为参考序列
X0=(x0(1),x0(2),…,x0(m))                  (10)
将所有历史样本的气象数据无量纲化后作为比较序列
计算得到比较序列与参考序列的差值序列为
其中:差值序列的每一个元素x′i(j)=|xi(j)-x0(j)|,1≤i≤n,1≤j≤m,按式(13)确定差值序列的两级最大差Δ(max)和两级最小差Δ(min)
比较序列中每个元素的关联系数为
其中:ρ为分辨系数,用来削弱Δ(max)过大而使关联系数失真的影响,各个比较序列与参考序列的灰色关联度为
其中:ωj表示每一列元素的权重系数。
7.根据权利要求6所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B1中,根据以下方法自适应确定加权灰色关联度中各个气象因素的分辨系数:
根据比较序列矩阵中每一列元素的平均值与Δ(max)的比值自适应确定该列的分辨系数ρ的取值:
定义
ε(j)的大小反应了每一列元素中是否存在异常值,当 时,认为序列中存在异常值,ρ(k)应取(0,0.5]的值来抑制Δ(max)对关联度的支配作用,可取ρ(k)=min(0.5,1.5ε(j));当 时,认为序列平稳,ρ(k)可取(0.5,1)内的值来增强Δ(max)对关联度的支配作用:
(1)当 时,可取ρ(k)=max(0.5,2ε(j));
(2)当 时,取ρ(k)∈(0.8,1)。
8.根据权利要求4所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B2中,自适应长度的滑动时间窗函数为:
kmid(n)=kmid(n-1)±Δk               (18)
L(m)=L(m-1)+ΔL               (19)
其中,k表示当前预测时刻点号,0≤k≤96;kmid(n)表示窗函数中心偏移n次后对应的点号,kmid(0)=k;Δk表示窗函数中心偏移步长;L(m)表示扩大m次半径后窗函数的搜索半径,L(0)=2,步长ΔL=1;
采用预测时刻辐照度数据在所选时间窗下所有历史样本的辐照度数据中的分布因子τ来调整时间窗的中心点位置
式中,N表示所选时间窗下所有样本个数,n表示N个样本中辐照度小于预测时刻辐照度的样本个数;
采用拟合优度R2来量化预测模型的拟合度,R2越接近1,说明模型的拟合度越好,反之越差;
其中, 表示待拟合量y的均值, 表示拟合值。
9.根据权利要求8所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S3中,采用支持向量回归机算法训练预测模型:
给定训练样本集:{(xi,yi)|i=1,2,…,l},其中,xi∈Rn表示输入向量,yi∈R表示输出结果,采用非线性映射 将输入向量xi映射到更高维特征空间Rk(k>n),在该空间中构造一个最优超平面
使所有样本点离超平面的“总偏差”最小,其中,ω表示权系数向量;b为偏置常数;
采用ε-不敏感损失函数,样本点与最优超平面的偏差表示为
c(x,y,f(x))=max(0,|y-f(x)|-ε)       (23)
其中,ε表示允许的误差;加入松弛因子ξi、 当划分有误差时,ξi、 均大于0;当划分无误差时,ξi、 均取0,以将该问题转换为求优化目标函数最小化问题:
其中,C表示惩罚因子;
随后,采用Lagrange系数方法并根据最优化条件解决该约束最优问题:
其中,αi、 分别表示Lagrange系数,SV表示支持向量。
10.根据权利要求9所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S3中,采用量子粒子群算法和网格法混合优化SVR的最优超参数,且量子粒子群算法包括以下步骤:
(1)设置包括种群规模m、粒子维度D、压缩-扩张因子α、最大迭代次数iter和粒子解空间范围的参数;
(2)初始化粒子当前位置xi、粒子历史最优位置pi、粒子历史适应度函数值fitpi、全局最优位置gbest;
(3)计算当前所有粒子适应度函数值fiti,搜索当前所有粒子最优适应度函数值fitbest及其对应的最优位置;
(4)更新全局历史最优位置gbest及其对应的历史最优种群适应度函数值fitgbest,更新所有粒子历史最优位置pi及其历史最优种群适应度fitpi;
(5)重复步骤(3-4)直至达到最大迭代次数iter,输出当前全局最优位置gbest。

说明书全文

基于自适应分类策略和混合优化SVR的光功率预测方法

技术领域

[0001] 本发明属于光伏功率预测技术领域,尤其是涉及一种基于自适应分类策略和混合优化SVR算法的光伏功率预测方法。

背景技术

[0002] 光伏电站输出功率受太阳辐照度、温度、湿度、速、风向、气压等气象特征的影响,这些气象特征的变化特性使光伏电站输出功率具有随机性、波动性和间歇性等特点,是导致光伏电站限电运行的主要因素。为了提高电网的光伏消纳能,并网光伏电站必须配置高精度的光伏功率预测系统。
[0003] 光伏功率预测大致包括数据预处理、样本筛选、模型训练、数值预测等几个步骤,为了提高光伏功率预测的准确率,本领域技术人员在影响光伏输出功率的主要气象特征的选取、样本筛选、模型选择、模型融合等方面进行了大量的研究。其中,常见的模型训练的算法有神经网络算法、分类回归算法、时间序列算法、随机森林算法、概率预测算法等。
[0004] 例如,由贺文,齐爽,李国庆等撰写,2015年公开于可再生能源33卷第3期333-339页的文献[1]“基于小波神经网络的太阳辐照强度预测”采用相关系数分析法和曲线估计筛选出影响太阳辐照度的主要气象特征;由杨光撰写,2014年公开于华北电力大学的文献[2]“光伏发电功率与气象影响因子关联关系的分析研究”采用灰色关联度分析(Grey Relational Analysis,GRA)确定各个气象特征对光伏功率的影响程度;由程泽,李思宇,韩丽洁等撰写,2017年公开于太阳能学报38卷03期726-733页的文献[3]“基于数据挖掘的光伏阵列发电预测方法研究”通过前项选择法在尽量减小变量间耦合的情况下,逐步约减气象特征,剔除影响较小的气象特征;由李燕青,杜莹莹撰写2018年公开于华北电力大学报(自然科学版)45卷05期29-35+61页的文献[4]“基于最优相似度与IMEA-RBFNN的短期光伏发电功率预测”利用相关性分析与平均影响值算法选取出温度、湿度、太阳辐照度3个气象特征作为影响光伏功率的主要气象特征;2019年公开于中国电机工程学报39卷08期2221-2230页的文献[5]“频域分解和深度学习算法在短期负荷及光伏功率预测中的应用”和2018年公开中南大学学报(自然科学版)49卷09期2232-2239的文献[6]“基于日类型及融合理论的BP网络光伏功率预测”将光伏板(组件)温度作为影响光伏输出功率的特征因素之一。而光伏板(组件)温度受太阳辐照度、温度、风速等气象特征和光伏组件转换效率的综合影响,在预测光伏输出功率前还需训练光伏板(组件)温度的预测模型
[0005] 另外,从相似日样本中筛选出与预测时段气象特征高度相似的样本训练预测模型是光伏功率预测算法中较常见的方法。例如文献[7]“光伏发电功率的智能预测算法”(2014年电力建设35卷07期34-39页,作者:程泽,韩丽洁,李思宇,巩力)提出根据天气类型、平均太阳辐照度、最高温度、最低温度等组成的日气象特征向量筛选出与预测日日内气象变化特征相似的相似日;文献[8]“基于相似日和径向基函数神经网络的光伏阵列输出功率预测”(2013年电力自动化设备33卷01期100-103+109页,作者,王晓兰,葛鹏江)则选取日辐照时长、最大最小辐照度及其出现时刻、最大最小温度及其出现时刻作为日气象特征向量;文献[9]“基于改进深度受限玻尔兹曼机算法的光伏发电短期功率概率预测”(2018电力自动化设备38卷05期43-49页,作者,王继东,冉冉,宋智林)以最大最小辐照度、最大最小温度作为日气象特征向量;文献[10]“基于相似日和CAPSO-SNN的光伏发电功率预测”(2017电力自动化设备37卷03期66-71页,作者陈通,孙国强,卫志农)选取季节类型、天气类型、逐时温度和风速为日气象特征向量,通过气象特征向量的灰色相关度和余弦相似度组成的综合相似度指标确定相似日。
[0006] 基于时刻聚类可以将各个时刻的历史样本精细化分类,文献[2]根据k-means聚类的手肘法将各时刻样本聚类成5类;文献[11](基于多尺度聚类分析的光伏功率特性建模及预测应用,2018电力系统自动化42卷151期24-30页,作者,管霖,赵琦,周保荣)在文献[2]的基础上,进一步与气象理论交互验证,通过k-means聚类算法将所选择的样本基于太阳辐照度聚类成3类,这3类样本集的中心点太阳辐照度刚好与晴天、阴天和雨天太阳辐照度一一对应。文献[12](基于模糊聚类和支持向量机的短期光伏功率预测,2016电力系统及其自动化学报,28卷12期115-118+129页,作者,于秋玲,许长清,李珊,刘洪,宋毅,刘晓鸥)通过气象信息建立模糊相似矩阵将光伏输出功率历史样本集划分为若干类,然后通过分类识别获得与预测日最相似一类历史日样本集。
[0007] 通过总结分析可以得出,目前的光伏功率预测研究面临以下难点:
[0008] (1)采用相关系数和灰色关联度衡量气象特征对光伏输出功率的影响程度,没有考虑各气象特征的耦合作用;采用前项选择方法,若各气象特征之间存在多重共线性,则最后确定的主要气象特征中可能混有不太重要的气象特征。不同时空尺度下影响光伏输出功率的主要气象特征及其作用机理不同,考虑到日内气象特征的多变性,有必要根据预测时刻气象特征自适应筛选出与该时刻气象特征更相似的样本训练精确的预测模型。
[0009] (2)相似日的确定方法较为粗放,导致相似日样本中可能混杂较多与预测时刻气象特征有明显差异的样本,进一步影响预测模型精度。此外,为了提高预测方法的鲁棒性,基于时刻聚类的历史样本还需进一步筛选与校验,才能用于模型训练。
[0010] (3)神经网络算法可以拟合复杂的非线性关系,但易产生过拟合;时间序列算法在天气剧烈变化的场景预测精度不高。
[0011] (4)目前大多数模型融合方法还只停留在多种模型简单的线性加权叠加上。

发明内容

[0012] 本发明的目的是针对上述问题,提供一种基于自适应分类策略和混合优化SVR的光功率预测方法。
[0013] 为达到上述目的,本发明采用了下列技术方案:
[0014] 一种基于自适应分类策略和混合优化SVR的光功率预测方法,包括以下步骤:
[0015] S1.数据预处理,采用无量纲化处理方法和基于密度的离群点算法剔除历史样本中的异常样本,并采用插值算法对缺失数据进行重构或直接删除;
[0016] S2.样本筛选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本;
[0017] S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练预测模型,输入预测时刻气象数据,得到功率预测值。
[0018] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S1中,对多种数据进行分别预处理:
[0019] S11.针对原始数据,进行无量纲化处理方法处理;
[0020] S12.针对异常数据,进行删除处理或插值算法重构处理。
[0021] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S12中,针对不同气象因素的变化特点及其对光伏功率的影响程度,采用不同的异常数据预处理策略:
[0022] A1.删除所有处于夜间时段的样本数据;
[0023] A2.对于太阳辐照度数据,若连续超过预设次数的采样数据没有变化,则认为该时段内太阳辐照度数据是死数,若连续缺失点/死数不超过规定个数,则采用插值算法重构,否则删除相应样本;
[0024] A3.对于温度、湿度、压强这三类气象数据,以时间为因变量采用插值算法重构;
[0025] A4.对于风资源,只对风速、风向数据做校验。
[0026] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,步骤S2中,自适应分类策略包括:
[0027] B1.结合PA和GRA算法自适应确定影响光伏输出功率的主要气象特征及其决定系数,进而筛选出与预测时刻气象特征高度相似的历史样本;
[0028] B2.基于分布因子和预测模型适应度函数值的负反馈策略自适应调整时间窗函数中心点和窗长,辅助筛选高度相似的历史样本。
[0029] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B1中,先排除日照时长和季节的影响,然后基于PA原理分析计算出各气象特征对光伏输出功率的决定系数,根据决定系数阈值确定主要气象特征;
[0030] 以标准化后的自变量x1、x2、…、xn及因变量y为例阐述通径分析计算方法,其中,自变量x1、x2、…、xn两两之间相关。xi与y的相关系数用riy表示,将riy按式(7)分解[0031]
[0032] 式中,piy表示xi对y的通径系数;pjy表示xj对y的通径系数;rij表示xi与xj的相关系数;rijpjy表示xi通过xj对y的间接作用分量,则自变量x1、x2、…、xn与y的相关系数可按式(8)分解
[0033]
[0034] 其中,rii=1。单自变量xi对y的决定系数di可以表示为
[0035]
[0036] 根据标准化的偏回归系数的特性可知,di反应了该自变量对因变量的解释能力,di越大,解释能力越强。
[0037] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B1中,将各个气象因素对光伏功率的决定系数作为权重,计算各个历史样本的气象数据与预测时刻气象数据的加权灰色关联度:
[0038] 将预测时刻气象数据无量纲化后作为参考序列
[0039] X0=(x0(1),x0(2),…,x0(m))  (10)
[0040] 将所有历史样本的气象数据无量纲化后作为比较序列
[0041]
[0042] 计算得到比较序列与参考序列的差值序列为
[0043]
[0044] 其中:差值序列的每一个元素xi′(j)=|xi(j)-x0(j)|,1≤i≤n,1≤j≤m,按式(13)确定差值序列的两级最大差Δ(max)和两级最小差Δ(min)
[0045]
[0046] 比较序列中每个元素的关联系数为
[0047]
[0048] 其中:ρ为分辨系数,用来削弱Δ(max)过大而使关联系数失真的影响,各个比较序列与参考序列的灰色关联度为
[0049]
[0050] 其中:ωj表示每一列元素的权重系数。
[0051] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B1中,根据以下方法自适应确定加权灰色关联度中各个气象因素的分辨系数:
[0052] 根据比较序列矩阵中每一列元素的平均值与Δ(max)的比值自适应确定该列的分辨系数ρ的取值:
[0053] 定义
[0054]
[0055] ε(j)的大小反应了每一列元素中是否存在异常值,当 时,认为序列中存在异常值,ρ(k)应取(0,0.5]的值来抑制Δ(max)对关联度的支配作用,可取ρ(k)=min(0.5,1.5ε(j));当 时,认为序列平稳,ρ(k)可取(0.5,1)内的值来增强Δ(max)对关联度的支配作用:
[0056] (1)当 时,可取ρ(k)=max(0.5,2ε(j));
[0057] (2)当 时,取ρ(k)∈(0.8,1)。
[0058] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B2中,自适应长度的滑动时间窗函数为:
[0059]
[0060] kmid(n)=kmid(n-1)±Δk  (18)
[0061] L(m)=L(m-1)+ΔL  (19)
[0062] 其中,k表示当前预测时刻点号,0≤k≤96;kmid(n)表示窗函数中心偏移n次后对应的点号,kmid(0)=k;Δk表示窗函数中心偏移步长;L(m)表示扩大m次半径后窗函数的搜索半径,L(0)=2,步长ΔL=1;
[0063] 采用预测时刻辐照度数据在所选时间窗下所有历史样本的辐照度数据中的分布因子τ来调整时间窗的中心点位置
[0064]
[0065] 式中,N表示所选时间窗下所有样本个数,n表示N个样本中辐照度小于预测时刻辐照度的样本个数;
[0066] 采用拟合优度R2来量化预测模型的拟合度,R2越接近1,说明模型的拟合度越好,反之越差;
[0067]
[0068] 其中,表示待拟合量y的均值,表示拟合值。
[0069] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S3中,采用支持向量回归机算法训练预测模型:
[0070] 给定训练样本集:{(xi,yi)|i=1,2,…,l},其中,xi∈Rn表示输入向量,yi∈R表示输出结果,采用非线性映射 将输入向量xi映射到更高维特征空间Rk(k>n),在该空间中构造一个最优超平面
[0071]
[0072] 使所有样本点离超平面的“总偏差”最小,其中,ω表示权系数向量;b为偏置常数;
[0073] 采用ε-不敏感损失函数,样本点与最优超平面的偏差表示为c(x,y,f(x))=max(0,|y-f(x)|-ε)  (23)
[0074] 其中,ε表示允许的误差;加入松弛因子ξi、 当划分有误差时,ξi、 均大于0;当划分无误差时,ξi、 均取0,以将该问题转换为求优化目标函数最小化问题:
[0075]
[0076] 其中,C表示惩罚因子;
[0077] 随后,采用Lagrange系数方法并根据最优化条件解决该约束最优问题:
[0078]
[0079]
[0080] 其中,αi、 分别表示Lagrange系数,SV表示支持向量。
[0081] 在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S3中,采用量子粒子群算法和网格法混合优化SVR的最优超参数,且量子粒子群算法包括以下步骤:
[0082] (1)设置包括种群规模m、粒子维度D、压缩-扩张因子α、最大迭代次数iter和粒子解空间范围的参数;
[0083] (2)初始化粒子当前位置xi、粒子历史最优位置pi、粒子历史适应度函数值fitpi、全局最优位置gbest;
[0084] (3)计算当前所有粒子适应度函数值fiti,搜索当前所有粒子最优适应度函数值fitbest及其对应的最优位置;
[0085] (4)更新全局历史最优位置gbest及其对应的历史最优种群适应度函数值fitgbest,更新所有粒子历史最优位置pi及其历史最优种群适应度fitpi;
[0086] (5)重复步骤(3-4)直至达到最大迭代次数iter,输出当前全局最优位置gbest。
[0087] 本发明的优点在于:
[0088] (1)采用无量纲化处理方法、基于密度的离群点算法对光伏电站历史样本数据进行预处理,采用插值算法对缺失数据进行重构,可以剔除错误数据,删除/重构缺失数据,降低错误数据和缺失数据对预测精度的不利影响;
[0089] (2)采用通径分析自适应确定不同时空尺度下影响光伏输出功率的主要气象特征及各主要气象特征对光伏输出功率的决定系数,结合灰色关联度分析自适应筛选出与预测时刻气象数据高度相似的历史样本;并提出了基于分布因子和预测模型适应度函数值的负反馈策略,动态调整时间窗中心及窗长,能够进一步提高筛选样本气象数据与预测时刻气象数据的相似度;
[0090] (3)采用量子粒子群与网格法混合优化SVR算法的超参数,提高模型的泛化能力。附图说明
[0091] 图1是本发明的功率预测整体流程图
[0092] 图2是本发明自适应相似样本筛选流程图;
[0093] 图3是本发明中的通径模型图;
[0094] 图4是本发明中负反馈策略;
[0095] 图5是本发明中量子粒子群算法流程图;
[0096] 图6是本发明中数据预处理后的散点图;
[0097] 图7是本发明中聚类分析散点图;
[0098] 图8是本发明中12:30时聚类分析散点图;
[0099] 图9是本发明中晴天功率曲线对比图;
[0100] 图10是本发明中多天功率曲线对比图;
[0101] 图11是本发明中雨天功率曲线对比图。

具体实施方式

[0102] 下面结合附图和具体实施方式对本发明做进一步详细的说明。
[0103] 如图1所示,不同时空尺度下影响光伏功率的主要气象因素及其作用机理不同,因此,基于光伏电站历史数据和预测气象数据的建模方法应能适应天气类型的多变性。本实施例综合考虑数据预处理、样本筛选、模型优化等各个方面,提出了一种基于自适应分类策略和混合优化SVR算法的光伏功率预测方法,包括以下步骤:
[0104] S1.数据预处理,采用无量纲化处理方法和基于密度的离群点算法剔除历史样本中的异常样本,采用插值算法对缺失数据进行重构或将缺失数据直接删除;
[0105] S2.样本筛选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本以用于后续对预测模型的训练;
[0106] S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练预测模型,输入预测时刻气象数据,得到功率预测值。
[0107] 进一步地,在步骤S1中,综合运用多种数据预处理方法,具体包括:
[0108] S11.历史样本数据的每一个维度具有不同的物理意义,单位不同,数据的量级各异,为了消除原始数据在量纲和数量级上的差异对最终分析结果造成的影响,首先对原始数据进行无量纲化处理,对原始数据无量纲化处理方法有区间化、均值化、初值化、倒数化等,根据各个因素的变化特点选择不同的归一化方法;
[0109] S12.基于密度的离群点算法筛选出历史样本中的异常数据,例如由于现场通讯的不稳定性以及天气的瞬时变化特性,导致光伏电站的历史实测气象数据和功率数据中存在死数、空值、脉冲值等异常数据,针对该类异常数据的样本点进行删除或采用插值算法重构。
[0110] 进一步地,在步骤S12中,针对不同的异常数据采用不同的处理方法:
[0111] 首先,考虑到夜间太阳辐照度为0,所有夜间采集的气象数据、太阳辐照度数据和功率数据均为无效数据,可以将所有处于夜间时段的样本数据删除。
[0112] 其次,当采集到的数据与实际客观规律不符,例如太阳辐照度小于0、输出功率与光伏电站额定容量比值超过限值、温度超过上下限值等,认定这样的样本数据为异常数据。针对不同气象因素的变化特点及其对光伏功率的影响程度,采用不同的异常数据预处理策略:
[0113] 太阳辐照度是影响光伏功率的最主要因素,与光伏功率近似成线性关系,且太阳辐照度在一定时段内可能受其他气象因素影响或者云遮挡而发生剧烈变化。针对太阳辐照度数据,若连续超过规定次数的采样数据没有变化,则认为该时段内太阳辐照度数据是死数。针对连续缺失点/死数不超过规定个数的情况,太阳辐照度和功率可以相互为自变量和因变量采用插值算法重构;超过规定个数,插值算法的计算结果误差较大,所以直接将该样本删除;
[0114] 温度、湿度、气压等气象因素随时间稳定变化,可以以时间为因变量,直接采用插值算法重构;
[0115] 风资源具有间歇性特点,且风速、风向不是影响光伏功率的主要因素,所以只对风速、风向数据只做简单的校验,比如风向度变化范围为0°~359°,风速非负等。
[0116] 进一步地,在步骤S2中,自适应分类策略由2部分组成:
[0117] B1结合PA和GRA算法自适应确定影响光伏输出功率的主要气象特征及其决定系数,进而筛选出与预测时刻气象特征高度相似的历史样本;
[0118] B2基于分布因子和预测模型适应度函数值的负反馈策略自适应调整时间窗函数中心点和窗长,辅助筛选相似样本。
[0119] 进一步地,在B1中,地球自转及公转使太阳辐照度、温度、湿度等气象数据发生周期性变化,最终使光伏输出功率具有季节、月、日、小时的周期性变化规律;光伏输出功率的波动性和间歇性则源于气象数据的瞬时变化、云层运动等;此外,光电转换效率、电力电子器件的转换效率也会影响光伏输出功率。光伏组件的光电转换效率除受电池发电效率、封装方式、电路结构等自身因素影响外,还受气象因素等外在因素的影响。
[0120] 各个气象因素不仅直接影响光伏组件输出功率,而且会通过相互作用影响光电转换效率等进而间接影响光伏组件输出功率。光伏组件最大输出功率Pmax及其发电效率η可用式(1)、(2)表示
[0121] Pmax=Voc·Isc  (1)
[0122]
[0123] 式中,Isc表示光伏组件的短路电流,Voc表示光伏组件的开路电压,Pin表示光伏组件接收到的太阳辐照度,FF表示光伏组件的填充因子,光伏组件Isc和Voc这两个重要的参数会因气象因素的变化而变化。当太阳辐照度增加时,光伏组件的短路电流Isc会线性增加,开路电压Voc近似对数关系增加;当光伏组件的温度升高时,短路电流Isc会略有增加,但开路电压Voc会线性下降;风速和风向会共同影响光伏组件表面与大气的热交换系数,并最终影响到光伏组件的转换效率;湿度越大,大气中汽含量越大,其对太阳辐照度的削弱则越大,从而导致光伏组件的输出功率降低。
[0124] 针对不同预测时段的气候、气象周期性变化规律,并考虑日内气象突变因素,本发明构建了基于适应不同时空尺度的自适应相似样本筛选策略,如图2所示。首先,排除日照时长、季节的影响:
[0125] 考虑到不同季节地表日照时长对光伏电站日发电功率平均水平的影响,将光伏电站历史气象特征数据和功率数据按季节进行初步分类。然后,选取样本特征量v0=[P,S,T],采用k-means聚类算法将各季节历史样本根据时刻聚类成3类,这3类样本的气象特征与晴天、阴天、雨天一一对应,其中,P表示功率,S表示太阳辐照度,T表示温度。
[0126] 考虑到日内天气类型反复切换等极端天气现象,与该日内各预测时刻气象特征相似的样本对应的天气类型也应自适应切换,根据式(3)从这3类样本中选取判决函数L(i)最小的一类样本
[0127] L(i)=di-μdi-2δdi  (3)
[0128] 其中,di表示该时刻气象特征数据与第i类样本中心点气象特征数据的欧氏距离;δdi和μdi表示第i类样本中各样本气象特征数据到该类样本中心点气象数据欧氏距离的标准差和平均值。
[0129] 排除日照时长、季节的影响后,基于通径分析(path analysis,PA)原理分析计算出各气象特征对光伏输出功率的决定系数,分析不同时空尺度下影响光伏输出功率的主要气象特征及其作用机理,根据决定系数阈值θd确定主要气象特征。例如PA可以将单个自变量对因变量的相关系数分解为直接作用(偏回归系数)和通过其它自变量的间接作用,进而可以判断单个自变量对因变量的作用方向、作用强度和解释能力。通径系数是用来表示相关变量因果关系的统计量,是标准化的偏回归系数,通径系数pxy的定义为
[0130]
[0131] 其中,bxy表示自变量x对因变量y的偏回归系数,δx表示自变量x的标准差,δy表示自变量y的标准差。
[0132] 图3中通径模型包含结果变量x3、外生变量x1和内生变量x2,x1→x3、x1→x2、x2→x3的通径系数分别为p13、p12、p23,其结构方程组为
[0133]
[0134] 将方程组(5)化简
[0135] x3=(p13+p23p12)x1  (6)
[0136] 其中,p13表示x1对x3的直接作用分量,p23p12表示x1对x3的间接作用分量,p13+p23p12表示x1对x3的相关系数。
[0137] 以标准化后的自变量x1、x2、…、xn及因变量y为例阐述通径分析计算方法,其中,自变量x1、x2、…、xn两两之间相关。xi与y的相关系数用riy表示,将riy按式(7)分解[0138]
[0139] 式中,piy表示xi对y的通径系数;pjy表示xj对y的通径系数;rij表示xi与xj的相关系数;rijpjy表示xi通过xj对y的间接作用分量,则自变量x1、x2、…、xn与y的相关系数可按式(8)分解
[0140]
[0141] 其中,rii=1。单自变量xi对y的决定系数di可以表示为
[0142]
[0143] 根据标准化的偏回归系数的特性可知,di反应了该自变量对因变量的解释能力,di越大,解释能力越强。
[0144] 进一步地,在步骤B1中,将各个气象因素对光伏功率的决定系数作为权重,计算各个历史样本的气象数据与预测时刻气象数据的加权灰色关联度。
[0145] 将预测时刻气象数据无量纲化后作为参考序列
[0146] X0=(x0(1),x0(2),…,x0(m))  (10)
[0147] 将所有历史样本的气象数据无量纲化后作为比较序列
[0148]
[0149] 计算得到比较序列与参考序列的差值序列为
[0150]
[0151] 其中:差值序列的每一个元素x′i(j)=|xi(j)-x0(j)|,1≤i≤n,1≤j≤m。按式(13)确定差值序列的两级最大差Δ(max)和两级最小差Δ(min)
[0152]
[0153] 则比较序列中每个元素的关联系数为
[0154]
[0155] 其中:ρ为分辨系数,用来削弱Δ(max)过大而使关联系数失真的影响。各个比较序列与参考序列的灰色关联度为
[0156]
[0157] 其中:ωj表示每一列元素的权重系数。
[0158] 进一步地,在B1中,根据如下方法自适应确定加权灰色关联度中各个气象因素的分辨系数。
[0159] 一般情况下,ρ取0.5时,恒有γ0i≥0.333,且考虑到每个气象因素自身的极差与整个差值序列的Δ(max)比值有明显差异,本发明根据比较序列矩阵中每一列元素的平均值与Δ(max)的比值自适应确定该列的ρ的取值。
[0160] 定义
[0161]
[0162] ε(j)的大小反应了每一列元素中是否存在异常值,当 时,认为序列中存在异常值,ρ(k)应取(0,0.5]的值来抑制Δ(max)对关联度的支配作用,可取ρ(k)=min(0.5,1.5ε(j));当 时,认为序列平稳,ρ(k)可取(0.5,1)内的值来增强Δ(max)对关联度的支配作用:
[0163] (1)当 时,可取ρ(k)=max(0.5,2ε(j));
[0164] (2)当 时,取ρ(k)∈(0.8,1)。
[0165] 进一步地,在B2中,当用于模型训练的样本数量较少,或其气象特征与预测时刻气象特征不一致都会导致预测精度不高。考虑到天气的复杂多变,以及光伏功率、辐照度数据的时空相依关系,为了提高功率预测方法的鲁棒性,本发明选用一个自适应长度的滑动时间窗函数,并基于分布因子和预测模型适应度函数值的负反馈策略,如图4所示,动态修改时间窗中心点及窗长,辅助筛选相似样本。
[0166] 自适应长度的滑动时间窗函数为
[0167]
[0168] kmid(n)=kmid(n-1)±Δk  (18)
[0169] L(m)=L(m-1)+ΔL  (19)
[0170] 其中,k表示当前预测时刻点号,0≤k≤96;kmid(n)表示窗函数中心偏移n次后对应的点号,kmid(0)=k;Δk表示窗函数中心偏移步长;L(m)表示扩大m次半径后窗函数的搜索半径,L(0)=2,步长ΔL=1。
[0171] 采用预测时刻辐照度数据在所选时间窗下所有历史样本的辐照度数据中的分布因子τ来调整时间窗的中心点位置
[0172]
[0173] 式中,N表示所选时间窗下所有样本个数,n表示N个样本中辐照度小于预测时刻辐照度的样本个数。
[0174] 采用式(21)拟合优度R2来量化预测模型的拟合度,R2越接近1,说明模型的拟合度越好,反之越差。
[0175]
[0176] 其中,表示待拟合量y的均值, 表示拟合值。
[0177] 如图4所示,当计算得到的τ小于设定的τmin,若预测时刻在上午(k<48),则应将时间窗中心朝前移动;若预测时刻在下午(k>48),则应将时间窗中心朝后移动;当时间窗中心移动步长超过最大限值时,则从初始时间窗中心开始,扩大时间窗半径,重新搜索直至τ∈(τmin,τmax),则认为所选时间窗合适。当计算得到的τ大于设定的τmax,时间窗中心的移动方向与小于τmin时相反。当训练得到的模型拟合优度R2小于0时,则扩大搜索半径重新筛选样本直至训练得到目标模型,即具有较好拟合度的模型。
[0178] 进一步地,在步骤S3中,采用支持向量回归机算法训练预测模型。给定训练样本集n为{(xi,yi)|i=1,2,…,l},其中,xi∈R 表示输入向量,yi∈R表示输出结果,采用非线性映射 将输入向量xi映射到更高维特征空间Rk(k>n),在该空间中构造一个最优超平面[0179]
[0180] 使所有样本点离超平面的“总偏差”最小,其中,ω表示权系数向量;b为偏置常数。
[0181] 采用ε-不敏感损失函数,样本点与最优超平面的偏差可以表示为c(x,y,f(x))=max(0,|y-f(x)|-ε)  (23)
[0182] 其中,ε表示允许的误差。加入松弛因子ξi、 当划分有误差时,ξi、 均大于0;当划分无误差时,ξi、 均取0。这时该问题转换为求优化目标函数最小化问题:
[0183]
[0184] 其中,C表示惩罚因子。该问题是一个凸二次优化问题,采用Lagrange(n次多项式插值)系数方法并根据最优化条件(Kuhn-Tucker conditions,KKT)解决该约束最优问题[0185]
[0186]
[0187] 其中,αi、 表示Lagrange系数,SV表示支持向量。
[0188] 进一步地,在步骤S3中,采用量子粒子群算法和网格法混合优化SVR的最优超参数;
[0189] 网格法是比较常用的SVR参数优化方法,其理论实质是根据先验知识设置各个参数的取值范围和步长,然后穷举所有参数组合,其搜索精度取决于步长,当步长足够小,可保证在规定的取值范围内寻找到全局最优解,但是以时间和空间复杂度为代价。
[0190] 模拟生物群体行为或生物进化规律的启发式智能优化算法,以随机或近似随机的方式搜索或逼近非线性复杂空间的全局最优解,能够有效提高搜索效率。以量子粒子群算法(Quantum Particle Swarm Optimization,QSPO)为例,其取消了粒子移动方向这个属性,增加了粒子位置的随机性,不仅所需设置的参数比粒子群算法更少,而且降低了粒子初始随机位置对搜索结果的影响。设粒子种群规模为m,粒子维度为D,每个粒子的位置代表了该粒子当前的解,对第i个粒子有以下属性:
[0191] 当前位置:xi=(xi1,xi2,…,xiD);
[0192] 历史最优位置:pi=(pi1,pi2,…piD);
[0193] 所有粒子历史最优位置的平均值为
[0194]
[0195] 粒子的下一次位置按照式(28)(29)更新
[0196]
[0197]
[0198] 其中,gbest为全局最优位置;α为压缩-扩张因子;和u为(0,1)上的均匀分布数值;式(29)取+和-的概率为0.5。QSPO算法流程如图5所示,其具体步骤如下:
[0199] (1)设置种群规模m、粒子维度D、压缩-扩张因子α、最大迭代次数iter、粒子解空间范围等参数;
[0200] (2)初始化粒子当前位置xi、粒子历史最优位置pi、粒子历史适应度函数值fitpi、全局最优位置gbest;
[0201] (3)计算当前所有粒子适应度函数值fiti,搜索当前所有粒子最优适应度函数值fitbest及其对应的最优位置;
[0202] (4)更新全局历史最优位置gbest及其对应的历史最优种群适应度函数值fitgbest,更新所有粒子历史最优位置pi及其历史最优种群适应度fitpi;
[0203] (5)重复步骤(3-4)直至达到最大迭代次数iter,输出当前全局最优位置gbest;
[0204] 当QSPO迭代到一定次数时,粒子个体及种群的适应度函数值更新变缓,种群的最佳适应度函数值甚至不再更新,易陷入解空间的局部最优解。本实施例将网格法和QSPO算法相结合,提出了一种兼顾收敛速度和搜索精度的混合优化方法,通过混合优化方法得到的最优参数组合能有效提高SVR的泛化能力,其具体方法是:首先,通过QSPO算法初步搜索得到若干个全局最优解,根据全局最优解缩小解空间搜索范围;然后采用网格法进行高精度搜索,尽可能逼近真正的全局最优解。
[0205] 本发明采用通径分析(path analysis,PA)原理,分析不同时空尺度下影响光伏输出功率的主要气象特征及其作用机理,提出了一种适应不同时空尺度的自适应分类策略,能够筛选出与预测时刻气象特征数据高度相似的历史样本,训练精确预测模型。
[0206] 另外,支持向量回归机(Support Vector Regression,SVR)的复杂度和泛化能力取决于惩罚系数C、核宽度δ、不敏感损失系数ε等超参数。网格法可保证在规定的解空间范围内寻找到全局最优解,但是以时间和空间复杂度为代价;当量子粒子群算法(Quantum Particle Swarm Optimization,QSPO)迭代到一定次数时,粒子个体及种群的适应度函数值更新变缓,种群的最佳适应度函数值甚至不再更新,易陷入解空间的局部最优解。将网格法和QSPO算法相结合,提出了一种兼顾收敛速度和搜索精度的混合优化方法,通过混合优化方法得到的最优超参数组合能有效提高SVR的泛化能力。
[0207] 下面给出具体算例对本实施例进行具体说明:
[0208] 采用本发明所述数据预处理方法处理某光伏电站2018年1月-3月历史发电数据,其预处理后的散点图如图6所示,图6中黑色五角星的点为删除点,灰色圆圈的点为保留点。图6中仅展示了太阳辐照度与光伏输出功率两个维度,通过对比分析可知,将各局部离群点剔除后,太阳辐照度与光伏功率的线性相关度将变高。剔除离群点后将样本通过k-means聚类算法分成3类,对应天气类型分别为晴天、阴天、雨天,各时刻3类样本及各类中心点散点图如图7所示,图7中,横坐标为时刻(7:30~17:30),纵坐标为太阳辐照度(0~1200W/m2),由图7可知,在相同时刻,晴天、阴天、雨天的太阳辐照度中心依次降低,各时刻各类历史样本分布在该时刻中心点两侧,将12:30时的三类样本及其中心点的散点以太阳辐照度为横坐标,光伏输出功率为纵坐标展开,得到如图8所示的12:30时的聚类分析散点图。图8中,雨
2
天样本太阳辐照度集中在0~500W/m ,对应的功率为0~6MW;阴天样本太阳辐照度集中在
550~900W/m2,对应的功率为5~8MW;晴天样本太阳辐照度集中在900~1200W/m2,对应的功率为7~10MW,各天气样本中的菱形点为各天气样本的样本中心点。
[0209] 以夏季和冬季为例,白天各个时段内各个气象因素对光伏功率的直接通径系数分析结果见表1~6可知,不同季节、不同天气类型下,太阳辐照度都是对光伏功率影响程度最大的气象因素,但不同季节、不同天气类型下,太阳辐照度对光伏功率的影响程度又存在差异。
[0210] 由表1~3可知,在夏季,太阳辐照度对光伏功率影响程度由大到小依次对应的天气类型为雨天、阴天和晴天。晴天白天气温较高,随着白天气温先升高后降低,温度对光伏功率的影响也对应经历了“正-负-正”的过程;此外,气温较高导致水汽蒸发较快,湿度对光伏功率总体呈现负影响;而风速可以加速光伏板散热,对光伏功率总体呈现正影响。在阴、雨天,温度对光伏功率影响的“正/负”变化不太稳定,但湿度总体保持负影响,风速也以负影响为主。
[0211] 由表4~6可知,在冬季,太阳辐照度对光伏功率的平均直接通径系数达到0.95,而其他气象因素对光伏功率的直接通径系数很小,几乎可以忽略,这与冬季大气温度较低,较少导致光伏板温度超过25℃而降低光伏组件出力,以及冬季气候干燥,太阳辐照度被水汽吸收较少等气候特征相吻合。
[0212] 由表1~6对比可以得知:冬季和夏季的不同天气类型下,各个气象因素对光伏功率的影响程度差异很大,需针对不同季节、不同天气类型建立不同的光伏功率预测模型。
[0213] 表1夏季晴天气象因素直接通径系数
[0214]
[0215]
[0216] 表2夏季阴天气象因素直接通径系数
[0217]
[0218] 表3夏季雨天气象因素直接通径系数
[0219]
[0220] 表4冬季晴天气象因素直接通径系数
[0221]
[0222] 表5冬季阴天气象因素直接通径系数
[0223]
[0224]
[0225] 表6冬季雨天气象因素直接通径系数
[0226]
[0227] 采用本发明所述方法,预测该光伏电站晴天(2018年4月16日)、多云天(2018年4月14日)、雨天(2018年4月13日)这3天的输出功率,预测功率与实测功率曲线如图9-11所示。
采用华东电网“两个细则”中光伏功率预测准确率算法,晴天的预测准确率为94.702%,多云天的预测准确率为88.532%,雨天的预测准确率为88.467%,说明本发明所提的基于自适应分类策略和混合优化SVR算法具有很好的功率预测效果,具有现场应用价值。
[0228] 本发明采用的无量纲化处理方法、基于密度的离群点算法、插值算法等数据预处理方法,可以剔除错误数据,删除/重构缺失数据,降低错误数据和缺失数据对预测精度的不利影响;采用通径分析(PA)自适应确定不同时空尺度下影响光伏输出功率的主要气象特征及各主要气象特征对光伏输出功率的决定系数,结合灰色关联度分析(GRA)自适应筛选出与预测时刻气象数据高度相似的历史样本,用于模型训练;并提出了基于分布因子和预测模型适应度函数值的负反馈策略,动态调整时间窗中心及窗长,能够进一步提高筛选样本气象数据与预测时刻气象数据的相似度;同时采用量子粒子群算法与网格法混合优化SVR算法的超参数,提高了预测模型的泛化能力。
[0229] 本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围,本发明的连接指直接连接或间接连接。
[0230] 尽管本文较多地使用了无量纲化处理、基于密度的离群点算法、通径分析原理、量子粒子群、网格法等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈