首页 / 专利库 / 风能 / 风能利用系数 / 有复用性的风力发电功率预测模型的实现方法

有复用性的发电功率预测模型的实现方法

阅读:374发布:2020-05-15

专利汇可以提供有复用性的发电功率预测模型的实现方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种有复用性的 风 力 发电功率 预测模型 的实现方法,应用数据描述和数据清洗动态互动与相互修正过程来解决由于每个电站 气候 、地理、运行环境,设备型号不同,使得预测模型的数据输入项不同引起的预测模型准确性低的问题;其次,依据优化结构的模型样本数据集,生成或判别多个学习器;以概率分布函数取代单一值的检验标准选取学习器,改进了传统单一、固定学习器堆积的预测模式,使得预测模型有其复用性。,下面是有复用性的发电功率预测模型的实现方法专利的具体信息内容。

1.一种有复用性的发电功率预测模型的实现方法,其特征在于包括以下步骤:
1)后台原始数据库获取,并后台原始数据库备份至中台数据库;
2)中台数据准备,实现数据特征描述和数据清洗,将数据可视化,最后数据描述和数据清洗互动与相互修正以得到物理和统计学意义上的结构优化数据;
3)中台模型生成,从中台数据库中选取模型样本数据集,划分为训练样本数据集和检验样本数据集;根据训练样本数据集特征判别或生成多个学习器;对多个学习器分别检验计算;检验指标以概率分布函数取代确定值,以人工或者机器自动两种方法判别得到最终学习器;以模型样本数据集做为最终学习器调参生成预测模型;用预测模型和中台实时数据生成前端展示数据并存于前端展示数据库;
功率预测的公式为:
P=风力机功率(PA)*风能利用系数(Pmax)*机械效率*发电机效率
V为实际风速,A为风轮叶片扫略面积,ρ为空气密度,D为直径,机械效率和发电机效率为设备设定值;
4)前端展示。
2.根据权利要求1所述的有复用性的风力发电功率预测模型的实现方法,其特征在于:
步骤1)所述的后台原始数据库获取过程具体如下:输入设备参数和限电计划;从实测系统中取实测风力气象数据;从预测气象数据服务器取预测气象数据存于后台原始数据库中,所述风力气象数据为测风塔和风机实时、历史,气象、功率数据,气象数据为不同高度的值。
3.根据权利要求1所述的有复用性的风力发电功率预测模型的实现方法,其特征在于:
步骤2)所述的中台数据准备过程中,所述的数据特征描述包括中心位置和分散程度。
4.根据权利要求1所述的有复用性的风力发电功率预测模型的实现方法,其特征在于:
步骤2)所述的中台数据准备过程中,所述的数据清洗具体包括以下步骤:
2.1)去除并补全有缺失的数据;
2.2)去除并修改格式和内容错误的数据;
2.3)去除并修改逻辑错误的数据;
2.4)去除不需要的数据;
2.5)关联性验证;
2.6)去掉功率为0时相应差值点的数据;
2.7)补全通讯中断数据;
2.8)差值法补全指定时间内的缺失数据;
2.9)气象数据,不同数据源,保留相同高度值。
5.根据权利要求1所述的有复用性的风力发电功率预测模型的实现方法,其特征在于:
步骤3)所述的中台模型生成过程具体步骤如下:
3.1)划分模型样本数据集为训练样本数据集和检验样本数据集。
3.2)根据训练样本数据集特征判别或生成多个学习器;
3.3)对多个学习器分别检验计算;
3.3.1)学习器的性能指标计算公式:
均方误差:E(f;D)=∫x-D(f(x)-y)2p(x)dx,其中,p(x)为概率密度函数;
3.3.2)每个学习器性能指标评估:
每个学习器多次训练和测试得K个误差率,
性能指标计算:
求k个平均值;
方差为:
3.4 根据μ,σ生成概率分布函数;
3.5 人工或者机器判别得到最终学习器;
3.6 以最初选的数据样本集作为最终学习器调参样本数据集生成预测模型。
6.根据权利要求1所述的有复用性的风力发电功率预测模型的实现方法,其特征在于:
步骤4)所述的前端展示采用移动端和固定端组成的多端展示模,包括短期功率预测查询、超短期功率预测查询、测风塔实时数据、风机实时数据、测风塔实测数据、测风塔预测数据、风机气象数据、数据对比、预测功率同步显示、预测数据统计。
7.根据权利要求6所述的有复用性的风力发电功率预测模型的实现方法,其特征在于:
所述的预测数据统计的统计学学数据指标项为:上下限内的点数、合格点数、最大偏差值、最大偏差率、均方根误差、平均绝对误差、合格率、相关性系数、符合率最大预测输出功率。

说明书全文

有复用性的发电功率预测模型的实现方法

技术领域

[0001] 本发明涉及风力发电功率预测领域,具体是一种有复用性的风力发电功率预测模型的实现方法。

背景技术

[0002] 把风的动能转变成机械动能,再把机械能转化为电力动能,这就是风力发电。风力发电的原理,是利用风力带动风车叶片旋转,再透过增速机将旋转的速度提升,来促使发电机发电。依据目前的风车技术,大约是每秒三米的微风速度(微风的程度),便可以开始发电。风力发电正在世界上形成一股热潮,因为风力发电不需要使用燃料,也不会产生辐射或空气污染。
[0003] 我国风能资源丰富,可开发利用的风能储量约10亿kW,其中,陆地上风能储量约2.53亿kW(陆地上离地10m高度资料计算),海上可开发和利用的风能储量约7.5亿kW,共计
10亿kW。
[0004] 随着社会发展的需要,风力发电系统越来越多,而其输出功率受气象因素影响较大,具有不连续性和不稳定的特点。预测风力发电功率有助于统筹安排常规电源和风力发电的协调配置。目前大家一般采用机器学习和概率统计的方法,主要包括多项式算法、BP神经网络、灰色模型、数据挖掘、SVM径向基模型等进行预测,无论采用哪种方法,都存在把A风力发电站预测模型用于B风力发电站时,预测值合格率低的情况。

发明内容

[0005] 本发明为了解决现有技术的问题,提供了一种有复用性的风力发电功率预测模型的实现方法,应用数据描述和数据清洗动态互动与相互修正过程来解决由于每个电站气候、地理、运行环境,设备型号不同,使得预测模型的数据输入项不同引起的预测模型准确性低的问题;其次,依据优化结构的模型样本数据集,生成或判别多个学习器;以概率分布函数取代单一值的检验标准选取学习器,改进了传统单一、固定学习器堆积的预测模式,使得预测模型有其复用性。
[0006] 本发明包括以下步骤:
[0007] 1)后台原始数据库获取,并后台原始数据库备份至中台数据库;
[0008] 2)中台数据准备,实现数据特征描述和数据清洗,将数据可视化,最后数据描述和数据清洗互动与相互修正以得到物理和统计学意义上的结构优化数据;
[0009] 3)中台模型生成,从中台数据库中选取模型样本数据集,划分为训练样本数据集和检验样本数据集;根据训练样本数据集特征判别或生成多个学习器;对多个学习器分别检验计算;检验指标以概率分布函数取代确定值,以人工或者机器自动两种方法判别得到最终学习器;以模型样本数据集做为最终学习器调参生成预测模型;用预测模型和中台实时数据生成前端展示数据并存于前端展示数据库;
[0010] 功率预测的公式为:
[0011] P=风力机功率(PA)*风能利用系数(Pmax)*机械效率*发电机效率
[0012]
[0013]
[0014] V为实际风速,A为风轮叶片扫略面积,ρ为空气密度,D为直径,机械效率和发电机效率为设备设定值;
[0015] 4)前端展示。
[0016] 进一步改进,步骤1)所述的后台原始数据库获取过程具体如下:从实测系统中取测风力气象数据,从预测气象数据服务器取预测气象数据存于后台原始数据库中,所述风力气象数据为测风塔和风机实时、历史,气象、功率数据,气象数据为不同高度的值。
[0017] 进一步改进,步骤2)所述的中台数据准备过程中,所述的数据特征描述包括中心位置和分散程度。
[0018] 进一步改进,步骤2)所述的中台数据准备过程中,所述的数据清洗具体包括以下步骤:
[0019] 2.1)去除并补全有缺失的数据;
[0020] 2.2)去除并修改格式和内容错误的数据;
[0021] 2.3)去除并修改逻辑错误的数据;
[0022] 2.4)去除不需要的数据;
[0023] 2.5)关联性验证;
[0024] 2.6)去掉功率为0时相应差值点的数据;
[0025] 2.7)补全通讯中断数据;
[0026] 2.8)差值法补全指定时间内的缺失数据;
[0027] 2.9)气象数据,不同数据源,保留相同高度值。
[0028] 进一步改进,步骤3)所述的中台模型生成过程具体步骤如下:
[0029] 3.1)划分模型样本数据集为训练样本数据集和检验样本数据集。
[0030] 3.2)根据训练样本数据集特征判别或生成多个学习器;
[0031] 3.3)对多个学习器分别检验计算;
[0032] 3.3.1)学习器的性能指标计算公式:
[0033] 均方误差:E(f;D)=∫x-D(f(x)-y)2p(x)dx,其中,p(x)为概率密度函数;
[0034] 3.3.2)每个学习器性能指标评估:
[0035] 每个学习器多次训练和测试得K个误差率,
[0036] 性能指标计算:
[0037] 求k个平均值;
[0038]
[0039] 方差为:
[0040]
[0041] 3.4根据μ,σ生成概率分布函数;
[0042] 3.5人工或者机器判别得到最终学习器;
[0043] 3.6以最初选的数据样本集作为最终学习器调参样本数据集生成预测模型。
[0044] 进一步改进,步骤4)所述的前端展示采用移动端和固定端组成的多端展示模,包括短期功率预测查询、超短期功率预测查询、测风塔实时数据、风机实时数据、测风塔实测数据、测风塔预测数据、风机气象数据、数据对比、预测功率同步显示、预测数据统计。
[0045] 进一步改进,所述的预测数据统计的统计学学数据指标项为:上下限内的点数、合格点数、最大偏差值、最大偏差率、均方根误差、平均绝对误差、合格率、相关性系数、符合率最大预测输出功率。
[0046] 本发明有益效果在于:
[0047] 1.针对预测模型复用性低,本方法学习器非固定单一,可适应不同模型样本数据集,保证了预测模型的复用性。
[0048] 2.针对预测模型预测值的准确性低,本方法通过数据描述和数据清洗可视化,互修正过程,提高了模型样本数据集的数据质量,从而提高预测模型的精准性。
[0049] 3.针对预测模型预测值的准确性低,本方法检验计算时采用概率分布函数取代确定值,提高了学习器选取的精准性,从而提高预测模型的精准性。
[0050] 4.针对模型预测值的准确性低,本方法气象特征值选取分高度的预测、实测值,风机、测风塔值,提高了模型的特征值选取的精准性。附图说明
[0051] 图1为本发明实施例的预测系统结构图。
[0052] 图2为本发明实施例的数据准备逻辑图。
[0053] 图3为本发明实施例模型生成流程图
[0054] 图4为本发明实施例数据准备步骤,数据特征值可视化,风机气象数据示例图[0055] 图5为本发明实施例中电站1未用本方法前预测值合格率显示界面。
[0056] 图6为本发明实施例中电站1使用本方法后预测值合格率显示界面。
[0057] 图7为本实施例中电站2预测值显示界面。

具体实施方式

[0058] 下面结合附图对本发明作进一步说明。
[0059] 以下结合具体实施例电站1和电站2对本发明的技术方案做进一步的说明,预测系统如图1所示,数据准备逻辑如图2所示,模型生成流程如图3所示。
[0060] 1.后台数据获取步骤:
[0061] 从实测系统中取测风塔和风机的实时、历史,气象、功率数据,从预测气象数据服务器取预测气象数据存于后台原始数据库中。
[0062] 风力电站的输入项种类基本相同,只是电站容量、风机型号等配置不同而有差异。
[0063] 表1是本实施例风力发电站1的输入项简表。由于数据项众多,只给出了输入项分类的表格。
[0064] 每个文件里存有不同种类的输入数据。
[0065]
[0066]
[0067] 表1输入项表
[0068] 2.中台数据准备步骤:
[0069] 2.1数据清洗处理异常值和缺失值不再赘述。在风力发电站中无论是测风塔、风机、还是预测的气象数据,都是分高度的。
[0070] 2.2数据特征描述,用曲线的方式显示中心位置和分散程度。
[0071] 2.3通过对比可适当去噪,尽量平滑曲线且让曲线连续。
[0072] 本实施例中实测分机和测风塔气象值高度不匹配,风机(10米、30米、50米、70米),测风塔(30米、50米、70米、90米),最后选取高度为(30米、50米、70米)。
[0073] 表2为实施例中气象数据值输入矩阵的文字描述。
[0074] 30米风速(m/s) 30米风向(°) 30米温度(℃) 30米湿度(%) 30米大气压(pa)50米风速(m/s) 50米风向(°) 50米温度(℃) 50米湿度(%) 50米大气压(pa)
70米风速(m/s) 70米风向(°) 70米温度(℃) 70米湿度(%) 70米大气压(pa)[0075] 表2输入矩阵
[0076] 图4为实施例中处理后的风机气象数据可视化界面。
[0077] 3.中台模型生成步骤:
[0078] 从中台数据库中选取模型样本数据集(D),划分为训练样本数据集和检验样本数据集;根据训练样本数据集特征判别或生成多个学习器;对多个学习器分别检验计算;检验指标以概率分布函数取代确定值,以人工或者机器自动两种方法判别得到最终学习器;以模型样本数据集(D)作为最终学习器调参生成预测模型。
[0079] 本实施例以短期功率预测为例各输入项;输出项;学习器,检验的概率分布函数和程序流程说明:
[0080] 3.1输入项:
[0081] 3.1.1模型样本数据集
[0082] 本实施例选了30天样本数量为96*3*30(一天96个点,每15分钟一个,每个预测值对应三个高度)。
[0083] 3.1.2训练样本数据集和检验样本数据集
[0084] 本实施例训练样本数据集和检验样本数据集用了三种划分比例,分别为D1(80%,20%),D2(70%,30%),D3(90%,10%)。
[0085] 3.2学习器,检验的概率分布函数
[0086] 3.2.1学习器
[0087] 本实施例选用三种学习器,标注为(A,B,C).
[0088] 学习器A Fa(x),N阶多项式(N为1…10;得4最好);
[0089] 学习器B Fb(x),K均值聚类+3层BP神经网络
[0090] 学习器C Fc(x),高斯混合模型
[0091] 3.2.2检验的概率分布函数
[0092] μ,σ详见前章说明,w是权值,D是数据集。
[0093] 数据集 学习器A 学习器B 学习器CD1 fa(μ1,σ1,ω1,D1) fb(μ1,σ1,ω1,D1) fc(μ1,σ1,ω1,D1)
D2 fa(μ2,σ2,ω2,D2) fb(μ2,σ2,ω2,D2) fc(μ2,σ2,ω2,D2)
D3 fa(μ3,σ3,ω3,D3) fb(μ3,σ3,ω3,D3) fc(μ3,σ3,ω3,D3)
[0094] 表3概率分布函数说明
[0095] 本实施例训练样本数据集离散度比较大,得出的学习器A拟合效果比较好。
[0096] 3.3输出项
[0097]
[0098] 表4输出项
[0099] 3.4.本实例程序流程如下:
[0100] 3.4.1读取模型样本数据集,划分样本数据集
[0101] def loadDataSet(dataMatD_filename):
[0102] Return dataMatD1T dataMatD1S dataMatD2T dataMatD2S dataMatD3T dataMatD3S
[0103] 3.4.2用训练样本数据集调参,返回算法参数
[0104] def standRegresA(dataMatD1S dataMatD2S dataMatD3S):
[0105] Return ws1A ws2A ws3A
[0106] def standRegresB(dataMatD1S dataMatD2S dataMatD3S):
[0107] Return ws1B ws2B ws3B
[0108] def standRegresC(dataMatD1S dataMatD2S dataMatD3S):
[0109] Return ws1C ws2C ws3C
[0110] 3.4.3用测试样本数据集测试得测试集性能指标
[0111] def TestA(dataMatD1T dataMatD2T dataMatD3T):
[0112] return wMat1A wMat2A wMat3A
[0113] def TestB(dataMatD1T dataMatD2T dataMatD3T):
[0114] return wMat1B wMat2B wMat3B
[0115] def TestC(dataMatD1T dataMatD2T dataMatD3T):
[0116] return wMat1C wMat2C wMat3C
[0117] 3.4.4检验计算,选学习器的依据
[0118] def CheckA(wMat1A wMat2A wMat3A):
[0119] return wCheckMatA1wCheckMatA2wCheckMatA3
[0120] def CheckB(wMat1B wMat2B wMat3B):
[0121] return wCheckMatB1wCheckMatB2wCheckMatB3
[0122] def CheckC(wMat1C wMat2C wMat3C):
[0123] return wCheckMatC1wCheckMatC2wCheckMatC3
[0124] 3.4.5模型样本数据集(D)生成预测学习器
[0125] 选择A学习器后
[0126] Def StandRegresA(dataMatD())
[0127] return wMat
[0128] 4.前端数据展示步骤:
[0129] 本方法用于电站1预测准确性得到提高。
[0130] 图5为本实施例中电站1未使用本方法前曲线拟合度低,准确性低。
[0131] 图6为本实施例中电站1使用本方法后曲线拟合度高,准确性高。
[0132] 图7本方法用于电站2,使用本方法后合格率90.44%示意图以证明此方法的可复用性。
[0133] 本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈