首页 / 专利库 / 人工智能 / 预测模型 / 基于改进K-means聚类与支持向量机的风功率预测方法

基于改进K-means聚类与支持向量机功率预测方法

阅读:1发布:2020-08-21

专利汇可以提供基于改进K-means聚类与支持向量机功率预测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于改进K-means聚类与 支持向量机 的 风 功率预测方法,步骤一:构造风速幅值的数据样本,步骤二:归一化处理;步骤三:运用改进K-means聚类方法,得到根据风速自适应变化的类别总数C;步骤四:按设定的时间尺度统计,得到L个连续时间段样本;步骤五:对连续时间段样本进行归一化处理后,聚类得到M类数据集;步骤六:采用支持向量机建立短期风功率 预测模型 ;步骤七:引入实时数据得到超短期风功率预测值,引入实时风功率,得到超短期风功率预测模型;步骤八:输入预测日及其前若干日的风电出 力 数据和数值天气预报数据,得到风功率结果。本发明提供的基于改进K-means聚类与支持向量机的风功率预测方法,聚类效果好,有很强的泛化能力和鲁棒性。,下面是基于改进K-means聚类与支持向量机功率预测方法专利的具体信息内容。

1.一种基于改进K-means聚类与支持向量机功率预测方法,其特征在于,包括以下步骤:
步骤一:采集一天内各个时段的风速幅值,并构造风速幅值的数据样本;
步骤二:对数据样本进行归一化处理;
步骤三:运用改进K-means聚类方法,将一年时间段内的数据样本进行聚类,得到类别总数C,所述类别总数C根据风速自适应变化;
步骤四:根据设定的时间尺度,将步骤三中聚类后的数据样本按L个连续时间段进行统计,得到L个连续时间段样本;
步骤五:按照步骤二中的方法对连续时间段样本进行归一化处理后,按照步骤三中的方法对连续时间段样本进行聚类,得到M类数据集;
步骤六:采用支持向量机针对每一类数据集训练对应的模型,建立短期风功率预测模型
步骤七:引入实时风电出数据和数值天气预报数据到短期风功率预测模型中,得到超短期风功率预测值,引入实时风功率,并对超短期风功率预测值和实时风功率采用权重的方法进行修正,得到超短期风功率预测模型;
步骤八:向短期风功率预测模型和超短期风功率预测模型输入预测日及预测日前若干天的风电出力数据和数值天气预报数据,得到短期风功率预测和超短期风功率预测的风功率结果。
2.如权利要求1所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤一中构造的数据样本如下:
a=(as1,as2,…,asH,asmax,asmin,asmean,asstd)
式中:as1,as2,…,asH为一天内若干节点风速的值;asmax为日风速最大值;asmin为日风速最小值;asmean为日风速平均值;asstd为日风速的标准差。
3.如权利要求1所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤二中,所述归一化方法的公式为:
式中,bij为第j个物理量中的第i个采样值;bjmin为第j个物理量中的最小值;bjmax为第j个物理量中的最大值。
4.如权利要求1所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤三中改进K-means聚类的步骤如下:
3.1:设初始类别c=1,初始化所有数据样本的聚类中心;
3.2:当聚类类别c=C'时,在聚类结果中筛选样本容量最大的一类,将其聚类的中心点zw分裂为对称的两个点zw-ε和zw+ε,由此聚类的类别总数增加为c=C'+1;
3.3:根据新划分的聚类中心,对数据样本进行重新归类;
3.4:根据重新归类结果,利用步骤3.2中的方法重新调整各个聚类中心的位置
3.5:重复步骤3.3至3.4,直至各个聚类中心不再移动;
3.6:重复步骤3.2至3.5,直至将所有数据样本进行分类。
5.如权利要求4所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤3.5中,当聚类的中心点zw分裂的两个点的距离小于设定的正数δ时,即满足|zw+ε-(zw-ε)|<δ收敛条件时,则认定各个聚类中心不再移动。
6.如权利要求1所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤四中设定的时间尺度为周、半月和月三个时间尺度中的一个。
7.如权利要求1所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤四中构造的连续时间段样本为:
sl=(st1,st2,…,stC,ssmax,ssmin,ssmean,ssstd,ssmd1,ssmd2,ssmd3)
式中,st1,st2,…stC为第l个连续时间段各类日子的数量;smax为第l个连续时间段内的风速最大值;smin为第l个连续时间段内的风速最小值;smean为第l个连续时间段的平均风速;ssstd为第l个连续时间段内的风速标准差;ssmd1为第l个连续时间段的一阶差分绝对平均值;ssmd2为第l个连续时间段的二阶差分绝对平均值;ssmd3为第l个连续时间段的三阶差分绝对平均值。
8.如权利要求1所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤六中,支持向量机法通过调用SVM-light和特征向量训练模型,其目标函数式为:
式中,ξi和 为松弛因子;w和θ为带估计参数;ε为损失函数;β为惩罚因子。
9.如权利要求8所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述特征向量中的物理量包括风速、风向、温度、湿度和气压。
10.如权利要求1所述的基于改进K-means聚类与支持向量机的风功率预测方法,其特征在于,所述步骤七中,取预测日前若干天风电出力数据和数值天气预报数据作为预测参考样本集MCo,将其与风速数据ws结合建立超短期风功率预测模型,并通过样本属性AT-1预测T时刻的风电场发电功率,计算方法如下:
Fo=SVM(MCo,ws)
式中,Fo为在线风电功率预测模型,xT为T时刻超短期风功率的预测值;
再根据预测日前若干天的实际风功率,采用权重修正预测日的预测结果,计算方法如下:
式中, 为修正后的功率预测值;pD1、pD2、pD3…pDn分别为预测日前若干日的实际风功率序列;ηT为预测值所占的权重系数,η1、η2、η3…ηn分别为预测日前若干日的权重系数。

说明书全文

基于改进K-means聚类与支持向量机功率预测方法

技术领域

[0001] 本发明涉及风功率预测技术领域,具体地说,涉及一种基于改进K-means聚类与支持向量机的风功率预测方法。

背景技术

[0002] 发电具有污染程度低、装机灵活、运营维护成本低等优点,已逐渐成为应用最广泛的分布式发电类型之一。然而,风力发电具有不确定性、波动性和间歇性等特性,当风电大规模接入电网时,风电输出功率的不稳定性将给系统稳定运行带来巨大挑战。
[0003] 风功率预测的精度对于风电系统具有重要意义,提高风力发电输出功率的预测精度,能够有效的减少系统运行的待机时间,从而降低风电系统的运行成本,同时保证电网运行的稳定性。基于此,国内外对风功率预测展开了一定研究。目前应用较广泛的预测方法主要有:时间序列分析法和人工神经网络法。其中,时间序列分析法模型基础,受外界干扰程度较小,适用于提前量较短的预测,然而随着预测提前量的增加,预测精度往往难以达到预期;人工神经网络法具有较强的非映射能力和自学习、自适应能力,适合描述功率预测模型的复杂非线性特点,但人工神经网络法网络训练时间长,收敛速度较慢,且易于陷入局部最优。
[0004] 对国内现有文献检索发现,文献《风电场功率时间序列分析及预测方法研究》(娜仁图雅;天津大学)提出了一种基于改进时间序列分析法的风功率预测方法,在简化运算过程的同时在一定程度上提高了预测精度,但其不适用于大规模风电场的功率预测。文献《基于BP神经网络优化的风电场短期功率预测研究》(聪;昆明理工大学)提出了一种基于改进BP算法的神经网络风功率短期预测模型,在一定范围内减小了神经网络法的预测误差,然而其学习算法训练时间较长,且易陷入局部最优。

发明内容

[0005] 本发明的目的在于提供一种基于改进K-means聚类与支持向量机的风功率预测方法,聚类效果好,有很强的泛化能力和鲁棒性。
[0006] 本发明公开的基于改进K-means聚类与支持向量机的风功率预测方法所采用的技术方案是:
[0007] 一种基于改进K-means聚类与支持向量机的风功率预测方法,包括以下步骤:
[0008] 步骤一:采集一天内各个时段的风速幅值,并构造风速幅值的数据样本;
[0009] 步骤二:对数据样本进行归一化处理;
[0010] 步骤三:运用改进K-means聚类方法,将一年时间段内的数据样本进行聚类,得到类别总数C,所述类别总数C根据风速自适应变化;
[0011] 步骤四:根据设定的时间尺度,将步骤三中聚类后的数据样本按L个连续时间段进行统计,得到L个连续时间段样本;
[0012] 步骤五:按照步骤二中的方法对连续时间段样本进行归一化处理后,按照步骤三中的方法对连续时间段样本进行聚类,得到M类数据集;
[0013] 步骤六:采用支持向量机针对每一类数据集训练对应的模型,建立短期风功率预测模型;
[0014] 步骤七:引入实时风电出力数据和数值天气预报数据到短期风功率预测模型中,得到超短期风功率预测值,引入实时风功率,并对超短期风功率预测值和实时风功率采用权重的方法进行修正,得到超短期风功率预测模型;
[0015] 步骤八:向短期风功率预测模型和超短期风功率预测模型输入预测日及预测日前若干天的风电出力数据和数值天气预报数据,得到短期风功率预测和超短期风功率预测的风功率结果。
[0016] 作为优选方案,所述步骤一中构造的数据样本如下:
[0017] a=(as1,as2,…,asH,as max,as min,asmean,asstd)
[0018] 式中:as1,as2,…,asH为一天内若干节点风速的值;as max为日风速最大值;as min为日风速最小值;asmean为日风速平均值;asstd为日风速的标准差。
[0019] 作为优选方案,所述步骤二中,所述归一化方法的公式为:
[0020]
[0021] 式中,bij为第j个物理量中的第i个采样值;bj min为第j个物理量中的最小值;bj max为第j个物理量中的最大值。
[0022] 作为优选方案,所述步骤三中改进K-means聚类的步骤如下:
[0023] 3.1:设初始类别c=1,初始化所有数据样本的聚类中心;
[0024] 3.2:当聚类类别c=C'时,在聚类结果中筛选样本容量最大的一类,将其聚类的中心点zw分裂为对称的两个点zw-ε和zw+ε,由此聚类的类别总数增加为c=C'+1;
[0025] 3.3:根据新划分的聚类中心,对数据样本进行重新归类;
[0026] 3.4:根据重新归类结果,利用步骤3.2中的方法重新调整各个聚类中心的位置
[0027] 3.5:重复步骤3.3至3.4,直至各个聚类中心不再移动;
[0028] 3.6:重复步骤3.2至3.5,直至将所有数据样本进行分类。
[0029] 作为优选方案,所述步骤3.5中,当聚类的中心点zw分裂的两个点的距离小于设定的正数δ时,即满足|zw+ε-(zw-ε)|<δ收敛条件时,则认定各个聚类中心不再移动。
[0030] 作为优选方案,所述步骤四中设定的时间尺度为周、半月和月三个时间尺度中的一个。
[0031] 作为优选方案,所述步骤四中构造的连续时间段样本为:
[0032] sl=(st1,st2,…,stC,ss max,ss min,ssmean,ssstd,ssmd1,ssmd2,ssmd3)[0033] 式中,st1,st2,…stC为第l个连续时间段各类日子的数量;smax为第l个连续时间段内的风速最大值;smin为第l个连续时间段内的风速最小值;smean为第l个连续时间段的平均风速;ssstd为第l个连续时间段内的风速标准差;ssmd1为第l个连续时间段的一阶差分绝对平均值;ssmd2为第l个连续时间段的二阶差分绝对平均值;ssmd3为第l个连续时间段的三阶差分绝对平均值。
[0034] 作为优选方案,所述步骤六中,支持向量机法通过调用SVM-light和特征向量训练模型,其目标函数式为:
[0035]
[0036] 式中,ξi和 为松弛因子;w和θ为带估计参数;ε为损失函数;β为惩罚因子。
[0037] 作为优选方案,所述特征向量中的物理量包括风速、风向、温度、湿度和气压。
[0038] 作为优选方案,所述步骤七中,取预测日前若干天风电出力数据和数值天气预报数据作为预测参考样本集MC°,将其与风速数据ws结合建立超短期风功率预测模型,并通过样本属性AT-1预测T时刻的风电场发电功率,计算方法如下:
[0039] F°=SVM(MC°,ws)
[0040]
[0041] 式中,F°为在线风电功率预测模型,xT为T时刻超短期风功率的预测值;
[0042] 再根据预测日前若干天的实际风功率,采用权重修正预测日的预测结果,计算方法如下:
[0043]
[0044] 式中, 为修正后的功率预测值;pD1、pD2、pD3…pDn分别为预测日前若干日的实际风功率序列;ηT为预测值所占的权重系数,η1、η2、η3…ηn分别为预测日前若干日的权重系数。
[0045] 本发明公开的基于改进K-means聚类与支持向量机的风功率预测方法的有益效果是:采集一天内各个时段的风速幅值,并构造风速幅值的数据样本。然后将一年时间段内的样本数据,运用改进K-means聚类方法,对数据样本进行聚类,得到能够根据风速特性自适应的改变类别总数C。在此基础上,根据设定的时间尺度对聚类后的数据样本进行统计,得到L个连续时间段样本,同样运用改进K-means聚类方法对连续时间段样本进行聚类,得到M类数据集,而后采用支持向量机针对每一类数据集训练对应的模型,建立短期风功率预测模型。然后引入实时风电出力数据和数值天气预报数据到短期风功率预测模型中,得到超短期风功率预测值,引入实时风功率,并对超短期风功率预测值和实时风功率采用权重的方法进行修正,得到超短期功率预测模型。向短期风功率预测模型和超短期风功率预测模型输入预测日及其前若干日的风电出力数据和数值天气预报数据,得到短期风功率预测和超短期风功率预测的风功率结果。本方法的优势体现在两个方面,其一,通过改进K-means聚类方法,使类别总数能够根据风速特性自适应变化,大大提高了聚类效果;其二,支持向量机本身基于结构风险最小化准则,对非线性和高维数等问题有良好的解决能力,有很强的泛化能力和鲁棒性。附图说明
[0046] 图1是本发明基于改进K-means聚类与支持向量机的风功率预测方法的流程示意图。
[0047] 图2是本发明基于改进K-means聚类与支持向量机的风功率预测方法的短期风功率预测类型日1的模拟结果示意图。
[0048] 图3是本发明基于改进K-means聚类与支持向量机的风功率预测方法的短期风功率预测类型日2的模拟结果示意图。
[0049] 图4是本发明基于改进K-means聚类与支持向量机的风功率预测方法的超短期风功率预测典型日的模拟结果示意图。

具体实施方式

[0050] 下面结合具体实施例说明书附图对本发明做进一步阐述和说明:
[0051] 请参考图1,一种基于改进K-means聚类与支持向量机的风功率预测方法包括以下步骤:
[0052] 步骤一:采集一天内各个时段的风速幅值,并构造风速幅值的数据样本
[0053] 步骤二:对数据样本进行归一化处理;
[0054] 步骤三:运用改进K-means聚类方法,将一年时间段内的数据样本进行无监督聚类,得到类别总数C,所述类别总数C根据风速自适应变化;
[0055] 步骤四:根据设定的时间尺度,将步骤三中聚类后的数据样本按L个连续时间段进行统计,得到L个连续时间段样本;
[0056] 步骤五:按照步骤二中的方法对连续时间段样本进行归一化处理后,按照步骤三中的方法对连续时间段样本进行无监督聚类,得到M类数据集;
[0057] 步骤六:采用支持向量机针对每一类数据集训练对应的模型,建立短期风功率预测模型;
[0058] 步骤七:引入实时风电出力数据和数值天气预报数据到短期风功率预测模型中,得到超短期风功率预测值,引入实时风功率,并对超短期风功率预测值和实时风功率采用权重的方法进行修正,得到超短期风功率预测模型;
[0059] 步骤八:向短期风功率预测模型和超短期风功率预测模型输入预测日及其前三日的风电出力数据和数值天气预报数据,得到短期风功率预测和超短期风功率预测的风功率结果。
[0060] 步骤一中构造的数据样本如下:
[0061] a=(as1,as2,…,asH,as max,as min,asmean,asstd)
[0062] 式中:as1,as2,…,asH为一天内若干节点风速的值;as max为日风速最大值;as min为日风速最小值;asmean为日风速平均值;asstd为日风速的标准差。
[0063] 步骤二中,采用最大最小归一化方法进行归一化处理,其公式为:
[0064]
[0065] 式中,bij为第j个物理量中的第i个采样值;bj min为第j个物理量中的最小值;bj max为第j个物理量中的最大值。
[0066] 步骤三中,令初始条件c=1,当c=C,(2≤C且k∈N+)时,若能区分不同的类型的风速,则c=C为聚类类别。设聚类样本集为X={Xk|Xk∈Rp,k=1,2,…,K,P∈N+},设已得到类别和聚类中心的数量为C',Z={Zc|Zc∈Rp,c=1,2,…,C',P∈N+}。wc表示聚类得到的C'个类别,则聚类中心定义为:
[0067]
[0068] 则目标函数定义为:
[0069]
[0070] 式中,Kc为wc类所包含的样本数量;dck(xk,zk)表示第c类的第k点到xk聚类中心zk的距离,归一化后X各分量均无量纲,采用欧氏距离作为度量,公式如下:
[0071]
[0072] 步骤三中改进K-means聚类的步骤如下:
[0073] 3.1:设初始类别c=1,初始化所有样本数据的聚类中心;
[0074] 3.2:当c=C'时,在聚类结果中筛选样本容量最大的一类,将其聚类的中心点zw分裂为对称的两个点zw-ε和zw+ε,由此聚类的类别总数增加为c=C'+1;
[0075] 3.3:根据新划分的聚类中心,对数据进行重新归类;
[0076] 3.4:根据分类结果,利用步骤3.2中的方法重新调整各个聚类中心的位置;
[0077] 3.5:重复步骤3.3至3.4,直至聚类中心不再移动,当聚类的中心点zw分裂的两个点的距离小于设定的正数δ时,即满足|zw+ε-(zw-ε)|<δ收敛条件时,则认定各个聚类中心不再移动;
[0078] 3.6:重复步骤3.2至3.5,直至将所有样本数据进行分类,也就是能明确将不同的风速类型分辨出来。
[0079] 步骤四中,设定的时间尺度为周、半月和月三个时间尺度中的一个,构造的连续时间段样本为:
[0080] sl=(st1,st2,…,stC,ss max,ss min,ssmean,ssstd,ssmd1,ssmd2,ssmd3)[0081] 式中,st1,st2,…stC为第l个连续时间段各类日子的数量;smax为第l个连续时间段内的风速最大值;smin为第l个连续时间段内的风速最小值;smean为第l个连续时间段的平均风速;ssstd为第l个连续时间段内的风速标准差;ssmd1为第l个连续时间段的一阶差分绝对平均值;ssmd2为第l个连续时间段的二阶差分绝对平均值;ssmd3为第l个连续时间段的三阶差分绝对平均值。
[0082] 步骤六中,支持向量机法采用MATLAB进行构建,通过调用SVM-light和特征向量训练模型,其中取风速、风向、温度、湿度、气压作为特征向量中的物理量,其目标函数式为:
[0083]
[0084] 式中,ξi和 为松弛因子;w和θ为带估计参数;ε为损失函数;β为惩罚因子。
[0085] 步骤七中,取预测日前三日的风电出力数据和数值天气预报数据作为预测参考样本集MC°,将其与风速数据ws结合建立超短期风功率预测模型,并通过样本属性AT-1预测T时刻的风电场发电功率,计算方法如下:
[0086] F°=SVM(MC°,ws)
[0087]
[0088] 式中,F°为在线风电功率预测模型,xT为T时刻超短期风功率的预测值;
[0089] 再根据预测日前三天的实际风功率,采用权重修正预测日的预测结果,计算方法如下:
[0090]
[0091] 式中, 为修正后的功率预测值;pD1、pD2、pD3分别为预测日前三天的实际风功率序列;ηT为预测值所占的权重系数,η1、η2、η3分别为预测日前三天的权重系数。
[0092] 本方法的优势体现在两个方面,其一,通过改进K-means聚类方法,使类别总数能够根据风速特性自适应变化,大大提高了聚类效果;其二,支持向量机本身基于结构风险最小化准则,对非线性和高维数等问题有良好的解决能力,有很强的泛化能力和鲁棒性。
[0093] 以某分布式风电场为例对所述功率预测方法进行说明。将其2017年的8、9、10月份根据风速特性分成两类。第一类为低风速特性日,日平均风速较低,最低风速低于启动风速,且风速幅值偏低;第二类为高风速特性日,日平均风速低但风速幅值偏高,风速标准差较大。针对8、9、10月份的历史数据和气象数据,对风电场进行短期风功率预测,两类日子典型出力曲线及预测模拟结果如图2、图3所示。针对7月的历史数据和气象数据,对风电场进行超短期风电功率预测,其典型日的出力曲线及预测模拟结果如图4所示。
[0094] 从图2、3、4中可以看出预测的曲线能够较好的跟踪功率出力。通过计算,可以得到类型日1的预测准确率为96.38%,类型日2的预测准确率为86.58%,超短期典型日的预测准确率为95.40%,全部满足风电场的功率预测要求;从预测结果来看,通过采用改进K-means聚类方法及支持向量机算法改进短期及超短期风功率预测模型,预测精度得到较大的提高。
[0095] 最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈