首页 / 专利库 / 人工智能 / 进化算法 / 遗传算法 / 基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法

基于遗传算法优化支持向量机多分类器的台区电压险识别方法

阅读:479发布:2020-05-08

专利汇可以提供基于遗传算法优化支持向量机多分类器的台区电压险识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于遗传 算法 优化 支持向量机 多分类器的台区 低 电压 风 险识别方法,通过对台区低电压的成因分析及公式推导,建立了台区低电压风险识别指标体系,并统计指标数据,将预处理后的指标数据作为输入变量,建立支持向量机模型,并利用 遗传算法 优化其参数,确定出最优的惩罚参数和核函数参数,使得典型低电压台区数据的训练样本在进行交叉验证方法意义下的准确率达到最高。本发明为供电公司制定相应低电压措施提供了技术支持,满足居民的用电需求。,下面是基于遗传算法优化支持向量机多分类器的台区电压险识别方法专利的具体信息内容。

1.一种基于遗传算法优化支持向量机多分类器的台区电压险识别方法,其特征在于,包括以下步骤:
(1)、分析台区低电压的成因,确定用于建立台区低电压风险识别模型的指标体系;
(2)、根据步骤(1)得到的指标体系,收集典型低电压台区的指标样本数据,将数据分为训练集和测试集并进行预处理,确定支持向量机多分类器模型;
(3)、将训练集数据导入步骤(2)中所建立的支持向量机多分类器模型中,利用遗传算法确定支持向量机多分类器模型的最优惩罚参数和核函数参数,确定出最优支持向量机低电压台区风险识别模型;
(4)、将测试集数据或待测台区的样本数据输入到步骤(3)中最优支持向量机低电压台区风险识别模型中,预测待测台区的低电压风险类型。
2.根据权利要求1所述的一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,其特征在于:所述步骤(1)中台区低电压的主要成因是电压在线路和配电变压器上产生压降。
3.根据权利要求1所述的一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,其特征在于:所述步骤(1)中台区低电压风险识别模型的指标体系中指标为供电距离、电压线路导线截面积、配变容量、负载率、功率因数以及三相功率不平衡度。
4.根据权利要求1所述的一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,其特征在于:所述步骤(2)中对收集到的台区数据进行归一化预处理,采用的归一化映射如下:
其中,x,y∈R,xi为归一化前的数值,y表示归一化后的数据;ximax、ximin分别为归一化前数据的最大值和最小值。
5.根据权利要求1所述的一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,其特征在于:步骤(2)中支持向量机多分类器模型为:假设样本空间为{(xi,yi)|i=1,2,L,l},其中xi∈Rn为给定的样本集,即输入量,yi∈Rn为目标输入量,i为样本输入个数;
支持向量机非线性分类模型的优化形式如下:
式中:ξi为松弛变量;参数c为惩罚因子;
将上述优化形式通过构建拉格朗日函数求解,即:
依据拉格朗日对偶理论将其转化为对偶问题,即:
决策函数为:
采用常用的径向基核函数为:
K(x,xi)=exp(-γ||x-xi||2),γ>0。
6.根据权利要求1所述的一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,其特征在于:步骤(3)中遗传算法按照所选择的适应度函数并通过遗传的选择,交叉和变异对个体进行筛选,直至确定出最优算法;主要步骤如下:
a)、染色体编码;编码规则选用浮点数编码,编码长度s为:
s=n1×n2+n2×n3+n2+n3
其中n1,n2,n3分别为输入层、隐含层和输出层的神经元个数;
b)、确定适应度函数;在进行神经网络训练时,将训练样本作为网络的输入和期望输出网络训练产生的输出为y(k),取网络训练产生的权值阈值,计算网络的误差平方和作为遗传算法的目标,误差平方和为:
其中,N为网络训练输入输出采样数据的数目;取误差平方和的倒数为适应度函数,引入一个足够小的正值ζ以免除零,适应度函数为:
-1
fit=(Jm+ζ)
c)、选择;按照适应度比例方法选择当前种群中生命强的染色体个体;设群体大小为n,其中个体i的适应度为fi,则i被选择的概率为:
d)、交叉;浮点数编码的个体一般采用算术交叉;设在个体 和 之间进行算术交叉,则交叉运算后所产生出的两个新个体为:
其中,α是区间[0,1]内均匀分布的随机数;
e)、变异;利用某一范围内均匀分布的随机数,以某一较小概率替换个体编码串中原有的基因实现变异,设xmax和xmin分别为初始个体的最大值和最小值,则变异后的新基因值为:
xk′=xmin+β(xmax-xmin)
其中,β是区间[0,1]内均匀分布的随机数;
将典型低电压台区数据的训练样本在进行交叉验证方法意义下的准确率达到最高时,选取惩罚参数c最小的一组惩罚参数c和核函数参数g作为最优解。
7.根据权利要求1所述的一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,其特征在于:所述风险类型为正常台区、低电压低风险台区、低电压严重风险台区三类,将待测台区的数据输入该模型,确定待测台区的低电压风险类型。

说明书全文

基于遗传算法优化支持向量机多分类器的台区电压险识

别方法

技术领域

[0001] 本发明涉及配电网配电台区低电压预测分类技术领域,尤其是涉及一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法

背景技术

[0002] 近年来,随着居民用电需求的激增,同时配电网网架结构的相对滞后导致配电网台区低电压问题层出不穷,对用电设备造成了损害,无法满足居民正常的用电需求,同时也增大了配电网损耗和供电成本,同时当前缺乏行之有效的台区低电压风险识别方法,无法及时对低电压台区进行治理,无法满足居民的用电需求。
[0003] 支持向量机SVM的基本模型是定义在特征空间上的间隔最大的线性分类器。支持向量机学习方法包含3种模型:线性可分支持向量机、线性支持向量机及非线性支持向量机。当训练数据线性可分时,通过硬间隔最大化,学习一个线性的分类器,即线性可分支持向量机;当训练数据近似线性可分时,通过软间隔最大化,也学习一个线性的分类器,即线性支持向量机;当训练数据线性不可分时,通过使用核技巧及软间隔最大化,学习非线性支持向量机。
[0004] 随着机器学习、神经网络和人工智能等技术的发展,如何将先进的技术应用到配电网风险识别中,对于提高配电网台区管理平、提高配电网运行安全性有着重要的意义。

发明内容

[0005] 技术目的:为了解决上述问题,本发明提出了一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,以便及时发现低压台区,为低压台区的风险治理提供数据基础
[0006] 技术方案:
[0007] 一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,其特征在于,包括以下步骤:
[0008] (1)、分析台区低电压的成因,确定用于建立台区低电压风险识别模型的指标体系;
[0009] (2)、根据步骤(1)得到的指标体系,收集典型低电压台区的指标样本数据,将数据分为训练集和测试集并进行预处理,确定支持向量机多分类器模型;
[0010] (3)、将训练集数据导入步骤(2)中所建立的支持向量机多分类器模型中,利用遗传算法确定支持向量机多分类器模型的最优惩罚参数和核函数参数,确定出最优支持向量机低电压台区风险识别模型;
[0011] (4)、将测试集数据或待测台区的样本数据输入到步骤(3)中最优支持向量机低电压台区风险识别模型中,预测待测台区的低电压风险类型。
[0012] 优选地,所述步骤(1)中台区低电压的主要成因是电压在线路和配电变压器上产生压降。
[0013] 优选地,所述步骤(1)中台区低电压风险识别模型的指标体系中指标为供电距离、电压线路导线截面积、配变容量、负载率、功率因数以及三相功率不平衡度。
[0014] 优选地,所述步骤(2)中对收集到的台区数据进行归一化预处理,采用的归一化映射如下:
[0015]
[0016] 其中,x,y∈R,xi为归一化前的数值,y表示归一化后的数据;ximax、 ximin分别为归一化前数据的最大值和最小值。
[0017] 优选地,步骤(2)中支持向量机多分类器模型为:假设样本空间为 {(xi,yi)|i=1,2,…,l},其中xi∈Rn为给定的样本集,即输入量,yi∈Rn为目标输入量,i为样本输入个数;
[0018] 支持向量机非线性分类模型的优化形式如下:
[0019]
[0020]
[0021] 式中:ξi为松弛变量;参数C为惩罚因子;
[0022] 将上述优化形式通过构建拉格朗日函数求解,即:
[0023]
[0024] 依据拉格朗日对偶理论将其转化为对偶问题,即:
[0025]
[0026] 决策函数为:
[0027]
[0028] 采用的径向基核函数为:
[0029] K(x,xi)=exp(-γ||x-xi||2),γ>0。
[0030] 优选地,步骤(3)中遗传算法按照所选择的适应度函数并通过遗传的选择,交叉和变异对个体进行筛选,直至确定出最优算法;主要步骤如下:
[0031] a)、染色体编码;编码规则选用浮点数编码,编码长度s为:
[0032] s=n1×n2+n2×n3+n2+n3
[0033] 其中n1,n2,n3分别为输入层、隐含层和输出层的神经元个数;
[0034] b)、确定适应度函数;在进行神经网络训练时,将训练样本作为网络的输入和期望输出 网络训练产生的输出为y(k),取网络训练产生的权值阈值,计算网络的误差平方和作为遗传算法的目标,误差平方和为:
[0035]
[0036] 其中,N为网络训练输入输出采样数据的数目;取误差平方和的倒数为适应度函数,引入一个足够小的正值ζ以免除零,适应度函数为:
[0037] fit=(Jm+ζ)-1
[0038] c)、选择;按照适应度比例方法选择当前种群中生命强的染色体个体;
[0039] 设群体大小为n,其中个体i的适应度为fi,则i被选择的概率为:
[0040]
[0041] d)、交叉;浮点数编码的个体一般采用算术交叉;设在个体 和 之间进行算术交叉,则交叉运算后所产生出的两个新个体为:
[0042]
[0043] 其中,α是区间[0,1]内均匀分布的随机数;
[0044] e)、变异;利用某一范围内均匀分布的随机数,以某一较小概率替换个体编码串中原有的基因实现变异,设xmax和xmin分别为初始个体的最大值和最小值,则变异后的新基因值为:
[0045] xk′=xmin+β(xmax-xmin)
[0046] 其中,β是区间[0,1]内均匀分布的随机数;
[0047] 将典型低电压台区数据的训练样本在进行交叉验证方法意义下的准确率达到最高时,选取惩罚参数c最小的一组惩罚参数c和核函数参数g作为最优解。
[0048] 优选地,所述风险类型为正常台区、低电压低风险台区、低电压严重风险台区三类,将待测台区的数据输入该模型,确定待测台区的低电压风险类型。
[0049] 技术效果:由于采用了上述技术方案,本发明具有如下技术效果:
[0050] 本发明提供了一种行之有效的台区低电压风险识别方法,建立最优支持向量机低电压台区风险识别模型,通过遗传算法来寻找出模型最优的惩罚参数和核函数参数,对低电压台区是否存在风险进行准确的状态评估,为供电公司制定相应低电压措施提供了有效的技术支持,减少了对用电设备造成的损害,为相关技术人员提供科学依据,从而有效地满足居民的用电需求。附图说明
[0051] 图1是本发明基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法的示意图;
[0052] 图2是遗传算法优化支持向量机多分类器寻找最优核函数参数g和惩罚参数c的流程示意图;
[0053] 图3是台区数据箱式图;
[0054] 图4是台区数据的分维可视化图;
[0055] 图5是利用GA寻找最佳参数的适应度曲线图;
[0056] 图6是测试分类的结果图。

具体实施方式

[0057] 为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
[0058] 如图1和图2所示,本发明公开了一种基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法,包括如下步骤:
[0059] 步骤(1)、根据推导台区低电压的成因,建立确定出台区低电压风险识别模型的指标体系;台区低电压风险识别模型的指标体系中的指标一般为供电距离、电压线路导线截面积、配变容量、负载率、功率因数、及三相功率不平衡度;
[0060] 步骤(2)、根据步骤(1)中的指标体系,收集典型低电压台区的指标样本数据,确定支持向量机多分类器的输入输出的基本模型;
[0061] 步骤(3)、根据步骤(2)中所建立的基本模型,利用遗传算法确定模型的最优惩罚参数c和核函数参数g,确定出最优建立支持向量机低电压风险识别的模型;
[0062] 步骤(4)、将待测台区特征数据输入到台区低电压风险识别模型中,确定待测台区的低电压风险类型。
[0063] 步骤(1)中台区低电压主要是因为电压在线路和配电变压器产生压降:
[0064] (1)、供电公司通过配电线路给用户供电,由于线路存在阻抗,当线路传输功率时,电流将在线路阻抗上产生电压损耗。目前农村及城镇配网的电压等级不高,可忽略线路对电容的影响。设用户负荷于线路末端,线路等效阻抗为 Z=R+jX。用户电压U2∠0°,用户负荷功率为S=P+jX,负荷变化为△P+j△Q,则首端电压U1为:
[0065]
[0066] 电压降落的纵分量△U、横分量δU为:
[0067]
[0068] 将上述U1改写为:
[0069] U1=(U2+△U)+jδU
[0070] 线路首端电压的幅值U1为:
[0071] U1=[(U2+△U)2+(δU)2]1/2
[0072] 一般情况而言:U2+ΔU>>δU,因此忽略δU,即U1=U2+△U,通过整理可得电压损耗为:
[0073] 式中r0和x0为单位电阻和电抗;L为总长度;为功率因数
[0074] 有上式可知,电压在线路上的损耗主要与线路长度、功率因素角、以及线路截面积有关。
[0075] (2)、设变压器副方向为 原方向电压为 负荷功率为 S=P+jQ,可以得到电压降落的纵分量和横分量:
[0076]
[0077] 其中,RT表示电阻,XT表示电抗,由于 和 的夹角很小,故 的幅值为:
[0078]
[0079] 由上式,配电变压器的电压损耗近似为:
[0080]
[0081] 令 KT与变压器的型号、负荷功率因素有关,将UT2近似为UN,上式可简化为:
[0082]
[0083] 由以上配电变压器电压降落推导可知,配电变压器电压降落△UT与当前的负荷功率、变压器自身型号及负荷对应的功率因数有关。
[0084] 选取17组某区域典型台区的特征数据,将前12组台区数据作为训练集,后5 组数据作为测试集,对台区数据的训练数据和测试数据进行归一化预处理,采用的归一化映射如下:
[0085]
[0086] 其中,x,y∈R,xi为归一化前的数值;ximax、ximin分别为归一化前数据的最大值和最小值。
[0087] 具体来说,步骤(2)中支持向量机多分类器的基本模型为:
[0088] 假设样本空间为{(xi,yi)|i=1,2,…,l},其中xi∈Rn为给定的样本集,即输入量, yi∈Rn为目标输入量,i为样本输入个数。
[0089] 支持向量机多分类模型的优化形式如下:
[0090]
[0091]
[0092] 式中:ξi为松弛变量;参数C为惩罚因子。
[0093] 构建拉格朗日函数为:
[0094]
[0095] 将其对偶化为:
[0096]
[0097] 决策函数为:
[0098]
[0099] 采用的径向基核函数为:
[0100] K(x,xi)=exp(-γ||x-xi||2),γ>0。
[0101] 核函数参数g通常意义上指的是径向基核函数公式中的γ。当核函数的核参数g较小时,训练误差小,但是所有样本会集中在支持向量周围,导致支持向量机对于不同台区分类适用性差;当g较大时,支持向量的数量减少,误差增大,但同时支持向量机的适用性会有所提高。惩罚参数c表示间隔大小和分类准确度的权重,c趋向于无穷大时,会导致过拟合,c趋向于0时,会出现欠拟合。
[0102] 本发明中步骤(3)中遗传算法模拟自然界生物遗传和进化理论形成的一种并行随机搜索最优算法,将自然界“优胜劣汰,适者生存”的生物进化原理引入优化参数形成的编码串联群体中,按照所选择的适应度函数并通过遗传的选择,交叉和变异对个体进行筛选,直至确定出最优。主要步骤如下:
[0103] a)染色体编码。为扩大搜索范围,保证网络权值和阈值的高精度,编码规则选用浮点数编码。编码长度s为:
[0104] s=n1×n2+n2×n3+n2+n3
[0105] 其中n1,n2,n3分别为输入层、隐含层和输出层的神经元个数。
[0106] b)确定适应度函数。遗传算法的搜索目标是在所有进化代中使网络的平方和最小的网络权重,朝着使适应度函数值增大的方向进化。在进行神经网络训练时,将训练样本作为网络的输入和期望输出 网络训练产生的输出为 y(k),取网络训练产生的权值阈值,计算网络的误差平方和作为遗传算法的目标,误差平方和为:
[0107]
[0108] 其中,N为网络训练输入输出采样数据的数目。取误差平方和的倒数为适应度函数,引入一个足够小的正值ζ以免除零,适应度函数为:
[0109] fit=(Jm+ζ)-1
[0110] c)选择。按照适应度比例方法选择当前种群中生命力强的染色体个体。设群体大小为n,其中个体i的适应度为fi,则i被选择的概率为:
[0111]
[0112] 由上式可知,个体的适应度越大,被选择的概率越高;反之亦然。
[0113] d)交叉。浮点数编码的个体一般采用算术交叉。设在个体 和 之间进行算术交叉,则交叉运算后所产生出的两个新个体为:
[0114]
[0115] 其中,α是区间[0,1]内均匀分布的随机数。
[0116] e)变异。利用某一范围内均匀分布的随机数,以某一较小概率替换个体编码串中原有的基因实现变异,增强算法的局部随机搜索能力,防止出现早熟现象。设xmax和xmin分别为初始个体的最大值和最小值,则变异后的新基因值为:
[0117] xk′=xmin+β(xmax-xmin)
[0118] 其中,β是区间[0,1]内均匀分布的随机数。
[0119] 将低电压台区数据的训练样本在进行交叉验证方法意义下的准确率达到最高时,选取惩罚参数c最小的一组惩罚参数c和核函数参数g作为最优解。
[0120] 实施例一:
[0121] 如图3和图4所示,前12组台区数据作为训练集,后5组数据作为测试集,将训练集台区各特征数据导入支持向量机台区低电压风险识别模型中,利用遗传算法优化SVM参数,确定交叉验证意义下最佳的惩罚参数c和核函数参数g,提高分类的准确性。选定核函数为高斯径向基函数,核函数g参数初始值为台区低电压风险识别模型中指标数目的倒数;遗传算法寻优过程中设定交叉验证折数为5,进化代数为100,种群数量为20,c参数和g参数的寻优范围均为0- 200。设定低电压低风险台区标签为“1”,正常台区标签为“2”,低电压严重风险台区为“3”。
[0122] 模型运行结果如图5和图6所示,在交叉验证意义下,最佳惩罚参数c为 2.1572,核函数参数g为1.8259,在此状态下,训练集的分类准确率高达91.667%,根据台区低电压风险识别模型,确定出五个待测台区的低电压风险类型,与实际情况相符。根据结果表明,基于遗传算法优化支持向量机的台区低电压风险识别模型,可以精准的预测出台区低电压发生的风险。
[0123] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈