首页 / 专利库 / 核能 / 临界状态 / 基于梯度提升树的大规模新能源接入电网稳定性辨识方法

基于梯度提升树的大规模新能源接入电网稳定性辨识方法

阅读:909发布:2020-05-11

专利汇可以提供基于梯度提升树的大规模新能源接入电网稳定性辨识方法专利检索,专利查询,专利分析的服务。并且一种基于快速梯度提升树的新 能源 接入 电网 稳定性 辨识方法。有效避免数学模型日趋复杂和不确定性因素给电 力 系统带来的影响,辨识过程中运算快速、准确率高,能够满足电网时效性和准确性需求。包括以下步骤:步骤1:模型建立;步骤2:基于电网 电压 、功 角 、 频率 数据的特征选择,将电网电压、功角、频率数据作为判定电网状态的 基础 数据,即判别模型的输入样本数据;步骤3:建立CART模型,将样本子空间划分为稳定状态、不稳定状态和 临界状态 ;在进行XGbost模型训练时,将训练样本分为稳定状态、不稳定状态和临界状态三个集合,分别标记:步骤4:采用4层XGboost结构的模型接入电压、功角、频率的特征样本,输出即为电压、功角、频率的判定结果。,下面是基于梯度提升树的大规模新能源接入电网稳定性辨识方法专利的具体信息内容。

1.基于梯度提升树的大规模新能源接入电网稳定性辨识方法,其特征是包括以下步骤:
步骤1:模型建立
步骤1.1 CART模型
M
对于包含有N个训练样本的数据集D, yi∈R ;假设将输入
空间划分为M个单元R1,R2,…,RM,且单元Rj上输出的数值为cm,m=1,2,……,M,则回归树的模型为:
其中,I(·)为示性函数;
若任意选取一个以划分空间,回归树在训练数据及上误差利用损失函数 表示,采用平方最小构建损失函数,如公式2:
其中,yi为第i个子空间的真实值;
回归树需要寻找最佳划分点,使得该划分方案对应的回归树平方误差在所有划分方案中误差最小,即满足损失函数要求;假设输入k维数据 任意选择第j维
的取值s作为划分变量的划分点;结合以上讨论,定义两个区域:
根据公式4构建数学模型公式4,求解分析最优划分变量j和最优划分点s;
其中,c1、c2分别为R1和R2区域所有输入样本对应的输出值的平均值;通过求解L′(xi)可得最优划分点,再利用最优划分点划分区域,划分区域结果计算对应的输出值,如此循环计算这一过程,将最终满足终止条件的M个区域组合成决策树;常用终止条件有:节点中样本个数小样预定值、样本集的平方误差小于预定值和无更多特征可供划分选择;
步骤1.2 XGboost算法
以CART为基学习器算法,XGboost的构建过程是多个CART树的合理组合,由弱学习器不断累加形成强学习能;模型根节点中包含所有样本数据,根据一定规则将样本节点分为左叶子节点和右叶子节点;左叶子节点中包含特征与最终目标相近时,左叶子节点将继续划分;
假设存在k棵树,则样本i的得分为:
设样本集共n个样本,在K棵树下的目标函数为:
式中, 为损失函数;Ω(fk)为正则项,表征树的复杂度;
XGboost中学习器按顺序进行学习分类,模型学习过程可归纳为:
Fm+1(x)=Fm(x)+h(x)    公式7
其中,x为样本中的变量;Fm(x)表示m个弱学习器的组合结果;h(x)形式灵活,可根据具体问题变换形式;公式7表明XGboost算法从样本集中按照一定规则将特征分类,并将特征逐层向下传递;每个学习器之间具有紧密的联系,上一个学习器输出信息作为下一学习器的样本数据,逐层向下,最终将学习器合理组合,构建完整模型;
步骤2:基于电网电压、功频率数据的特征选择
发明将电网电压、功角、频率数据作为判定电网状态的基础数据,即判别模型的输入样本数据;
所述电网电压是指暂态稳定仿真计算得到的电网母线电压变化数值序列,取全网
220kV及以上电压等级母线的数据序列,取值数量为故障发生后300周波的结果;
电网功角是指暂态稳定仿真计算得到的电网各发电机绝对功角变化序列,取全网发电机绝对功角的数据序列,取值数量为故障发生后300周波的结果;
电网频率是指暂态稳定仿真计算得到的电网母线频率变化数值序列,取全网220kV及以上电压等级母线的数据序列,取值数量为故障发生后300周波的结果;
电网电压、功角、频率数据构成样本的特征,按照母线电压、发电机绝对功角、母线频率数据的顺序排列,用下述公式表示:
s={V,θ,F}                    公式8
V={vbus1,vbus2…vbusn},
θ={θGen1,θGen2…θGenn},
F={fbus1,fbus2…fbusn}
其中,V表示母线电压序列,θ表示发电机功角序列,F表示母线频率序列;
步骤3:建立CART模型,将样本子空间划分为稳定状态、不稳定状态和临界状态在进行XGbost模型训练时,将训练样本分为稳定状态、不稳定状态和临界状态三个集合,分别标记:
所述稳定状态指样本的电网电压、功角、频率数据都是稳定的,即没有超出电网运行规定的限值,不存在电压、功角、频率失稳的可能;
所述不稳定状态是指样本的电网电压、功角、频率数据曲线至少有一种是失稳的,即超出电网运行规定的限值;
所述临界状态是指样本的电网电压、功角、频率数据曲线各自出现5次及以上振荡后才平直,此时系统为临界稳定;
上述处理使得XGboost最终将有三个叶子节点,这三个叶子节点中任意有一个显示为失稳,则系统失稳;若无失稳节点,但任意有一个叶子节点显示为临界状态,系统临界稳定;
三个叶子节点均显示为稳定状态,则系统稳定;
步骤4:采用4层XGboost结构的模型
采用4层XGboost模型同时接入前述步骤2电压、功角、频率的特征样本,输出即为电压、功角、频率的判定结果。
2.根据权利要求1所述的基于梯度提升树的大规模新能源接入电网稳定性辨识方法,其特征是步骤3中根据叶子节点显示为何种特征的失稳,可以判断系统失稳的类型为电压、功角或频率失稳。

说明书全文

基于梯度提升树的大规模新能源接入电网稳定性辨识方法

技术领域

[0001] 本发明是以梯度提升树为基础的电网稳定性辨识方法,尤其涉及一种基 于快速梯度提升树的大规模新能源接入电网稳定性辨识方法。

背景技术

[0002] 传统的电系统安全稳定分析主要基于机理模型的仿真计算,条件是参 数和已知条件的确定性。电动汽车、新能源等持续渗透给电网带来了不确定 性因素,挑战着电力系统分析特别是基于机理因果模型的分析方法:一方面, 大规模新能源接入使计算方程日趋复杂,计算速度和精度往往不能满足电网发 展需求;另一方面,新能源带来的不确定性因素日益复杂,难以利用物理方法 建模,给分析控制带来了极大挑战。目前,新能源接入电网稳定性辨识还是采 用仿真分析方法,因此不可避免地带来分析误差。
[0003] 目前尚未有采用决策树进行新能源接入电网安全稳定性快速辨识的相关 报道。

发明内容

[0004] 本发明的目的是要解决现有技术存在的上述问题,提供一种基于快速梯度 提升树的新能源接入电网稳定性辨识方法。能够从电网运行数据入手,有效避 免数学模型日趋复杂和不确定性因素给电力系统带来的影响。另外,辨识过程 中运算快速、准确率高,能够满足电网时效性和准确性需求。
[0005] 本发明的技术解决方案是:
[0006] 基于梯度提升树的大规模新能源接入电网稳定性辨识方法,包括以下步 骤:
[0007] 步骤1.模型建立
[0008] 步骤1.1CART模型
[0009] 对于包含有N个训练样本的数据集D, 假设将输入空间划分为M个单元R1,R2,…,RM,且单元Rj上输出的数值为cm, m=1,2,……,M,则回归树的模型为:
[0010]
[0011] 其中,I(·)为示性函数;
[0012] 若任意选取一个以划分空间,回归树在训练数据及上误差利用损失函数  表示,采用平方最小构建损失函数,如公式2:
[0013]
[0014] 其中,yi为第i个子空间的真实值;
[0015] 回归树需要寻找最佳划分点,使得该划分方案对应的回归树平方误差在所 有划分方案中误差最小,即满足损失函数要求;假设输入k维数据  任意选择第j维 的取值s作为划分变量的划分点; 结合以上讨论,定义两个区域:
[0016]
[0017] 根据公式4构建数学模型公式4,求解分析最优划分变量j和最优划分点 s;
[0018]
[0019] 其中,c1、c2分别为R1和R2区域所有输入样本对应的输出值的平均值;通过 求解L′(xi)可得最优划分点,再利用最优划分点划分区域,划分区域结果计算对 应的输出值,如此循环计算这一过程,将最终满足终止条件的M个区域组合成 决策树;常用终止条件有:节点中样本个数小样预定值、样本集的平方误差小 于预定值和无更多特征可供划分选择;
[0020] 步骤1.2XGboost算法
[0021] 以CART为基学习器算法,XGboost的构建过程是多个CART树的合理组合, 由弱学习器不断累加形成强学习能力;模型根节点中包含所有样本数据,根据 一定规则将样本节点分为左叶子节点和右叶子节点;左叶子节点中包含特征与 最终目标相近时,左叶子节点将继续划分;
[0022] 假设存在k棵树,则样本i的得分为:
[0023]
[0024] 设样本集共n个样本,在K棵树下的目标函数为:
[0025]
[0026] 式中, 为损失函数;Ω(fk)为正则项,表征树的复杂度;
[0027] XGboost中学习器按顺序进行学习分类,模型学习过程可归纳为:
[0028] Fm+1(x)=Fm(x)+h(x)    公式7
[0029] 其中,x为样本中的变量;Fm(x)表示m个弱学习器的组合结果;h(x)形式 灵活,可根据具体问题变换形式;公式7表明XGboost算法从样本集中按照一 定规则将特征分类,并将特征逐层向下传递;每个学习器之间具有紧密的联系, 上一个学习器输出信息作为下一学习器的样本数据,逐层向下,最终将学习器 合理组合,构建完整模型;
[0030] 步骤2:基于电网电压、功频率数据的特征选择
[0031] 本发明将电网电压、功角、频率数据作为判定电网状态的基础数据,即判 别模型的输入样本数据;
[0032] 所述电网电压是指暂态稳定仿真计算得到的电网母线电压变化数值序列, 取全网220kV及以上电压等级母线的数据序列,取值数量为故障发生后300周 波的结果;
[0033] 电网功角是指暂态稳定仿真计算得到的电网各发电机绝对功角变化序列, 取全网发电机绝对功角的数据序列,取值数量为故障发生后300周波的结果;
[0034] 电网频率是指暂态稳定仿真计算得到的电网母线频率变化数值序列,取全 网220kV及以上电压等级母线的数据序列,取值数量为故障发生后300周波的 结果;
[0035] 电网电压、功角、频率数据构成样本的特征,按照母线电压、发电机绝对 功角、母线频率数据的顺序排列,用下述公式表示:
[0036] s={V,θ,F}                    公式8
[0037] V={vbus1,vbus2…vbusn},
[0038] θ={θGen1,θGen2…θGenn},
[0039] F={fbus1,fbus2…fbusn}
[0040] 其中,V表示母线电压序列,θ表示发电机功角序列,F表示母线频率序 列;
[0041] 步骤3:建立CART模型,将样本子空间划分为稳定状态、不稳定状态和临 界状态[0042] 在进行XGbost模型训练时,将训练样本分为稳定状态、不稳定状态和临界 状态三个集合,分别标记:
[0043] 所述稳定状态指样本的电网电压、功角、频率数据都是稳定的,即没有超 出电网运行规定的限值,不存在电压、功角、频率失稳的可能;
[0044] 所述不稳定状态是指样本的电网电压、功角、频率数据曲线至少有一种是 失稳的,即超出电网运行规定的限值;
[0045] 所述临界状态是指样本的电网电压、功角、频率数据曲线各自出现5次及 以上振荡后才平直,此时系统为临界稳定;
[0046] 上述处理使得XGboost最终将有三个叶子节点,这三个叶子节点中任意有 一个显示为失稳,则系统失稳;若无失稳节点,但任意有一个叶子节点显示为 临界状态,系统临界稳定;三个叶子节点均显示为稳定状态,则系统稳定;
[0047] 步骤4:采用4层XGboost结构的模型
[0048] 采用4层XGboost模型同时接入前述步骤2电压、功角、频率的特征样本, 输出即为电压、功角、频率的判定结果。
[0049] 进一步,步骤3中根据叶子节点显示为何种特征的失稳,可以判断系统失 稳的类型为电压、功角或频率失稳。
[0050] 本发明的有益效果是:本发明选取电压、功角、频率、发电机速度偏差 四种维度数据作为表征电网的特征量,通过弱学习器分别学习目标维度特性 并判别状态,再合理组合各弱学习器,最终形成分辨能力较强的算法模型, 从电网多维度运行数据评估电网稳定性。相对于数值仿真计算能够不受新能源 随机性波动的影响,且不需要复杂的计算公式推导,可以更准确地实现大规模 新能源接入电网的稳定性快速辨识。此外,相对于目前的数值仿真算法一次只 能对电压、功角、频率中的一种进行判别,本方法不但能够同时快速判别系统 电压、功角、频率是否失稳,还能够获得失稳类型的信息;本发明采用4层 XGboost模型,辨别效率和效果的均衡程度最好。附图说明
[0051] 图1是决策树结构示意图;
[0052] 图2是XGboost算法基本架构图;
[0053] 图3是本发明的方法流程图

具体实施方式

[0054] 决策树是一种有监督学习算法,如图1所示,主要由3个主要部分组成: 决策节点,分支和叶子节点。决策树最顶部的决策节点是根决策节点,又可 称为根节点。每一个分支都有一个新的决策节点。决策节点下面是叶子节点, 每个决策节点表示一个待分类的数据类别或属性,每个叶子节点表示一种结 果。整个决策的过程从根决策节点开始,从上到下,根据数据的分类在每个 决策节点给出不同的结果。叶子节点往往是有相同属性数据的集合,可直接 展示样本数据经决策树处理后的数据分类。
[0055] 决策树可大致分为分类树与回归树。分类树结果是离散值,可能会有多个 叶子节点,输出的是类别的形式。回归树结果是连续值,以数值的形式呈现。 二者本质基本一致,都是特征(feature)到结果/标签(label)之间的映射。显 然,由于分类树和回归树的输出不同,二者的损失函数、适用场景和分析逻辑 均有一定区别。单个决策树分类能力不能满足实际需求,一般采用多个决策树 组合的方式构建算法模型,即集成学习方法。集成学习大致可分为Boosting和 Bagging方法。Bagging方法以随机森林(random forest)方法为代表,特点是 每个自学习器相互独立,有利于算法并行。Boosting方法以分类与回归树 (CART)为代表,学习器之间存在先后顺序,即前序学习器的结果作为后序 学习器的样本数据。Boosting方法每一个样本均有权重,初始时权重相同,随 着训练过程学习器的权重不断调整。XGboost算法由多个CART模型组合,其 结果经过多层筛选计算求得,具有较好的时效性和准确率。
[0056] 本发明涉及的基于梯度提升树的大规模新能源接入电网稳定性辨识方法, 包括以下步骤:
[0057] 步骤1:模型建立
[0058] 步骤1.1CART模型
[0059] 1)CART模型
[0060] 对于包含有N个训练样本的数据集D, 假设将输入空间划分为M个单元R1,R2,…,RM,且单元Rj上输出的数值为cm, m=1,2,……,M。则回归树的模型为[10]:
[0061]
[0062] 其中,I(·)为示性函数。
[0063] 若任意选取一个以划分空间,回归树在训练数据及上误差可利用损失函数 表示,采用平方最小构建损失函数,如公式2:
[0064]
[0065] 其中,yi为第i个子空间的真实值。
[0066] 回归树需要寻找最佳划分点,使得该划分方案对应的回归树平方误差在所 有划分方案中误差最小,即满足损失函数要求。假设输入k维数据  任意选择第j维 的取值s作为划分变量的划分点。结 合以上讨论,可定义两个区域:
[0067]
[0068] 根据公式3构建数学模型公式4,求解分析最优划分变量j和最优划分点 s;
[0069]
[0070] 其中,c1、c2分别为R1和R2区域所有输入样本对应的输出值的平均值。通过 求解L′(xi)可得最优划分点,再利用最优划分点划分区域,划分区域结果计算对 应的输出值,如此循环计算这一过程,将最终满足终止条件的M个区域组合成 决策树。一般而言,常用终止条件有:节点中样本个数小样预定值;样本集的 平方误差小于预定值;无更多特征可供划分选择。
[0071] 2)Xgboost算法
[0072] XGboost(eXtreme Grdient Boosting)方法由多个CART树组合构成,具 有速度快精度高等特点。电网是一种实时动态网络,对于算法速度和精度具有 较高要求。
[0073] 图2所示为XGboost算法基本架构,以CART为基学习器算法。XGboost的 构建过程是多个CART树的合理组合,由弱学习器不断累加形成强学习能力。模 型根节点(root)中包含所有样本数据,根据一定规则将样本节点分为左叶子 节点(left)和右叶子节点(right)。左叶子节点中包含特征与最终目标相近 时,左叶子节点将继续划分。例如,XGboost辨识宫颈癌时,第一层树可设定 性别:男性(右叶子节点)和女性(左叶子节点)。下一步算法将只针对女性所 在的左叶子节点进行下一步划分。XGboost每一个子学习器是一个二分类过程, 这一特点保证了算法的快速性,一定程度上也保证了算法的准确率。XGboost 由多个CART构成,下面将基于前面讨论介绍具有k棵树XGboost的实现方法。
[0074] 假设存在k棵树,则样本i的得分为:
[0075]
[0076] 设样本集共n个样本,在K棵树下的目标函数为:
[0077]
[0078] 式中, 为损失函数;Ω(fk)为正则项,表征树的复杂度。
[0079] XGboost中学习器按顺序进行学习分类,模型学习过程可归纳为:
[0080] Fm+1(x)=Fm(x)+h(x)          公式7
[0081] 其中,x为样本中的变量;Fm(x)表示m个弱学习器的组合结果;h(x)形式 灵活,可根据具体问题变换形式。式(7)表明XGboost算法从样本集中按照一 定规则将特征分类,并将特征逐层向下传递。每个学习器之间具有紧密的联系, 上一个学习器输出信息作为下一学习器的样本数据,逐层向下,最终将学习器 合理组合,构建完整模型。
[0082] 步骤2:基于电网电压、功角、频率数据的特征选择
[0083] 本发明将电网电压、功角、频率数据作为判定电网状态的基础数据,即判 别模型的输入样本数据;
[0084] 所述电网电压是指暂态稳定仿真计算得到的电网母线电压变化数值序列, 取全网220kV及以上电压等级母线的数据序列,取值数量为故障发生后300周 波的结果;
[0085] 电网功角是指暂态稳定仿真计算得到的电网各发电机绝对功角变化序列, 取全网发电机绝对功角的数据序列,取值数量为故障发生后300周波的结果;
[0086] 电网频率是指暂态稳定仿真计算得到的电网母线频率变化数值序列,取全 网220kV及以上电压等级母线的数据序列,取值数量为故障发生后300周波的 结果;
[0087] 电网电压、功角、频率数据构成样本的特征,按照母线电压、发电机绝对 功角、母线频率数据的顺序排列,用下述公式表示:
[0088] s={V,θ,F}                    公式8
[0089] V={vbus1,vbus2…vbusn},
[0090] θ={θGen1,θGen2…θGenn},
[0091] F={fbus1,fbus2…fbusn}
[0092] 其中,V表示母线电压序列,θ表示发电机功角序列,F表示母线频率序 列;
[0093] 步骤3:建立CART模型,将样本子空间划分为稳定状态、不稳定状态和临 界状态[0094] 在进行XGbost模型训练时,将训练样本分为稳定状态、不稳定状态和临界 状态三个集合,分别标记:
[0095] 所述稳定状态指样本的电网电压、功角、频率数据都是稳定的,即没有超 出电网运行规定的限值,不存在电压、功角、频率失稳的可能;
[0096] 所述不稳定状态是指样本的电网电压、功角、频率数据曲线至少有一种是 失稳的,即超出电网运行规定的限值;
[0097] 所述临界状态是指样本的电网电压、功角、频率数据曲线各自出现5次及 以上振荡后才平直,此时系统为临界稳定;
[0098] 上述处理使得XGboost最终将有三个叶子节点,这三个叶子节点中任意有 一个显示为失稳,则系统失稳;若无失稳节点,但任意有一个叶子节点显示为 临界状态,系统临界稳定;三个叶子节点均显示为稳定状态,则系统稳定。
[0099] 步骤4:采用4层XGboost结构的模型
[0100] 采用4层XGboost模型同时接入前述步骤2电压、功角、频率的特征样本, 输出即为电压、功角、频率的判定结果。
[0101] 首先基于历史数据进行预处理,核心是通过模拟计算建立样本集合;其次, 将样本集按1:1分为训练集和测试集;再次,对训练集进行筛选,删除多余的 稳定样本,使失稳和稳定样本达到1:1比例;最后,进行XGboost模型训练, 如果测试集测试不满足准去率要求则调整训练集,增加或减少稳定样本数量, 如果满足准确率要求则输出模型。
[0102] 进一步,步骤3中根据叶子节点显示为何种特征的失稳,可以判断系统失 稳的类型为电压、功角或频率失稳。
[0103] 以上仅为本发明的具体实施例而已,并不用于限制本发明,对于本领域 的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则 之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围 之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈