专利汇可以提供一种基于混沌萤火虫与梯度提升树模型的河流水位预测方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于混沌萤火虫与梯度提升树模型的河流 水 位预测方法,涉及信息技术领域和水文情况预测技术领域。首先 数据采集 ,所需数据总共分成五类。再进行数据预处理,包括异常值的剔除、缺失值的处理、数据归一化。将改进后的混沌萤火虫 算法 对梯度提升树模型的训练参数进行优化,并将改进的梯度提升树模型应用于结构化数据的河流水位预测研究。最后构造训练样本集,将处理后得到的5类数据中随机采用一部分用于模型训练,用GSO算法进行寻优,进行参数调优,得到最优参数下的GBDT模型,具有更好的泛化能 力 ,提高了模型对于水位预测的 精度 ,最后结合测试集进行模型检验,将得到的实际值与计算值的误差进行对比分析,验证模型的优良。,下面是一种基于混沌萤火虫与梯度提升树模型的河流水位预测方法专利的具体信息内容。
1.一种基于混沌萤火虫与梯度提升树模型的河流水位预测方法,其特征在于,所述方法包括:
S101:数据采集,所需数据总共分成五类,分别包括能够表示一份数据在一个特定时间点已经存在的完整的可验证的时间戳数据,当前时间段内河流流量总和的累计水量数据,单位时间内流经封闭管道或明渠有效截面的流体量的瞬时流量数据,河流单位时间内的位移的流速数据,当前时间段内最直观反映水体水情的水位数据。
S102:采集数据预处理,本发明中所采集的数据均为结构化数据,结构化数据中数据预处理包含异常值的剔除、缺失值的处理、数据归一化。
S103:基于改进后的混沌萤火虫算法(Glowworm Swarm Optimization,GSO)对梯度提升树模型(Gradient Boosted Decision Tree,GBDT)的训练参数进行优化,并将改进的梯度提升树模型应用于河流水位预测研究。
S104:构造训练样本集,将处理后得到的5类数据中随机采用一部分用于模型训练,用GSO算法进行寻优,进行参数调优,得到最优参数下的GBDT模型,结合测试集进行模型检验,计算与实际值的误差,验证模型的优良。
2.根据权利要求1所述的五类数据,其特征在于:
预测水位的数据获取包括以下:
S1011:时间戳能够表示在一个特定时间点已经存在的完整的可验证的数据;
S1012:累计水量反映当前时间段内河流水总和;
S1013:瞬时流量反映单位时间内流经封闭管道或明渠有效截面的流体量的数据,目前主要采用流量仪表来测量河流的流量,由于流量具有不稳定性,所以流量的测量值与实际值误差较大;
S1014:流速反映河流单位时间内的位移,渠道和河道里的水流各点的流速不相同,靠近河(渠)底、河边处的流速较小,河中心近水面处的流速最大;
S1015:水位能够反映当前时间段内最直观反映水体水情,水位的观测内容一般包含流势、波浪、冰情等变化的影响,观测的时间和次数要随一天内水位的变化过程而改变。
3.根据权利要求1所述的结构化数据预处理,其特征在于:
S1021:本发明中对数据进行预处理时,对于缺失值处理的三种方法:直接使用含有缺失值的特征;删除含有缺失值的特征(该方法在包含缺失值的属性含有大量缺失值而仅仅包含极少量有效值时是有效的);缺失值补全;常见的特征选择类型分为三类:过滤式(filter)、包裹式(wrapper)、嵌入式(embedding)。
4.根据权利要求1所述的S103的GBDT模型,其特征在于:
S1031:本发明提出可较好的实现分类和回归任务的GBDT模型对水位进行预测。
GBDT是每一次的训练为了减少上一次的残差,在减少残差的梯度方向训练一个新的模型,最后所有树的累加起来作为最终分类器,能够较好的实现分类和回归任务,且不易出现过拟合现象。GBDT原理:用Gradient Boosting的策略训练出来的Decision Tree模型。模型的结果是一组回归分类树组合(CART Tree Ensemble),可以表示为以下模型:
式(1)中,fk(xi)表示第k棵决策树,表示由n个弱分类器线性相加而成的强分类器。即在上一轮预测值上加入一个新的决策树函数fk(xi)使得与真实值的残差最大程度的减少。
GBDT的目标函数如下:
式(2)中,l是可微的损失函数表示预测值 和真实值yi的差值, 为添加的正则化,Ω表示决策树的复杂度,可以约束决策树的节点数量、树的深度或者叶子节点所对应的分数的L2范数,止模型出现过拟合:
式(3)中为第t次迭代的目标函数,式中C为常数,根据泰勒公式将上式进行展开,以二阶形式作为目标函数近似值,公式如下:
式(4)中, 分别是损失函数对于 的一阶导数和二阶
导数,掉常数项t次迭代的目标函数可以简化为如式(5),本文使用的树的复杂度函数如下:
式(6)中,γ表示叶子节点系数,T为叶子节点数。λ作为L2平方模系数也起到防止过拟合的作用,ω表示叶子权重。将决策树函数f进行重新定义ft(x)=ωq(x),即把树拆分成结构函数q和叶子权重部分ω,其中q将输入映射到叶子的索引,即q:Rd→{1,2,3,L,T},定义每个叶子的样本集合为Ij={i|q(xi)=j},从而对目标函数进行改写:
其中, 使用一元二次方程最小值求解得到最优解 目标函数最优
解L*:
由上可知,当获取决策树的结构函数q,目标函数可根据上式计算获得。最终问题转化为寻找最优树结构q*,使得目标函数有最小值。
5.权利要求1所述的S103的萤火虫算法,其特征在于:
S1032:萤火虫搜索算法是一种基于仿生学提出的启发式搜索算法,萤火虫的亮度与它所在位置上的目标值有关,越亮的萤火虫表示它所在的位置越好,即有较优的目标函数值。
越亮的萤火虫表示它所在的位置越好,即有较优的目标函数值,大部分萤火虫会聚集在多个位置上,即达到极值点,萤火虫的相对荧光亮度:
式(10)中,I0表示最亮萤火虫的亮度,γ表示光吸收系数,rij表示萤火虫i与萤火虫j之间的距离,相互吸引度β:
式(11)中,β0表示最大吸引度,即光源处的吸引度,最优目标迭代:
xi(t+1)=xi(t)+β(xj(t)-xi(t))+α(rand-1/2) (12)
式(12)中xi与xj表示i与j两个萤火虫的空间位置,α是步长因子,rand为[0,1]上服从均匀分布的随机因子。
萤火虫算法具体实现过程如下:
(1)初始状态设定,设置萤火虫数目n,最大吸引度β0,光强吸收系数γ,步长因子α,最大迭代次数MaxGeneration或者搜索精度ε。
(2)随机初始化萤火虫的位置,计算萤火虫的目标函数值作为各自最大荧光亮度I0。
(3)计算群体中萤火虫的相对亮度I和吸引度β,根据相对亮度决定萤火虫的移动方向。
(4)更新萤火虫的位置,对最佳位置的萤火虫进行随机移动,重新计算萤火虫的亮度(5)更新目标函数最优解和最优解位置,判断最优解是否满足设定条件以及是否达到最大迭代次数,如不满足则转到步骤(3)进行迭代。
(6)输出全局极值点。
6.根据权利要求1所述的改进的萤火虫算法对GBDT模型训练参数进行优化,其特征在于:
S1033:萤火虫算法具有简单易懂,参数少等特点,在解决问题时,无需配置过多参数,易于实现。研究表明,该算法可能比遗传算法、PSO以及其他算法更有效。但萤火虫算法的在局部搜索的发现率低,搜索速度慢且精度低等缺点。本说明通过以下两方面进行改进:
(1)引入惯性权重
在解决问题的过程中,一般期望寻优算法前期表现出良好的全局搜索能力,后期具有精细的局部开发能力。萤火虫算法的位置更新具有随机性,为了提高算法的性能,更新权重公式引入惯性权重:
xi(t+1)=ωxi(t)+β(xj(t)-xi(t))+α(rand-1/2) (13)
ω随着迭代次数t的增大而减小,确保了萤火虫算法具有良好的搜索空间,前期ω的值较大,有利于跳出局部最优解,确保算法的全局搜索能力。后期ω值较小,保证算法局部搜索能力的同时加快了算法后期的搜索能力。
(2)加入混沌变异系统
为改善算法寻优精度差的特点,当多数点处于迭代停止状态,利用混沌系统遍历的特性,跳出局部最优解。是Logistic映射的混沌系统:
Xn+1=uXn(1-Xn)n=0,1,2L (14)
其中u是控制参量,一般取u=4,系统完全处于混沌状态。赋予任何一个初值X0∈[0,1],Logistic完全处于混沌状态,保证分散的全局性和均匀性。算法不易陷入局部最优,确保算法后期的精准性。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种仿生学水轮机 | 2020-05-12 | 168 |
仿生学的生活用品 | 2020-05-13 | 128 |
一种基于仿生学的新型焊枪 | 2020-05-16 | 894 |
仿生学蜂窝轮胎 | 2020-05-11 | 935 |
基于仿生学的多功能电动助步轮椅 | 2020-05-16 | 193 |
仿生学保暖裤 | 2020-05-11 | 166 |
基于仿生学的人脸画像合成方法 | 2020-05-14 | 685 |
仿生学微流控混合器 | 2020-05-12 | 408 |
冬虫夏草菌的一种仿生学培养方法 | 2020-05-14 | 210 |
仿生学智能立体支撑剂及其应用 | 2020-05-18 | 791 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。