首页 / 专利库 / 空中管制 / 飞行计划 / 一种基于渐进梯度回归树的天气影响下空中通行能力的预测方法

一种基于渐进梯度回归树的天气影响下空中通行能的预测方法

阅读:1031发布:2020-05-22

专利汇可以提供一种基于渐进梯度回归树的天气影响下空中通行能的预测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于渐进梯度回归树的天气影响下空中通行能 力 的预测方法,包括如下步骤:(1)数据读取和处理;(2)数据清洗;(3)构建数据特征量;(4)模型训练和测试;(5)模型性能评估和优化;(6)天气影响下空中通行能力的预测。本发明能够对扇区、终端区和机场的空中通行能力进行科学合理的预测,为流量管理人员进行决策提供支持。,下面是一种基于渐进梯度回归树的天气影响下空中通行能的预测方法专利的具体信息内容。

1.一种基于渐进梯度回归树的天气影响下空中通行能的预测方法,其特征在于,包括如下步骤:
(1)数据读取和处理;
(2)数据清洗;
(3)构建数据特征量;
(4)模型训练和测试;
(5)模型性能评估和优化;
(6)天气影响下空中通行能力的预测。
2.如权利要求1所述的基于渐进梯度回归树的天气影响下空中通行能力的预测方法,其特征在于,步骤(1)中,数据读取和处理具体包括如下步骤:
(11)读取的数据包括:读取气象雷达数据、日常天气报告、航班的飞行计划数据;
(12)根据气象雷达数据文件名得到时间的年月日时分秒;
(13)根据气象雷达数据计算雷达反射率>40dBZ的面积与空域对象的比值得到天气对空域的影响指数;
(14)根据气象雷达数据的回波信号得到机场过去时刻/当前时刻各离场方向航路点的可用容量比率;
(15)根据机场日常天气报告得到过去时刻/当前时刻的机场向/风速、侧风、能见度、量、云底高度、天气现象;
(16)根据风向与跑道的夹计算跑道的侧风分量,依据《民用航空空中交通管理规则》附件15侧风、顺风限制标准表判断机场是否可以起飞
(17)根据航班的飞行计划得到计划进/离场飞机、离场重/中/轻机型数量、进场重/中/轻机型数量、国内航班数、国际航班数、飞机起降总架次。
3.如权利要求1所述的基于渐进梯度回归树的天气影响下空中通行能力的预测方法,其特征在于,步骤(2)中,数据清洗具体包括如下步骤:
(21)对天气和空中通行能力超过统计最大值的异常数据进行清洗;
(22)对重复数据的清洗;
(23)对不完整数据的清洗;
(24)数据进行离差标准化处理,消除量纲和数据取值范围的影响。
4.如权利要求1所述的基于渐进梯度回归树的天气影响下空中通行能力的预测方法,其特征在于,步骤(3)中,构建数据特征量具体包括如下步骤:
(31)由当前的时间点、过去1小时的所有时间片数据构建有时间特征、空域气象特征、机场气象特征和航班流量特征4个特征的n个输入特征量X;
(32)将输入特征量X1…Xn为自变量,管制员根据历史数据和管制经验得到对天气影响下的空域通行能力作为因变量Y,X和Y共同组成特征量数据集;
(33)对不完整数据的清洗;
(34)将特征量数据集分成3份,其中60%作为训练数据集,20%作为交叉验证数据集,
20%作为测试数据集;
(35)将所有的特征量进行重要度分析,提取前Z个重要度较高的特征量;
特征量j的重要度通过特征量j在单颗树中的重要度的平均值来得到:
式中,M是树的数量;L为树的叶子节点数量,L-1为树中的非叶子节点数量,vt为内部节点t进行分裂时选择的特征, 是内部节点t分裂之后平方损失的减少值。
5.如权利要求1所述的基于渐进梯度回归树的天气影响下空中通行能力的预测方法,其特征在于,步骤(4)中,模型训练和测试具体包括如下步骤:
(41)选择渐进梯度回归树(GBRT)作为核心算法
(42)所用的损失函数是平方损失函数;
L(yi,f(xi))=(yi-f(xi))2
式中,L为损失函数,yi为第i个样本对应的真实值,f(xi)为回归树,xi为第i个样本值;
(43)初始化弱学习器;
式中,yi为第i个样本对应的真实值,γ是使损失函数L极小化的常数值。
(44)对每个样本i=1,2,…,N,计算残差;
(45)将上步得到的残差作为样本新的真实值,并将数据(xi,rim)(i=1,2,...N)作为下棵树的训练数据,得到一颗新的回归树fm(x),其对应的叶子节点区域为Rim,j=1,2,...,J,其中J为回归树t的叶子节点的个数;
(46)对叶子区域j=1,2,...,J计算最佳拟合值;
(47)更新强学习器;
式中,I为指示函数,即样本x∈Rjm为1,否则为0。
6.如权利要求1所述的基于渐进梯度回归树的天气影响下空中通行能力的预测方法,其特征在于,步骤(5)中,模型性能评估和优化具体包括如下步骤:
(51)计算均方根差(RMSE);
(52)计算平均绝对误差(MAE);
(53)计算拟合优度(R2);
上述式中,yi为原始数据; 为预测数据; 为原始数据均值;
综合均方根差和平均绝对误差最小、拟合优度越接近1原则,综合确定最优模型的回归树的数量、每棵独立树的深度、学习速率、损失函数参数。
7.如权利要求1所述的基于渐进梯度回归树的天气影响下空中通行能力的预测方法,其特征在于,步骤(6)中,对天气影响下空中通行能力的预测具体包括如下步骤:
(61)空中通行能力包括管制扇区,终端区和机场;
(62)将新数据作为输入,采用渐进梯度回归树模型,使用模型性能评估确定下的参数的回归模型,对天气影响下空中通行能力进行预测。

说明书全文

一种基于渐进梯度回归树的天气影响下空中通行能的预测

方法

技术领域

[0001] 本发明涉及空中通行能力预测技术领域,尤其是一种基于渐进梯度回归树的天气影响下空中通行能力的预测方法

背景技术

[0002] 随着我国民航事业的快速发展,飞行流量激增,在相对有限的空域资源条件下,交通拥挤日趋严重,严重影响着空中交通运行的安全与效率。为了平衡空域资源供需矛盾、减少航班延误,科学、合理、准确的预测空域通行能力成为空中交通管理亟需解决的问题。
[0003] 空中通行能力是指空中交通管制单位用以声明并反映其空中交通管制系统或者其任何子系统或者运行席位在特定条件下提供空中交通服务的能力,通常用在给定的一段时间内进入指定空域的航空器数量来表示。目前,国内外相关机构对晴好天气条件下空域和机场的空中通行能力评估方法进行了大量的分析研究,对流天气影响下扇区、终端区和机场的空中通行能力的量化研究较少。在对流天气条件下,管制单位只能根据历史数据和管制经验,对天气影响下的空中通行能力进行人工预判。这种主观估计严重依赖个体的经验,不但容易产生偏差而且没有客观的理论和方法进行优化和校正。因此,在空中交通流量管理工作中迫切需要对天气影响下空中通行能力的预测。
[0004] 目前,基于机器学习智能算法预测空中通行能力已成为一个趋势。机器学习的算法很多,在建模和算法选择的时候需要根据输入数据来选择最合适的算法来获得最好的结果。

发明内容

[0005] 本发明所要解决的技术问题在于,提供一种基于渐进梯度回归树的天气影响下空中通行能力的预测方法,能够对扇区、终端区和机场的空中通行能力进行科学合理的预测,为流量管理人员进行决策提供支持。
[0006] 为解决上述技术问题,本发明提供一种基于渐进梯度回归树的天气影响下空中通行能力的预测方法,包括如下步骤:
[0007] (1)数据读取和处理;
[0008] (2)数据清洗;
[0009] (3)构建数据特征量;
[0010] (4)模型训练和测试;
[0011] (5)模型性能评估和优化;
[0012] (6)天气影响下空中通行能力的预测。
[0013] 优选的,步骤(1)中,数据读取和处理具体包括如下步骤:
[0014] (11)读取的数据包括:读取气象雷达数据、日常天气报告、航班的飞行计划数据;
[0015] (12)根据气象雷达数据文件名得到时间的年月日时分秒;
[0016] (13)根据气象雷达数据计算雷达反射率>40dBZ的面积与空域对象的比值得到天气对空域的影响指数;
[0017] (14)根据气象雷达数据的回波信号得到机场过去时刻/当前时刻各离场方向航路点的可用容量比率;
[0018] (15)根据机场日常天气报告(METAR)得到过去时刻/当前时刻的机场向/风速、侧风、能见度、量、云底高度、天气现象;
[0019] (16)根据风向与跑道的夹计算跑道的侧风分量,依据《民用航空空中交通管理规则》附件15侧风、顺风限制标准表判断机场是否可以起飞
[0020] (17)根据航班的飞行计划得到计划进/离场飞机、离场重/中/轻机型数量、进场重/中/轻机型数量、国内航班数、国际航班数、飞机起降总架次。
[0021] 优选的,步骤(2)中,数据清洗具体包括如下步骤:
[0022] (21)对天气和空中通行能力超过统计最大值的异常数据进行清洗;
[0023] (22)对重复数据的清洗;
[0024] (23)对不完整数据的清洗;
[0025] (24)数据进行离差标准化处理,消除量纲和数据取值范围的影响。
[0026] 优选的,步骤(3)中,构建数据特征量具体包括如下步骤:
[0027] (31)由当前的时间点、过去1小时的所有时间片数据构建有时间特征、空域气象特征、机场气象特征和航班流量特征4个特征的n个输入特征量X;
[0028] (32)将输入特征量X1…Xn为自变量,管制员根据历史数据和管制经验得到对天气影响下的空域通行能力作为因变量Y,X和Y共同组成特征量数据集;
[0029] (33)对不完整数据的清洗;
[0030] (34)将特征量数据集分成3份,其中60%作为训练数据集,20%作为交叉验证数据集,20%作为测试数据集;
[0031] (35)将所有的特征量进行重要度分析,提取前Z个重要度较高的特征量;
[0032] 特征量j的重要度通过特征量j在单颗树中的重要度的平均值来得到:
[0033]
[0034] 式中,M是树的数量;L为树的叶子节点数量,L-1为树中的非叶子节点数量,vt为内部节点t进行分裂时选择的特征,是内部节点t分裂之后平方损失的减少值。
[0035] 优选的,步骤(4)中,模型训练和测试具体包括如下步骤:
[0036] (41)选择渐进梯度回归树(GBRT)作为核心算法;
[0037] (42)所用的损失函数是平方损失函数;
[0038] L(yi,f(xi))=(yi-f(xi))2
[0039] 式中,L为损失函数,yi为第i个样本对应的真实值,f(xi)为回归树,xi为第i个样本值;
[0040] (43)初始化弱学习器;
[0041]
[0042] 式中,yi为第i个样本对应的真实值,γ是使损失函数L极小化的常数值。
[0043] (44)对每个样本i=1,2,…,N,计算残差;
[0044]
[0045] (45)将上步得到的残差作为样本新的真实值,并将数据(xi,rim)(i=1,2,...N)作为下棵树的训练数据,得到一颗新的回归树fm(x),其对应的叶子节点区域为Rim,j=1,2,...,J,其中J为回归树t的叶子节点的个数;
[0046] (46)对叶子区域j=1,2,...,J计算最佳拟合值;
[0047]
[0048] (47)更新强学习器;
[0049]
[0050] 式中,I为指示函数,即样本x∈Rjm为1,否则为0。
[0051] 优选的,步骤(5)中,模型性能评估和优化具体包括如下步骤:
[0052] (51)计算均方根差(RMSE);
[0053]
[0054] (52)计算平均绝对误差(MAE);
[0055]
[0056] (53)计算拟合优度(R2);
[0057]
[0058] 上述式中yi为原始数据; 为预测数据; 为原始数据均值;
[0059] 综合均方根差(RMSE)和平均绝对误差(MAE)最小、拟合优度越接近1原则综合确定最优模型的回归树的数量、每棵独立树的深度、学习速率、损失函数参数。
[0060] 优选的,步骤(6)中,对天气影响下空中通行能力的预测具体包括如下步骤:
[0061] (61)空中通行能力包括管制扇区,终端区和机场;
[0062] (62)将新数据作为输入,采用渐进梯度回归树模型,使用模型性能评估确定下的参数的回归模型,对天气影响下空中通行能力进行预测。
[0063] 本发明的有益效果为:渐进梯度回归树(Gradient Boost Regression Tree,GBRT)是一种集成学习的方法,GBRT基于大量回归树,采用的Boosting(提升法)进行集成,是对于任意的可微损失函数的提升算法的泛化;GBRT算法能够处理多种特征值、适用性广泛的优势其得到了广泛的应用;空中通行能力预测是个回归问题,利用渐进梯度回归树预测天气影响下的空中通行能力,不仅合理,而且还能提高空中通行能力的预测精度,为空中交通流量管理提供决策支持。附图说明
[0064] 图1为本发明的方法流程示意图。

具体实施方式

[0065] 如图1所示,一种基于渐进梯度回归树的天气影响下空中通行能力的预测方法,包括如下步骤:
[0066] (1)数据读取和处理;
[0067] (2)数据清洗;
[0068] (3)构建数据特征量;
[0069] (4)模型训练和测试;
[0070] (5)模型性能评估和优化;
[0071] (6)天气影响下空中通行能力的预测。
[0072] 步骤(1)中,数据读取和处理具体包括如下步骤:
[0073] (11)读取的数据包括:读取气象雷达数据、日常天气报告、航班的飞行计划数据;
[0074] (12)根据气象雷达数据文件名得到时间的年月日时分秒;
[0075] (13)根据气象雷达数据计算雷达反射率>40dBZ的面积与空域对象的比值得到天气对空域的影响指数;
[0076] (14)根据气象雷达数据的回波信号得到机场过去时刻/当前时刻各离场方向航路点的可用容量比率;
[0077] (15)根据机场日常天气报告(METAR)得到过去时刻/当前时刻的机场风向/风速、侧风、能见度、云量、云底高度、天气现象;
[0078] (16)根据风向与跑道的夹角计算跑道的侧风分量,依据《民用航空空中交通管理规则》附件15侧风、顺风限制标准表判断机场是否可以起飞;
[0079] (17)根据航班的飞行计划得到计划进/离场飞机、离场重/中/轻机型数量、进场重/中/轻机型数量、国内航班数、国际航班数、飞机起降总架次。
[0080] 步骤(2)中,数据清洗具体包括如下步骤:
[0081] (21)对天气和空中通行能力超过统计最大值的异常数据进行清洗;
[0082] (22)对重复数据的清洗;
[0083] (23)对不完整数据的清洗;
[0084] (24)数据进行离差标准化处理,消除量纲和数据取值范围的影响。
[0085] 步骤(3)中,构建数据特征量具体包括如下步骤:
[0086] (31)由当前的时间点、过去1小时的所有时间片数据构建有时间特征、空域气象特征、机场气象特征和航班流量特征4个特征的n个输入特征量X;
[0087] (32)将输入特征量X1…Xn为自变量,管制员根据历史数据和管制经验得到对天气影响下的空域通行能力作为因变量Y,X和Y共同组成特征量数据集;
[0088] (33)对不完整数据的清洗;
[0089] (34)将特征量数据集分成3份,其中60%作为训练数据集,20%作为交叉验证数据集,20%作为测试数据集;
[0090] (35)将所有的特征量进行重要度分析,提取前Z个重要度较高的特征量;
[0091] 特征量j的重要度通过特征量j在单颗树中的重要度的平均值来得到:
[0092]
[0093] 式中,M是树的数量;L为树的叶子节点数量,L-1为树中的非叶子节点数量,vt为内部节点t进行分裂时选择的特征,是内部节点t分裂之后平方损失的减少值。
[0094] 步骤(4)中,模型训练和测试具体包括如下步骤:
[0095] (41)选择渐进梯度回归树(GBRT)作为核心算法;
[0096] (42)所用的损失函数是平方损失函数;
[0097] L(yi,f(xi))=(yi-f(xi))2
[0098] 式中,L为损失函数,yi为第i个样本对应的真实值,f(xi)为回归树,xi为第i个样本值;
[0099] (43)初始化弱学习器;
[0100]
[0101] 式中,yi为第i个样本对应的真实值,γ是使损失函数L极小化的常数值。
[0102] (44)对每个样本i=1,2,…,N,计算残差;
[0103]
[0104] (45)将上步得到的残差作为样本新的真实值,并将数据(xi,rim)(i=1,2,...N)作为下棵树的训练数据,得到一颗新的回归树fm(x),其对应的叶子节点区域为Rim,j=1,2,...,J,其中J为回归树t的叶子节点的个数;
[0105] (46)对叶子区域j=1,2,...,J计算最佳拟合值;
[0106]
[0107] (47)更新强学习器;
[0108]
[0109] 式中,I为指示函数,即样本x∈Rjm为1,否则为0。
[0110] 步骤(5)中,模型性能评估和优化具体包括如下步骤:
[0111] (51)计算均方根差(RMSE);
[0112]
[0113] (52)计算平均绝对误差(MAE);
[0114]
[0115] (53)计算拟合优度(R2);
[0116]
[0117] 上述式中yi为原始数据; 为预测数据;为原始数据均值;
[0118] 综合均方根差(RMSE)和平均绝对误差(MAE)最小、拟合优度越接近1原则综合确定最优模型的回归树的数量、每棵独立树的深度、学习速率、损失函数参数。
[0119] 步骤(6)中,对天气影响下空中通行能力的预测具体包括如下步骤:
[0120] (61)空中通行能力包括管制扇区,终端区和机场;
[0121] (62)将新数据作为输入,采用渐进梯度回归树模型,使用模型性能评估确定下的参数的回归模型,对天气影响下空中通行能力进行预测。
[0122] 以中南区2017年1月1日至2018年5月31日的历史运行数据为基础。以广州白云国际机场为例,对气象雷达数据、日常天气报告、航班的飞行计划数据进行处理,得到时间特征模、空域气象特征模块、航班属性特征模块、气象观测特征模块4个特征83个输入特征量作为自变量X。管制员根据历史数据和管制经验得到对流天气影响下的空域通行能力作为因变量Y。将特征集随机取样,其中60%作为训练数据集,20%作为交叉验证数据集,20%作为测试数据集。最优模型的平均绝对误差(MAE)为5.67、均方根差(RMSE)为7.54、拟合优度(R2)为0.87。确定回归树个数为300、每个回归树的深度为6、生成子节点所需的最小样本数为2、学习速率为0.02。
[0123] 随机选取2017年04月19日、2017年08月27日、2017年10月05日、2017年11月13日,2018年02月22日等5日作为典型日进行验证。预测结果的平均准确率:94.02%;预测平均绝对误差:1.13;预测均方误差误差:2.23。
[0124] 从结果中可以看出,渐进梯度回归树预测天气影响下空中通行能力得出的结果科学合理,具有指导意义。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈