首页 / 专利库 / 专利权 / 国际初步审查 / 国际初步审查要求 / 选定 / 一种基于天气数据挖掘的机场进离场交通流量预测方法

一种基于天气数据挖掘的机场进离场交通流量预测方法

阅读:721发布:2021-04-12

专利汇可以提供一种基于天气数据挖掘的机场进离场交通流量预测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种基于天气 数据挖掘 的机场进离场交通流量预测方法,包括:对 选定 机场的历史数据按照预设规则提取所需天气信息,并按照预设条件进行识别;获取选定机场特定时间段内的机场流量统计数据,将机场流量与天气信息进行匹配,其中,机场流量分为 起飞 、降落和飞跃三类;基于BP神经网络分别对各类机场流量对应的匹配信息进行训练和学习,得到不同天气类型对选定机场的各类机场流量的影响关系,并对影响关系进行分析和验证,最终获得相应的BP神经网络模型;最后,基于训练好的BP神经网络模型以及预报的天气信息对机场的进离场流量进行分类预测。通过该方法,能有效解决复杂天气下的航班正常运行,提高终端 空域 空中交通安全 水 平和效率。,下面是一种基于天气数据挖掘的机场进离场交通流量预测方法专利的具体信息内容。

1.一种基于天气数据挖掘的机场进离场交通流量预测方法,其特征在于,包括:
步骤S1、对选定机场的历史数据按照预设规则提取所需天气信息,并将提取到的特定时间段的天气信息按照预设条件进行识别,得到天气信息识别表;
步骤S2、获取选定机场特定时间段内的机场流量统计数据,将所述机场流量与所述天气信息识别表中的天气信息进行匹配,获得天气信息与机场流量的同时段匹配信息,并将所述机场流量分为起飞、降落和飞跃三类;
步骤S3、基于BP神经网络分别对各类机场流量对应的匹配信息进行训练和学习,得到不同天气类型对选定机场的各类机场流量的影响关系,并对影响关系进行分析和验证,最终获得相应的BP神经网络模型;
步骤S4、基于步骤3中训练好的BP神经网络模型以及预报的天气信息对机场的进离场流量进行分类预测。
2.如权利要求1所述的预测方法,其特征在于,所述天气信息包括向、风速、能见度、底高、降、雾、霾。
3.如权利要求1所述的预测方法,其特征在于,所述历史数据选自历史METAR报文,步骤S1具体包括:
翻译原始METAR报文以提取所需的天气数据,并将提取的天气数据存入数据库
对提取到的天气数据根据预设的METAR报文信息识别条件进行识别和0-1分类,从而得到天气数据识别表。
4.如权利要求3所述的预测方法,其特征在于,所述METAR报文信息识别条件包括:
能见度:>5000米,识别数值设定为0;≤5000米,识别数值设定为1;
云底高:>300米,识别数值设定为0;≤300米,识别数值设定为1;
降水:无降水,识别数值设定为0;有降水,识别数值设定为1;
雾:无雾,识别数值设定为0;有雾,识别数值设定为1;
霾:无霾,识别数值设定为0;有霾,识别数值设定为1;
地面风:侧风风速<15m/s,识别数值设定为0;侧风风速≥15m/s,识别数值设定为1;顺风风速<15m/s,识别数值设定为0;顺风风速≥15m/s,识别数值设定为1。
5.如权利要求1所述的预测方法,其特征在于,所述BP神经网络采用学习运算模式,通过误差反向传播算法对网络权值进行训练并使其收敛的。
6.如权利要求5所述的预测方法,其特征在于,具体包括:
定义误差准则函数J(w)为期望输出向量t与实际输出向量z的误差平方,表示如下:
基于梯度下降算法,权值w首先被初始化为随机值,然后向误差减小的方向调整;
由于随着模型的学习训练,w不断变化,其变化量Δw表示如下:
根据隐含层到输出层的权值更新规则,输出层单元和隐含层单元之间的权值Δwkj表达式如下:
根据(6)式,定义输出层单元k的敏感度δk:
根据输入层到隐含层的权值更新规则,输入层单元和隐含层单元之间的权值Δwji表达式如下:
根据(7)式,定义隐含层单元j的敏感度δj:
上述表达式中,w为网络里所有权值,η为学习率,k为输出层单元,i为输入层单元,j为隐含层单元,c为输出层单元数目,nH为隐藏层单元的数目,nI为输入层单元的数目,xi为输入向量,yj为激活的隐含层单元,wkj为输出层单元之间的权值,vji为隐含层单元之间的权值;
基于上述定义,步骤S3中,基于BP神经网络对所述匹配信息进行训练和学习包括如下步骤:
S31、初始化:设置天气和机场进离场流量之间的权值,并设定训练精度m和迭代次数N;
S32、将选取的历史天气数据和相应的进离场流量数据作为训练样本输入至BP神经网络;
S33、确定BP神经网络隐含层单元和输出层单元的输出;
S34、根据式(4)计算实际输出与期望输出之间的误差平方和;
S35、计算全局误差并判断是否达到设定的训练精度,若是则转到S38,否则转到S36;
S36、判断是否已经到了最大迭代次数,若是转到S38,否则转到S37;
S37、根据式(7)和(8)调整网络权值,并转到S33;
S38、判断是否达到最大迭代次数,若是,则提示网络无法收敛,重新修改最大迭代次数N,否则提示提示网络已经收敛,训练结束。
7.如权利要求1至6任意一所述的预测方法,其特征在于,通过Microsoft Visual Basic软件调用MATLAB软件实现BP神经网络训练和学习。

说明书全文

一种基于天气数据挖掘的机场进离场交通流量预测方法

技术领域

[0001] 本发明涉及一种空中交通流量预测技术,尤其涉及不同天气类型下的机场终端区交通流量预测方法,其适用于机场终端区飞行流量优化调度和飞行计划编排,保证空中交通运行的安全高效。

背景技术

[0002] 随着民航业的发展,终端区空域容量与交通需求之间的不平衡越来越明显,航班延误问题经常发生,航班正点率偏低,航班延误问题显著影响着航空运输业的发展。为了减少延误,提升航班正常率,对天气影响下的空中交通流量管理已经势在必行。
[0003] 我国航空运输业的蓬勃发展,带来空中交通需求的持续上升,复杂天气导致的机场延误日益加剧。未来空中交通流量管理的趋势是研究如何将天气概率信息加入流量管理决策中,从而实现概率交通流量管理。评估空中交通流量管理系统性能的一个主要指标是延误,而恶劣天气正是导致延误的重要因素。
[0004] 大气运动的本质特征决定了各种天气现象具有一定的随机性,而天气是影响机场交通量的最主要因素,因此机场交通量极易受到天气影响而呈现随机性。随机交通量是指交通量随时间变化表现为一定的分布形式,并具有相应的概率。现有机场交通量预测大多是围绕机场的高峰小时来确定机场终端区、跑道和滑行道的最大交通流量,但缺乏对于不同类型天气影响下的交通量的预测;或者考虑了天气影响因素,但计算量过大,其适用性值得深入考究。天气变化对交通量的影响具有一定的随机规律性,已有越来越多的空中交通管理者、决策者和研究者认识到常规机场交通量预测方法不能全面、有效地反映和揭示天气变化对容量的影响,而统计学认为概率是研究随机现象规律性的科学。
[0005] 因此,针对天气发生的特征和规律,有必要分析天气与交通量之间的内在联系,从概率论和统计学度对天气影响的交通流量预测进行崭新的认识和理论探讨。

发明内容

[0006] 本发明的目的是提供一种基于天气数据挖掘的机场进离场交通流量预测方法,通过获取天气数据和进离场交通流分布信息,构建天气影响下的进离场航班流量预测模型,有效解决复杂天气下的航班正常运行,提高终端空域空中交通安全平和效率。
[0007] 本发明公开一种基于天气数据挖掘的机场进离场交通流量预测方法,其包括如下步骤:
[0008] 步骤S1、对选定机场的历史数据按照预设规则提取所需天气信息,并将提取到的特定时间段的天气信息按照预设条件进行识别,得到天气信息识别表;
[0009] 步骤S2、获取选定机场特定时间段内的机场流量统计数据,将所述机场流量与所述天气信息识别表中的天气信息进行匹配,获得天气信息与机场流量的同时段匹配信息,并将所述机场流量分为起飞、降落和飞跃三类;
[0010] 步骤S3、基于BP神经网络分别对各类机场流量对应的匹配信息进行训练和学习,得到不同天气类型对选定机场的各类机场流量的影响关系,并对影响关系进行分析和验证,最终获得相应的BP神经网络模型;
[0011] 步骤S4、基于步骤3中训练好的BP神经网络模型以及预报的天气信息对机场的进离场流量进行分类预测。
[0012] 优选的,所述天气信息包括向、风速、能见度、底高、降水、雾、霾。
[0013] 优选的,所述历史数据选自历史METAR报文,步骤S1具体包括:
[0014] 翻译原始METAR报文以提取所需的天气数据,并将提取的天气数据存入数据库
[0015] 对提取到的天气数据根据预设的METAR报文信息识别条件进行识别和0-1分类,从而得到天气数据识别表。
[0016] 其中,所述METAR报文信息识别条件包括:
[0017] 能见度:>5000米,识别数值设定为0;≤5000米,识别数值设定为1;
[0018] 云底高:>300米,识别数值设定为0;≤300米,识别数值设定为1;
[0019] 降水:无降水,识别数值设定为0;有降水,识别数值设定为1;
[0020] 雾:无雾,识别数值设定为0;有雾,识别数值设定为1;
[0021] 霾:无霾,识别数值设定为0;有霾,识别数值设定为1;
[0022] 地面风:侧风风速<15m/s,识别数值设定为0;侧风风速≥15m/s,识别数值设定为1;顺风风速<15m/s,识别数值设定为0;顺风风速≥15m/s,识别数值设定为1。
[0023] 优选的,所述BP神经网络采用学习运算模式,通过误差反向传播算法对网络权值进行训练并使其收敛的。具体包括:
[0024] 定义误差准则函数J(w)为期望输出向量t与实际输出向量z的误差平方,表示如下:
[0025]
[0026] 基于梯度下降算法,权值w首先被初始化为随机值,然后向误差减小的方向调整;由于随着模型的学习训练,w不断变化,其变化量Δw表示如下:
[0027]
[0028] 根据隐含层到输出层的权值更新规则,输出层单元和隐含层单元之间的权值Δwkj表达式如下:
[0029]
[0030] 根据(6)式,定义输出层单元k的敏感度δk:
[0031]
[0032] 根据输入层到隐含层的权值更新规则,输入层单元和隐含层单元之间的权值Δwji表达式如下:
[0033]
[0034] 根据(7)式,定义隐含层单元j的敏感度δj:
[0035]
[0036] 上述表达式中,w为网络里所有权值,η为学习率,k为输出层单元,i为输入层单元,j为隐含层单元,c为输出层单元数目,nH为隐藏层单元的数目,nI为输入层单元的数目,xi为输入向量,yj为激活的隐含层单元,wkj为输出层单元之间的权值,vji为隐含层单元之间的权值;
[0037] 基于上述定义,步骤S3中,基于BP神经网络对所述匹配信息进行训练和学习包括如下步骤:
[0038] S31、初始化:设置天气和机场进离场流量之间的权值,并设定训练精度m和迭代次数N;
[0039] S32、将选取的历史天气数据和相应的进离场流量数据作为训练样本输入至BP神经网络;
[0040] S33、确定BP神经网络隐含层单元和输出层单元的输出;
[0041] S34、根据式(4)计算实际输出与期望输出之间的误差平方和;
[0042] S35、计算全局误差并判断是否达到设定的训练精度,若是则转到S38,否则转到S36;
[0043] S36、判断是否已经到了最大迭代次数,若是转到S38,否则转到S37;
[0044] S37、根据式(7)和(8)调整网络权值,并转到S33;
[0045] S38、判断是否达到最大迭代次数,若是,则提示网络无法收敛,重新修改最大迭代次数N,否则提示提示网络已经收敛,训练结束。
[0046] 优选的,可通过Microsoft Visual Basic软件调用MATLAB软件实现BP神经网络训练和学习。
[0047] 本发明所公开的基于天气数据挖掘的机场进离场交通流量预测方法,一方面,能对机场的运行状态进行预测,另一方面,可根据预测结果为决策者修改方案提供参考,具体包括:
[0048] (1)可实现机场流量的即时预报模式,即利用生成的天气影响的机场流量预测系统,在任意小时获取当前的机场天气信息,确定天气类型,并根据不同天气类型对流量的影响程度,即时预测这一小时内的机场流量。
[0049] (2)天气影响下的进离场交通流预测技术的实现,可以为复杂天气下的终端空域的改航提供建议,供管制部和决策者借鉴,减少和避免天气原因航班不正常率。另外,还可以为空管部门随着天气变化下的飞行计划优化提供辅助决策,为终端空域的安全和高效运行,提供量化依据。
[0050] (3)可用于衡量交通管理措施的范围和程度,使用预报天气信息预测机场的进离场流量,为交通管理人员提供交通管理措施的决策支持。具有更多信息支持的交通管理措施将会更符合预计交通状况的范围和程度,进而更有效的缓解交通状况,比如更合理的实施地面等待程序,减少可能的延误程度。
[0051] (4)评估可能的航班取消水平,可为旅客提供出行指数。为了降低运营成本,提高飞机的利用率,航空公司往往安排同一架次飞机执行连续或者短时间间隔的多个航班任务(连续航班),连续航班模式是国内外航空公司常见的运营模式之一,然而,当连续航班运行时,执行过程中的任一环节的延误都会引起更多的延误,这样延误会延续到下一个航班甚至更多(延误波及)。随着当下航班安排密集程度不断增加,这种延误波愈加严重。利用预报天气信息对机场流量的评估可以为机场运行提供信息,决定取消航班的数量以达到可承受的延误水平,从而有效缓解不利天气下的航班延误波及问题,减少航空公司损失。同时,结合机场延误水平和航空公司的航班取消等信息,也可以为旅客提供出行指数。
[0052] (5)可通过对机场进离场流量的预测进一步分析实现对机场的延误运行状况表征。当天气恶化时,管制员需要采取某些措施(比如增加飞机间隔,改变跑道构型等)使得机场容量降低,导致机场进离场流量降低,这样可能会引起延误的发生。根据机场的运行经验以及历史数据,可以得到机场在某一时段内着陆的飞机数量,这就形成了所需着陆架次,当航班延误产生的时候,实际的着陆数量必然降低。因此,通过对飞机进离场流量的预测分析,可以对延误情况进行表征。
[0053] (6)对机场进离场流量的分析预测可进一步实现对地面等待程序的预测。当机场进离场流量值低于良好天气下对应的值时,需要实施地面等待程序。当预计机场容量低于预计的交通量时,管制单位可能会实施地面等待程序,通过指定特定离场机场的航班起飞时间,减少受影响的机场到达流量,使机场的进离场流量在预定范围内。因此,在预测到机场进离场流量的情况下,可以进一步推得地面等待程序的实施状况。附图说明
[0054] 图1为机场进离场流量分类预测模型构建流程示意图;
[0055] 图2为禄口机场天气报文资料示意图;
[0056] 图3为禄口机场报文翻译所需资料示意图;
[0057] 图4为禄口机场天气报文翻译界面示意图;
[0058] 图5为禄口机场天气报文翻译结果示意图;
[0059] 图6为禄口机场天气报文译文识别界面示意图;
[0060] 图7为禄口机场天气报文译文识别结果示意图;
[0061] 图8为三层BP神经网络结构示意图;
[0062] 图9为天气影响机场起飞流量的BP神经网络结构示意图;
[0063] 图10为VB调用MATLAB分析数据程序界面(1)示意图;
[0064] 图11为VB调用MATLAB分析数据程序界面(2)示意图;
[0065] 图12为MATAB-BP神经网络分析代码示意图;
[0066] 图13为MATAB-BP神经网络训练性能表现示意图;
[0067] 图14为MATAB-BP神经网络训练状况示意图。

具体实施方式

[0068] 本发明采用有指导学习模型中的分类模型对天气影响空中交通进行研究。有指导学习模型通过使用若干输入属性对输出属性的值进行预测,且输入属性被称为自变量,其类型既可以是分类类型或数值类型,也可以是两者的混合。有指导学习模型中的输出属性被称为因变量,其中,分类模型的输出属性为分类类型。本发明采用的机场进离场流量分类预测模型是一个广义线性模型,通过模型可以将相关的终端区天气情况(比如能见度、降水、云底高等)映射到机场进离场流量分类预测中。
[0069] 机场进离场流量分析包括两个关键部分,即:1)选择适当的回归技术,利用历史数据构造回归模型;2)使用天气报文配置回归模型,进行每小时机场进离场流量的分类预测。本发明基于逻辑斯谛回归技术,对机场天气信息和进离场流量数据进行分析建模,利用历史数据对模型进行有监督学习,通过训练所得的BP神经网络模型实现对机场进离场流量的分类预测。这里选用的多项逻辑斯谛回归分析法能很好的适用于粗略估计机场进离场流量分类预测的目标,特别是可用数据有限时,它可以快速产生一个机场进离场流量分类的随机模型,并给出回归参数。并且,预测机场进离场流量水平的潜在属性极有可能是一些多个数值属性的混合(如能见度以及风速)以及分类属性(例如是否有降水),而多项逻辑斯谛回归算法允许分类型和数值型回归量的同时使用,即同时依据数值变量和分类变量(本发明指属性或者其中一个子集)回归一个特定的目标分类变量(本发明中指机场进离场流量)。
此外,多元逻辑回归模型的理论前提相对判别分析法要宽松得多,且没有关于分布类型、协方差阵等方面的严格假定。
[0070] 本发明基于逻辑斯谛回归技术,对机场天气信息和进离场流量数据进行分析建模,利用历史数据对模型进行有监督学习,通过训练所得的模型实现对机场进离场流量的分类预测。具体的,首先,对选定机场的历史数据进行预处理,包括按照规则提取所需天气信息并加以识别;其次,将天气数据同机场流量数据进行同时段匹配;然后,通过MATLAB软件对预处理过匹配好的天气和流量数据进行训练和学习,得到分析和评估结果,即训练所得的BP神经网络模型。
[0071] 本发明将通过数据挖掘中的分类方法,详细分析并建立多项逻辑斯蒂回归模型,对终端区重要天气现象与机场进离场交通流量(简称进离场流量)的关系进行定量的分析研究,达到初步量化研究的目的。如图1所示,本发明构建了一种机场进离场流量分类预测模型的构建思路,主要包括:
[0072] 步骤一、原始数据选择
[0073] 本发明可使用机场日常航空天气报告(METAR)或航站天气预报电报(TAF)获取所需机场天气信息,实施例中优选机场日常航空天气报告(METAR)。
[0074] 机场日常航空天气报告(METAR)有图标、电码(METAR)和缩写明语(MET REPORT)形式,机场气象台在整点或者半点采集数据后会立即发布机场例行天气报告,配备气象自动观测系统或者自动气象站的机场气象台(站)应当每天24小时连续发布时间间隔为1h的机场例行天气报告。机场天气报告可以显示出目的地机场的天气是否大于目视飞行或者仪表飞行的最低天气标注,若没有达到或者根据预报在飞机到达目的地机场时天气仅有很小的变化,则目的地机场的天气不适合降落。一份METAR报文依次包括以下主要要素:识别码、ICAO的地址代码、观测时间组、地面风向风速组、能见度组、跑道视程组、天气现象组、云组、好天气组、温度/露点组及补充说明等。
[0075] 航站天气预报电报(TAF)与METAR有着类似的天气信息和编码规则。TAFs针对终端区(在机场跑道5mile半径内)的天气预报,包括了影响机场运行的主要参数(能见度、风速、云顶高等)。预报的时长以及针对机场条件的预测都使得TAFs也适合于机场进离场流量的预测,在航空业的普遍适用也使得对其预报的验证和改进具有优势。
[0076] 步骤二、被选择数据确定
[0077] 数据挖掘的首要步骤是确定研究对象,本发明的因变量选择为机场进离场流量,结合天气对机场进离场流量影响的分析,选定对机场运行具有重要影响的几个天气要素和天气现象作为自变量(回归元),对机场进离场流量进行分类分析(包括起飞、降落和飞跃)。
[0078] 第一步是要确定可能影响机场进离场流量的潜在因素或者属性。
[0079] 每个机场都会有可以显著影响进场和离场常见的环境参数。许多研究成果显示确定的终端区天气特征以及终端区附近的对流天气是影响机场进离场流量的重要因素,例如,降水、能见度、地面风、雾和霾这几个对机场运行具有重要影响的天气现象和天气要素会使得机场容量降低,进而使得机场的进离场流量发生变化。进一步,多种可用航空气象资料也都包含了这些属性的预报,所以,本发明将使用上述天气属性作为自变量。
[0080] 步骤三、数据预处理
[0081] 应用逻辑回归算法之前需要对一些数据进行预处理,以确保每个解释变量是严格的数值量或者分类量。比如,本发明中对风向和云底高变量进行处理,以产生严格的数值记录。数据点指示晴空状态(无云)时,云底高将会被数值大于最大记录云底高的某个值替代,以表示区别。比如,低速变量风向状况不会显著限制容量,因此任何角度对与回归的影响都可以忽略,所以数据指示变量风向使用风向为0°进行代替。此外,作为数据处理步骤,同时还要对数据进行过滤。由于雷暴等恶劣天气多出现在夏季期间,可选取四月到九月的数据进行研究。对于每天的数据,去除夜间范围的历史数据,即当地时间午夜到早上六点的交通数据,因为在这段时间,导致低机场进离场流量的原因是夜间航班少,交通需求较低,而不是因为外部环境所致。
[0082] 经过处理历史数据之后,下一个目标是基于数值阈值决定不同机场进离场流量的分类方法。通过历史数据中的机场进离场流量数值选定相应的阈值,这些阈值应该确定可以表征终端区可能延误的机场进离场流量值分类,一旦确定好阈值数值,机场进离场流量数值将被指示不同分类的符号取代。
[0083] 本发明对机场进离场流量分类进行分析,利用模型结合不同终端区天气预报进行预测,有利于实时决策管理。根据天气现象及对应的跑道配置,可以进一步通过机场进离场流量的分类预测进行机场的容量变化趋势以及延误的研究。机场进离场流量作为分析的因变量,具体步骤如下:当机场容量由于天气原因减少时,管制员通常需要采取一定的措施将机场的进离场流量减少至适当水平。这使得出现恶劣天气时,机场会趋向于降低至一个较小的机场进离场流量值,这样,通过分类方法进行分析预测时,可以将可能的输出结果分类到不多的且区别明显的组别中。然后,选定各个组别的值,判定当某天的值属于哪一组别,这使得分类变得可行。
[0084] 步骤四、数据挖掘
[0085] 在预处理历史记录之后,应用多项逻辑斯谛回归技术进行分析。逻辑斯谛回归算法可以依据多个独立属性预测感兴趣的分类变量,独立属性可以为数值量或者分类量。接下来对多项逻辑斯谛回归分析法进行简要介绍,并讨论使用回归技术对机场进离场流量分类进行建模。
[0086] 模型首先假设将被建模的量Y(对应机场进离场流量)有k个不同的分类(之后称做“水平”,并记为1,...,k),这些水平概率依赖于m个回归量(对应天气属性X),记为x1,x2,...,xm。具体来说,如果X=[x1 x2 … xm],Y在水平j≠k中的概率Pj(X)表述为X的函数,即得到条件概率质量函数如下公式所示:
[0087]
[0088] 其中,cj表示截距参数,是一个常量,Bj=[b1 b2 … bm]T是将被决定的水平j的系数列向量。
[0089] Y在水平k中的概率可由 得到。
[0090] 如果某种属性是分类类型时,比如当xi可以假设为m个不同值之一,即则算法将用m个假设的二进制变量 替换这个属性,这些二进
制变量可以取为0或者1。这样,算法就为公式(1)中的每个假设变量分配了一个逻辑系数。
[0091] 当属性x1,x2,...,xm为0时,可以通过截距参数cj获取Pj(X)。这种情况下,在水平j中的概率为:
[0092]
[0093] 接下来,令Xi=[xi,1 … xi,m]为n个历史记录中的第i个,Y的历史数据对应为Yi。多项逻辑斯谛回归算法通过最小化负相关多项对数似然函数,并估计得到每个j=1,...,k-1的系数列向量Bj以及截距参数cj,如公式(3)所示:
[0094]
[0095] 此外,逻辑斯谛回归学习中通常采用梯度下降法以及拟顿法对目标函数L进行最优化。
[0096] 逻辑系数捕获了预测Y中的每个属性的相对重要性,对于给定的某个水平Y,高系数指示了属性和水平之间的高相关性。简而言之,一个特定的水平,比如Y中的水平p∈{1,...,k},如果对于p水平,属性xj有正(或者负)系数,那么xj值的增加(或者减少)会增大Y属于P水平的几率。系数的大小指示了随着xj中的单位增加量,将会导致所观测Y在p水平中的几率增加(或减少)的决定因素。
[0097] 步骤五、对模型性能评价及利用历史数据迭代优化
[0098] 建立了多项逻辑斯谛回归模型之后,下一步是通过将其预测结果同历史记录中的实际机场进离场流量进行比较,对模型的分类预测性能进行评价,并基于评价对回归进行完善。模型的输入量为不同天气属性每小时的历史记录,接下来在测试数据集中对每小时相应的机场进离场流量分类进行预测,然后与实际的机场进离场流量比较。如果模型性能较差,可以通过以下措施进行改进:1)改变回归量的设置;2)对机场进离场流量和其他逻辑变量进行重新分类;3)修改归回算法。
[0099] 步骤六、结果分析
[0100] 基于上述步骤,在模型的开发和测试工作完成后,便可以利用模型对机场进离场流量进行实时随机预测。逻辑回归的输出系数对每个分类水平的概率具有描述作用,通过一个有条件的概率质量函数明确了在给定环境属性下各个水平的概率。
[0101] 对于每个未来小时内将被预测的机场进离场流量水平,对公式(1)中的天气属性预测值的代入,对多种机场进离场流量水平的条件概率质量函数Pj(X)进行计算。对于未来某个小时,一个属性的预测值本质上就是这个小时属性的预测。通过条件概率质量函数得出给定小时的机场进离场流量。基于计算得到的条件概率质量函数匹配多个机场进离场流量结果,其中一个较好的方法是对于每个未来的小时,选择在条件概率质量函数中最高概率的水平,另一个常用方法是基于条件概率随机产生机场进离场流量。
[0102] 综上所述,实施例中基于对机场天气状况对航班运行的影响分析,进一步对重要天气状况对机场进离场流量的影响进行定量的分析研究。首先,对数据挖掘及分类技术进行了简要的描述,包括数据挖掘及分类技术的基本概念和应用过程;然后对机场进离场流量进行了阐述和分析,并对所需天气信息及来源进行了分析选定;最后,应用多项逻辑斯谛回归技术,在对研究目标的分析基础上进行了建模,并说明了模型需要注意的事项以及模型的应用分析。并且,通过多项逻辑斯谛回归模型对天气和机场进离场流量之间影响关系的分析评估,我们发现,天气和机场进离场流量之间的关系并不是简单地线性关系即可描述的,两者之间的关系用BP神经网络可以更好的模拟两者之间的关系。
[0103] 接下来,我们给出一具体机场的模型案例研究和分析验证,具体包括:
[0104] S1、数据预处理
[0105] 数据预处理阶段主要是对天气数据进行分类和提取,然后和对应时段的机场进离场流量数据进行匹配,将数据处理成神经网络算法所需的数据布局。具体可将天气数据组中的需要考虑的因素进行提取并与同时刻的机场的进离场流量匹配,然后存入ACCESS数据库进行相应的处理。
[0106] 在机场选择原则上,最好选择受天气影响较大的区域性机场或国家级枢纽机场。交通量大,对周边地区影响较大,受天气影响较为严重和频繁,有足够的历史交通数据和气象资料进行分析研究。南京禄口国际机场的航空运输在中国东部沿海地区起着重要的作用。由于恶劣的天气和更多的交通,繁忙的东海岸航空走廊的中间位置造成了全国的延误,因此,本实施例中以南京禄口国际机场(以下简称禄口机场)为例进行说明。
[0107] S11、天气信息提取
[0108] 选取几个典型的天气要素(主要包括风速、风向、能见度、云底高)以及天气现象(主要包括降水、雾和霾几个常见天气现象)作为变量,这些天气现象和机场进离场流量相关,且所有的天气属性都可以从机场每日天气报告和天气预报中获得。天气属性从历史METAR报文中获取,报文记录来自于禄口机场的历史报文数据。如图2所示为获取的原始禄口机场天气数据。
[0109] 首先,需要翻译原始METAR报文以提取所需的天气数据。
[0110] 由于METAR报文是一个文本格式,数据量大,而且形式和文字描述和数据的位置发生了改变,所以根据以下规则的信息翻译是通过编程实现。应该指出的是,METAR报文是根据世界协调时间编译依据报文编组的先后顺序,依次提取风向风速、能见度、云底高及天气现象。
[0111] 风向风速编组格式为dddffGfmfmKMH或MPS或KT,其中ddd表示观测前10分钟的平均风向,ff表示平均风速,“G”为阵风指示码,无阵风时略去,“fmfm”为大于平均风速5米/秒的阵风。例如,本组编报为“33006G12MPS”译为:风向330°,风速6m/s,阵风12m/s。电码“00000MPS”表示静风。
[0112] 能见度编组格式为VVVVDV,其中“VVVV”为能见度数值,一般指有效能见度,当有效能见度≥本场最低标准,而跑道能见度≤本场最低表准时,则用跑道能见度代替有效能见度编报。当水平能见度在不同的方向不同时,以最小能见度编报“VVVV”再加“DV”,“DV”表示最小能见度相对于气象台的方向,可用一个或两个字母表示,如N,NW等。如本组编报为“0000”,表示能见度<50m;如本组编报为“9999”,表示能见度≥10km。
[0113] 云组采用NsNsNshshshs(CC)的格式进行编报,本组可以编报若干组,按云底高度从低到高顺次编报,其中“NsNsNs”为云量,需用简语“FEW”(1/8~2/8云量,少云),“SCT”(3/8~3/8云量,疏云),“BKN”(5/8~7/8,云量,多云),“OVC”(8/8,阴天)。“hshshs”为云底高,以30m为单位编报(云高等于电码乘以30m)。“CC”为云状,只对积雨云(Cb)以及浓积云(TCu)进行编报。
[0114] 天气现象编组格式为W'W',当观测时出现几种不同的天气现象时,可重复编报,“W'W'”可按要求的简字编报(每组可由2~9个字符表示)。例如,“BR”表示轻雾,“RA”表示雨,“HZ”表示霾,“FG”表示雾。
[0115] 下表为METAR报文及解码的举例。
[0116] 表1METAR报文(华东地区)及解码举例
[0117]
[0118] 通过编好的程序对每一条METAR报文逐一翻译,并将其翻译结果存入数据库中,以便于提取报文的必要信息时使用。
[0119] 以下为METAR报文的具体翻译步骤:
[0120] 第一步,将EXCEL中MEAR报文数据导入到文件名为“20130701至20150901的报文”的ACCESS数据库中的METAR表中,方便翻译处理时的调用。结果如图3所示。
[0121] 第二步,通过Microsoft Visual Basic程序软件读取“20130701至20150901的报文.mdb”中的METAR表,并根据编码的翻译程序对读取的报文信息进行翻译,具体过程如下:
[0122] 1),打开Microsoft Visual Basic软件,运行编码的翻译程序,如图4所示;
[0123] 2),点击报文翻译键,待翻译过程结束,点击退出键,并得到如下结果,翻译结果存入“20130701至20150901的报文.mdb”文件中的RESULT表中,如图5所示。
[0124] 其次,对翻译好的报文根据表2所列的METAR报文(华东地区)信息识别条件进行分析,并将能见度、云底高等需要提取的信息按照设定的识别条件进行识别,并进行0-1分类。
[0125] 表2METAR报文(华东地区)信息识别条件
[0126]
[0127] 此外,一年中随着季节的变化,机场的流量会呈现出一些变化模式,所以将一年中的报文数据的识别分为冬春季和夏秋季分别进行分析。将每一条METAR报文逐一分析识别,并将其分析结果存入数据库中。通过Microsoft Visual Basic程序软件读取“20130701至20150901的报文.mdb”中的RESULT表,并根据编码的报文识别程序对读取的报文翻译信息进行识别具体操作过程如下:
[0128] 首先,打开Microsoft Visual Basic软件,运行编码的报文译文识别程序,如图6所示;
[0129] 然后,点击识别键,待报文识别过程结束,点击退出键,并得到如下结果,识别结果存入“20130701至20150901的报文.mdb”文件中的RECOGNIZE表中,如图7所示。
[0130] S12、匹配对应的交通数据
[0131] 选取对应时段的机场流量与按上述规则提取的天气信息进行匹配。然后对机场流量进行分类处理,分为起飞、降落和飞跃三个部分。需要注意的是,在少数情况下,可能会有两个METAR在一小时内,或者缺一个小时的报告数据,并应注意每月校正的机场交通。如果一天缺少一小时的数据,为了不影响独立变量的小时,可以将一整天的数据删除。
[0132] 利用2014年的数据构建模型,并筛选当年3月30日到9月27日(夏季范围)的数据中的前3500组数据作为训练数据。为了验证模型的性能,使用剩余的数据作为测试数据。需要说明的是,同样的冬春季的数据也作相同的处理,因为,不论是冬春季节还是夏秋季节,也不管是起飞还是降落又或者是飞跃,其分析过程都是相同的,实施例中以夏季范围的机场天气对起飞流量的影响进行分析。
[0133] 实施例中的交通数据获取自禄口机场2014年机场流量统计数据,如表3所示(篇幅所限只列举了3月30日的数据),其中包括进场、离场、进离场和飞跃的航班数量。
[0134] 表3 2014年3月禄口机场进离场流量统计表
[0135]
[0136] S2、模型的构建与分析
[0137] S21、BP神经网络的构建
[0138] 误差反向传播神经网络简称为BP网络,它是由非线性变换单元组成的有指导前馈网络。如图8所示,三层BP网络由一个输入层、一个隐含层和一个输出层组成,它们由可修正的权值互连,这些权值由层间的连线表示,各层之间实现全连接。
[0139] BP网络有两类基本运算模式:前馈和学习,共同用于训练神经网络,本发明中主要采用学习运算模式。学习(误差反向传播)BP网络是采用误差反向传播算法对网络权值进行训练并使其收敛的。基本的学习算法是从一个未训练网络开始,向输入层提供一个训练模式,再通过网络传递信号,并决定输出层的输出值。根据输出信号与期望输出之间的误差平方,用基于梯度下降法的学习规则,找到隐含层到输出层的权值,权值向着可以减小误差值的方向调整。
[0140] 考虑一个输入的训练误差,定义误差准则函数J(w)为期望输出向量t与实际输出向量z的误差平方,表示如下:
[0141]
[0142] 式中,w表示网络里所有的权值。
[0143] 反向传播学习规则是基于梯度下降算法的,权值首先被初始化为随机值,然后向误差减小的方向调整。由于随着模型的学习训练,w是不断变化的,其变化量Δw表示如下:
[0144]
[0145] 式中,η是学习率。
[0146] 进一步,对式(5)推导可得到权值的更新规则。
[0147] 隐含层到输出层的权值更新规则,即输出层单元和隐含层单元之间的权值Δwkj表达式如下:
[0148]
[0149] 根据(6)式,定义输出层单元k的敏感度δk:
[0150]
[0151] 输入层到隐含层的权值更新规则,即输入层单元和隐含层单元之间的权值Δwji表达式如下:
[0152]
[0153] 根据(7)式,定义隐含层单元j的敏感度δj:
[0154]
[0155] 上述表达式中,k为输出层单元,i为输入层单元,j为隐含层单元,c为输出层单元数目,nH为隐藏层单元的数目,nI为输入层单元的数目,xi为输入向量,yj为激活的隐含层单元,wkj为输出层单元之间的权值,vji为隐含层单元之间的权值。
[0156] 式(7)和(8)共同给出了“误差反向传播”算法,在训练过程中一个“误差”(敏感度δk)必须从输出层传播回隐含层,以实现式(8)中输入层到隐含层的权值学习。
[0157] 神经网络训练过程就是调整网络权值的过程,通过计算实际输出与期望输出之间的平方误差和,使权值向着可以减小误差值的方向不断进行调整。设有N个n维数据组成的样本空间Ω,Xi∈Ω,xi=(xi1,…xin)。BP神经网络算法步骤如下:
[0158] a1.初始化:连接权值初始化,给各权值矩阵赋以随机的小数,设定训练精度和迭代次数。即根据历史天气和流量数据,设置天气和机场进离场流量之间的权值,并设定训练精度为0.01,迭代次数为200。
[0159] a2.输入训练样本集Ω:即将历史天气数据和相应的进离场流量数据作为训练样本输入至BP神经网络。
[0160] a3.确定BP网络隐含层单元和输出层单元的输出。
[0161] a4.根据式(4)计算实际输出与期望输出之间的误差平方和。
[0162] a5.计算全局误差并判断是否达到设定的训练精度,若是则转到第a8步,否则转到第a6步。
[0163] a6.判断是否已经到了最大迭代次数,若是转到第a8步,否则转到第a7步。
[0164] a7.根据式(7)和(8)调整网络权值,并转到第a3步。
[0165] a8.判断是否达到最大迭代次数,若是则提示网络无法收敛,则重新修改最大迭代次数,否则提示网络已经收敛,如图13所示后期呈现为水平直线不在变化,即训练结束。
[0166] S22、模型结果分析
[0167] 不同的机场天气在不同的季节发生的频率及持续的时间是不同的,对机场的流量的影响也是不同的,因此有必要对不同的天气类型影响的机场流量进行分析评估。在识别机场天气类型的基础之上,对历史天气数据及其同时段匹配的机场流量数据进行统计分析,分析方法采用BP神经网络算法,通过MATLAB软件调用BP神经网络工具箱对预先处理好的机场天气及流量数据进行训练和学习,从而确定机场的不同天气类型对机场流量的影响关系。
[0168] 实施例中通过Microsoft Visual Basic软件调用MATLAB软件使用部分数据对天气及流量数据进行BP神经网络训练和学习,然后用得到的结果进行的预测,其中,神经网络结构如图9所示。
[0169] 通过Microsoft Visual Basic程序软件调用MATLAB软件读取“报文识别EXCEL表格”中的机场流量及匹配的天气报文识别信息,基于构建好的BP神经网络模型进行BP神经网络分析。由于对3-9月与9-3月的分析过程完全一致,对进场和离场的操作过程也相同,故,实施例中只介绍分析3-9月进场流量与天气影响关系分析的具体操作过程,操作步骤如下:
[0170] 首先,打开Microsoft Visual Basic软件,运行编码的vb调用MATLAB分析数据程序,如图10所示;
[0171] 然后,点击3-9月分析键,得到如下所示界面,如图11所示;最后,点击起飞键,得到最终分析结果;
[0172] 其中,根据天气影响机场起飞流量的BP神经网络结构图以及历史天气及起飞流量数据所编写的MATLAB分析代码运行相应程序,如图12所示。
[0173] 代码的运行结果由图13和图14的训练曲线图可知,计算得训练110次左右时均方根误差达到0.0257678,与设定的均方根误差目标0.01已经十分接近,故模型停止计算。并且,利用测试数据对模型进行验证,由验证结果可知构建的预测模型用于根据天气类型信息预测机场的进离场流量是可行的。
[0174] 机场流量与天气类型具有紧密的联系,当恶劣天气发生的时候,机场的进离场流量必然减少。本发明利用天气预报提取天气信息,预先对机场的流量进行预测,可以提供机场未来一段时间由于天气影响的流量变化趋势。通过对流量进行预测,为机场的运行决策提供信息,为地面等待措施提供信息支持。将训练之后的模型(根据已有数据采用BP神经网络进行学习训练得到的模型)保存,利用天气报告(实时天气报告)以及天气预报数据(未来一段时间的天气预测)可以实现一段时间内机场进离场流量的预测。利用训练好的BP神经网络模型自动提取所需天气信息,调用MATLAB等工具进行机场流量的分类预测,进一步为交通管理人员进行流量管理决策支持。
[0175] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈