首页 / 专利库 / 电脑零配件 / 接口 / 基于旅客出行多元数据分析的空铁联程中转地点确定方法

基于旅客出行多元数据分析的空联程中转地点确定方法

阅读:243发布:2023-05-26

专利汇可以提供基于旅客出行多元数据分析的空联程中转地点确定方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于旅客出行多元数据分析的空 铁 联程中转地点确定方法,该方法包括了分类 预测模型 多源 数据采集 、多元数据分类、旅客出行方式选择时最大影响因素的预测、空铁联程出行信息采集、出行方案排序及生成以及中转地点的确定六大步骤。本发明方法通过对旅客一年中的出行 频率 、旅客一年中出行的主要目的、旅客一年中一次出行的平均距离、旅客一年中一次出行的平均花费等数据的分类预测出不同旅客出行方式选择时影响最大的因素,为旅客的空铁联程出行提供最符合个人偏好的中转地点选择以及个性化的出行方案推荐。,下面是基于旅客出行多元数据分析的空联程中转地点确定方法专利的具体信息内容。

1.基于旅客出行多元数据分析的空联程中转地点确定方法,其特征在于,该方法包括如下步骤:
(1)分类预测模型多源数据采集,包括:采集N名旅客的多元数据,用于分类预测模型的构建,所述第i名旅客的多源数据Xi,i=1,2,3…,N包括旅客一年中的出行频率Ai、旅客一年中出行的主要目的Bi、旅客一年中一次出行的平均距离Ci、旅客一年中一次出行的平均花费Di、旅客出行方式选择时影响最大的因素Ei;所述第i名旅客一年中的出行频率Ai的取值范围是1至5的五个自然数,其中Ai=1表示出行频率小于3次,Ai=2表示出行频率3-6次,Ai=3表示出行频率7-10次,Ai=4表示出行频率11-14次,Ai=5表示出行频率15次以上;所述旅客一年中出行的主要目的Bi的取值范围是1至5的五个自然数,其中Bi=1表示出行目的为公务出行,Bi=2表示出行目的为探亲访友,Bi=3表示出行目的为回家,Bi=4表示出行目的为旅游,Bi=5表示出行目的为上学;所述旅客一年中一次出行的平均距离Ci的取值范围是1至4的四个自然数,其中Ci=1表示平均出行距离小于500公里,Ci=2表示平均出行距离500-
1000公里,Ci=3表示平均出行距离1000-1500公里,Ci=4表示平均出行距离大于1500公里;
所述旅客一年中一次出行的平均花费Di的取值范围是1至4的四个自然数,其中Di=1表示平均花费小于500元,Di=2表示平均花费500-800元,Di=3表示平均花费800-1100元,Di=4表示平均花费大于1100元;所述旅客出行方式选择时影响最大的因素Ei的取值范围是集合{F,T,S}中的一个元素,其中Ei=F表示因素为出行费用的高低,Ei=T表示因素为出行时间的长短,Ei=S表示因素为出发时刻表;
(2)多元数据分类,包括:创建分类模型,将所述步骤(1)中的N名旅客多源数据Xi,i=1,
2,3…,N划分成训练旅客数据 和检验旅客数据 两类,训练旅客数据 的个数为N1,其取值是N1=0.8×N取整后的数值,检验旅客数据 的个数为N2,其取值是N2=N-N1;
对于任意一个训练旅客数据 utrain=1,2,3,4,…,N1包含旅客一年中的出行频率为一年中出行的主要目的为 一年中一次出行的平均距离为 一年中一次出行的平均花费为 出行方式选择时影响最大的因素为 对于任意一个检验旅客数据vtest=1,2,3,4,…,N2包含旅客一年中的出行频率为 一年中出行的主要目的为一年中一次出行的平均距离为 一年中一次出行的平均花费为 出行方式选择时影响最大的因素为
采用KNN算法对数据进行分类,将旅客的一年中的出行频率Ai、旅客一年中出行的主要目的Bi、旅客一年中一次出行的平均距离Ci、旅客一年中一次出行的平均花费Di这四项作为模型的自变量,分别以 向量的形式表示;将旅客出行方式选择时影响最大的因素Ei作为模型的因变量,以 向量的形式表示,通过寻找因变量与自变量的关系从而构建分类模型,寻找过程包括:
首先进行外部循环,设定一个数值K,K的初始值为1,进行下一次外部循环时K的数值增加1,K的上限为 对每一个检验旅客数据 vtest=1,2,3,4,…,N2进行内部的嵌套循环,内部循环中依次计算检验数据 与所有的训练数据 之间的距离d,
按照距离d的递增关系进行排序,找出与该检验数据 距离d最小的K个训练数据,确定K个数据中各个因变量E的出现次数,将出现次数最高的因变量E作为检验数据 的分类,从而找到;对于所有的检验数据 判断分类模型预测得到的旅客因变量E与该名旅客实际出行方式选择时影响最大的因素E是否一致,一致的因变量个数记为M,准确率若准确率δ高于90%,,则认为分类效果较好,跳出内部循环和外部循环,整个循环结束,输出此时的K的数值;若测试的准确率δ低于90%时,则认为分类效果不理想,跳出内部循环进行下一次的外部循环,直至准确率δ高于90%为止;
循环结束后,将输出的K值作为KNN算法用于分类类别预测的K值,对于任意一个新的数据,输入其四个自变量A、B、C、D的数值,计算其与各个训练数据 之间的距离d,按照距离d的递增关系进行排序,找出距离d最小的K个训练数据 确定K个数据中各个因变量E的出现次数,将出现次数最高的因变量E作为该新数据的预测分类值;
(3)旅客出行方式选择时最大影响因素的预测,包括:对于任意一名需要分类预测的旅客L,获得其历史信息中一年中的出行频率Al、旅客一年中出行的主要目的Bl、旅客一年中一次出行的平均距离Cl、旅客一年中一次出行的平均花费Dl四个自变量数据,通过步骤(2)中的分类模型预测其因变量旅客出行方式选择时影响最大的因素El;
(4)空铁联程出行信息采集,包括:设置旅客L的出发城市为P,目的地城市为Q,其他同时具有高铁站和机场的城市为Oi,i依次为各个满足要求的城市;获取P-Oi和Oi-Q的机票价格、高铁价格、航空的飞行时长、高铁的时长、航班到发时刻表、高铁到发时刻表;
(5)出行方案排序及生成,包括:若旅客出行是飞机换乘高铁,则P-Q的出行费用为P-Oi的机票价格和Oi-Q的高铁价格的求和,P-Q的出行时长为P-Oi的航空飞行时长和Oi-Q的高铁时长的求和,P-Q的出发时间是P-Oi的航班和与之衔接的Oi-Q的高铁班次;按照P-Q出行费用从低到高、出行时长从低到高、出发时刻从早到晚三种方法将P-Q进行排序,形成按照费用、出行时长以及出发时刻三种形式划分的行方案;
(6)中转地点的确定,包括:根据所预测得到的旅客出行方式选择时考虑的最大因素El在步骤(5)中的空铁联程信息寻找对应的出行方案,选出旅客出行P-Q路线上最符合旅客在出行方式选择时考虑的最大因素E的出行方案,从而确定空铁联程中转地点Oi。
2.根据权利要求1所述的基于旅客出行多元数据分析的空铁联程中转地点确定方法,其特征在于:所述步骤(2)中,抽取旅客数据作为训练数据的方式采用计算机生成随机数的形式,将旅客依次编号为1,2,3,,,N,采用Random函数生成取值范围在1~N中0.8×N个不重复的随机数值,选出这些数值对应的旅客作为训练数据。
3.根据权利要求1所述的基于旅客出行多元数据分析的空铁联程中转地点确定方法,其特征在于:所述步骤(4)中采用现有API接口,在配套网页采集高铁价格、高铁的时长、高铁到发时刻表。
4.根据权利要求1所述的基于旅客出行多元数据分析的空铁联程中转地点确定方法,其特征在于:所述步骤(4)中采用API接口,在配套网页采集机票价格、航空的飞行时长、航班到发时刻表。

说明书全文

基于旅客出行多元数据分析的空联程中转地点确定方法

技术领域

[0001] 本发明涉及交通出行与数据挖掘领域,特别是涉及基于旅客出行多元数据分析的空 铁联程中转地点确定方法。

背景技术

[0002] 随着我国高速铁路的快速发展,各条高铁线路的相继开通对于民航的分流产生了一 定的影响,尤其是中短途的出行,高铁凭借其网络可达性以及准时性使其具有较大的竞 争优势,航空公司因此减少或是修改了许多中短途出行的线路。但是,对于中长距离的 出行,民航的优势有了明显的提升,对于长距离的出行,高铁对于航空几乎造不成影响。
[0003] 然而,高铁与民航之间并非只存在着竞争的关系。面对着与高铁的激烈竞争,航空 公司除了调整既有线路之外,还可以考虑与高铁进行合作;除此之外,对于那些飞机无 法直达的城市,旅客还需通过空铁联程的形式进行出行。因此,“空铁联程”为航空与高 铁带来了合作的机会,为旅客的出行提供了除了高铁直达或航空直达外的新的出行方案。
[0004] 对于国内高铁城际出行网络较为发达的京津冀、长三、珠三角地区,可以优先考 虑空铁联程方案的实行。由于以上三个地区的高铁网络较为发达,因此对于空铁联程中 转站可以有很多地点的选择。不同地点的选择会造成旅客空铁联程出行中的航空和高铁 的在途时间以及票价的不同;同时不同地点的联程方案也会带来航空和高铁的到发时刻 表的衔接有所差异。这些不同与差异针对旅客个人出行属性的差异会造成不同乘客同一 次空铁联程出行中选择的中转换乘地点有所不同,因此对于旅客出行的推荐方案也就不 尽相同。
[0005] 在目前的旅客空铁联程出行中,存在着一些可以提升的地方:1)运营商只是为旅客 的出行提供了最简单的飞机与高铁的衔接,对于不同的旅客提供的都是同样的联程出行 方案,并未考虑到不同旅客之间的个体差异和选择偏好的不同;2)目前空铁联程出行的 中转地点选择大多单一固定,可供中转选择的城市很少,因此所能提供给旅客出行的选 择方案数量并不理想。

发明内容

[0006] 为了解决上述存在的问题,本发明提供基于旅客出行多元数据分析的空铁联程中转地点 确定方法,为解决传统空铁联程出行方案中未考虑旅客个人选择和偏好的差异,且可供中转 的地点较为单一的实际问题,发明目的在于提供一种基于多元数据分析的空铁联程用户中转 地点确定方法,通过对旅客一年中的出行频率、旅客一年中出行的主要目的、旅客一年中一 次出行的平均距离、旅客一年中一次出行的平均花费、旅客出行方式选择时影响最大的因素 等多源数据的采集、分类,预测出不同旅客在旅客出行方式选择时影响最大的因素,并基于 航班和高铁的信息数据,对不同的旅客匹配筛选出符合旅客个人选择偏好的出行方案,确定 空铁联程的中转地点,为达此目的,本发明提供基于旅客出行多元数据分析的空铁联程中转 地点确定方法,该方法包括如下步骤:
[0007] (1)分类预测模型多源数据采集,包括:采集N名旅客的多元数据,用于分类预测模型 的构建,所述第i名旅客的多源数据Xi,i=1,2,3…,N包括旅客一年中的出行频率Ai、旅客一 年中出行的主要目的Bi、旅客一年中一次出行的平均距离Ci、旅客一年中一次出行的平均花 费Di、旅客出行方式选择时影响最大的因素Ei;所述第i名旅客一年中的出行频率Ai的取值 范围是1至5的五个自然数,其中Ai=1表示出行频率小于3次,Ai=2表示出行频率3-6次, Ai=3表示出行频率7-10次,Ai=4表示出行频率11-14次,Ai=5表示出行频率15次以上; 所述旅客一年中出行的主要目的Bi的取值范围是1至5的五个自然数,其中Bi=1表示出行目 的为公务出行,Bi=2表示出行目的为探亲访友,Bi=3表示出行目的为回家,Bi=4表示出行 目的为旅游,Bi=5表示出行目的为上学;所述旅客一年中一次出行的平均距离Ci的取值范围 是1至4的四个自然数,其中Ci=1表示平均出行距离小于500公里,Ci=2表示平均出行距 离500-1000公里,Ci=3表示平均出行距离1000-1500公里,Ci=4表示平均出行距离大于1500 公里;所述旅客一年中一次出行的平均花费Di的取值范围是1至4的四个自然数,其中Di=1 表示平均花费小于500元,Di=2表示平均花费500-800元,Di=3表示平均花费
800-1100元, Di=4表示平均花费大于1100元;所述旅客出行方式选择时影响最大的因素Ei的取值范围是 集合{F,T,S}中的一个元素,其中Ei=F表示因素为出行费用的高低,Ei=T表示因素为出行 时间的长短,Ei=S表示因素为出发时刻表;
[0008] (2)多元数据分类,包括:创建分类模型,将所述步骤(1)中的N名旅客多 源数据Xi,i=1,2,3…,N划分成训练旅客数据 和检验旅客数据 两类,训 练旅客数据的个数为N1,其取值是N1=0.8×N取整后的数值,检验旅客数据  的个数为N2,其取值是N2=N-N1;对于任意一个训练旅客数据  utrain=1,2,3,4,…,N1包含旅客一年中的出行频率为 一年中出行的主要目的为  一年中一次出行的平均距离为 一年中一次出行的平均花费为 出行方式选择时影响最大的因素为 对于任意一个检验旅客数据  vtest=1,2,3,4,…,N2包含旅客一年中的出行频率为 一年中出行的主要目的 为 一年中一次出行的平均距离为 一年中一次出行的平均花费为出行方式选择时影响最大的因素为
[0009] 采用KNN算法对数据进行分类,将旅客的一年中的出行频率Ai、旅客一年中出行的主 要目的Bi、旅客一年中一次出行的平均距离Ci、旅客一年中一次出行的平均花费Di这四项作 为模型的自变量,分别以 向量的形式表示;将旅客出行方式选择时影响最 大的因素Ei作为模型的因变量,以 向量的形式表示,通过寻找因变量与自变量的关系  从而构建分类模型,寻找过程包括:
[0010] 首先进行外部循环,设定一个数值K,K的初始值为1,进行下一次外部循环时K的数 值增加1,K的上限为 对每一个检验旅客数据 vtest=1,2,3,4,…,N2进行内部的嵌 套循环,内部循环中依次计算检验数据 与所有的训练数据 之间的距离d,[0011]
[0012] 按照距离d的递增关系进行排序,找出与该检验数据 距离d最小的K个训练数据, 确定K个数据中各个因变量E的出现次数,将出现次数最高的因变量E作为检验数据的 分类,从而找到;对于所有的检验数据 判断分类模型预测得到的旅客因变量E与该名旅 客实际出行方式选择时影响最大的因素E是否一致,一致的因变量个数记为M,准确率  若准确率δ高于90%,,则认为分类效果较好,跳出内部循环和外部循环, 整个循环结束,输出此时的K的数值;若测试的准确率δ低于90%时,则认为分类效果不理 想,跳出内部循环进行下一次的外部循环,直至准确率δ高于90%为止;
[0013] 循环结束后,将输出的K值作为KNN算法用于分类类别预测的K值,对于任意一个新 的数据,输入其四个自变量A、B、C、D的数值,计算其与各个训练数据 之间的距离d, 按照距离d的递增关系进行排序,找出距离d最小的K个训练数据 确定K个数据中 各个因变量E的出现次数,将出现次数最高的因变量E作为该新数据的预测分类值;
[0014] (3)旅客出行方式选择时最大影响因素的预测,包括:对于任意一名需要分类预测的 旅客L,获得其历史信息中一年中的出行频率Al、旅客一年中出行的主要目的Bl、旅客一年 中一次出行的平均距离Cl、旅客一年中一次出行的平均花费Dl四个自变量数据,通过步骤(2) 中的分类模型预测其因变量旅客出行方式选择时影响最大的因素El;
[0015] (4)空铁联程出行信息采集,包括:设置旅客L的出发城市为P,目的地城市为Q, 其他同时具有高铁站和机场的城市为Oi,i依次为各个满足要求的城市;获取P-Oi和Oi-Q 的机票价格、高铁价格、航空的飞行时长、高铁的时长、航班到发时刻表、高铁到发时刻表;
[0016] (5)出行方案排序及生成,包括:若旅客出行是飞机换乘高铁,则P-Q的出行费用为 P-Oi的机票价格和Oi-Q的高铁价格的求和,P-Q的出行时长为P-Oi的航空飞行时长和 Oi-Q的高铁时长的求和,P-Q的出发时间是P-Oi的航班和与之衔接的Oi-Q的高铁班次; 按照P-Q出行费用从低到高、出行时长从低到高、出发时刻从早到晚三种方法将P-Q进行 排序,形成按照费用、出行时长以及出发时刻三种形式划分的行方案;
[0017] (6)中转地点的确定,包括:根据所预测得到的旅客出行方式选择时考虑的最大因素El在步骤(5)中的空铁联程信息寻找对应的出行方案,选出旅客出行P-Q路线上最符合旅客在 出行方式选择时考虑的最大因素E的出行方案,从而确定空铁联程中转地点Oi。
[0018] 本发明的进一步改进,所述步骤(2)中,抽取旅客数据作为训练数据的方式采用计算机 生成随机数的形式,将旅客依次编号为1,2,3,,,N,采用Random函数生成取值范围在1~N 中0.8×N个不重复的随机数值,选出这些数值对应的旅客作为训练数据。
[0019] 本发明的进一步改进,所述步骤(4)中采用现有API接口,在配套网页采集高铁价格、 高铁的时长、高铁到发时刻表。
[0020] 本发明的进一步改进,所述步骤(4)中采用现有API接口,在配套网页采集机票价格、 航空的飞行时长、航班到发时刻表。
[0021] 本发明提出的基于多元数据分析的空铁联程用户中转地点确定方法,该方法充分考虑了 旅客出行时由于个体社会经济以及出行目的等属性的不同会导致出行选择偏好有所差异,不 同的出行需求需要被不同的供给所满足,通过本方法获得的空铁联程用户中转地点的选择, 一方面增加了用户的出行方案可选择性,更重要的是更加符合用户的个人选择偏好,更能满 足个性化出行的需求。附图说明
[0022] 图1为本发明的流程框图

具体实施方式

[0023] 下面结合附图与具体实施方式对本发明作进一步详细描述:
[0024] 本发明提供基于旅客出行多元数据分析的空铁联程中转地点确定方法,为解决传统 空铁联程出行方案中未考虑旅客个人选择和偏好的差异,且可供中转的地点较为单一的 实际问题,发明目的在于提供一种基于多元数据分析的空铁联程用户中转地点确定方法, 通过对旅客一年中的出行频率、旅客一年中出行的主要目的、旅客一年中一次出行的平 均距离、旅客一年中一次出行的平均花费、旅客出行方式选择时影响最大的因素等多源 数据的采集、分类,预测出不同旅客在旅客出行方式选择时影响最大的因素,并基于航 班和高铁的信息数据,对不同的旅客匹配筛选出符合旅客个人选择偏好的出行方案,确 定空铁联程的中转地点。
[0025] 如图1所示,本发明实施例公开的一种基于多元数据分析的空铁联程用户中转地点 确定方法,通过过对旅客一年中的出行频率、旅客一年中出行的主要目的、旅客一年中 一次出行的平均距离、旅客一年中一次出行的平均花费等数据的分类预测出不同旅客出 行方式选择时影响最大的因素,为旅客的空铁联程出行提供最符合个人偏好的中转地点 选择以及出行方案推荐。该方法主要包含以下步骤:
[0026] 步骤S1:分类预测模型多源数据采集。采集N名旅客的多元数据,用于分类预测模 型的构建。所述第i名旅客的多源数据Xi(i=1,2,3…,N)具体包括如下方面数据的采集:
[0027] 步骤1A)旅客一年中的出行频率Ai的数据采集。在石家庄正定机场和正定机场高铁 站对于使用空铁联程出行的用户采用sp进行调查。所述旅客一年中的出行频率Ai的取值 范围是1至5的五个自然数,其中Ai=1表示出行频率小于3次,Ai=2表示出行频率3-6 次,Ai=3表示出行频率7-10次,Ai=4表示出行频率11-14次,Ai=5表示出行频率15 次以上;
[0028] 步骤1B)旅客一年中出行的主要目的Bi的数据采集。在石家庄正定机场和正定机场 高铁站对于使用空铁联程出行的用户采用sp进行调查。所述旅客一年中出行的主要目的 Bi的取值范围是1至5的五个自然数,其中Bi=1表示出行目的为公务出行,Bi=2表示出 行目的为探亲访友,Bi=3表示出行目的为回家,Bi=4表示出行目的为旅游,Bi=5表示 出行目的为上学;
[0029] 步骤1C)旅客一年中一次出行的平均距离Ci的数据采集。在石家庄正定机场和正定 机场高铁站对于使用空铁联程出行的用户采用sp进行调查。所述旅客一年中一次出行的 平均距离Ci的取值范围是1至4的四个自然数,其中Ci=1表示平均出行距离小于500公 里,Ci=2表示平均出行距离500-1000公里,Ci=3表示平均出行距离1000-1500公里,Ci=4 表示平均出行距离大于1500公里;
[0030] 步骤1D)旅客一年中一次出行的平均花费Di的数据采集。在石家庄正定机场和正定 机场高铁站对于使用空铁联程出行的用户采用sp进行调查。所述旅客一年中一次出行的 平均花费Di的取值范围是1至4的四个自然数,其中Di=1表示平均花费小于500元,Di=2 表示平均花费500-800元,Di=3表示平均花费800-1100元,Di=4表示平均花费大于1100 元;
[0031] 步骤1E)旅客出行方式选择时影响最大的因素Ei。在石家庄正定机场和正定机场高 铁站对于使用空铁联程出行的用户采用rp进行调查。所述旅客出行方式选择时影响最大 的因素Ei的取值范围是集合{F,T,S}中的一个元素,其中Ei=F表示因素为出行费用的高 低,Ei=T表示因素为出行时间的长短,Ei=S表示因素为出发时刻表;
[0032] 步骤S2:多源数据分类,包含如下步骤:
[0033] 步骤2A)训练数据和检验数据的划分。将S1步骤中采集的N名旅客多源数据Xi (i=1,2,3…,N)划分成训练旅客数据 和检验旅客数据 两类,训练旅客数据 的 个数为N1,其取值是N1=0.8×N取整后的数值,检验旅客数据 的个数为N2,其取值是 N2=N-N1;对于任意一个训练旅客数据 (utrain=1,2,3,4,…,N1)包含旅客一年中的 出行频率为 一年中出行的主要目的为 一年中一次出行的平均距离为 一年中一次出行的平均花费为 出行方式选择时影响最大的因素为 对于任意 一个检验旅客数据 (vtest=1,2,3,4,…,N2)包含旅客一年中的出行频率为 一年 中出行的主要目的为 一年中一次出行的平均距离为 一年中一次出行的平均花 费为 出行方式选择时影响最大的因素为
[0034] 步骤2B)自变量和因变量的划分。将旅客的一年中的出行频率Ai、旅客一年中出行 的主要目的Bi、旅客一年中一次出行的平均距离Ci、旅客一年中一次出行的平均花费Di这四项作为模型的自变量,分别以 向量的形式表示;将旅客出行方式 选择时影响最大的因素Ei作为模型的因变量,以 向量的形式表示,通过寻找因变量与 自变量的关系 从而构建分类模型;
[0035] 步骤2C)分类模型的建立。采用KNN算法对数据进行分类,首先进行外部循环, 设定一个数值K,K的初始值为1,进行下一次外部循环时K的数值增加1(K的上限为  );对每一个检验旅客数据 (vtest=1,2,3,4,…,N2)进行内部的嵌套循环,内部 循环中依次计算检验数据 与所有的训练数据 之间的距离d,
[0036]
[0037] 按照距离d的递增关系进行排序,找出与该检验数据 距离d最小的K个训练数 据,确定K个数据中各个因变量E的出现次数,将出现次数最高的因变量E作为检验数 据的分类,从而找到;对于所有的检验数据 判断分类模型预测得到的旅客因变 量E与该名旅客实际出行方式选择时影响最大的因素E是否一致,一致的因变量个数记 为M,准确率若准确率δ高于90%,,则认为分类效果较好,跳出内部循 环和外部循环,整个循环结束,输出此时的K的数值;若测试的准确率δ低于90%时, 则认为分类效果不理想,跳出内部循环进行下一次的外部循环,直至准确率δ高于90% 为止;
[0038] 循环结束后,将输出的K值作为KNN算法用于分类类别预测的K值,对于任意一 个新的数据,输入其四个自变量A、B、C、D的数值,计算其与各个训练数据 之间 的距离d,按照距离d的递增关系进行排序,找出距离d最小的K个训练数据 确 定K个数据中各个因变量E的出现次数,将出现次数最高的因变量E作为该新数据的预 测分类值;
[0039] 步骤S3:旅客出行方式选择时最大影响因素的预测,包含如下步骤:
[0040] 步骤3A)旅客出行数据的获取。对于任意一名需要分类预测的旅客L,获得其历史 信息中一年中的出行频率Al、旅客一年中出行的主要目的Bl、旅客一年中一次出行的平 均距离Cl、旅客一年中一次出行的平均花费Dl四个自变量数据,通过步骤(2)中的分 类模型预测其因变量旅客出行方式选择时影响最大的因素El;
[0041] 步骤3B)通过步骤2C中的KNN算法对该名旅客的因变量旅客出行方式选择时影 响最大的因素El进行分类预测;
[0042] 步骤S4:空铁联程出行信息采集。具体包括如下方面数据的采集:
[0043] 步骤4A)高铁数据的采集。采用12306API(https://www.12306.cn/index/),选择同 时具有高铁站和机场的城市作为Oi,在12306网页采集出发城市P到中转城市Oi的高铁 价格GPi1、高铁的时长GTi1、高铁的到发时刻表GSi1以及在12306网页采集中转城市Oi到 目的地城市Q的高铁价格GPi2、高铁的时长GTi2、高铁的到发时刻表GSi2,将结果按照 每个Oi对应的GPi1、GTi1、GSi1、GPi2、GTi2、GSi2进行保存;
[0044] 步骤4B)航空数据的采集。采用携程API(https://flights.ctrip.com/),同样选择同时 具有高铁站和机场的城市作为Oi,在携程机票查询网页采集出发城市P到中转城市Oi的 航班价格FPi1、航班的时长FTi1、航班的到发时刻表FSi1以及在携程机票查询网页采集中 转城市Oi到目的地城市Q的航班价格FPi2、航班的时长FTi2、航班的到发时刻表FSi2, 将结果按照每个Oi对应的FPi1、FTi1、FSi1、FPi2、FTi2、FSi2进行保存;
[0045] 步骤S5:出行方案排序及生成。具体如下:
[0046] 对Oi进行循环,在每一次循环中:若旅客从P到Q选择是先乘坐飞机再换乘高铁, 则计算最低总费用 计算最短总时长 找出最早出发时间 由最早的FSi1和与之能接续 上
的最早的GSi2构成;若旅客从P到Q选择是先乘坐高铁再换乘飞机,则计算最低总费 用计算最短总时长 找出最早出 发时
间 由最早的GSi1和与之能接续上的最早的FSi2构成;对比两种方案,找 出最低费用 最短总时长 
最早的出发时间 
循环得到了所有Oi对应的Pricei、Timei、 
Schedulei,最后找出所有Oi中对应的这三项最低的Oi;
[0047] 步骤S6:中转地点的确定。包括:
[0048] 根据所预测得到的旅客出行方式选择时考虑的最大因素El在步骤S5中的空铁联程 信息寻找对应的出行方案,选出旅客出行P-Q路线上最符合旅客在出行方式选择时考虑 的最大因素E的出行方案,从而确定空铁联程中转地点Oi。
[0049] 以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制, 而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈