首页 / 专利库 / 编辑中 / 时间线 / 融合公交GPS轨迹与IC卡数据的乘客OD识别方法

融合公交GPS轨迹与IC卡数据的乘客OD识别方法

阅读:469发布:2024-02-17

专利汇可以提供融合公交GPS轨迹与IC卡数据的乘客OD识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种融合公交GPS轨迹与IC卡数据的乘客OD识别方法,综合公交IC卡数据、公交GPS数据、公交线路与 站点 数据对乘客OD进行推算。在刷卡数据中,以公交线路车牌按时间顺序提取公交刷卡数据;公交GPS轨迹数据中,提取出按时间排序的各公交车辆。对两类数据进行预处理中,包括完全重复数据、缺失数据剔除以及GPS数据补点。然后对公交乘客一日出行IC卡数据,利用时间匹配 算法 识别上车站点,在非阶梯收费公交中利用泊松分布、线路匹配算法识别下车站点,在阶梯收费公交中利用时间匹配算法识别下车站点,实现公交乘客乘车OD提取。,下面是融合公交GPS轨迹与IC卡数据的乘客OD识别方法专利的具体信息内容。

1.一种融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:包括如下步骤:
步骤一、采集公交IC卡数据、公交GPS数据和公交站点数据;
步骤二、将公交IC卡数据按对应公交线路及车牌号分类,按获取时间排序,删除重复数据和缺失数据;将公交GPS数据按车牌号分类,按获取时间排序,删除重复数据和缺失数据、然后按1s/点的频率对公交GPS数据进行插值补充,获取公交IC卡与公交GPS全日完整数据;
同时将公交GPS数据与公交站点数据调整至相同坐标系
步骤三、匹配完整公交GPS数据与站点经纬度数据,通过按时间排序获取当前公交上下行信息;
步骤四、判断公交线路是否为阶梯收费线路:若是,则进入步骤五;若否,则进入步骤六;
步骤五、利用时间匹配算法对上下车站点进行识别,然后进入步骤七;
步骤六、利用时间匹配算法对上车站点进行识别,利用泊松分布、线路匹配算法对下车站点进行识别,然后进入步骤七;
步骤七、对两种公交线路的上下车识别结果进行整合,得到乘客公交出行OD信息。
2.根据权利要求1所述的融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:所述公交IC卡数据主要包括:1)公交车牌号;2)公交线路编号;3)乘客识别号;4)时间戳;5)公交刷卡类型;所述公交GPS数据主要包括:1)公交车牌号;2)公交线路编号;3)时间戳;4)经纬度数据;所述公交站点数据主要包括:1)公交线路;2)公交站点编号;3)公交站点名称;4)站点经纬度数据。
3.根据权利要求1所述的融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:所述进行插值补充的频率为1s/点,内容包括公交车牌、公交线路、时间戳、经度、纬度。
4.根据权利要求1所述的融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:步骤三所述按时间排序获取当前公交上下行信息的方法为:根据车牌号及时间戳数据补点公交GPS数据经纬度信息后,通过匹配GPS经纬度与站点经纬度信息,获取该车牌公交到达各个站点的时间顺序,通过对比顺序与默认站点顺序,得到该车牌公交车上下行信息。
5.根据权利要求1所述的融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:步骤五所述利用时间匹配算法识别上下车站点的方法为:以公交车牌分类提取公交IC卡数据并按时间排序,根据时间戳数据,匹配补点公交GPS数据经纬度,获取IC卡数据经纬度信息,然后结合该车辆上下行信息,将经纬度在两公交站点间的IC卡数据匹配到前一个公交站点,获取乘客上下站点及时间数据。
6.根据权利要求1所述的融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:步骤六所述利用泊松分布、线路匹配算法对非阶梯收费下车站点进行识别的方法为:
(1)泊松分布参数标定:
利用阶梯收费线路乘客上下车站识别结果,获取乘客乘坐公交站点数量分布,同时利用实地线路进行分布矫正,最终获取泊松分布参数;
(2)公交下站站点数据提取:
利用时间匹配算法识别出上车站点后,将刷卡数据按乘客识别号及刷卡时间进行分类提取,获取每个乘客全日完整数据集;然后根据乘客刷卡数据特征,结合公交接驳出行方式及出行距离特征,识别出下车站点信息。
7.根据权利要求6所述的融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:对非阶梯收费线路下站站点数据提取的方法为:
第一步、判断是否为多次出行:若否,则进入第二步;若是,则进入第三步;
第二步、利用泊松概率分布随机获取乘客乘坐公交站数,从而识别出下车站点信息;然后进入第十二步;
第三步、判断是否为首末次刷卡数据:若是,则进入第四步;若否,则进入第八步;
第四步、判断是否为折返线:若是,则进入第五步;若否,则进入第六步;
第五步、确定首条刷卡数据的上车站点为末条刷卡数据的下车站点、末条刷卡数据的上车站点为首条刷卡数据的下车站点;然后进入第十二步;
第六步、判断是否为环线:若是,则进入第七步;若否,则进入第三步;
第七步、确定末条刷卡数据行进方向上距离首条刷卡数据的站点距离最小且在当前城市步行极限距离范围内的站点为下车站点;然后进入第十二步;
第八步、判断两次出行是否为同线:若是,则进入第九步;若否,则进入第十步;
第九步、确定第i+1条数据的上车站点为第i条数据的下车站点;然后进入第十二步;
第十步、判断两次出行是否为异线:若是,则进入第十一步;若否,则进入第二步;
第十一步、确定第i条数据所在公交线路行驶方向中距离第i+1条数据上车站点距离最小且在当前城市步行极限距离范围内的站点为下车站点;然后进入第十二步;
第十二步、判断是否完成识别:若否,则返回第一步;若是,则整合得到乘客公交出行OD信息。
8.根据权利要求1所述的融合公交GPS轨迹与IC卡数据的乘客OD识别方法,其特征在于:所识别的乘客公交出行信息包括:公交线路、公交车牌号、乘客识别号、上下行、上站站点编号、上站时间、上站经度、上站纬度、下车站点编号、下车时间、下车经度、下车纬度、刷卡类型。

说明书全文

融合公交GPS轨迹与IC卡数据的乘客OD识别方法

技术领域

[0001] 本发明属于交通大数据传感器数据信息识别领域,尤其是针对城市居民公交出行上下车站点(OD)的识别。

背景技术

[0002] 随着社会经济的不断发展与居民出行需求的增加,城市机动车保有量快速上升,交通需求供给的不平衡造成城市交通拥堵频发。大发展公共交通是解决城市交通问题的有效途径,在城市交通发展中占有重要地位。通常公共交通系统需优先建立在出行需求量大、人口密集的区域,以缓解区域交通情况。传统的调查方法往往通过问卷问询、跟车调查等方式来获得居民的出行信息,这些方法对固定线路及固定内容具有良好的调查效果,然而这类方法通常存有调查样本较少、调查成本高,数据更新时间过长等问题。随着公共交通网络的愈加复杂化以及非集计化概念的兴起,对于覆盖面更广、客流量更大的常规公交,调查范围、调查精度需求逐步提升,调查内容更加复杂多元,急需一种新的方法弥补现有调查方法的缺陷
[0003] 城市公共交通系统能够有效采集乘客公交IC卡数据(包括物理IC卡数据、移动网络IC卡支付数据)与公交出行GPS数据,通过被动采集的方式记录乘客公交出行信息,具有覆盖范围广、获取成本低、动态性高等优势,同时随着移动支付的兴起,公交刷卡比例将越来越高。但除某些阶梯收费线路需在上下车时进行刷卡外,大部分非阶梯收费线路中,刷卡数据中通常仅包含上车刷卡信息,而缺失下车站点记录等信息,同时公交GPS数据长期存有采集频率低,频率不均匀的特征,难以直接应用。
[0004] 因此本发明基于公交IC卡数据与公交GPS数据,对乘客在公共交通系统出行时的上下站点信息,基于时间匹配算法、泊松分布及线路匹配算法,分别对阶梯收费与非阶梯收费数据进行快速提取;从而实现从海量公交IC卡数据中提取个体上下站信息,复现个体一日完整公交出行路径。本发明通过研究利用公交IC卡数据、公交GPS数据以及公交站点数据实现公共交通个体出行信息完整提取,为分析站点客流信息提供基础,把握城市公交线网客流分布提供基础支撑,对分析公共交通现状与问题、提升公共交通运营管理、支撑未来公交规划建设具有重要意义。

发明内容

[0005] 为了克服现有技术的上述缺点,本发明提出了一种融合公交GPS轨迹与IC卡数据的乘客OD识别方法,旨在解决城市公交系统中,尤其是在非阶梯收费中仅具有上车刷卡数据的条件下,乘客上下车站点OD信息提取的问题。本发明运用海量公交IC卡数据、公交GPS数据,完成数据预处理和基础数据提取后,构造单个车牌单日完整数据;利用时间匹配算法识别阶梯收费乘客上下车站点数据,利用时间匹配算法、泊松分布及线路匹配算法快速识别非阶梯收费乘客上下车站点数据,该方法可结合公交专项调查校核识别结果。其中,特别分析了非阶梯收费下车站点的识别方法。
[0006] 本发明解决其技术问题所采用的技术方案是:一种融合公交GPS轨迹与IC卡数据的乘客OD识别方法,包括如下步骤:
[0007] 步骤一、采集公交IC卡数据、公交GPS数据和公交站点数据;
[0008] 步骤二、将公交IC卡数据按对应公交线路及车牌号分类,按获取时间排序,删除重复数据和缺失数据;将公交GPS数据按车牌号分类,按获取时间排序,删除重复数据和缺失数据、然后按1s/点的频率对公交GPS数据进行插值补充,获取公交IC卡与公交GPS全日完整数据;同时将公交GPS数据与公交站点数据调整至相同坐标系
[0009] 步骤三、匹配完整公交GPS数据与站点经纬度数据,通过按时间排序获取当前公交上下行信息;
[0010] 步骤四、判断公交刷卡线路是否为阶梯收费线路:若是,则进入步骤四;若否,则进入步骤五;
[0011] 步骤五、利用时间匹配算法对上下车站点进行识别,然后进入步骤六;
[0012] 步骤六、利用时间匹配算法对上车站点进行识别,利用泊松分布、线路匹配算法对下车站点进行识别,然后进入步骤六;
[0013] 步骤七、对两种公交刷卡线路的上下车识别结果进行整合,得到乘客公交出行OD信息。
[0014] 与现有技术相比,本发明的积极效果是:
[0015] 本发明针对目前公共交通乘客出行信息调查方法中,存在的调查样本量小,调查数据动态性差以及调查费用高昂的缺陷,提出了时间匹配算法、泊松分布及线路匹配算法识别的乘客上下车站点提取方法,利用线性插值实现数据预处理,结合公交IC卡数据与公交GPS数据的时间同一性,利用时间匹配算法实现阶梯收费上下车站点识别及非阶梯收费上车站点快速识别,利用乘客公交出行时空特性,利用泊松分布及线路匹配算法快速识别非阶梯收费下车站点。具体包括:
[0016] 一、基于线性插值算法的公交GPS数据预处理
[0017] 由于公交GPS采集频率通常为15s/个,难以满足上车站点识别,需对数据进行预处理。以公交车牌号分类公交GPS数据,以个体识别号分类公交IC卡数据,完成重复数据、缺失数据删除后,按公交车牌号及采样时间对采集数据进行排序,然后以1s/个的频率补充缺失时间、经纬度,并补全车牌号与线路数据。对于公交IC卡数据需删除重复数据、缺失数据;对于公交站点数据需与公交GPS数据统一坐标系。
[0018] 二、基于时间匹配算法提取乘客上车信息
[0019] 以公交车牌对公交IC卡数据进行分类并按时间排序,首先匹配公交GPS数据与公交站点数据,根据经过各公交站点的时间戳情况,获取该趟公交的上下行信息。然后匹配补点后公交GPS数据与对应IC卡数据的时间戳,获取IC卡数据该时刻的坐标信息,结合公交上下行情况判断上车站点及时间。阶梯收费下车站点提取方法同上。
[0020] 三、基于泊松分布及线路匹配算法提取非阶梯收费乘客下车信息
[0021] 完成上车信息提取后,对于阶梯收费线路,根据相邻刷卡数据的出行线路、公交车牌号以及刷卡时间进行整合,获取完成上下站点数据。对于非阶梯收费,根据乘客公交出行时空阈值特性以及各刷卡数据出行线路,利用泊松分布及线路匹配算法进行评估,获取下车出行信息。
[0022] 本发明的优点在于:基于公交出行数据方面,公交刷卡数据与公交GPS数据均由公交公司存储,公交站点数据可由爬虫获取,三类数据采集相对容易;基于时间匹配算法方面,充分考虑、GPS数据缺乏站点信息、刷卡数据缺乏经纬度的情况,通过GPS数据补点的站点匹配与时间匹配,可快速获取GPS上下行、公交到站信息及刷卡坐标信息,从而匹配乘客刷卡站点,基于泊松分布与线路匹配算法方面,深入考虑真实公交出行中乘客的时空特性,包括乘客平均乘坐站数、公交接驳出行方式、公交接驳出行距离等特征,能够快速识别非阶梯收费路线乘客公交下车站点。相比现有调查与识别手段,具有快速准确的识别优势,对城市海量数据匹配较高的实用价值。对分析公共交通现状与问题、提升公共交通运营管理、支撑未来公交规划建设具有重要意义。附图说明
[0023] 本发明将通过例子并参照附图的方式说明,其中:
[0024] 图1为本发明的总体识别流程图
[0025] 图2为本发明的阶梯收费线路上下站点识别流程图;
[0026] 图3为本发明的非阶梯收费线路上下站点识别流程图。

具体实施方式

[0027] 首先对本发明涉及到的公交IC卡数据、公交GPS数据、公交站点数据的各个字段进行解析:公交IC卡数据,主要字段包括公交车牌号、公交线路编号、乘客识别号、时间戳、公交刷卡类型。公交GPS数据主要字段包括公交车牌号、公交线路编号、时间戳、经纬度。公交站点数据主要字段包括公交线路、公交站点编号、公交站点名称、站点经纬度。主要字段含义如下:
[0028] (1)公交车牌号
[0029] 标记不同公交车,IC卡数据通常为5位整数,GPS数据通常为实际车牌号,两者一一对应。
[0030] (2)公交线路
[0031] 标记不同公交车出行线路,通常为3位整数。
[0032] (2)时间戳
[0033] 记录数据的采集时间,通常为年/月/日,时/分/秒的24小时标准时间格式。
[0034] (3)刷卡类型
[0035] 记录IC卡类别,通常包括13类:成人月票卡、低保卡、电子钱包、纪念卡、康养卡、老年免费卡、老年优待卡、普通卡、伤残卡、退休员工卡、学生卡、员工卡、员工子女卡。此外移动支付根据支付软件显示为微信/支付宝。
[0036] (4)采集经纬度
[0037] 记录时间戳下的位置信息,其中采集频率为15s/个,均保留小数点后6位有效数字,公交GPS数据常用坐标系为WGS84。站点信息数据常用坐标系为BD-09。
[0038] 原始刷卡数据与GPS数据主要字段表如下。
[0039] 表1公交刷卡数据字段
[0040]
[0041] 表2公交GPS数据字段
[0042]
[0043] 然后以某城市某日中心城区全部线路公交GPS数据、公交IC卡数据、公交站点数据为基础建立城市公交信息数据库。在数据基础预处理上先以公交车牌按时间顺序提取公交GPS、公交IC卡两类数据,然后利用时间匹配算法识别非阶梯收费上车站点以及阶梯收费上下车站点,再以乘客识别号按时间顺序提取刷卡数据,根据相邻刷卡数据的出行线路、公交车牌号以及刷卡时间整合阶梯收费上下站点数据,根据乘客公交出行时空阈值特性以及各刷卡数据出行线路,利用泊松分布及线路匹配算法评估获取下车出行信息。总体识别流程如图1所示。所述方法中主要包含以下步骤:
[0044] 步骤一:公交数据分析
[0045] 公交数据包括公交IC卡数据、公交GPS数据、公交站点数据:
[0046] 公交IC卡数据包括主要含有五类字段:公交车牌号、公交线路编号、乘客识别号、时间戳、公交刷卡类型。
[0047] 公交GPS数据包括四类字段:公交车牌号、公交线路编号、时间戳、经纬度数据。
[0048] 公交站点数据包括四类字段:公交线路、公交站点编号、公交站点名称、站点经纬度数据。
[0049] 其中公交IC卡数据、公交GPS数据可由当地公交公司获取,公交站点数据可由网络爬虫获取,同时还需获取IC卡数据车牌编号与公交GPS数据的对应关系表。
[0050] 步骤二:数据基础预处理
[0051] 2.1数据剔除
[0052] (1)重复数据剔除
[0053] 大量完全重复数据容易对分析造成影响,因此相同数据仅保留一条。
[0054] (2)缺失数据剔除
[0055] 字段缺失数据容易造成字段错位、识别异常,该类数据需直接剔除。
[0056] 2.2数据补充
[0057] 数据稀疏的采集频率、剔除数据、短时穿过建筑物都将造成数据缺失,需按1s/个的频率插值补充公交GPS数据的时间戳、经纬度插值,保障后续识别的准确性,同时补充序号、手机识别号、采集时间。
[0058] 步骤三:阶梯收费线路上下站点识别
[0059] 阶梯收费线路上下站点识别流程如图2所示,包括基于时间的上下站点匹配和单次出行上下站点整合。
[0060] 3.1基于时间的上下站点匹配
[0061] 以公交车牌分类提取公交IC卡数据并按时间排序,首先利用GPS匹配公交GPS数据与公交站点数据,获取公交到站信息,并根据经过各公交站点的时间戳情况,获取该趟公交的上下行信息。然后根据刷卡数据的车牌号数据及时间戳数据,匹配补点公交GPS数据经纬度,获取刷卡数据经纬度数据,并结合公交上下行信息与到站信息获取乘客上下站点及时间数据。
[0062] 3.2单次出行上下站点整合
[0063] 完成上下站点信息提取后,根据相邻刷卡数据的出行线路、公交车牌号以及刷卡时间进行整合:若相邻刷卡数据公交车牌号及公交线路相同,且两次刷卡时间小于该线路公交完整出行时间,则两条数据分别为同一出行上下车数据,进行整合,整合字段包括:公交线路、公交车牌号、乘客识别号、上下行、上站站点编号、上站时间、上站经度、上站纬度、下车站点编号、下车时间、下车经度、下车纬度、刷卡类型。
[0064] 步骤四:非阶梯收费线路上下站点识别
[0065] 非阶梯收费线路上下站点识别流程如图3所示,包括基于时间的上站点匹配和基于泊松分布、线路匹配的下车站点识别。
[0066] 4.1基于时间的上站点匹配
[0067] 非阶梯收费上车站点识别方法同阶梯收费,首先匹配公交GPS数据与公交站点数据,获取公交到站信息,然后结合IC卡数据与公交GPS时间戳数据,获取乘客上站信息。
[0068] 4.2基于泊松分布、线路匹配的下车站点识别
[0069] (1)泊松分布参数标定
[0070] 泊松分布识别下车站点主要思想为通过调整参数λ使其分布与乘客乘坐公交站点数量分布相同,因此可通过阶梯收费线路乘客上下站识别结果,获取乘客乘坐公交站点数量分布,同时结合实地线路问询进行分布矫正,最终获取泊松分布参数。
[0071] (2)公交下站站点数据提取
[0072] 完成上车识别后,将刷卡数据按乘客识别号及刷卡时间进行分类提取,获取每个乘客全日完整数据集。然后根据乘客刷卡数据特征,结合公交接驳出行方式及出行距离特征,识别下车站点信息。
[0073] 1)存在单条刷卡数据,利用泊松概率分布随机获取乘客乘坐公交站数,从而推测下车站点信息。
[0074] 2)存在多条刷卡数据,分四种情况进行推断:
[0075] ①首末次出行为折返线,即相同线路不同上下行。首条刷卡数据i的上车站点为末条数据i+n的下车站点,末条刷卡数据i+n的上车站点为首次出行i的下车站点。
[0076] ②首末次出行为环线,即末条数据的行进方向站点逐渐靠近首条刷卡数据站点。则末条数据i+n行进方向上,距离首条刷卡数据i的站点距离最小且低于1500米的站点为下车站点,其中1500m由当前城市步行极限距离确定。
[0077] ③同线与异线,除首末刷卡外,相邻两条刷卡数据出行线路相同时,两次出行为同线,否则为异线。同线的两次出行中,第i+1条数据的上车站点为第i条数据的下车站点;异线的两次出行中,第i条数据所在公交线路行驶方向中,距离第i+1条上车站点距离最小且低于1500m的站点为下车站点。
[0078] ④其他出行情况,利用泊松概率分布随机获取乘客乘坐公交站数,推测下车站点信息。
[0079] 完成下车识别后,将上下车数据进行整理,形成包含如下字段的表格:公交线路、公交车牌号、乘客识别号、上下行、上站站点编号、上站时间、上站经度、上站纬度、下车站点编号、下车时间、下车经度、下车纬度、刷卡类型。最终识别结果如下表所示。
[0080] 表3公交出行上下站识别信息识别样例
[0081]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈