首页 / 专利库 / 电信 / 峰均功率比 / 基于多模式公交数据匹配的公共交通出行特征提取方法

基于多模式公交数据匹配的公共交通出行特征提取方法

阅读:990发布:2022-12-15

专利汇可以提供基于多模式公交数据匹配的公共交通出行特征提取方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于多模式公交数据匹配的公共交通出行特征提取方法,引入了公共交通通勤出行链的概念,利用地面公交、轨道交通和公共 自行车 刷卡数据,公交GPS数据,公共交通 站点 、线路 基础 数据等多源数据,通过数据预处理与匹配、公共交通出行链结构提取、通勤出行行为判别、出行阶段起讫点确定和出行特征信息匹配五个步骤,来获取居民通勤出行特征信息,如通勤出行时间、通勤出行距离和换乘特性等。本发明有助于公共交通运营企业和政府主管部 门 准确掌握居民通勤出行状况,为城市公共交通线网优化、公共交通政策的制定等提供支持,对提高居民通勤出行效率有重要意义。,下面是基于多模式公交数据匹配的公共交通出行特征提取方法专利的具体信息内容。

1.基于多模式公交数据匹配的公共交通出行特征提取方法,其特征在于:所述方法包括以下步骤:
步骤1:公共交通多源数据预处理与匹配;
步骤2:公共交通出行链结构提取;
步骤3:通勤出行行为判别;
步骤4:出行阶段起讫点确定;
步骤5:出行特征信息匹配;
所述步骤1公共交通多源数据预处理与匹配的方法如下,
筛选海量数据中的有效数据,改善数据质量,并利用相关字段进行数据整合与关联匹配;
(1)公共交通刷卡数据预处理;
地面公交、轨道交通和公共自行车三类方式的刷卡数据字段互不相同,而地面公交又分为一票制公交和分段计价公交两类;需根据各类刷卡数据字段的含义,从中提取居民出行相关的用户卡号、交易时间、乘车线路、站点编号等字段,并整合到同一个数据表中;为区分不同刷卡类型,给每类刷卡数据添加唯一的标记:一票制地面公交标记为“B1”,分段计价地面公交标记为“B2”,轨道交通标记为“R”,公共自行车标记为“Z”;整合之后的刷卡数据表的字段如表1所示,信息不全的字段,暂置为空;
表1 公共交通刷卡数据整合表字段
(2)基于公交GPS数据的公交到站时间确定;
基于公交GPS定位数据和公交线路基础数据,通过地图匹配、弧段弥补、站点匹配、行驶方向判别等步骤,获取公交车辆的到达站点的时间;
(3)多模式公共交通站点空间关系匹配;
由于轨道交通和公共自行车刷卡数据记录了出行起讫点的信息,而地面公交刷卡数据中记录的出行起讫点信息不全,部分上下车站点信息需通过换乘过程去推断;因此,利用地面公交、轨道交通和公共自行车的站点坐标数据,建立了三类公共交通站点的空间关系表,以此来确定居民的换乘过程信息;根据不同类型站点的辐射不同,确定的地面公交站点吸引范围为360m,轨道交通站点的吸引范围为770m,公共自行车站点的吸引范围为
300m;在各类站点相应的吸引范围阈值内,加之出行的乘车线路等信息,根据换乘距离最短原则,确定换乘过程的上下车站点;公共交通站点空间关系表字段如下所示:
表2 公共交通站点空间关系表
(4)轨道交通任意站点间行程距离确定;
居民在轨道交通内部换乘不需刷卡,这对获取乘客出行路径造成了困难;基于居民出行会选择时间最短方案的假设,通过最短路径搜索,确定已知轨道交通站点OD对之间的最优路径,再根据轨道交通基础数据中任意相邻站点间距离数据,计算得到轨道交通站点任意OD对之间的行程距离;
所述步骤2公共交通出行链结构提取的方法如下,
公共交通出行链是指从出行起始站点到目的站点,由一个或多个公共交通出行阶段按发生顺序组成的一次完整出行过程;公共交通出行链属于不闭合的单链,可再现出行者每一次公共交通出行的微观过程;出行者一天可出现一条或多条公共交通出行链,一条公共交通出行链可包含一个或多个出行阶段;
根据同一用户相邻两条刷卡记录的交易时间差,判断此相邻的两个出行阶段是属于换乘关系还是分属两条不同的出行链,据此对出行者的各出行阶段进行连接或划分,确定出行链的基本结构;
由于地面公交、轨道交通和公共自行车三类刷卡数据中所记录的交易时间含义不同:
一票制公交(B1)记录了上车时间、分段计价公交(B2)记录了下车时间、轨道交通(R)记录了进站和出站时间、公共自行车(Z)记录了借车和还车时间,因此三类出行方式之间存在
14种换乘类型,而每种换乘类型的交易时间差中包含了不同的时间组成部分,如不同交通方式的在途时间、不同换乘过程的换乘时间等,因此每种换乘类型的交易时间差阈值各不相同;14种换乘类型的交易时间差组成及阈值如表3所示:
表3 相邻出行阶段换乘时间阈值
根据上表中的交易时间差阈值,若相邻两个出行阶段的交易时间在阈值以内,则认为此两个出行阶段之间存在换乘行为,两者属于同一出行链;反之,则认为两者分属于不同的出行链;
所述步骤3通勤出行行为判别的方法如下:
由于刷卡数据中包含了各种不同出行目的的刷卡记录,因此,需要制定规则筛选出以通勤为目的的出行行为;
所述步骤4出行阶段起讫点确定的方法如下,
使用轨道交通或公共自行车方式的出行阶段,可根据其刷卡数据中记录的站点编号,加之轨道交通和公共自行车站点的基础信息,两者匹配可获得其完整的进站站点名称和出站站点名称;而地面公交刷卡数据记录的上下车站点信息不完整,要获取地面公交方式的出行阶段的起讫点,需经过以下三个步骤的匹配:
(1)基于公交到站时间的公交上车或下车站点匹配;
一票制公交的刷卡数据记录了乘客上车时间,分段计价公交的刷卡数据记录了乘客的下车时间,两者与乘客所在公交车辆的到站时间表匹配,可得到一票制公交乘客的上车站点名称以及分段计价公交乘客的下车站点名称;
但是,刷卡数据记录的是IC卡系统的时间,而公交车辆到站时间记录的是公交GPS系统的时间,两者存在一定的偏差;并且考虑到乘客下车会提前刷卡、大量乘客排队上车时刷卡过程持续时间长等因素的影响,需要在站点匹配时设置合理的阈值,以保证匹配的成功率与准确率;在分别考虑一票制公交和分段计价公交的平均站距等条件的基础上,确定了如下的阈值:一票制公交2.8min,分段计价公交3.2min;即当一票制公交乘客的上车时间与公交车辆到站时间的差值小于2.8min时,则将公交车辆所到的站点匹配为乘客的上车站点;当分段计价公交乘客的下车时间与公交车辆到站时间的差值小于3.2min时,则将公交车辆所到的站点匹配为乘客的下车站点;
(2)基于公共交通站点空间关系的公交上车或下车站点匹配;
对于一票制公交的下车站点和分段计价公交的上车站点,一部分可以在公共交通站点空间关系表的基础上通过出行的换乘过程去推断;具体的推断过程如下:
1)确定一票制公交的下车站点
对于同一出行链的两个相邻出行阶段,若其换乘类型属于:一票制公交换乘一票制公交(B1—B1)、一票制公交换乘轨道交通(B1—R)或者一票制公交换乘公共自行车(B1—Z),这三种情况均已知了乘客换乘行为之后的上车(进站或借车)站点,而换乘行为之前乘坐的一票制公交的下车站点未知;在此,利用已建立的公共交通站点空间关系表,以换乘行为之后的上车站点为中心站点,搜索中心站点吸引范围以内的其他地面公交站点;再从这些候选公交站点中,根据其所属线路的编号,筛选与乘客换乘行为之前乘坐的公交线路编号相同的站点,此站点即为乘客乘坐一票制公交相应的下车站点;
2)确定分段计价公交的上车站点
对于同一出行链的两个相邻出行阶段,若其换乘类型属于:分段计价公交换乘分段计价公交(B2—B2)、轨道交通换乘分段计价公交(R—B2)或者公共自行车换乘分段计价公交(Z—B2),这三种情况均已知了乘客换乘行为之前的下车站点,而换乘行为之后乘坐的分段计价公交的上车站点未知;同样,利用已建立的公共交通站点空间关系表,以换乘行为之前的下车站点为中心站点,搜索中心站点吸引范围以内的其他地面公交站点;再从这些候选公交站点中,根据其所属线路的编号,筛选与乘客换乘行为之后乘坐的公交线路编号相同的站点,此站点即为乘客乘坐分段计价公交相应的上车站点;
(3)基于通勤行为规律的公交上车或下车站点匹配;
根据通勤出行行为的对称性,出行者一天内第一次通勤出行的起点应与一天内最后一次通勤出行的终点相同,而第一次通勤出行的终点应与最后一次通勤出行的起点相同;据此,提出了部分类型的一票制公交下车站点和分段计价上车站点的判断方法,具体如下:
1)确定一票制公交的下车站点
若出行者一天内第一次通勤出行链的最后一个出行阶段乘坐的是一票制公交(B1),则将该出行者当天最后一次通勤出行链的起始站点作为中心站点,搜索中心站点吸引范围内的地面公交站点,筛选出其中属于出行者所乘公交线路上的站点,将其作为出行者第一次通勤出行链的下车站点;利用同样的方法,出行者一天内最后一次通勤出行链的最后出行阶段所乘坐的一票制公交的下车站点也能够确定;
2)确定分段计价公交的上车站点
若出行者一天内第一次通勤出行链的第一个出行阶段乘坐的是分段计价公交(B2),则将该出行者当天最后一次通勤出行链的结束站点作为中心站点,搜索中心站点吸引范围内的地面公交站点,筛选出其中属于出行者所乘公交线路上的站点,将其作为出行者第一次通勤出行链的上车站点;利用同样的方法,出行者一天内最后一次通勤出行链的第一个出行阶段所乘坐的分段计价公交的上车站点也可以确定;
所述步骤5出行特征信息匹配的方法如下:
在以上步骤获取的出行阶段起讫点信息的基础上,结合地面公交到站时间表和轨道交通任意站点间行程距离等数据,完成各出行阶段的行程时间、行程距离的计算,进而获取居民的公共交通通勤出行特征;
(1)地面公交出行上下车时间修正
上面步骤中,一票制公交(B1)的上车时间和分段计价公交(B2)的下车时间,使用的是IC卡系统的时间,而地面公交其他的时间用的是地面公交到站时间表中的GPS系统时间;
由于GPS系统的时间经过校正,准确性更高,同时为了计算行程时间的标准统一,用地面公交到站时间表(GPS系统时间)中的时间对一票制公交(B1)的上车时间和分段计价公交(B2)的下车时间(IC卡系统时间)进行修正;
(2)行程时间和行程距离匹配
各出行阶段的行程时间,是乘客下车(出站或还车)时间与上车(进站或借车)时间的时间差;而地面公交、轨道交通和公共自行车三种方式出行阶段的行程距离,分别通过与地面公交线路基础数据表、轨道交通任意站点间行程距离表和公共自行车站点基础数据表匹配得到。
2.根据权利要求1所述的基于多模式公交数据匹配的公共交通出行特征提取方法,其特征在于:根据居民通勤出行行为规律性较强且具有比较固定的发生频率和发生时间等特点,在大量数据分析的基础上提出了通勤出行行为判别规则:
(1)提取一周中五个工作日的刷卡数据并按用户卡号分组;
(2)若同一用户(同一卡号)在一周的五个工作日中,至少有三天保持了相同的出行规律(指相同的出行链次序和出行链结构),则认为该用户为通勤出行用户,建立通勤出行用户样本库;
(3)通勤用户在每个工作日的高峰时段发生的出行认为是通勤出行;
(4)通勤出行用户样本库每月更新一次。
3.根据权利要求1所述的基于多模式公交数据匹配的公共交通出行特征提取方法,其特征在于:地面公交出行上下车时间修正的修正方法为,利用出行阶段匹配得到的一票制公交(B1)的上车站点和分段计价公交(B2)的下车站点信息,通过线路编号、车辆编号等字段匹配,用地面公交到站时间表中车辆到达相应站点的时间替换乘客的刷卡时间。

说明书全文

基于多模式公交数据匹配的公共交通出行特征提取方法

技术领域

[0001] 本发明属于公共交通运行监测领域,涉及一种基于多模式公交数据匹配的公共交通出行特征计算与分析方法。

背景技术

[0002] 通勤出行是公共交通服务的主体,掌握其出行特征是合理投放公共交通运、制定公共交通线网优化措施的基础。随着智能化公共交通系统的推广,公共交通多源数据(如IC卡数据、公交GPS数据等)被广泛采集,这些数据记录了居民的公共交通出行过程,为提取其出行特征奠定了良好的数据基础。申请号为CN201210074506的专利公开了一种基于手机定位数据的居民出行特征参数的获取方法,将手机数据与交通小区匹配,并把连续的数据进行合并,根据合并的数目及影响时长还原用户的出行路径,得到出行距离、出行速度。但是该专利公开的居民出行特征参数的获取方法,无法准确识别用户的类别,即不能准确区分通勤与非通勤用户,且根据修正后的手机定位数据直接计算出行距离等参数,会导致计算误差偏大。申请号为CN200910190637的专利公开了一种基于多源数据融合的人口时空动态出行特征建模方法,将地图数据、手机定位数据和浮动车辆数据融合,建立人口出行特征空间分析模型,获得人口分布和人口出行特征分布。但是该专利公开的人口时空动态出行特征建模方法,并非居民使用公共交通工具的出行特征,且所得到的人口出行特征是宏观层面的,达不到具体用户在某出行阶段的出行特征的精度
[0003] 国内大部分的大中城市的公共交通均包括地面公交、轨道交通和公共自行车三种方式,而地面公交通常又包括单一票制公交和分段计价公交两种类型。如何有效地关联匹配这些海量异构数据,挖掘公共交通通勤出行特征,目前还缺乏一套完整的方法体系。

发明内容

[0004] 本发明提出了“公共交通出行链”的概念,并引入“出行阶段”以实现对公共交通出行过程的细化表达。本发明在多源数据关联匹配的基础上,提出了通过出行链结构提取、通勤出行判别、出行阶段起讫点确定和出行特征信息匹配等步骤,获取居民公共交通通勤出行特征的完整方法。
[0005] 基于多模式公交数据匹配的公共交通出行特征提取方法,包括以下步骤:
[0006] 步骤1:公共交通多源数据预处理与匹配。
[0007] 筛选海量数据中的有效数据,改善数据质量,并利用相关字段进行数据整合与关联匹配。
[0008] 步骤1.1:公共交通刷卡数据预处理。
[0009] 地面公交、轨道交通和公共自行车三类方式的刷卡数据字段互不相同,而地面公交又分为一票制公交和分段计价公交两类。需根据各类刷卡数据字段的含义,从中提取居民出行相关的用户卡号、交易时间、乘车线路、站点编号等字段,并整合到同一个数据表中。为区分不同刷卡类型,给每类刷卡数据添加唯一的标记:一票制地面公交标记为“B1”,分段计价地面公交标记为“B2”,轨道交通标记为“R”,公共自行车标记为“Z”。整合之后的刷卡数据表的字段如表1所示,信息不全的字段,暂置为空。
[0010] 表1公共交通刷卡数据整合表字段
[0011]
[0012] 步骤1.2:基于公交GPS数据的公交到站时间确定。
[0013] 根据本著作权人拥有的授权专利《基于公交车GPS数据的公交运送速度提取方法》(专利号:2012102664718),基于公交GPS定位数据和公交线路基础数据,通过地图匹配、弧段弥补、站点匹配、行驶方向判别等步骤,可以获取公交车辆的到达站点的时间。
[0014] 步骤1.3:多模式公共交通站点空间关系匹配。
[0015] 由于轨道交通和公共自行车刷卡数据记录了出行起讫点的信息,而地面公交刷卡数据中记录的出行起讫点信息不全,部分上下车站点信息需通过换乘过程去推断。因此,本发明利用地面公交、轨道交通和公共自行车的站点坐标数据,建立了三类公共交通站点的空间关系表,以此来确定居民的换乘过程信息。根据不同类型站点的辐射能力不同,本发明确定的地面公交站点吸引范围为360m,轨道交通站点的吸引范围为770m,公共自行车站点的吸引范围为300m。在各类站点相应的吸引范围阈值内,加之出行的乘车线路等信息,根据换乘距离最短原则,确定换乘过程的上下车站点,具体流程如图1所示。公共交通站点空间关系表字段如下所示:
[0016] 表2公共交通站点空间关系表
[0017]
[0018] 步骤1.4:轨道交通任意站点间行程距离确定。
[0019] 居民在轨道交通内部换乘不需刷卡,这对获取乘客出行路径造成了困难。本发明基于居民出行会选择时间最短方案的假设,通过最短路径搜索,确定已知轨道交通站点OD对之间的最优路径,再根据轨道交通基础数据中任意相邻站点间距离数据,计算得到轨道交通站点任意OD对之间的行程距离。
[0020] 步骤2:公共交通出行链结构提取。
[0021] 公共交通出行链是指从出行起始站点到目的站点,由一个或多个公共交通出行阶段按发生顺序组成的一次完整出行过程。公共交通出行链属于不闭合的单链,可再现出行者每一次公共交通出行的微观过程。出行者一天可出现一条或多条公共交通出行链,一条公共交通出行链可包含一个或多个出行阶段。
[0022] 本发明根据同一用户相邻两条刷卡记录的交易时间差,判断此相邻的两个出行阶段是属于换乘关系还是分属两条不同的出行链,据此对出行者的各出行阶段进行连接或划分,确定出行链的基本结构。
[0023] 由于地面公交、轨道交通和公共自行车三类刷卡数据中所记录的交易时间含义不同:一票制公交(B1)记录了上车时间、分段计价公交(B2)记录了下车时间、轨道交通(R)记录了进站和出站时间、公共自行车(Z)记录了借车和还车时间,因此三类出行方式之间存在14种换乘类型,而每种换乘类型的交易时间差中包含了不同的时间组成部分(如不同交通方式的在途时间、不同换乘过程的换乘时间等),因此每种换乘类型的交易时间差阈值各不相同。14种换乘类型的交易时间差组成及阈值如表3所示:
[0024] 表3相邻出行阶段换乘时间阈值
[0025]
[0026]
[0027] 根据上表中的交易时间差阈值,若相邻两个出行阶段的交易时间在阈值以内,则认为此两个出行阶段之间存在换乘行为,两者属于同一出行链;反之,则认为两者分属于不同的出行链。
[0028] 步骤3:通勤出行行为判别。
[0029] 由于刷卡数据中包含了各种不同出行目的的刷卡记录,因此,需要制定规则筛选出以通勤为目的的出行行为。
[0030] 根据居民通勤出行行为规律性较强且具有比较固定的发生频率和发生时间等特点,本发明在大量数据分析的基础上提出了如下的通勤出行行为判别规则:
[0031] (1)提取一周中五个工作日的刷卡数据并按用户卡号分组;
[0032] (2)若同一用户(同一卡号)在一周的五个工作日中,至少有三天保持了相同的出行规律(指相同的出行链次序和出行链结构),则认为该用户为通勤出行用户,建立通勤出行用户样本库。
[0033] (3)通勤用户在每个工作日的高峰时段发生的出行认为是通勤出行。
[0034] (4)通勤出行用户样本库每月更新一次。
[0035] 步骤4:出行阶段起讫点确定。
[0036] 使用轨道交通或公共自行车方式的出行阶段,可根据其刷卡数据中记录的站点编号,加之轨道交通和公共自行车站点的基础信息,两者匹配可获得其完整的进站(借车)站点名称和出站(还车)站点名称。而地面公交刷卡数据记录的上下车站点信息不完整,要获取地面公交方式的出行阶段的起讫点,需经过以下三个步骤的匹配:
[0037] 步骤4.1:基于公交到站时间的公交上车或下车站点匹配。
[0038] 一票制公交的刷卡数据记录了乘客上车时间,分段计价公交的刷卡数据记录了乘客的下车时间,两者与乘客所在公交车辆(通过车辆编号匹配)的到站时间表(记录车辆到达每个站点的时间)匹配,可得到一票制公交乘客的上车站点名称以及分段计价公交乘客的下车站点名称。
[0039] 但是,刷卡数据记录的是IC卡系统的时间,而公交车辆到站时间记录的是公交GPS系统的时间,两者存在一定的偏差;并且考虑到乘客下车会提前刷卡、大量乘客排队上车时刷卡过程持续时间长等因素的影响,需要在站点匹配时设置合理的阈值,以保证匹配的成功率与准确率。本发明在分别考虑一票制公交和分段计价公交的平均站距等条件的基础上,确定了如下的阈值:一票制公交2.8min,分段计价公交3.2min。即当一票制公交乘客的上车时间与公交车辆到站时间的差值小于2.8min时,则将公交车辆所到的站点匹配为乘客的上车站点;当分段计价公交乘客的下车时间与公交车辆到站时间的差值小于3.2min时,则将公交车辆所到的站点匹配为乘客的下车站点。
[0040] 步骤4.2:基于公共交通站点空间关系的公交上车或下车站点匹配。
[0041] 对于一票制公交的下车站点和分段计价公交的上车站点,一部分可以在公共交通站点空间关系表的基础上通过出行的换乘过程去推断。具体的推断过程如下:
[0042] (1)确定一票制公交的下车站点
[0043] 对于同一出行链的两个相邻出行阶段,若其换乘类型属于:一票制公交换乘一票制公交(B1—B1)、一票制公交换乘轨道交通(B1—R)或者一票制公交换乘公共自行车(B1—Z),这三种情况均已知了乘客换乘行为之后的上车(进站或借车)站点,而换乘行为之前乘坐的一票制公交的下车站点未知。在此,利用已建立的公共交通站点空间关系表,以换乘行为之后的上车(进站或借车)站点为中心站点,搜索中心站点吸引范围以内的其他地面公交站点;再从这些候选公交站点中,根据其所属线路的编号,筛选与乘客换乘行为之前乘坐的公交线路编号相同的站点(若有多个,则取其中距中心站点最近的一个),此站点即为乘客乘坐一票制公交相应的下车站点。
[0044] (2)确定分段计价公交的上车站点
[0045] 对于同一出行链的两个相邻出行阶段,若其换乘类型属于:分段计价公交换乘分段计价公交(B2—B2)、轨道交通换乘分段计价公交(R—B2)或者公共自行车换乘分段计价公交(Z—B2),这三种情况均已知了乘客换乘行为之前的下车(出站或还车)站点,而换乘行为之后乘坐的分段计价公交的上车站点未知。同样,利用已建立的公共交通站点空间关系表,以换乘行为之前的下车(出站或还车)站点为中心站点,搜索中心站点吸引范围以内的其他地面公交站点;再从这些候选公交站点中,根据其所属线路的编号,筛选与乘客换乘行为之后乘坐的公交线路编号相同的站点(若有多个,则取其中距中心站点最近的一个),此站点即为乘客乘坐分段计价公交相应的上车站点。
[0046] 步骤4.3:基于通勤行为规律的公交上车或下车站点匹配。
[0047] 根据通勤出行行为的对称性,出行者一天内第一次通勤出行的起点应与一天内最后一次通勤出行的终点相同,而第一次通勤出行的终点应与最后一次通勤出行的起点相同。据此,本发明提出了部分类型的一票制公交下车站点和分段计价上车站点的判断方法,具体如下:
[0048] (1)确定一票制公交的下车站点
[0049] 若出行者一天内第一次通勤出行链的最后一个出行阶段乘坐的是一票制公交(B1),则将该出行者当天最后一次通勤出行链的起始站点作为中心站点,搜索中心站点吸引范围内的地面公交站点,筛选出其中属于出行者所乘公交线路上的站点,将其作为出行者第一次通勤出行链的下车站点。利用同样的方法,出行者一天内最后一次通勤出行链的最后出行阶段所乘坐的一票制公交的下车站点也能够确定。
[0050] (2)确定分段计价公交的上车站点
[0051] 若出行者一天内第一次通勤出行链的第一个出行阶段乘坐的是分段计价公交(B2),则将该出行者当天最后一次通勤出行链的结束站点作为中心站点,搜索中心站点吸引范围内的地面公交站点,筛选出其中属于出行者所乘公交线路上的站点,将其作为出行者第一次通勤出行链的上车站点。利用同样的方法,出行者一天内最后一次通勤出行链的第一个出行阶段所乘坐的分段计价公交的上车站点也可以确定。
[0052] 具体匹配流程如图2所示。
[0053] 步骤5:出行特征信息匹配。
[0054] 在以上步骤获取的出行阶段起讫点信息的基础上,结合地面公交到站时间表和轨道交通任意站点间行程距离等数据,可以完成各出行阶段的行程时间、行程距离的计算,进而可以获取居民的公共交通通勤出行特征。具体方法如下:
[0055] (1)地面公交出行上下车时间修正
[0056] 上面步骤中,一票制公交(B1)的上车时间和分段计价公交(B2)的下车时间,使用的是IC卡系统的时间,而地面公交其他的时间用的是地面公交到站时间表中的GPS系统时间。由于GPS系统的时间经过校正,准确性更高,同时为了计算行程时间的标准统一,本发明中用地面公交到站时间表(GPS系统时间)中的时间对一票制公交(B1)的上车时间和分段计价公交(B2)的下车时间(IC卡系统时间)进行修正。修正方法为:利用出行阶段匹配得到的一票制公交(B1)的上车站点和分段计价公交(B2)的下车站点信息,通过线路编号、车辆编号等字段匹配,用地面公交到站时间表中车辆到达相应站点的时间替换乘客的刷卡时间。
[0057] (2)行程时间和行程距离匹配
[0058] 各出行阶段的行程时间,是乘客下车(出站或还车)时间与上车(进站或借车)时间的时间差;而地面公交、轨道交通和公共自行车三种方式出行阶段的行程距离,分别通过与地面公交线路基础数据表、轨道交通任意站点间行程距离表和公共自行车站点基础数据表匹配得到。
[0059] 通过以上各步骤,得到的公共交通通勤出行计算结果表的字段,如表4所示:
[0060] 表4公共交通通勤出行计算结果表
[0061]
[0062] 本发明具有以下有益效果:提出了公共交通出行链的概念,通过公共交通多源数据的关联匹配,重点解决了换乘行为判断、通勤出行鉴别和地面公交上下车站点时空信息匹配等关键问题,具体阐述了通勤出行时间、通勤出行距离和换乘次数等居民出行特征的提取步骤和方法。本发明有助于公共交通运营企业和政府主管部准确掌握居民通勤出行状况,为城市公共交通线网优化、公共交通政策的制定等提供支持,对提高居民通勤出行效率有重要意义。附图说明
[0063] 图1为公共交通站点空间关系匹配流程图
[0064] 图2为公共交通出行阶段起讫点匹配流程图;
[0065] 图3为基于多模式公交数据匹配的公共交通出行特征提取方法流程图;

具体实施方式

[0066] 下面结合附图和实施例对本发明做进一步说明。
[0067] 基于多模式公交数据匹配的公共交通出行特征提取方法的流程图如图3所示,包括以下步骤:
[0068] 步骤1:公共交通多源数据预处理与匹配。
[0069] 步骤2:公共交通出行链结构提取。
[0070] 步骤3:通勤出行行为判别。
[0071] 步骤4:出行阶段起讫点确定。
[0072] 步骤5:出行特征信息匹配。
[0073] 下面给出本发明的应用实例。
[0074] 以北京市2014年9月22至9月26日连续五个工作日的公共交通运行数据为例对居民公交出行特征进行计算和分析。
[0075] (1)进行公共交通多源数据的预处理与匹配
[0076] 根据字段含义,从地面公交、轨道交通和公共自行车三类刷卡数据中提取居民出行相关字段,并整合到一个表,为每类刷卡数据添加标记,结果如表5所示:
[0077] 表5公共交通刷卡数据整合表
[0078]
[0079]
[0080] 在公交GPS定位数据和公交线路数据的基础上,通过公交运送速度提取方法,得到的公交车辆的到达站点的时间,结果如表6所示:
[0081] 表6公交车辆到站时间表
[0082]
[0083] 为确定居民换乘过程的信息,利用地面公交、轨道交通和公共自行车的站点坐标数据,建立的三类公共交通站点的空间关系表如下所示:
[0084] 表7公共交通站点空间关系表
[0085]
[0086] 基于轨道交通基础数据中任意相邻站点间距,根据最短路径搜索,确定的轨道任意两站点间的距离,如表8所示:
[0087] 表8轨道交通任意站点间行程距离表
[0088]
[0089]
[0090] (2)提取公共交通出行链结构
[0091] 根据本发明确定的交易时间差阈值,若相邻两个出行阶段的交易时间在阈值以内,则认为此两个出行阶段之间存在换乘行为,两者属于同一出行链;反之,则认为两者分属于不同的出行链。经过以上判断,提取的公共交通出行链结构如表9所示:
[0092] 表9公共交通出行链信息
[0093]日期 一卡通卡号 出行链结构 出行链次序 出行阶段数
2014/9/22 00001082 R-B2 1 2
2014/9/22 00001082 R-B1-R 2 3
2014/9/22 00009234 R-B1 1 2
2014/9/22 00009234 B1-R 2 2
2014/9/22 00006068 R 1 1
2014/9/22 00006068 R 2 1
[0094] 在出行链结果的基础上,进一步提取的各出行阶段的信息如表10所示:
[0095] 表10公共交通出行链各出行阶段信息表
[0096]
[0097] (3)判别通勤出行行为
[0098] 分析2014年9月22至9月26日连续五个工作日的刷卡数据,若相同出行链次序,相同出行链结构的数据出现3次以上(含3次),则认为该用户(一卡通卡号)为通勤用户,通勤用户在高峰时段发生的出行,则为通勤出行。
[0099] 表11通勤出行用户信息表
[0100]一卡通卡号 出行链次序 出行链结构 出现天数
00001062 1 B1 3
00001099 1 B1-B2 3
00001100 1 B1-Z 3
00001156 2 R 4
[0101] (4)确定出行阶段起讫点
[0102] 通过利用轨道交通或公共自行车的站点编号匹配进出站(借还车)站点、基于公交到站时间匹配的公交上车或下车站点、基于公共交通站点空间关系匹配公交上车或下车站点和基于通勤行为规律匹配公交上车或下车站点四个步骤,得到各出行阶段的起讫点信息,如表12所示:
[0103] 表12公共交通各出行阶段起讫点信息表
[0104]
[0105] (5)匹配出行特征信息
[0106] 在各出行阶段起讫点信息的基础上,结合地面公交到站时间表、地面公交线路基础数据和轨道交通任意站点间行程距离等数据,通过地面公交出行上下车时间修正和行程时间、行程距离匹配,得到公共交通通勤出行特征计算结果,如表13所示:
[0107] 表13公共交通通勤出行特征计算结果表
[0108]
[0109] 通过以上的计算结果,可以获取每个出行个体的通勤出行时间、通勤出行距离和换乘次数等出行特征信息,如上表中卡号为00001082的出行者,其第一次出行链的出行距离为38.48km,出行时间为87.2min,由于有两个出行阶段,所以该出行者第一次出行链包含一次换乘过程。
[0110] 在每个出行个体出行特征的基础上,将出行者在不同维度上分类,分析不同类别出行者的出行行为的统计特征,进而可以掌握全市通勤出行者的出行规律。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈