首页 / 专利库 / 资料储存系统 / 挖矿 / 数据挖掘 / 一种基于大数据挖掘的空载出租车辅助系统

一种基于大数据挖掘的空载出租车辅助系统

阅读:1017发布:2020-06-21

专利汇可以提供一种基于大数据挖掘的空载出租车辅助系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 大数据 挖掘的空载出租车辅助系统,包括:出租车 数据采集 模 块 ,用于收集出租车大数据; 数据处理 模块,用于对采集的出租车数据进行数据预处理后,将路网网格化,计算所有网格在每个时间段的载客能 力 和载客概率,并转换为载客数量;载客热点预测模块,用于根据历史载客数量数据预测下一个时间段的载客热点;空载出租车巡游路径推荐模块,用于根据建立的空载出租车路径优化模型和载客热点,推荐巡游路径。本发明利用大数据,预测未来一段时间的载客热点区域,为空载出租车巡游路径推荐做准备,然后根据巡游成本最低化原则,为空载出租车推荐一条经过较多载客热点区域的通畅巡游路径。,下面是一种基于大数据挖掘的空载出租车辅助系统专利的具体信息内容。

1.一种基于大数据挖掘的空载出租车辅助系统,其特征在于,包括:
出租车数据采集,用于收集出租车大数据,所述出租车大数据包括车辆ID、车辆所处位置经纬度、车辆载客状态、车辆行驶速度信息;其中,车辆载客状态表示为:上车时间和载客状态或者下车时间和空载状态;
数据处理模块,用于对采集的出租车数据进行数据预处理后,将路网网格化,计算所有网格在每个时间段的载客能和载客概率,并转换为载客数量;
载客热点预测模块,用于根据历史载客数量数据预测下一个时间段的载客热点;
空载出租车巡游路径推荐模块,用于根据建立的空载出租车路径优化模型和载客热点,生成用于向空载出租车推荐的巡游路径;
所述空载出租车路径优化模型具体如下:
空载出租车路径优化模型的目标函数如下:
其中:N为空载车巡游起点网格与载客热点网格集合;α为交通阻碍系数; 为车Tk从起始点网格i到最终载客热点网格j的期望距离;S为一辆车的固定成本,K为所有出租车的数量,C为出租车单位距离的运输成本。
2.根据权利要求1所述的基于大数据挖掘的空载出租车辅助系统,其特征在于,所述数据处理模块中,路网网格化是对现有路网进行网格划分,划分的原则为满足一个网格内仅有一条机动车道路。
3.根据权利要求1所述的基于大数据挖掘的空载出租车辅助系统,其特征在于,所述数据处理模块中,时间段划分是以单位时间为周期,顺序划分时间段,所述时间段周期根据路网区域内出租车平均接客间隔时间确定。
4.根据权利要求1所述的基于大数据挖掘的空载出租车辅助系统,其特征在于,所述载客热点预测模块中,历史载客数量数据为预测时段前一时间段的出租车载客数量以及前一天、前一周同时段的出租车载客数量数据。
5.根据权利要求4所述的基于大数据挖掘的空载出租车辅助系统,其特征在于,所述载客热点预测模块中,将历史载客数量数据作为预测数据,设立三层卷积层的卷积神经网络,提取局部特征,输出路网网格的预测出租车载客数量。
6.根据权利要求5所述的基于大数据挖掘的空载出租车辅助系统,其特征在于,所述卷积神经网络包括输入层、三层卷积层和输出层,数据输入为三维矩阵,其中包含经纬度平的网格划分以及时间维度的时间段间隔,其中第一层卷积层包含5个3*3大小的卷积核,第二层包含10个5*5大小的卷积核,第三次包含5个3*3大小的卷积核。
7.根据权利要求1所述的基于大数据挖掘的空载出租车辅助系统,其特征在于,所述空载出租车路径优化模型约束条件采用以下条件中的一个或多个:
网格载客能力约束:每个网格可能经过的空载出租车车的数量不大于该网格的载客能力;
潜在收益网格约束:各载客热点网格的载客能力之和大于空载出租车数量;
距离约束:期望距离不大于城市出租车平均空载巡游时间和出租车平均时速之积。
8.根据权利要求1所述的基于大数据挖掘的空载出租车辅助系统,其特征在于,所述交通阻碍系数的取值如下:
α=1,道路通畅
α=1.3,道路拥挤
α=1.7,道路堵塞。

说明书全文

一种基于大数据挖掘的空载出租车辅助系统

技术领域

[0001] 本发明涉及人工智能技术,尤其涉及一种基于大数据挖掘的空载出租车辅助系统。

背景技术

[0002] 随着社会经济的发展,人们的出行需求不断增加,出租车凭借其便捷性、快速性在交通工具中占有重要地位。但由于乘客和出租车之间的信息交互程度低,出租车“载客难”,导致出租车空载率居高不下,出租车司机的经济收益降低。且近年来网约车的出现对出租车行业产生了巨大冲击,使得出租车空载率再次上升,我国各地出租车司机罢工抗议,严重影响了公众的日常出行。
[0003] 出租车高空载率不仅降低了出租车司机的经济收益,也严重影响了出租车行业的健康发展。为了降低出租车空载率,出租车司机无目的巡游,而由于无法精确掌握载客热点分布,只能凭借经验模糊判断,准确率低,无法有效地降低出租车空载率。目前我国少有研究或系统关注于空载出租车巡游路径的推荐,未发现一种有效的手段降低出租车空载率。

发明内容

[0004] 本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于大数据挖掘的空载出租车辅助系统。
[0005] 本发明解决其技术问题所采用的技术方案是:一种基于大数据挖掘的空载出租车辅助系统,包括:
[0006] 出租车数据采集,用于收集出租车大数据,所述出租车大数据包括车辆ID、车辆所处位置经纬度、车辆载客状态、车辆行驶速度信息,;其中,车辆载客状态表示为:上车时间和载客状态或者下车时间和空载状态;
[0007] 数据处理模块,用于对采集的出租车数据进行数据预处理后,将路网网格化,计算所有网格在每个时间段的载客能和载客概率,并转换为载客数量;
[0008] 载客热点预测模块,用于根据历史载客数量数据预测下一个时间段的载客热点;
[0009] 空载出租车巡游路径推荐模块,用于根据建立的空载出租车路径优化模型和载客热点,推荐巡游路径;
[0010] 所述空载出租车路径优化模型具体如下:
[0011] 空载出租车路径优化模型的目标函数如下:
[0012]
[0013] 其中:N为空载车巡游起点网格与载客热点网格集合;α为交通阻碍系数; 为车Tk从起始点网格i到最终载客热点网格j的期望距离;S为一辆车的固定成本,K为所有出租车的数量,C为出租车单位距离的运输成本。
[0014] 按上述方案,所述数据处理模块中,路网网格化是对现有路网进行网格划分,划分的原则为满足一个网格内仅有一条机动车道路。
[0015] 按上述方案,所述数据处理模块中,时间段划分是以单位时间为周期,顺序划分时间段,所述时间段周期根据路网区域内出租车平均接客间隔时间确定。
[0016] 按上述方案,所述载客热点预测模块中,历史载客数量数据为预测时段前一时间段的出租车载客数量以及前一天、前一周同时段的出租车载客数量数据。
[0017] 按上述方案,所述载客热点预测模块中,将历史载客数量数据作为预测数据,设立三层卷积层的卷积神经网络,提取局部特征,输出路网网格的预测出租车载客数量。
[0018] 按上述方案,所述卷积神经网络包括输入层、三层卷积层和输出层,数据输入为三维矩阵,其中包含经纬度平的网格划分以及时间维度的时间段间隔,其中第一层卷积层包含5个3*3大小的卷积核,第二层包含10个5*5大小的卷积核,第三次包含5个3*3大小的卷积核。
[0019] 按上述方案,所述空载出租车路径优化模型约束条件采用以下条件中的一个或多个:
[0020] 网格载客能力约束:每个网格可能经过的空载出租车车的数量不大于该网格的载客能力;
[0021] 潜在收益网格约束:各载客热点网格的载客能力之和大于空载出租车数量;
[0022] 距离约束:期望距离不大于城市出租车平均空载巡游时间和出租车平均时速之积;
[0023] 按上述方案,所述交通阻碍系数的取值如下:
[0024] α=1,道路通畅
[0025] α=1.3,道路拥挤
[0026] α=1.7,道路堵塞。
[0027] 本发明产生的有益效果是:本发明利用历史大数据,构建并训练卷积神经网络,预测未来一段时间的载客热点区域,为空载出租车巡游路径推荐做准备,然后根据巡游成本最低化原则,建立空载出租车路径优化模型,为空载出租车推荐一条经过较多载客热点区域的通畅巡游路径。附图说明
[0028] 下面将结合附图及实施例对本发明作进一步说明,附图中:
[0029] 图1是本发明实施例的结构示意图;
[0030] 图2是本发明实施例的神经网络结构示意图;
[0031] 图3是本发明实施例的方法流程图

具体实施方式

[0032] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0033] 如图1所示,一种基于大数据挖掘的空载出租车辅助系统,包括:
[0034] 出租车数据采集模块,用于收集出租车大数据,所述出租车大数据包括车辆ID、车辆所处位置经纬度、车辆载客状态、车辆行驶速度信息,;其中,车辆载客状态表示为:上车时间和载客状态或者下车时间和空载状态;
[0035] 本实施例中,收集了武汉、成都两市的交管部和滴滴公司共3.6亿余条出租车大数据,其中包括车辆ID、经纬度、载客状态、行驶速度等车辆信息。选用Hadoop生态体系对于海量的数据处理,并对超大规模数据集进行实时读写,随机对于数据的存储使用构建在分布式存储系统HDFS的非关系分布式数据库HBase。由于大数据因一些环境因素导致数据出错,利用拉伊达法则对数据预处理,将重复和位置信息错误的GPS数据筛除。
[0036] 数据处理模块,用于对采集的出租车数据进行数据预处理后,将路网网格化,计算所有网格在每个时间段的载客能力和载客概率,并转换为载客数量;
[0037] 载客热点预测模块,用于根据历史载客数量数据预测下一个时间段的载客热点;
[0038] 对历史载客数据使用基于Hadoop的分布式计算框架MapReduce,采用Mahout对分布式数据实现聚类算法,得到所需热点数据集。并将热点区域利用ArcGIS可视化,可以发现网格区域的载客数量随时间呈现规律性变化。由于卷积神经网络在时间序列方面的预测中表现较好,能有效挖掘大数据内部规律。因此构建卷积神经网络,挖掘大数据内在规律预测载客热点区域。
[0039] 历史载客数量数据为预测时段前一时间段(一个月)的出租车载客数量以及前一天、前一周同时段的出租车载客数量数据,将其作为预测数据,设立三层卷积层的卷积神经网络,如图2,提取局部特征,输出各路网网格的预测出租车载客数量。
[0040] 本发明建立的卷积神经网络包括输入层、三层卷积层和输出层,数据输入为三维矩阵,其中包含经纬度水平的网格划分以及时间维度的时间段间隔,其中第一层卷积层包含5个3*3大小的卷积核,第二层包含10个5*5大小的卷积核,第三次包含5个3*3大小的卷积核。
[0041] 该卷积神经网络采用输入-三层卷积层-输出结构,卷积层降低了网络的复杂度,减少权值数量;神经网络结构可以映射线性特征,而激活函数可以映射非线性特征,卷积神经网络能更好的提取其中的复杂特征。使用Keras+TensorFlow平台构造卷积神经网络并进行训练,使用GPU运算,大大加快的训练过程,能更快地调整其中的参数,更快地学习其中的规律。
[0042] 空载出租车巡游路径推荐模块,用于根据建立的空载出租车路径优化模型和载客热点,推荐巡游路径;
[0043] 所述空载出租车路径优化模型具体如下:
[0044] 空载出租车路径优化模型的目标函数如下:
[0045]
[0046] 其中:N为空载车巡游起点网格与载客热点网格集合;α为交通阻碍系数; 为车Tk从起始点网格i到最终载客热点网格j的期望距离;S为一辆车的固定成本,K为所有出租车的数量,C为出租车单位距离的运输成本。
[0047] 空载出租车路径优化模型约束条件如下:
[0048] 网格载客能力约束:每个网格可能经过的空载出租车车的数量不大于该网格的载客能力;
[0049] 潜在收益网格约束:各载客热点网格的载客能力之和大于空载出租车数量;
[0050] 距离约束:期望距离不大于城市出租车平均空载巡游时间和出租车平均时速之积;
[0051] 交通阻碍系数的取值如下:
[0052] α=1,道路通畅
[0053] α=1.3,道路拥挤
[0054] α=1.7,道路堵塞。
[0055] 该系数用于调节出租车单位距离的运输成本C。
[0056] 对于期望距离,
[0057] 1)根据目标函数得,优化路径为期望距离最短的路径,即出租车空载巡游成本最小的路径Wk=(Gi,g1k,g2k,……,gmk),gmk∈N-,Gi→gmk为空载出租车Tk行驶至潜在收益网格过程中所经过的网格;
[0058] 2)网格Gi为空载出租车起始点,Gi→gmk为空载出租车Tk行驶路径,定义Erk为出租车Tk在路径g1k→gmk的载客事件;
[0059] 3)E∞k为出租车Tk在此路径上不能载客的事件,出租车Tk的巡游路径的所有的可能性为Ωk={Erk∪E∞k}r,k∈m,
[0060] 4)空载出租车Tk在网格载客事件发生的概率计算公式如下:
[0061]
[0062] 5)空载出租车巡游过程中,可能在巡游路径中任意网格载客,也可能在潜在收益网格载客,则期望空载巡游距离,
[0063] 其中,d(gnk,g(n+1)k)为相邻网格gnk和g(n+1)k之间的距离。
[0064] 本实施例中,对该模型采用蚁群算法求解。也可采用其他遍历的方式求解。
[0065] 图3蚁群算法流程。
[0066] 1)Step1:nc←0(为搜索次数或迭代次数);每个τij和Δτij的初始化;将m只蚂蚁放置在n个顶点上;
[0067] 2)Step2:将每只蚂蚁的出发点放置在目前的解集中;将每只蚂蚁k(k=1,2,3,4........,m)按照概率 移至下一位置点j;将点j放置在目前的解集中;
[0068] 3)Step3:统计并计算每只蚂蚁搜索过的路径的长度Lk=(k=1,2,3,4........,m)并记录当前的最优解;
[0069] 4)Step4:按照更新方程修改轨迹强度;
[0070] 5)Step5:对每个边弧(i,j)置Δτij←0,nc←nc+1;
[0071] 6)Step6:如果nc没有达到预先设定的迭代次数,但是算法并无退化的现象,即找到解是相同的,则转Step2;
[0072] 7)Step7:输出当前最优解。
[0073] 本发明以目前所在位置为基础,根据预测热点区域,为出租车司机推荐最佳的巡游路径,并将其可视化供司机使用。
[0074] 应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈