首页 / 专利库 / 计算机网络 / 环境网络 / 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法

基于车辆轨迹语义分析和深度信念网络的轨迹预测方法

阅读:275发布:2024-02-15

专利汇可以提供基于车辆轨迹语义分析和深度信念网络的轨迹预测方法专利检索,专利查询,专利分析的服务。并且本 发明 请求 保护一种基于车辆轨迹语义分析和 深度信念网络 的轨迹预测方法,属于智能交通分析领域。首先,获取数据源。其次,交通卡口 关联性分析 。根据轨迹集中交通卡口的上下文关系,使用统计概率模型构建关联空间,按照关联空间中的相对 位置 度量交通卡口之间的关联性;第三,根据新的轨迹 时空 关联向量集挖掘轨迹中的用户行车模式,训练DBN网络形成特征提取模型;第四,根据轨迹特征建立回归 预测模型 ,利用处理后的交通轨迹特征集,对未来轨迹进行回归预测,同时采用权重聚类对结果进行优化,最终实现对车辆轨迹的精确预测。本发明有效改善了实际交通环境中复杂的路网关系对轨迹预测的负面影响,提高了预测效率。,下面是基于车辆轨迹语义分析和深度信念网络的轨迹预测方法专利的具体信息内容。

1.一种基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,包括以下步骤:
获取数据源的步骤:提取车辆原始信息中的车牌号、过车时间、卡口编码作为表征车辆轨迹信息的属性,具体是将每一辆车按过车时间顺序,将卡口编号排列作为其轨迹序列,所述车辆原始信息是通过卡口信息采集装置对行驶中车辆进行采集得到的;
卡口上下文分析的步骤:引入词嵌入思想,即利用单词在句子中的上下文关系来分析单词之间的关联性,通过使用滑动窗口对车辆的卡口轨迹序列数据进行卡口在轨迹中的上下文关系提取,建立卡口语料库,卡口语料库具有反映不同卡口在路网中的相关性的能,卡口在轨迹数据中的色相似度用卡口在高维空间中对应的点之间的距离衡量,最后根据相似度构建轨迹节点的向量空间,实现运用节点向量集表征节点间的交通时空关系;
提取用户轨迹特征的步骤:根据轨迹节点向量之间表现出的交通时空关系,对用户的历史轨迹数据进行数据分析,使用DBN深度信念网络对用户的轨迹向量进行逐层训练,将大量用户的历史轨迹集中表现出来的共性特征提取出来,作为后续进行轨迹预测的依据;
预测与分析步骤,根据轨迹特征建立回归预测模型,利用提取到的用户轨迹特征作为预测的依据,利用线性回归的预测思想生成预测结果;同时,同时考虑到交通轨迹交叉多、相似度高的特性,采用权重聚类对结果进行优化。
2.根据权利要求1所述的基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,所述获取数据源后还包括预处理原始数据的步骤:即对数据源重复数据、无效数据进行清洗。
3.根据权利要求1所述的基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,所述卡口上下文分析的步骤具体包括:
S21:定义交通卡口间的关联性;使用统计概率模型来定义关联性,取轨迹为数据集中的第i条车辆轨迹,n为该轨迹包含的交通卡
口的数量,c1,c2,…,cn为该车按时间顺序依次经过的交通卡口one-hot向量,T={t1,t2,…,tm}为卡口语料库,m为数据集中轨迹的数量,卡口c与轨迹中其他卡口关联性的计算公式为:
其中Context(c)表示卡口c的前后n-1个卡口,即Context(ci)={ci-n+1,ci-n+2,…,ci-1,ci+1,…,ci+n-2,ci+n-1};
S22:构建向量空间;构造一个s维向量空间 使得每一个ci都可以在空间 有唯一的映射向量 并满足:
向量空间中与卡口 关联性最强的就是和它同时出现在一条轨迹中的卡口,即由此可以将卡口语料库T={t1,t2,…,tm}经空间嵌入后转换为
其中 是交通卡口在空间
的向量表示;其中 n是轨迹中卡口数量, 是交
通卡口ci在空间 的向量表示。
4.根据权利要求1所述的基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,所述提取用户轨迹特征的步骤具体包括:
S31:结合交通轨迹的时空关联性和轨迹模式,引入受限玻尔兹曼机RBM模型,该模型通过一个能量函数E=(v,h;θ)定义了v,h上的概率分布,假设它是一个二进制RBM,它可以写成:
其中,可见变量v通过无向加权连接与随机隐藏单元h连接,θ=(w,b,a)是参数集,wij是连接可见层单元i和隐藏层j的权重矩阵,而bi和aj是它们的偏置,可见层与隐藏层的神经元数量用|V|和|H|来表示,当v或h固定时,条件概率可以计算如下:
其中, 是Sigmoid函数,参数集θ=(w,b,a)中的参数可以使用对
比散度进行有效地学习;
S32:考虑到交通轨迹数据的高复杂性,堆叠多个RBM形成一个DBN,通过训练一系列RBM来训练DBN的关键思想是,由RBM学习的参数θ是由p(v|h,θ)和先验分布p(h|θ)共同决定的。
因此,生成可见层的概率可写为:
在从RBM学习θ之后,也就得到了p(v|h,θ),并且p(h|θ)可以被一个连续的RBM替代,该RBM将前一个RBM的隐藏层视为可见层,这样,DBN就可以作为一个无监督的特征学习方法。
5.根据权利要求1所述的基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,所述预测和分析过程,主要分为以下两个步骤:
S41:使用S3中得到交通轨迹特征集进行回归预测分析,得到最终的预测结果,轨迹特征集 其中,p代表特征提取网络的顶层输出,m为该层网络的神经元
个数;再根据带标签的轨迹数据利用回归模型训练得到权重矩阵集合W={w1,w2,…,wm},其|C|×k
中,wi∈R 为预测模型对第i条轨迹的权重矩阵;
S42:采用权重聚类的方法对结果进行优化,通过对W进行无监督训练,得到聚类后的权重集合 其中,s是聚类的类别数,再找出 中包含每一辆车对应的
轨迹样本权重wi最多的类 作为该车的回归预测权重值;最后,进行轨迹预测时,将该轨迹的特征向量 与车辆对应的权重矩阵 进行回归预测即得到最后结果。

说明书全文

基于车辆轨迹语义分析和深度信念网络的轨迹预测方法

技术领域

[0001] 本发明属于智能交通数据分析领域,涉及用户车辆历史轨迹分析研究,是一种基于车辆轨迹数据分析的轨迹预测方法。

背景技术

[0002] 随着城市的迅速发展,交通系统面临的问题越来越严重,用户每天产生的交通数据也越来越多,为提高用户的出行效率,人们不断采用新的措施,如分析道路拥挤程度,分析车辆行驶轨迹等来解决交通道路拥挤带来的问题。
[0003] 近年来,对车辆的行驶轨迹的分析研究受到了越来越多相关的企业的关注,当前轨迹数据分析的研究方向主要包括位置预测、兴趣挖掘、路径规划等。其中,车辆位置预测技术的发展,对改善用户体验和提高服务质量起到了重要的作用。车辆轨迹的预测主要有两种类型:基于个人移动模式的预测和基于群体移动模式的预测。基于个人移动模式的预测都是基于单个用户的行为习惯和历史轨迹来训练模型并预测未来的位置,基于群体移动模式的预测则是运用大量用户数据,分析特定群体所具有的移动模式,构建一个适用于这个群体的预测模型。由于基于个人移动模式的轨迹预测无法体现交通路网和其他用户对用户出行轨迹的影响,因此,基于群体模式的轨迹预测得到了更广泛的关注。
[0004] 然而,现有的轨迹数据分析方案主要面临两大问题:轨迹数据的管理和轨迹数据挖掘。由于位置信息的时空复杂性,交通数据采集器属性不统一以及存在数据缺失的现象,使得高效地表示和管理轨迹数据成为支撑深度轨迹分析的关键基础;此外,由于大量用户轨迹所表现出来的高复杂性和模式的多样性,给构建预测模型带来了许多困难。因此,解决模型构建过程中的数据管理问题和提升模型应对大量复杂数据的能对预测模型的构建十分重要。为了解决上述不足,本发明针对传统轨迹数据表示方法无法体现轨迹的时空特性和数据缺失的问题,通过引入自然语言处理领域中的词嵌入(Word Embedding)的思想,利用实际轨迹中节点存在的上下文关系,使用相对位置表征相似程度,构建轨迹节点的向量空间,达到运用节点向量集表征节点间的交通时空关系的目的;针对轨迹在节点集合中的强稀疏性特点,考虑到一般特征学习方法对新特征的泛化能力不足,本文利用深度信念网络(Deep Belief Network,DBN)较强的无监督特征学习能力,达到提取轨迹局部空间特性的目的;针对轨迹的时空特性,本文采用线性回归的预测思路,用当前轨迹集在路网特征空间中的线性组合来表示预测轨迹,并针对交通轨迹的同一个目的地下路径存在多样性的问题,采用权重聚类的方法对结果进行了优化。

发明内容

[0005] 本发明旨在解决以上现有技术的问题。提出了一种解决客观存在的路径多样性的问题,提高了预测的准确度的基于车辆轨迹语义分析和深度信念网络的轨迹预测方法。本发明的技术方案如下:
[0006] 一种基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其包括以下步骤:
[0007] 获取数据源的步骤:提取车辆原始信息中的车牌号、过车时间、卡口编码作为表征车辆轨迹信息的属性,具体是将每一辆车按过车时间顺序,将卡口编号排列作为其轨迹序列,所述车辆原始信息是通过卡口信息采集装置对行驶中车辆进行采集得到的;
[0008] 卡口上下文分析的步骤:引入词嵌入思想,即利用单词在句子中的上下文关系来分析单词之间的关联性,通过使用滑动窗口对车辆的卡口轨迹序列数据进行卡口在轨迹中的上下文关系提取,建立卡口语料库,卡口语料库具有反映不同卡口在路网中的相关性的能力,卡口在轨迹数据中的色相似度用卡口在高维空间中对应的点之间的距离衡量,最后根据相似度构建轨迹节点的向量空间,实现运用节点向量集表征节点间的交通时空关系;
[0009] 提取用户轨迹特征的步骤:根据轨迹节点向量之间表现出的交通时空关系,对用户的历史轨迹数据进行数据分析,使用DBN深度信念网络对用户的轨迹向量进行逐层训练,将大量用户的历史轨迹集中表现出来的共性特征提取出来,作为后续进行轨迹预测的依据;
[0010] 预测与分析步骤,根据轨迹特征建立回归预测模型,利用提取到的用户轨迹特征作为预测的依据,利用线性回归的预测思想生成预测结果;同时,同时考虑到交通轨迹交叉多、相似度高的特性,采用权重聚类对结果进行优化。
[0011] 进一步的,所述获取数据源后还包括预处理原始数据的步骤:即对数据源重复数据、无效数据进行清洗。
[0012] 进一步的,所述卡口上下文分析的步骤具体包括:
[0013] S21:定义交通卡口间的关联性;使用统计概率模型来定义关联性,取轨迹为数据集中的第i条车辆轨迹,n为该轨迹包含的交通卡口的数量,c1,c2,…,cn为该车按时间顺序依次经过的交通卡口one-hot向量,T={t1,t2,…,tm}为卡口语料库,m为数据集中轨迹的数量,卡口c与轨迹中其他卡口关联性的计算公式为:
[0014]
[0015] 其中Context(c)表示卡口c的前后n-1个卡口,即Context(ci)={ci-n+1,ci-n+2,…,ci-1,ci+1,…,ci+n-2,ci+n-1};
[0016] S22:构建向量空间;构造一个s维向量空间 使得每一个ci都可以在空间有唯一的映射向量 并满足:
[0017]
[0018] 向量空间中与卡口 关联性最强的就是和它同时出现在一条轨迹中的卡口,即由此可以将卡口语料库T={t1,t2,…,tm}经空间嵌入后转换为其中 是交通卡口在空间
的向量表示;其中 n是轨迹中卡口数量, 是交
通卡口ci在空间 的向量表示。
[0019] 进一步的,所述提取用户轨迹特征的步骤具体包括:
[0020] S31:结合交通轨迹的时空关联性和轨迹模式,引入受限玻尔兹曼机RBM模型,该模型通过一个能量函数E=(v,h;θ)定义了v,h上的概率分布,假设它是一个二进制RBM,它可以写成:
[0021]
[0022] 其中,可见变量v通过无向加权连接与随机隐藏单元h连接,θ=(w,b,a)是参数集,wij是连接可见层单元i和隐藏层j的权重矩阵,而bi和aj是它们的偏置,可见层与隐藏层的神经元数量用|V|和|H|来表示,当v或h固定时,条件概率可以计算如下:
[0023]
[0024]
[0025] 其中, 是Sigmoid函数,参数集θ=(w,b,a)中的参数可以使用对比散度进行有效地学习;
[0026] S32:考虑到交通轨迹数据的高复杂性,堆叠多个RBM形成一个DBN,通过训练一系列RBM来训练DBN的关键思想是,由RBM学习的参数θ是由p(v|h,θ)和先验分布p(h|θ)共同决定的。因此,生成可见层的概率可写为:
[0027]
[0028] 在从RBM学习θ之后,也就得到了p(v|h,θ),并且p(h|θ)可以被一个连续的RBM替代,该RBM将前一个RBM的隐藏层视为可见层,这样,DBN就可以作为一个无监督的特征学习方法。
[0029] 进一步的,所述预测和分析过程,主要分为以下两个步骤:
[0030] S41:使用S3中得到交通轨迹特征集进行回归预测分析,得到最终的预测结果,轨迹特征集 其中,p代表特征提取网络的顶层输出,m为该层网络的神经元个数;再根据带标签的轨迹数据利用回归模型训练得到权重矩阵集合W={w1,w2,…,wm},其中,wi∈R|C|×k为预测模型对第i条轨迹的权重矩阵;
[0031] S42:采用权重聚类的方法对结果进行优化,通过对W进行无监督训练,得到聚类后的权重集合 其中,s是聚类的类别数,再找出 中包含每一辆车对应的轨迹样本权重wi最多的类 作为该车的回归预测权重值;最后,进行轨迹预测时,将该轨迹的特征向量 与车辆对应的权重矩阵 进行回归预测即得到最后结果。
[0032] 本发明的优点及有益效果如下:
[0033] 本发明对轨迹节点向量化、提取轨迹集的特征、利用线性回归进行预测。其中,提取轨迹集的特征和利用线性回归进行预测是轨迹预测关键的两个步骤,目的分别是利用数据的共性发现影响用户轨迹变化的基础元素集和针对个体的差异进行轨迹预测,预测模型的最终目的是针对目标用户,基于其已有车辆轨迹,分析其下一个最有可能出现的地点。
[0034] 首先运用词嵌入的思想,达到运用相关向量空间的向量表示轨迹节点的目的,为提取轨迹特征的有效性提供了坚实的基础;其次运用DBN较强的泛化能力和特征学习能力,学习轨迹向量集中较为复杂的特征,得到较为精准的轨迹特征;最后,在进行回归预测时,采用权值聚类的思想,解决客观存在的路径多样性的问题,提高了预测的准确度。附图说明
[0035] 图1是本发明提供优选实施例基于车辆轨迹语义分析和深度信念网络的轨迹预测方法的总体流程图
[0036] 图2是本发明各部分模型示意图;
[0037] 图3是本发明算法流程图。

具体实施方式

[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
[0039] 本发明解决上述技术问题的技术方案是:
[0040] 如图1是本发明总体的流程图,包括数据获取,卡口上下文分析模,特征提取模块,预测分析模块共四大模块。本发明的详细实施过程具体如下,包括四个步骤:
[0041] S1:获取数据源。数据源的获取可以直接从现有的交通大数据开源平台或者从交通管理部获取。其中包括用户的车辆信息及其在各个卡口的过车信息集合。
[0042] S2:卡口上下文分析。根据交通轨迹数据的时空特性,本发明利用词嵌入思想,通过构建交通卡口向量空间对交通卡口进行时空关联性分析
[0043] S3:轨迹特征提取。根据轨迹中可能存在的一些特定的行车模式,构建深层特征提取模型。该模型能够适应轨迹卡口集合中的强稀疏性特点,并针对新特征具有很好的泛化能力,能够较为完整地发现轨迹中的行车模式。
[0044] S4:预测和分析过程。根据轨迹特征建立回归预测模型,利用处理后的交通轨迹特征,对未来轨迹进行回归预测,同时,针对交通轨迹的同一个目的地下路径存在多样性的问题,采用权重聚类对结果进行优化。
[0045] 下面将对各个部分进行详细介绍,如图2所示,上述步骤S1获取数据源。主要分为以下两个步骤:
[0046] S11:获取数据。各路口在不同时间点的过车数据,包括过车车牌,路口名称与位置。
[0047] S12:预处理原始数据。对数据源重复数据、无效数据进行清洗,有利于数据分析。
[0048] 上述步骤S2中的卡口上下文分析。具体可以分为以下2个步骤。
[0049] S21:定义交通卡口间的关联性。将使用统计概率模型来定义关联性,取轨迹卡口c与轨迹中其他卡口关联性的计算公式为:
[0050]
[0051] 其中Context(c)表示卡口c的前后n-1个卡口,即Context(ci)={ci-n+1,ci-n+2,…,ci-1,ci+1,…,ci+n-2,ci+n-1}。
[0052] S22:构建向量空间。通过上述统计概率模型的描述,我们可以构造一个s维向量空间 使得每一个ci都可以在空间 有唯一的映射向量 并满足:
[0053]
[0054] 向量空间中与卡口 关联性最强的就是和它同时出现在一条轨迹中的卡口,即由此得到空间嵌入后的轨迹集 其中n是轨迹中卡口数量, 是交通卡口ci在空间 的
向量表示。
[0055] 上述步骤S3中对用户轨迹进行特征提取,主要分为以下两个步骤:
[0056] S31:结合交通轨迹的时空关联性和轨迹模式,引入受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)模型,该模型通过一个能量函数E=(v,h;θ)定义了v,h上的概率分布。假设它是一个二进制RBM,它可以写成:
[0057]
[0058] 其中,θ=(w,b,a)是参数集,wij是连接可见层单元i和隐藏层j的权重矩阵,而bi和aj是它们的偏置。可见层与隐藏层的神经元数量用|V|和|H|来表示。当v或h固定时,条件概率可以计算如下:
[0059]
[0060]
[0061] 其中, 是Sigmoid函数,参数集θ=(w,b,a)中的参数可以使用对比散度进行有效地学习,达到对输入的轨迹数据进行有效的特征提取的目的。
[0062] S32:考虑到交通轨迹数据的高复杂性,堆叠多个RBM形成一个DBN。通过训练一系列RBM来训练DBN的关键思想是,由RBM学习的参数θ是由p(v|h,θ)和先验分布p(h|θ)共同决定的。因此,生成可见层的概率可写为:
[0063]
[0064] 在从RBM学习θ之后,也就得到了p(v|h,θ),并且p(h|θ)可以被一个连续的RBM替代,该RBM将前一个RBM的隐藏层视为可见层,这样,DBN就可以作为一个无监督的特征学习方法。
[0065] 上述步骤S4,预测和分析过程。主要分为以下两个步骤:
[0066] S41:使用S3中得到交通轨迹特征集进行回归预测分析,得到最终的预测结果。轨迹特征集 其中,p代表特征提取网络的顶层输出,m为该层网络的神经元个数;再根据带标签的轨迹数据利用回归模型训练得到权重矩阵集合W={w1,w2,…,wm},其中,wi∈R|C|×k为预测模型对第i条轨迹的权重矩阵。
[0067] S42:针对交通轨迹的同一个目的地下路径存在多样性的问题,采用权重聚类的方法对结果进行了优化。通过对W进行无监督训练,得到聚类后的权重集合其中,s是聚类的类别数,再找出 中包含每一辆车对应的轨迹样本权重wi最多的类 作为该车的回归预测权重值;最后,进行轨迹预测时,将该轨迹的特征向量 与车辆对应的权重矩阵 进行回归预测即得到最后结果。
[0068] 本发明针对智能交通中交通轨迹卡口序列的高时空复杂度和数据稀疏性问题,提出了一种基于交通轨迹上下文分析和特征提取的轨迹预测方法。使用卡口上下文分析卡口间的时空关联性,构建向量空间,使用卡口向量表征卡口;利用DBN分析轨迹向量集中的用户行为模式和行为特征,准确把握数据特征;进行回归预测时,采用权值聚类的思想,解决客观存在的路径多样性的问题,提高了预测的准确度。
[0069] 以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈