首页 / 专利库 / 人工智能 / 机器学习 / 监督学习 / 生成自动驾驶策略的方法和装置

生成自动驾驶策略的方法和装置

阅读:355发布:2020-05-08

专利汇可以提供生成自动驾驶策略的方法和装置专利检索,专利查询,专利分析的服务。并且本 申请 公开了生成自动驾驶策略的方法和装置。方法的一具体实施方式包括:测量本车的状态信息以及周围场景信息,周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息;从预定时间段内的障碍车的状态信息中,确定障碍车的行驶轨迹;基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略。该实施方式可以从本车和周围车辆的行驶信息中学习驾驶策略,学习得到的驾车策略适用的道路和场景更加广泛。,下面是生成自动驾驶策略的方法和装置专利的具体信息内容。

1.一种生成自动驾驶策略的方法,其特征在于,所述方法包括:
测量本车的状态信息以及周围场景信息,所述周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息;
从预定时间段内的所述障碍车的状态信息中,确定障碍车的行驶轨迹;
基于所述预定时间段内的所述障碍车的状态信息和所述障碍车的行驶轨迹,确定第一映射关系,包括:从预定时间段内的所述障碍车的状态信息和所述障碍车的行驶轨迹中,确定障碍车的第二映射关系,所述第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系;将所述障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段;从所述障碍车的轨迹片段中筛选障碍车的有效轨迹片段;采用无监督的学习方法,学习第三映射关系,所述第三映射关系为所述障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系;基于第二映射关系和第三映射关系,采用监督学习的方法确定第一映射关系;所述第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;
基于所述第一映射关系、所述道路结构信息、所述本车的状态信息和所述本车的交通场景信息,生成本车的自动驾驶策略。
2.根据权利要求1所述的方法,其特征在于,所述将所述障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段包括:
遍历所述障碍车的行驶轨迹中的所有轨迹点和轨迹时间长度,确定轨迹片段。
3.根据权利要求1所述的方法,其特征在于,所述从所述障碍车的轨迹片段中,筛选障碍车的有效轨迹片段包括:
采用评估函数对所述轨迹片段进行评估;
响应于评估值大于阈值,将所述轨迹片段确定为有效轨迹片段。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述基于所述第一映射关系、所述道路结构信息、所述本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略包括:
将所述第一映射关系中对应本车的交通场景信息的障碍车的驾驶行为信息,确定为本车的驾驶行为信息;
建立所述第三映射关系的逆映射关系,得到第四映射关系;
将所述第四映射关系中对应本车驾驶行为信息的障碍车的行驶轨迹,确定为本车的行驶轨迹;
基于预先建立的自动驾驶车辆的行驶性能指标函数、所述道路结构信息、所述本车的状态信息和所述本车的交通场景信息,对所述本车的行驶轨迹进行优化,得到本车的驾驶策略。
5.一种生成自动驾驶策略的装置,其特征在于,所述装置包括:
信息测量单元,用于测量本车的状态信息以及周围场景信息,所述周围场景信息包括:
障碍车的状态信息、道路结构信息和本车的交通场景信息;
行驶轨迹确定单元,用于从预定时间段内的所述障碍车的状态信息中,确定障碍车的行驶轨迹;
映射关系确定单元,用于基于所述预定时间段内的所述障碍车的状态信息和所述障碍车的行驶轨迹,确定第一映射关系,所述所述映射关系确定单元包括:场景轨迹映射单元,用于从预定时间段内的所述障碍车的状态信息和所述障碍车的行驶轨迹中,确定障碍车的第二映射关系,所述第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系;轨迹片段切分单元,用于将所述障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段;有效片段筛选单元,用于从所述障碍车的轨迹片段中,筛选障碍车的有效轨迹片段;映射关系学习单元,用于采用无监督的学习装置,学习第三映射关系,所述第三映射关系为所述障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系;学习映射关系单元,用于基于第二映射关系和第三映射关系,采用监督学习的装置确定第一映射关系;所述第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;
驾驶策略生成单元,用于基于所述第一映射关系、所述道路结构信息、所述本车的状态信息和所述本车的交通场景信息,生成本车的自动驾驶策略。
6.根据权利要求5所述的装置,其特征在于,所述轨迹片段切分单元进一步用于:
遍历所述障碍车的行驶轨迹中的所有轨迹点和轨迹时间长度,确定轨迹片段。
7.根据权利要求5所述的装置,其特征在于,所述有效片段筛选单元进一步用于:
采用评估函数对所述轨迹片段进行评估;
响应于评估值大于阈值,将所述轨迹片段确定为有效轨迹片段。
8.根据权利要求5-7任意一项所述的装置,其特征在于,所述驾驶策略生成单元包括:
行为信息确定单元,用于将所述第一映射关系中对应本车的交通场景信息的障碍车的驾驶行为信息,确定为本车的驾驶行为信息;
逆映射关系建立单元,用于建立所述第三映射关系的逆映射关系,得到第四映射关系;
确定行驶轨迹单元,用于将所述第四映射关系中对应本车驾驶行为信息的障碍车的行驶轨迹,确定为本车的行驶轨迹;
行驶轨迹优化单元,用于基于预先建立的自动驾驶车辆的行驶性能指标函数、所述道路结构信息、所述本车的状态信息和所述本车的交通场景信息,对所述本车的行驶轨迹进行优化,得到本车的驾驶策略。
9.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任意一项所述的生成自动驾驶策略的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任意一项所述的生成自动驾驶策略的方法。
11.一种自动驾驶车辆,其特征在于,包括如权利要求5-8任意一项所述的生成自动驾驶策略的装置。

说明书全文

生成自动驾驶策略的方法和装置

技术领域

[0001] 本申请涉及计算机技术领域,具体涉及计算机网络技术领域,尤其涉及生成自动驾驶策略的方法和装置。

背景技术

[0002] 自动决策功能是自动驾驶车辆的必备功能,其基于感知得到的周围障碍物的状态和相应的道路结构,选择相应的驾驶策略,保证行驶的安全性和舒适性。由于实际行驶过程中,道路结构多样,交通场景瞬息万变,如何在各种复杂场景中做出正确的决策,以保证行驶的安全性和舒适性,是目前需要解决的问题。
[0003] 现有的自动决策方案有两种:一是专家系统方案,即基于熟练驾驶员的经验,提取相应的自动驾驶规则,利用车辆所处交通场景和道路结构触发相应的规则实现自动决策;二是机器学习方案,采集熟练驾驶员的驾驶数据,利用机器学习模型学习交通场景和道路结构与驾驶员决策的映射关系。
[0004] 然而,专家系统方案提取的规则难以覆盖所有的交通场景,特别是当覆盖的交通场景越来越多时,如何保证规则之间的正交不冲突是一项繁重的工程;而机器学习方案,则要求数据必须覆盖足够的交通场景和道路结构,当遇到未曾学习的场景和道路时,难以保证决策策略的正确性和驾驶的安全性。因此,现有的自动决策方案适用于简单的交通场景,难以应用于道路结构复杂、瞬息万变的交通场景。发明内容
[0005] 本申请的目的在于提出一种改进的生成自动驾驶策略的方法和装置,来解决以上背景技术部分提到的技术问题。
[0006] 第一方面,本申请实施例提供了一种生成自动驾驶策略的方法,方法包括:测量本车的状态信息以及周围场景信息,周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息;从预定时间段内的障碍车的状态信息中,确定障碍车的行驶轨迹;基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略。
[0007] 在一些实施例中,基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系包括:从预定时间段内的障碍车的状态信息和障碍车的行驶轨迹中,确定障碍车的第二映射关系,第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系;将障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段;从障碍车的轨迹片段中筛选障碍车的有效轨迹片段;采用无监督的学习方法,学习第三映射关系,第三映射关系为障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系;基于第二映射关系和第三映射关系,采用监督学习的方法确定第一映射关系。
[0008] 在一些实施例中,将障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段包括:遍历障碍车的行驶轨迹中的所有轨迹点和轨迹时间长度,确定轨迹片段。
[0009] 在一些实施例中,从障碍车的轨迹片段中,筛选障碍车的有效轨迹片段包括:采用评估函数对轨迹片段进行评估;响应于评估值大于阈值,将轨迹片段确定为有效轨迹片段。
[0010] 在一些实施例中,基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略包括:将第一映射关系中对应本车的交通场景信息的障碍车的驾驶行为信息,确定为本车的驾驶行为信息;建立第三映射关系的逆映射关系,得到第四映射关系;将第四映射关系中对应本车驾驶行为信息的障碍车的行驶轨迹,确定为本车的行驶轨迹;基于预先建立的自动驾驶车辆的行驶性能指标函数、道路结构信息、本车的状态信息和本车的交通场景信息,对本车的行驶轨迹进行优化,得到本车的驾驶策略。
[0011] 第二方面,本申请实施例提供了一种生成自动驾驶策略的装置,装置包括:信息测量单元,用于测量本车的状态信息以及周围场景信息,周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息;行驶轨迹确定单元,用于从预定时间段内的障碍车的状态信息中,确定障碍车的行驶轨迹;映射关系确定单元,用于基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;驾驶策略生成单元,用于基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略。
[0012] 在一些实施例中,映射关系确定单元包括:场景轨迹映射单元,用于从预定时间段内的障碍车的状态信息和障碍车的行驶轨迹中,确定障碍车的第二映射关系,第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系;轨迹片段切分单元,用于将障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段;有效片段筛选单元,用于从障碍车的轨迹片段中,筛选障碍车的有效轨迹片段;映射关系学习单元,用于采用无监督的学习装置,学习第三映射关系,第三映射关系为障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系;学习映射关系单元,用于基于第二映射关系和第三映射关系,采用监督学习的装置确定第一映射关系。
[0013] 在一些实施例中,轨迹片段切分单元进一步用于:遍历障碍车的行驶轨迹中的所有轨迹点和轨迹时间长度,确定轨迹片段。
[0014] 在一些实施例中,有效片段筛选单元进一步用于:采用评估函数对轨迹片段进行评估;响应于评估值大于阈值,将轨迹片段确定为有效轨迹片段。
[0015] 在一些实施例中,驾驶策略生成单元包括:行为信息确定单元,用于将第一映射关系中对应本车的交通场景信息的障碍车的驾驶行为信息,确定为本车的驾驶行为信息;逆映射关系建立单元,用于建立第三映射关系的逆映射关系,得到第四映射关系;确定行驶轨迹单元,用于将第四映射关系中对应本车驾驶行为信息的障碍车的行驶轨迹,确定为本车的行驶轨迹;行驶轨迹优化单元,用于基于预先建立的自动驾驶车辆的行驶性能指标函数、道路结构信息、本车的状态信息和本车的交通场景信息,对本车的行驶轨迹进行优化,得到本车的驾驶策略。
[0016] 第三方面,本申请实施例提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上任意一项生成自动驾驶策略的方法。
[0017] 第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上任意一项生成自动驾驶策略的方法。
[0018] 第五方面,本申请实施例提供了一种自动驾驶车辆,包括如上任意一项的生成自动驾驶策略的装置。
[0019] 本申请实施例提供的生成自动驾驶策略的方法和装置,首先测量本车的状态信息以及周围场景信息,周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息;之后,从预定时间段内的障碍车的状态信息中,确定障碍车的行驶轨迹;之后,基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略。本实施例生成的本车的驾驶策略,可以从本车和周围车辆的行驶信息中学习驾驶策略,增加了驾驶员样本、交通场景样本和道路结构样本,扩充了学习空间,学习得到的驾车策略适用的道路和场景将更加广泛,并且在本车未曾学习的场景下,由于本车和周围车辆行驶道路结构相同,交通场景相似,通过学习周围车辆的方式可以很容易学习到适合自身的驾驶策略和行驶轨迹,保证策略的正确性和行车的安全性。附图说明
[0020] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0021] 图1是基于本申请的生成自动驾驶策略的方法的一个实施例的示意性流程图
[0022] 图2是基于本申请的确定第一映射关系的方法的一个实施例的示意性流程图;
[0023] 图3示出了基于图2中的第一映射关系生成自动驾驶策略的方法的一个实施例的示意性流程图;
[0024] 图4是基于本申请实施例的生成自动驾驶策略的方法的一个应用场景的示例性流程图;
[0025] 图5是基于本申请的生成自动驾驶策略的装置的一个实施例的示例性结构图;
[0026] 图6是适于用来实现本申请实施例的终端设备或服务器计算机系统的结构示意图。

具体实施方式

[0027] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0028] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0029] 自动驾驶车辆的实现从技术上通常被分为三层:感知层、决策层和控制层。其中感知层通过激光雷达、毫米波雷达、摄像头和GPS等传感器,测量本车的状态信息以及周围场景信息,例如障碍物的状态等客观信息(包括位置、速度和朝向等)、道路结构信息和本车的交通场景信息;而决策层则是基于感知层测量得到的本车的状态信息和周围场景信息,决定本车采取何种策略(如左右换道、避让、加减速等)及相应的行驶轨迹才能安全舒适地行驶到目的地;控制层则以决策轨迹作为下游控制输入,操纵刹车度和方向盘,使得车辆按既定轨迹行驶。
[0030] 作为自动驾驶车辆的核心层,决策层需要考虑本车的状态信息和周围障碍物的状态信息、道路结构信息、目标位置、可行的策略集以及采取策略后造成的结果等,从中选择最为安全和舒适的策略作为决策。
[0031] 图1示出了基于本申请的生成自动驾驶策略的方法的一个实施例的流程100。该生成自动驾驶策略的方法包括:
[0032] 在步骤110中,测量本车的状态信息以及周围场景信息,周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息。
[0033] 在本实施例中,自动驾驶车辆的感知层通过激光雷达、毫米波雷达、摄像头和全球定位测量仪等传感器,测量本车的状态信息以及本车的周围场景信息,周围场景信息包括位于本车周围的障碍物的状态信息、道路结构信息和本车的交通场景信息。其中,状态信息可以包括位置信息、速度信息和朝向信息等。
[0034] 这里的障碍物,是指位于本车的周围且阻碍车辆行驶的物体。例如,车辆、行人、隔离带、指示标牌等。障碍车是指位于本车的周围且行驶路线与本车一致或类似、可供本车学习的车辆。道路结构是道路的结构,可以包括道路上的车道、隔离带、路肩、路口、人行横道、各种道路指示标志以及指示标牌等。交通场景信息,包括周围存在的车辆、行人、红绿灯、站点等。
[0035] 在步骤120中,从预定时间段内的障碍车的状态信息中,确定障碍车的行驶轨迹。
[0036] 在本实施例中,预定时间段可以为预先设定的时间段,可以获取该时间段内的障碍车的状态信息,以便作为生成自动驾驶策略的依据。例如,可以获取当前时间之前2分钟内的障碍车的状态信息。
[0037] 在获取预定时间段内的障碍车的状态信息之后,可以基于障碍车的位置、速度和朝向等,确定障碍车的行驶轨迹。
[0038] 在步骤130中,基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系。
[0039] 在本实施例中,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系。在这里,可以基于本车的交通场景信息以及障碍车的状态信息,确定障碍车的交通场景信息;基于障碍车的行驶轨迹,学习到障碍车的驾驶行为信息;将位于同一时间点的障碍车的交通场景信息和障碍车的驾驶行为信息相对应,就可以得到第一映射关系。
[0040] 在步骤140中,基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略。
[0041] 在本实施例中,在得到第一映射关系之后,可以从第一映射关系中,查询对应当前本车的交通场景信息的驾驶行为信息,并将该驾驶行为信息结合道路结构信息、本车的状态信息以及本车的交通场景信息,生成本车的自动驾驶策略。具体地,可以预先设置模型、函数或算法,将该驾驶行为信息结合道路结构信息、本车的状态信息以及本车的交通场景信息,生成本车的自动驾驶策略。
[0042] 本申请的上述实施例提供的生成自动驾驶策略的方法,可以从本车和周围车辆的行驶信息中学习驾驶策略,增加了驾驶员样本、交通场景样本和道路结构样本,扩充了学习空间,学习得到的驾车策略适用的道路和场景更加广泛,并且在本车未曾学习的场景下,由于本车和周围车辆行驶道路结构相同,交通场景相似,通过学习周围车辆的驾驶策略,可以很容易的学到适合本车的驾驶策略和行驶轨迹,保证本车的驾驶策略的正确性。
[0043] 进一步地,参考图2,图2示出了基于本申请的确定第一映射关系的方法的一个实施例的示意性流程图。
[0044] 如图2所示,该确定第一映射关系的方法200包括:
[0045] 在步骤210中,从预定时间段内的障碍车的状态信息和所述障碍车的行驶轨迹中,确定障碍车的第二映射关系。
[0046] 在本实施例中,第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系。在这里,将预定时间段内的障碍车的状态信息结合本车的交通场景信息,可以得到障碍车的交通场景信息;根据时间节点,可以将障碍车的交通场景信息与障碍车的行驶轨迹信息相对应,从而得到第二映射关系。
[0047] 在步骤220中,将障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段。
[0048] 在本实施例中,障碍车的行驶轨迹包括轨迹点和对应轨迹点的时间点。基于这些轨迹点和轨迹点对应的时间点,可以将障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段,这些轨迹片段包含有完整的驾驶行为特征。
[0049] 在本实施例的一些可选实现方式中,遍历障碍车的行驶轨迹中的所有轨迹点和轨迹时间长度,确定轨迹片段。
[0050] 在本实现方式中,轨迹时间长度是指两个轨迹点对应的时间点之间的时间长度。对于记录的行驶轨迹,遍历轨迹上的两个时间点,截取两个时间点之间的所有轨迹点,可以组成轨迹片段。
[0051] 在步骤230中,从障碍车的轨迹片段中筛选障碍车的有效轨迹片段。
[0052] 在本实施例中,有效轨迹片段为采用预设的有效轨迹筛选规则从障碍车的轨迹片段中筛选得到。
[0053] 在本实施例的一些可选实现方式中,从障碍车的轨迹片段中筛选障碍车的有效轨迹片段包括:采用评估函数对轨迹片段进行评估;响应于评估值大于阈值,将轨迹片段确定为有效轨迹片段。也即,当评估值大于阈值时,认为轨迹片段含有足够的驾驶行为特征。
[0054] 在步骤240中,采用无监督的学习方法,学习第三映射关系。
[0055] 在本实施例中,第三映射关系为障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系。
[0056] 这里的无监督的学习方法,可以为现有技术或未来发展的技术中的无监督的学习方法,例如,可以为自编码器(Auto-Encoder)、聚类、受限玻尔兹曼机等学习方法。采用无监督的学习方法学习有效轨迹片段,可以得到驾驶行为信息,从而得到有效轨迹片段至障碍车的驾驶行为信息的映射关系。
[0057] 在步骤250中,基于第二映射关系和第三映射关系,采用监督学习的方法确定第一映射关系。
[0058] 在本实施例中,第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系,第三映射关系为障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系,那么,根据第二映射关系和第三映射关系中有效轨迹片段之间的对应关系,可以确定第一映射关系,也即确定障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系。
[0059] 这里的监督学习的方法,可以为现有技术或未来发展的技术中的监督学习的方法,例如深度神经网络决策树和多层感知机等方法。
[0060] 本申请上述实施例提供的确定第一映射关系的方法,通过障碍车的交通场景信息和障碍车的驾驶行为信息的映射关系,为后续决策中生成本车的自动驾驶策略提供了学习样本,扩充了决策层的决策参数,提升了学习适合本车的驾驶策略的能力。
[0061] 进一步参考图3,图3示出了基于图2中的第一映射关系生成自动驾驶策略的方法的一个实施例的示意性流程图。
[0062] 如图3所示,基于图2中的第一映射关系生成自动驾驶策略的方法300包括:
[0063] 在步骤310中,将第一映射关系中对应本车的交通场景信息的驾驶行为信息,确定为本车的驾驶行为信息。
[0064] 在本实施例中,第一映射关系为障碍车的交通场景信息和障碍车的驾驶行为信息的映射关系。从第一映射关系中,可以查询符合本车的交通场景信息的障碍车的交通场景信息,并将对应该障碍车的交通场景信息的驾驶行为信息,确定为本车的驾驶行为信息。
[0065] 在步骤320中,建立第三映射关系的逆映射关系,得到第四映射关系。
[0066] 在本实施例中,在图2中采用无监督的学习方法学习第三映射关系之时或之后,可以建立第三映射关系的逆映射关系,得到第四映射关系,也即得到障碍车的驾驶行为信息至障碍车的有效轨迹片段的映射关系。
[0067] 在步骤330中,将第四映射关系中对应本车驾驶行为信息的障碍车的行驶轨迹,确定为本车的行驶轨迹。
[0068] 在本实施例中,从第四映射关系中,可以查询符合本车驾驶行为信息的障碍车的驾驶行为信息,并将对应该障碍车的驾驶行为信息的障碍车的行驶轨迹,确定为本车的行驶轨迹。
[0069] 在步骤340中,基于预先建立的自动驾驶车辆的行驶性能指标函数、道路结构信息、本车的状态信息和本车的交通场景信息,对本车的行驶轨迹进行优化,得到本车的驾驶策略。
[0070] 在本实施例中,从周围车辆行驶轨迹提取到的驾驶行为信息,只能作为一个参考,还需要结合自动驾驶车辆的状态(包含所在道路、朝向、速度),以及周围的障碍物情况,确定一个近似的决策策略,根据策略特征进行上述无监督学习的逆操作,得到本车的行驶轨迹。进一步地,还可以基于预先建立的结合安全性和舒适性的指标函数,对上面的决策后的本车的行驶轨迹进行优化,找到最优的行车轨迹。
[0071] 本申请上述实施例提供的基于第一映射关系生成自动驾驶策略的方法,通过不断地对周围车辆行驶轨迹的分析和学习,结合自身状态特征,优化已有的决策能力,从而提升了自动驾驶车辆在各种场景下完成自动驾驶的能力,提高驾驶性能指标。
[0072] 以下结合图4,描述本申请实施例的生成自动驾驶策略的方法的示例性应用场景。
[0073] 如图4所示,图4示出了基于本申请实施例的生成自动驾驶策略的方法的一个应用场景的示例性流程图。
[0074] 在图4中,自动驾驶车辆410从前方障碍车辆420的行驶轨迹中学习路口掉头的实例。
[0075] 自动驾驶车辆410的前方,存在行驶路线与本车一致的障碍车420。由于路口430较窄,无法直接实现掉头,障碍车420需要执行一次倒车操作才能实现掉头,障碍车掉头轨迹如图中轨迹440所示。在此过程中,自动驾驶车辆410记录障碍车420的位置、速度和朝向角等数据,结合自动驾驶车辆410周围的道路结构、交通场景和本车的位置、速度和朝向角等数据,学习得到适合于自动驾驶车辆410的掉头策略,并根据掉头策略操纵油门、刹车力度以及方向盘转角,使得自动驾驶车辆410按照学习得到的掉头策略完成在路口430的掉头。
[0076] 应当理解,图4中所示的应用场景,仅为本申请实施例的示例性应用场景,并不代表对本申请的限定。
[0077] 本申请的上述应用场景中提供的生成自动驾驶策略的方法,可以从本车和周围车辆的行驶信息中学习驾驶策略,增加了驾驶员样本、交通场景样本和道路结构样本,扩充了学习空间,学习得到的驾车策略适用的道路和场景更加广泛。
[0078] 进一步参考图5,作为对上述方法的实现,本申请实施例提供了一种生成自动驾驶策略的装置的一个实施例,该生成自动驾驶策略的方法的实施例与图1至图4所示的生成自动驾驶策略的方法的实施例相对应,由此,上文针对图1至图4中生成自动驾驶策略的方法描述的操作和特征同样适用于生成自动驾驶策略的装置500及其中包含的单元,在此不再赘述。
[0079] 如图5所示,该配置用于生成自动驾驶策略的装置500包括:信息测量单元510、行驶轨迹确定单元520、映射关系确定单元530和驾驶策略生成单元540。
[0080] 其中,信息测量单元510,用于测量本车的状态信息以及周围场景信息,周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息;行驶轨迹确定单元520,用于从预定时间段内的障碍车的状态信息中,确定障碍车的行驶轨迹;映射关系确定单元530,用于基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;驾驶策略生成单元540,用于基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略。
[0081] 在本实施例的一些可选实现方式中(图中未示出),映射关系确定单元包括:场景轨迹映射单元,用于从预定时间段内的障碍车的状态信息和障碍车的行驶轨迹中,确定障碍车的第二映射关系,第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系;轨迹片段切分单元,用于将障碍车的行驶轨迹沿时间轴进行切分,得到障碍车的轨迹片段;有效片段筛选单元,用于从障碍车的轨迹片段中,筛选障碍车的有效轨迹片段;映射关系学习单元,用于采用无监督的学习装置,学习第三映射关系,第三映射关系为障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系;学习映射关系单元,用于基于第二映射关系和第三映射关系,采用监督学习的装置确定第一映射关系。
[0082] 在本实施例的一些可选实现方式中(图中未示出),轨迹片段切分单元进一步用于:遍历障碍车的行驶轨迹中的所有轨迹点和轨迹时间长度,确定轨迹片段。
[0083] 在本实施例的一些可选实现方式中(图中未示出),有效片段筛选单元进一步用于:采用评估函数对轨迹片段进行评估;响应于评估值大于阈值,将轨迹片段确定为有效轨迹片段。
[0084] 在本实施例的一些可选实现方式中(图中未示出),驾驶策略生成单元包括:行为信息确定单元,用于将第一映射关系中对应本车的交通场景信息的障碍车的驾驶行为信息,确定为本车的驾驶行为信息;逆映射关系建立单元,用于建立第三映射关系的逆映射关系,得到第四映射关系;确定行驶轨迹单元,用于将第四映射关系中对应本车驾驶行为信息的障碍车的行驶轨迹,确定为本车的行驶轨迹;行驶轨迹优化单元,用于基于预先建立的自动驾驶车辆的行驶性能指标函数、道路结构信息、本车的状态信息和本车的交通场景信息,对本车的行驶轨迹进行优化,得到本车的驾驶策略。
[0085] 本申请还提供了一种设备的实施例,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上任意一项所述的生成自动驾驶策略的方法。
[0086] 本申请还提供了一种计算机可读存储介质的实施例,其上存储有计算机程序,该程序被处理器执行时实现如上任意一项所述的生成自动驾驶策略的方法。
[0087] 本申请还提供了一种自动驾驶车辆的实施例,包括如上任意一项的生成自动驾驶策略的装置。
[0088] 应当理解,本申请上述实施例中的第一映射关系、第二映射关系、第三映射关系和第四映射关系,仅代表四个具有不同映射对象的映射关系,并不代表对本申请的特殊限定。其中,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;第二映射关系为障碍车的交通场景信息至障碍车的行驶轨迹的映射关系;第三映射关系为障碍车的有效轨迹片段至障碍车的驾驶行为信息的映射关系;第四映射关系为障碍车的驾驶行为信息至障碍车的有效轨迹片段的映射关系。
[0089] 下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
[0090] 如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以基于存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
[0091] 以下部件连接至I/O接口605:包括键盘鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也基于需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,基于需要安装在驱动器610上,以便于从其上读出的计算机程序基于需要被安装入存储部分608。
[0092] 特别地,基于本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
[0093] 需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
[0094] 附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0095] 描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括信息测量单元、行驶轨迹确定单元、映射关系确定单元和驾驶策略生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,信息测量单元还可以被描述为“测量本车的状态信息以及周围场景信息的单元”。
[0096] 作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:测量本车的状态信息以及周围场景信息,周围场景信息包括:障碍车的状态信息、道路结构信息和本车的交通场景信息;从预定时间段内的障碍车的状态信息中,确定障碍车的行驶轨迹;基于预定时间段内的障碍车的状态信息和障碍车的行驶轨迹,确定第一映射关系,第一映射关系为障碍车的交通场景信息至障碍车的驾驶行为信息的映射关系;基于第一映射关系、道路结构信息、本车的状态信息和本车的交通场景信息,生成本车的自动驾驶策略。
[0097] 以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈