技术领域
[0001] 本
申请属于
人工智能技术领域,特别是涉及一种适用于无人驾驶决策学习和训练的系统。
背景技术
[0002] 研究无人驾驶的成本很高,一方面是由于无人驾驶是涉及到多个领域相关技术的综合应用,如车辆
定位,物体检测、
跟踪、路径规划等一系列复杂的
算法,另一方面还需要自动驾驶的实验室和实验场地来验证相关算法,否则研究的算法无法验证和真正应用。尤其是无人驾驶
汽车在真实上路后所面临的外部环境十分复杂且多变,为了让无人驾驶能够应对这些复杂的情况,一种办法是让车辆在实际的路况下,在有人负责驾驶安全的前提下采集数据,然后对采集到的场景数据进行分析,并设计相应的算法让车辆的“大脑”在下次遇到类似的情况时,知道该如何处理。这种方法成本高、周期长。另一种方法是通过仿真的形式训练和验证无人驾驶汽车在不同场景下的
感知和决策算法。甚至有一些开源的自动驾驶仿真平台,包括Carla、AirSim、Udacity self-driving car simulator、Apollo和Autoware等。这些仿真平台主要分为两类:第一类是基于合成的数据,对环境、感知及车辆进行模拟,这里的感知大多数是图像层面的感知,这类
模拟器主要用于感知、规划算法的初步开发上,如Carla、AirSim、Udacity self-driving car simulator就属于这类;另一类是基于真实数据的回放,这里的真实数据包括图像、lidar、radar等各种
传感器的数据,这类模拟器主要用于测试无人驾驶中信息融合算法以及车辆不同部件的性能,Apollo和Autoware就属于这类。
[0003] 现有的无人驾驶仿真平台中,无论是基于生成的虚拟数据,还是真实数据的回放,在训练或测试时,都只是解决了算法研究中的数据问题。由于现有的方法都是设计好算法
框架,利用
大数据进行训练,或按照制定好的一套规则进行训练/验证,对于无人驾驶的核心-驾驶技能或者说智能决策算法帮助不大,而且效率低、成本较高。这或许是导致了无人驾驶技术开发中的“长尾”效应的原因之一。
发明内容
[0004] 1.要解决的技术问题
[0005] 基于现有的无人驾驶仿真平台中,无论是基于生成的虚拟数据,还是真实数据的回放,在训练或测试时,都只是解决了算法研究中的数据问题。由于现有的方法都是设计好算法框架,利用大数据进行训练,或按照制定好的一套规则进行训练/验证,对于无人驾驶的核心-驾驶技能或者说智能决策算法帮助不大,而且效率低、成本较高的问题,本申请提供了一种适用于无人驾驶决策学习和训练的系统。
[0006] 2.技术方案
[0007] 为了达到上述的目的,本申请提供了一种适用于无人驾驶决策学习和训练的系统,所述系统包括
虚拟现实/
机器学习单元;
[0008] 所述虚拟现实/机器学习单元包括主处理器模
块,所述主处理器模块与虚拟现实呈现模块相连接,所述主处理器模块与车辆操纵机电模块相连接,所述车辆操纵机电模块与
方向盘相连接,所述车辆操纵机电模块与档位相连接,所述车辆操纵机电模块与
油门/
刹车相连接;
[0009] 所述主处理器模块,用于模拟各种驾驶场景,并通过各种参数学习车辆操作者在各种场景下的开车技能,
[0010] 所述虚拟现实呈现模块,用于将模拟的各种驾驶场景显示给车辆操作者,[0011] 所述车辆操纵机电模块,实时采集车辆操作者的各种操作信息,同时和
虚拟环境中的路况参数对应记录,并发送给主处理器模块,
[0012] 所述方向盘,用于模拟车辆操作,
[0013] 所述档位,用于模拟车辆操作,
[0014] 所述油门/刹车,用于模拟车辆操作。
[0015] 本申请提供的另一种实施方式为:所述主处理器模块包括相互连接的机器学习算法子模块和虚拟现实场景生成器,所述机器学习算法子模块与所述车辆操纵机电模块相连接,
[0016] 所述虚拟现实场景生成器用于将场景的当前参数发送至所述机器学习算法子模块,所述机器学习算法子模块用于接收所述车辆操纵机电模块的
采样,所述机器学习算法子模块用于通过各种参数学习车辆操作者在各种场景下的开车技能。
[0017] 本申请提供的另一种实施方式为:所述场景的当前参数包括道路状况和
位置。
[0018] 本申请提供的另一种实施方式为:所述主处理器模块为一台
服务器或者分布式系统。
[0019] 本申请提供的另一种实施方式为:所述虚拟现实呈现模块为头戴式VR显示器、投影显示或电脑显示器。
[0020] 本申请提供的另一种实施方式为:所述机器学习算法子模块为传统的
专家系统、神经元网络或
深度学习算法模块。
[0021] 本申请提供的另一种实施方式为:所述机器学习算法子模块学习到的模型可直接用于无人驾驶的决策与控制中。
[0022] 本申请提供的另一种实施方式为:还包括动感底盘,所述动感底盘,用于模拟
车身运动;所述动感底盘与所述主处理器模块相连接。
[0023] 本申请提供的另一种实施方式为:所述动感底盘包括运动模拟装置,所述运动模拟装置为三轴驱动平台、四轴驱动平台或者多轴驱动平台;
[0024] 所述动感底盘用于模拟各种天气、季节、路面状况下车辆的运动状态。
[0025] 本申请提供的另一种实施方式为:所述连接为局域网连接或者
现场总线连接。
[0026] 3.有益效果
[0027] 与
现有技术相比,本申请提供的一种适用于无人驾驶决策学习和训练的系统的有益效果在于:
[0028] 本申请提供的一种适用于无人驾驶决策学习和训练的系统,所述系统针对无人驾驶和辅助驾驶技术中如何实现快速学习人类决策智能,并将学习到的技能部署到无人驾驶系统或ADAS系统中,以提升无人驾驶/ADAS决策技能和乘客体验。
[0029] 本申请提供的一种适用于无人驾驶决策学习和训练的系统,在模拟驾驶的
基础上,将人在复杂的虚拟环境下的驾驶经验融合到智能决策算法的学习中,以快速提升无人驾驶车辆的决策能
力。基于本申请的内容,不仅可以实现无人驾驶算法的学习,也可以用于驾校学员快速学习驾驶技巧,缩短学习。从而降低资源和成本。
[0030] 本申请提供的一种适用于无人驾驶决策学习和训练的系统,解决了无人驾驶技术中如何快速训练算法,提升车辆驾驶能力,尤其是人工智能的学习。
[0031] 本申请提供的一种适用于无人驾驶决策学习和训练的系统,通过模拟驾驶装置和虚拟现实技术相结合,通过经验丰富的驾驶员在各种挑战性环境下的驾驶参数的获取,将人的驾驶技能融入无人驾驶的决策算法的学习中,实现无人驾驶决策算法的快速学习。本申请不仅节省了实际路况
数据采集的成本,相对于已有的仿真平台,将人的驾驶经验融入人工智能的学习中,可极大促进算法的收敛速度。
附图说明
[0032] 图1是本申请的适用于无人驾驶决策学习和训练的系统示意图;
[0033] 图2是本申请的适用于无人驾驶决策学习和训练的系统数据流程示意图。
[0034] 图中:1-主处理器模块、2-虚拟现实呈现模块、3-车辆操纵机电模块、4-方向盘、5-档位、6-油门/刹车、7-机器学习算法子模块、8-虚拟现实场景生成器、9-动感底盘。
具体实施方式
[0035] 在下文中,将参考附图对本申请的具体
实施例进行详细地描述,依照这些详细的描述,所属领域技术人员能够清楚地理解本申请,并能够实施本申请。在不违背本申请原理的情况下,各个不同的实施例中的特征可以进行组合以获得新的实施方式,或者替代某些实施例中的某些特征,获得其它优选的实施方式。
[0036] 参见图1~2,本申请提供一种适用于无人驾驶决策学习和训练的系统,所述系统包括虚拟现实/机器学习单元;
[0037] 所述虚拟现实/机器学习单元包括主处理器模块1,所述主处理器模块1与虚拟现实呈现模块2相连接,所述主处理器模块1与车辆操纵机电模块3相连接,所述车辆操纵机电模块3与方向盘4相连接,所述车辆操纵机电模块3与档位5相连接,所述车辆操纵机电模块3与油门/刹车6相连接;
[0038] 所述主处理器模块1,用于模拟各种驾驶场景,并通过各种参数学习车辆操作者在各种场景下的开车技能,
[0039] 所述虚拟现实呈现模块2,用于将模拟的各种驾驶场景显示给车辆操作者,[0040] 所述车辆操纵机电模块3,实时采集车辆操作者的各种操作信息,同时和虚拟环境中的路况参数对应记录,并发送给主处理器模块,
[0041] 所述方向盘4,用于模拟车辆操作,
[0042] 所述档位5,用于模拟车辆操作,
[0043] 所述油门/刹车6,用于模拟车辆操作。
[0044] 进一步地,所述主处理器模块包括相互连接的机器学习算法子模块7和虚拟现实场景生成器8,所述机器学习算法子模块7与所述车辆操纵机电模块3相连接,[0045] 所述虚拟现实场景生成器8用于将场景的当前参数发送至所述机器学习算法子模块7,所述机器学习算法子模块7用于接收所述车辆操纵机电模块3的采样,所述机器学习算法子模块7用于通过各种参数学习车辆操作者在各种场景下的开车技能。
[0046] 进一步地,所述场景的当前参数包括道路状况和位置。
[0047] 进一步地,所述主处理器模块1为一台服务器或者分布式系统。
[0048] 进一步地,所述虚拟现实呈现模块2为头戴式VR显示器、投影显示或电脑显示器。
[0049] 进一步地,所述机器学习算法子模块7为传统的专家系统、神经元网络或深度学习算法模块。
[0050] 进一步地,所述机器学习算法子模块7学习到的模型可直接用于无人驾驶的决策与控制中。
[0051] 进一步地,还包括动感底盘9,所述动感底盘9,用于模拟车身运动;所述动感底盘与所述主处理器模块相连接。
[0052] 进一步地,所述动感底盘9包括运动模拟装置,所述运动模拟装置为三轴驱动平台、四轴驱动平台或者多轴驱动平台;
[0053] 所述动感底盘9用于模拟各种天气、季节、路面状况下车辆的运动状态。
[0054] 进一步地,所述连接为局域网连接或者现场总线连接。
[0055] 系统各个组件的连接可以是局域网、现场总线等;
[0056] 该车辆操纵机电模块3,用于接收车辆操作者的各种车辆操作信息,该主处理器模块1与所述虚拟现实呈现模块2、所述车辆操纵机电模块3、所述动感底盘9按对应的数据
接口相连。在模拟驾驶操作时,该主处理器模块1通过内置的虚拟现实场景生成器8模拟各种驾驶场景,并将其通过虚拟现实呈现装置显示给车辆操作者,车辆操作者根据呈现的驾驶场景,通过操纵方向盘4、档位5、油门/刹车6等各种车辆操作接口实现模拟车辆在虚拟现实场景中的移动,同时该车辆操纵机电模块3将车辆操作者对车辆的各种操作按一定周期进行采样,发送给内置于主处理器模块1中的机器学习算法子模块7,虚拟现实场景生成器8将场景的当前参数(如道路状况、位置等)也同时发送机器学习算法子模块7。主处理器模块1根据当前车辆操作者的操作以及当前场景,通过动感底盘9模拟车辆运动状态,让车辆操作者有临场感。机器学习算法子模块7通过各种参数学习车辆操作者在各种场景下的开车技能。
[0057] 实施例1:
[0058] 用一台带有GPU图形
加速器的服务器连接到一个电脑显示屏上,车辆模拟系统可以由市面可以采购到的模拟方向盘4、档位5、刹车/油门6模块组成。利用3D建模工具生成各种道路场景,让一个有经验的驾驶员在生成的模拟场景下操纵车辆模拟模块,各个车辆模拟模块的输出信息实时发送给服务器,服务器将模拟场景下当前的道路参数等与驾驶员的操作参数对应起来,并作为内置在服务器上的机器学习算法子模块7的输入训练样本,对算法模块进行学习训练。
[0059] 实施例2:
[0060] 用2台电脑组建成一个基于局域网的分布式计算系统,其中一台作为虚拟现实模拟驾驶的主控电脑,其对应的显示为一个头戴式VR显示装置,以显示各种路况,同时该主控电脑控制一个三轴的动感底盘9,模拟车辆在各种路况下的运动,让驾驶员获得临场感的驾驶体验;另一台电脑作为机器学习算法子模块7的主处理器,接受模拟驾驶的操作参数,以及虚拟现实模拟驾驶的主控电脑发送的各种路况参数,将这些参数作为本机的输入训练样本,对算法模块进行学习训练。
[0061] 实施例3:
[0062] 用2台服务器组建成一个基于高速局域网的分布式系统,其中一台服务器作为虚拟现实模拟驾驶的主控电脑,其对应的显示为一个头戴式VR显示装置,以显示各种路况,同时该主控电脑控制一个六轴的动感底盘9,模拟车辆在各种路况下的运动,让驾驶员获得临场感的驾驶体验;另一台带有GPU加速卡的服务器作为机器学习算法子模块7的主处理器,接受模拟驾驶的操作参数,以及虚拟现实模拟驾驶的主控电脑发送的各种路况参数,将这些参数作为深度神经元网络的输入训练样本,并采用一定的评价指标对每次的驾驶结果进行评估,将评估结果也作为样本,对驾驶决策模型进行学习训练。
[0063] 本申请可以使用在车地无线通信领域,对车地无线通信有一定的帮助。
[0064] 本申请提供的一种适用于无人驾驶决策学习和训练的系统,通过模拟驾驶装置和虚拟现实技术相结合,通过经验丰富的驾驶员在各种挑战性环境下的驾驶参数的获取,将人的驾驶技能融入无人驾驶的决策算法的学习中,实现无人驾驶决策算法的快速学习。本申请不仅节省了实际路况数据采集的成本,相对于已有的仿真平台,将人的驾驶经验融入人工智能的学习中,可极大促进算法的收敛速度。
[0065] 尽管在上文中参考特定的实施例对本申请进行了描述,但是所属领域技术人员应当理解,在本申请公开的原理和范围内,可以针对本申请公开的配置和细节做出许多
修改。本申请的保护范围由所附的
权利要求来确定,并且权利要求意在涵盖权利要求中技术特征的等同物文字意义或范围所包含的全部修改。