首页 / 专利分类库 / 一般车辆 / 面向矿区场景的自动驾驶数据构建方法和装置

面向矿区场景的自动驾驶数据构建方法和装置

申请号 CN202410148923.5 申请日 2024-02-02 公开(公告)号 CN117681893B 公开(公告)日 2024-05-14
申请人 中国科学院自动化研究所; 发明人 田滨; 宋瑞琦; 吕宜生; 张才集; 要婷婷; 王飞跃;
摘要 本 发明 提供一种面向矿区场景的自动驾驶数据构建方法和装置,应用于自动驾驶技术领域。该方法包括:在满足预设触 发条 件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难 感知 场景数据、异常分布数据、稀缺类数据;对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。
权利要求

1.一种面向矿区场景的自动驾驶数据构建方法,其特征在于,包括:
在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;
对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;
确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;
其中,所述类别标签包括场景标签、障碍物标签以及环境标签;
在所述第一数据包括所述困难感知场景数据的情况下,所述预设触发条件为检测到用户驾驶操作;在所述第一数据包括所述异常分布数据的情况下,所述预设触发条件为矿区感知模型输出的感知结果的不确定度大于第二阈值;在所述第一数据包括所述稀缺类数据的情况下,所述预设触发条件为矿区感知模型基于所述稀缺类数据输出的感知结果的置信度大于第四阈值;
所述在满足预设触发条件的情况下,采集矿区场景的第一数据之前,所述方法还包括:
基于场景数据库的类别标签确定样本数量小于第三阈值的稀缺类数据;将所述稀缺类数据的置信度阈值设置为所述第四阈值;其中,所述场景数据库用于分类存储自动驾驶数据的类别标签。
2.根据权利要求1所述的面向矿区场景的自动驾驶数据构建方法,其特征在于,所述第一数据还包括:周期性数据、补采数据以及仿真数据;所述对所述第一数据进行目标处理,得到第二数据之前,所述方法还包括:
接收用户的第一输入;
响应于所述第一输入,执行以下至少一项操作:
按照预设周期采集自动驾驶数据,得到所述周期性数据;
确定低质量数据,并采集所述低质量数据的补采数据;
采集仿真驾驶系统产生的所述仿真数据,并对所述仿真数据进行真实数据域转换。
3.根据权利要求1所述的面向矿区场景的自动驾驶数据构建方法,其特征在于,所述无效数据过滤处理用于通过数据校验清洗损坏数据和静止数据,以过滤无效数据;
所述数据切分处理用于通过切分数据得到长度相同的数据片段
所述时间同步处理用于实现不同来源数据的时间同步;
所述数据解析处理用于区分不同来源的数据。
4.根据权利要求1所述的面向矿区场景的自动驾驶数据构建方法,其特征在于,所述确定所述第二数据的类别标签,包括:
通过场景分类模型确定所述第二数据的场景标签;
通过矿区感知模型识别所述第二数据所包含的障碍物种类,以得到所述第二数据的障碍物标签;
通过人工标注的方式确定所述第二数据的环境标签。
5.根据权利要求1所述的面向矿区场景的自动驾驶数据构建方法,其特征在于,所述确定所述第二数据的类别标签之后,所述方法还包括:
将所述有效自动驾驶数据的类别标签存储至场景数据库,将所述有效自动驾驶数据存储至数据存储库,所述场景数据库与所述数据存储库之间存在映射关系。
6.一种面向矿区场景的自动驾驶数据构建装置,其特征在于,包括:采集模、处理模块以及标签模块;
所述采集模块,用于在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;
所述处理模块,用于对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;
所述标签模块,用于确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;
其中,所述类别标签包括场景标签、障碍物标签以及环境标签;
在所述第一数据包括所述困难感知场景数据的情况下,所述预设触发条件为检测到用户驾驶操作;在所述第一数据包括所述异常分布数据的情况下,所述预设触发条件为矿区感知模型输出的感知结果的不确定度大于第二阈值;在所述第一数据包括所述稀缺类数据的情况下,所述预设触发条件为矿区感知模型基于所述稀缺类数据输出的感知结果的置信度大于第四阈值;
所述标签模块,用于基于场景数据库的类别标签确定样本数量小于第三阈值的稀缺类数据;将所述稀缺类数据的置信度阈值设置为所述第四阈值;其中,所述场景数据库用于分类存储自动驾驶数据的类别标签。
7.根据权利要求6所述的面向矿区场景的自动驾驶数据构建装置,其特征在于,所述第一数据还包括:周期性数据、补采数据以及仿真数据;所述对所述第一数据进行目标处理,得到第二数据之前,所述采集模块,用于接收用户的第一输入;响应于所述第一输入,执行以下至少一项操作:按照预设周期采集自动驾驶数据,得到所述周期性数据;确定低质量数据,并采集所述低质量数据的补采数据;采集仿真驾驶系统产生的所述仿真数据,并对所述仿真数据进行真实数据域转换。

说明书全文

面向矿区场景的自动驾驶数据构建方法和装置

技术领域

[0001] 本发明涉及自动驾驶技术领域,尤其涉及一种面向矿区场景的自动驾驶数据构建方法和装置。

背景技术

[0002] 随着自动驾驶技术的快速发展,其配置的传感器硬件也在不断升级,导致每天产生的数据量呈爆炸式增长。如何实现高质量自动驾驶数据的采集和管理成为推动自动驾驶技术落地的重要环节。
[0003] 一方面,由于矿区场景复杂多变,环境极端,且为非结构化场景,因此,其出现极端场景的可能性很大。常规的数据采集方式往往无法适应极端场景,因此极端场景下的数据缺失情况较为严重。另一方面,由于数据量激增,因此,常规数据管理方式已经无法满足当前的管理需求。

发明内容

[0004] 本发明提供一种面向矿区场景的自动驾驶数据构建方法和装置,用以实现高质量自动驾驶数据的采集和管理。
[0005] 本发明提供一种面向矿区场景的自动驾驶数据构建方法,包括:在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。
[0006] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建方法, 所述第一数据还包括:周期性数据、补采数据以及仿真数据;所述对所述第一数据进行目标处理,得到第二数据之前,所述方法还包括:接收用户的第一输入;响应于所述第一输入,执行以下至少一项操作:按照预设周期采集自动驾驶数据,得到所述周期性数据;确定低质量数据,并采集所述低质量数据的补采数据;采集仿真驾驶系统产生的所述仿真数据,并对所述仿真数据进行真实数据域转换。
[0007] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建方法,在所述第一数据包括所述困难感知场景数据的情况下,所述预设触发条件为检测到用户驾驶操作;在所述第一数据包括所述异常分布数据的情况下,所述预设触发条件为矿区感知模型输出的感知结果的不确定度大于第二阈值;在所述第一数据包括所述稀缺类数据的情况下,所述预设触发条件为矿区感知模型基于所述稀缺类数据输出的感知结果的置信度大于第四阈值。
[0008] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建方法,所述在满足预设触发条件的情况下,采集矿区场景的第一数据之前,所述方法还包括:基于场景数据库的类别标签确定样本数量小于第三阈值的稀缺类数据;将所述稀缺类数据的置信度阈值设置为所述第四阈值;其中,所述场景数据库用于分类存储自动驾驶数据的类别标签。
[0009] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建方法,所述无效数据过滤处理用于通过数据校验清洗损坏数据和静止数据,以过滤无效数据;所述数据切分处理用于通过切分数据得到长度相同的数据片段;所述时间同步处理用于实现不同来源数据的时间同步;所述数据解析处理用于区分不同来源的数据。
[0010] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建方法,所述确定所述第二数据的类别标签,包括:通过场景分类模型确定所述第二数据的场景标签;通过矿区感知模型识别所述第二数据所包含的障碍物种类,以得到所述第二数据的障碍物标签;通过人工标注的方式确定所述第二数据的环境标签。
[0011] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建方法,所述确定所述第二数据的类别标签之后,所述方法还包括:将所述有效自动驾驶数据的类别标签存储至场景数据库,将所述有效自动驾驶数据存储至数据存储库,所述场景数据库与所述数据存储库之间存在映射关系。
[0012] 本发明还提供一种面向矿区场景的自动驾驶数据构建装置,包括:采集模、处理模块以及标签模块;所述采集模块,用于在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;所述处理模块,用于对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;所述标签模块,用于确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。
[0013] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建装置,所述第一数据还包括:周期性数据、补采数据以及仿真数据;所述对所述第一数据进行目标处理,得到第二数据之前,所述采集模块,用于接收用户的第一输入;响应于所述第一输入,执行以下至少一项操作:按照预设周期采集自动驾驶数据,得到所述周期性数据;确定低质量数据,并采集所述低质量数据的补采数据;采集仿真驾驶系统产生的所述仿真数据,并对所述仿真数据进行真实数据域转换。
[0014] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建装置,在所述第一数据包括所述困难感知场景数据的情况下,所述预设触发条件为检测到用户驾驶操作;在所述第一数据包括所述异常分布数据的情况下,所述预设触发条件为矿区感知模型输出的感知结果的不确定度大于第二阈值;在所述第一数据包括所述稀缺类数据的情况下,所述预设触发条件为矿区感知模型基于所述稀缺类数据输出的感知结果的置信度大于第四阈值。
[0015] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建装置,所述在满足预设触发条件的情况下,采集矿区场景的第一数据之前,所述标签模块,用于基于场景数据库的类别标签确定样本数量小于第三阈值的稀缺类数据;将所述稀缺类数据的置信度阈值设置为所述第四阈值;其中,所述场景数据库用于分类存储自动驾驶数据的类别标签。
[0016] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建装置,所述无效数据过滤处理用于通过数据校验清洗损坏数据和静止数据,以过滤无效数据;所述数据切分处理用于通过切分数据得到长度相同的数据片段;所述时间同步处理用于实现不同来源数据的时间同步;所述数据解析处理用于区分不同来源的数据。
[0017] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建装置,所述标签模块,用于通过场景分类模型确定所述第二数据的场景标签;通过矿区感知模型识别所述第二数据所包含的障碍物种类,以得到所述第二数据的障碍物标签;通过人工标注的方式确定所述第二数据的环境标签。
[0018] 根据本发明提供一种的面向矿区场景的自动驾驶数据构建装置,所述确定所述第二数据的类别标签之后,所述标签模块,还用于将所述有效自动驾驶数据的类别标签存储至场景数据库,将所述有效自动驾驶数据存储至数据存储库,所述场景数据库与所述数据存储库之间存在映射关系。
[0019] 本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述面向矿区场景的自动驾驶数据构建方法的步骤。
[0020] 本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述面向矿区场景的自动驾驶数据构建方法的步骤。
[0021] 本发明提供的面向矿区场景的自动驾驶数据构建方法和装置,可以在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。通过该方案,可以在满足预设触发条件的情况下,采集矿区场景的第一数据,由于第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,因此,可以实现极端场景下数据的自动化采集;可以对所述第一数据进行目标处理,得到第二数据,并确定第二数据的类别标签,由于类别标签包括场景标签、障碍物标签以及环境标签,因此可以实现有效自动驾驶数据的分类管理,从而提高管理效率。
附图说明
[0022] 为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023] 图1是本发明提供的面向矿区场景的自动驾驶数据构建系统的结构示意图;
[0024] 图2是本发明提供的面向矿区场景的自动驾驶数据构建方法的流程示意图之一;
[0025] 图3是本发明提供的面向矿区场景的自动驾驶数据构建方法的流程示意图之二;
[0026] 图4是本发明提供的面向矿区场景的自动驾驶数据构建方法的流程示意图之三;
[0027] 图5是本发明提供的面向矿区场景的自动驾驶数据构建方法的流程示意图之四;
[0028] 图6是本发明提供的面向矿区场景的自动驾驶数据构建装置的结构示意图;
[0029] 图7是本发明提供的电子设备的结构示意图。

具体实施方式

[0030] 为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0031] 需要说明的是,本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
[0032] 需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本发明实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
[0033] 为了便于清楚描述本发明实施例的技术方案,在本发明实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
[0034] 本发明实施例为了阐释的目的而描述了一些示例性实施例,需要理解的是,本发明可通过附图中没有具体示出的其他方式来实现。
[0035] 下面结合具体实施例和附图对上述实现方式进行详细的阐述。
[0036] 如图1所示,本发明实施例提供一种面向矿区场景的自动驾驶数据构建系统,该面向矿区场景的自动驾驶数据构建系统可以包括数据采集平台110和数据管理平台120,其中,数据采集平台110可以包括人工数据采集模块111和自动数据采集模块112;数据管理平台120可以包括数据处理模块121、标签生成模块122、数据存储库123以及场景数据库124。
[0037] 上述人工数据采集模块111,用于在用户输入的触发下采集矿区场景的周期性数据、补采数据以及仿真数据。
[0038] 上述自动数据采集模块112,用于在满足预设触发条件的情况下,采集矿区场景的困难感知场景数据、异常分布数据以及稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据。
[0039] 上述数据处理模块121,用于对采集的第一数据进行数据校验、数据切分、时间同步和数据解析等处理,得到第二数据。
[0040] 上述标签生成模块122,用于为经过处理的第二数据添加类别标签,得到有效自动驾驶数据。
[0041] 上述数据存储库123用于存储采集的第一数据。
[0042] 上述场景数据库124,用于分类存储自动驾驶数据的类别标签。
[0043] 本发明实施例中,可以在满足预设触发条件的情况下,采集矿区场景的第一数据,由于第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,因此,可以实现极端场景下数据的自动化采集;可以对所述第一数据进行目标处理,得到第二数据,并确定第二数据的类别标签,由于类别标签包括场景标签、障碍物标签以及环境标签,因此可以实现有效自动驾驶数据的分类管理,从而提高管理效率。
[0044] 如2所示,本发明实施例提供一种面向矿区场景的自动驾驶数据构建方法,该面向矿区场景的自动驾驶数据构建方法可以应用于面向矿区场景的自动驾驶数据构建装置。该面向矿区场景的自动驾驶数据构建方法可以包括S201‑S203:
[0045] S201、自动驾驶数据构建装置在满足预设触发条件的情况下,采集矿区场景的第一数据。
[0046] 其中,上述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据。
[0047] 可选地,上述自动驾驶数据构建装置可以为矿区自动驾驶车辆,也可以为矿区自动驾驶车辆中的装置。自动驾驶数据构建装置可以包括至少一个矿区感知模型,该至少一个矿区感知模型可以用于感知矿区场景的驾驶环境。
[0048] 可选地,自动驾驶数据构建装置可以采用多种采集方式融合采集的方式进行数据采集。该多种采集方式分为人工数据采集和自动数据采集。人工数据采集主要用于采集周期性数据、补采数据以及仿真数据,通过人工数据采集方式采集到的数据可以用于实现矿区感知模型的泛化能提升和常规感知能力提升。自动数据采集主要用于采集困难感知场景数据、异常分布数据、稀缺类数据,通过自动数据采集方式采集到的数据可以用于提升矿区自动驾驶困难场景的感知能力。自动数据采集具有采集效率高、采集数据量大、有效数据占比高等特点。可以弥补人工数据采集的不足。
[0049] 可选地,在第一数据包括困难感知场景数据的情况下,所述预设触发条件为检测到用户驾驶操作。
[0050] 具体地,当驾驶环境比较恶劣时,通常需要进行人工介入或人工接管,因此,当自动驾驶数据构建装置检测到用户驾驶操作时,可以认为当前的驾驶场景为困难驾驶场景,自动驾驶数据构建装置可以自动采集当前场景下感知到的数据,得到困难感知场景数据。如此,可以实现困难驾驶场景的数据采集,从而加强矿区自动驾驶车辆对困难驾驶场景的感知能力。
[0051] 可选地,在第一数据包括所述异常分布数据的情况下,所述预设触发条件为矿区感知模型输出的感知结果的不确定度大于第二阈值。
[0052] 具体地,自动驾驶数据构建装置可以构建多个相同任务的矿区感知模型,通过不同的矿区感知模型实时进行感知,并对不同矿区感知模型的感知结果进行不确定度计算,若矿区感知模型输出的感知结果的不确定度大于第二阈值,则自动采集矿区感知模型的输入数据,得到异常分布数据。也就是说,可以根据一数据的不确定度表现确定该帧数据是否为异常分布(out‑of‑distribution,OOD)数据。如此,可以实现数据集分布外数据的自动采集,从而提高数据集中数据种类的丰富性。
[0053] 可选地,在第一数据包括所述稀缺类数据的情况下,所述预设触发条件为矿区感知模型基于所述稀缺类数据输出的感知结果的置信度大于第四阈值。
[0054] 具体地,自动驾驶数据构建装置可以计算稀缺类数据输出的感知结果的置信度,若置信度大于第四阈值,则自动采集数据,得到稀缺类数据。该稀缺类数据的置信度阈值小于其他类数据的置信度阈值。
[0055] 可选地,在满足预设触发条件的情况下,自动采集矿区场景的第一数据之前,自动驾驶数据构建装置可以基于场景数据库的类别标签确定样本数量小于第三阈值的稀缺类数据;将所述稀缺类数据的置信度阈值设置为所述第四阈值;其中,所述场景数据库用于分类存储自动驾驶数据的类别标签。
[0056] 具体地,数据存储库中的数据分布往往并不均衡,通常会存在长尾分布问题,结合场景数据库中的类别标签,可以确定样本数量较少的稀缺类数据,并将稀缺类数据的置信度阈值设置为第四阈值。如此,可以弥补稀缺类数据样本量不足的缺陷
[0057] 可选地,第一数据还可以包括:周期性数据、补采数据以及仿真数据;自动驾驶数据构建装置可以接收用户的第一输入;响应于所述第一输入,执行以下至少一项操作:按照预设周期采集自动驾驶数据,得到所述周期性数据;确定低质量数据,并采集所述低质量数据的补采数据;采集仿真驾驶系统产生的所述仿真数据,并对所述仿真数据进行真实数据域转换。
[0058] 具体地,周期性数据采集为面向泛化场景、常态化进行的数据采集方式,自动驾驶数据构建装置可以基于第一输入,在不同矿区、同一矿区不同场景、不同采集时间、不同环境天气等因素进行周期性和持续性的数据采集。低质量数据是指相机成像存在逆光、过曝、过暗、对比度异常、模糊、偏色、遮挡、花噪声、抖动数据等情况,在发现低质量数据后,可以通过第一输入进行补采,得到补采数据。自动驾驶数据构建装置可以基于第一输入,采集仿真驾驶系统产生的仿真数据,该仿真数据可以用于对矿区感知模型进行预训练,以增强矿区感知模型的泛化能力。在进行仿真数据预训练之前,可以对仿真数据进行域转换,实现仿真域和真实数据域分布的逼近,然后再将转换后的仿真数据应用于矿区感知模型的预训练。
[0059] 可选地,上述第一输入还可以用于对稀缺类数据进行采集。
[0060] S202、自动驾驶数据构建装置对所述第一数据进行目标处理,得到第二数据。
[0061] 其中,上述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理。
[0062] 可选地,所述无效数据过滤处理用于通过数据校验清洗损坏数据和静止数据,以过滤无效数据;所述数据切分处理用于通过切分数据得到长度相同的数据片段;所述时间同步处理用于实现不同来源数据的时间同步;所述数据解析处理用于区分不同来源的数据。
[0063] 具体地,如图3所示,第一数据可以包括多个传感器信息,例如,激光雷阵点、红外图像、可见光图像、定位数据以及坐标转换关系等,自动驾驶数据构建装置可以通过数据校验的方式,清洗损坏数据和静止数据,得到原始数据,以实现无效数据过滤处理,从而剔除无效数据,避免系统存储冗余。数据校验的方式可以包括车辆定位和光流法。之后,再按照场景分类对原始数据进行数据切分处理得到长度相同的数据片段Clip,该数据片段Clip包括Clip数据和Clip信息,以便于根据类别标签对Clip数据进行元数据存储。之后,自动驾驶数据构建装置可以通过传感器时间对齐实现对应帧定位,激光点云,毫米波点云,可见光相机,红外相机等数据的时间同步处理。最后,自动驾驶数据构建装置可以对相应帧的数据进行数据解析处理,得到第二数据,第二数据可以包括对应的单帧激光点云,毫米波点云、图像以及定位数据,之后,自动驾驶数据构建装置可以将解析的第二数据存储至临时数据存储池。
[0064] S203、自动驾驶数据构建装置确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据。
[0065] 其中,上述类别标签包括场景标签、障碍物标签以及环境标签。
[0066] 可选地,自动驾驶数据构建装置可以通过场景分类模型确定所述第二数据的场景标签;通过矿区感知模型识别所述第二数据所包含的障碍物种类,以得到所述第二数据的障碍物标签;通过人工标注的方式确定所述第二数据的环境标签。
[0067] 可选地,如图4所示,场景标签可以包括范围和区域两个维度,范围维度的场景标签可以包括露天矿、井工矿以及封闭园区,区域维度的场景标签可以包括道路、装载区、卸载区、破碎站以及路口。障碍物标签可以包括路面状态和障碍物两个维度,路面状态维度的障碍物标签可以包括车辙、坑、落石、淤泥、湿滑、上坡、下坡以及转弯等,障碍物维度的障碍物标签可以包括车辆、行人、动物、警示标志以及过道电缆等。环境标签可以包括天气和光线两个维度,天气维度的环境标签可以包括晴天、阴天、雨天、雪天、雾天以及扬尘等,光线维度的环境标签可以包括早晨、中午、傍晚、夜晚等。
[0068] 可选地,继续参考图4,自动驾驶数据构建装置可以通过模型训练构建场景分类模型,并通过场景分类模型确定第二数据的场景标签。即该场景分类模型可以用于实现对露天矿区,井工矿以及封闭园区数据的自动场景分类。
[0069] 可选地,对于同一矿区,场景分类模型还可以用于实现对不同作业区域如装载区,卸载区,道路,交叉路口等场景的有效分类。
[0070] 可选地,继续参考图4,自动驾驶数据构建装置可以通过矿区感知模型识别第二数据所包含的障碍物种类,以得到第二数据的障碍物标签。
[0071] 可选地,继续参考图4,自动驾驶数据构建装置可以通过人工标注的方式确定第二数据的环境标签。自动驾驶数据构建装置主要可以对矿区自动驾驶环境如晴天,阴天,雨天,雪天,扬尘等天气进行分类。其次可以根据一天的光线变化按照早晨,中午,晚上进行分类。
[0072] 可选地,在确定第二数据的场景标签、障碍物标签和环境标签后,自动驾驶数据构建装置可以为第二数据添加这些类别标签,并将添加了类别标签的第二数据确定为有效自动驾驶数据。
[0073] 可以理解的是,由于矿区自动驾驶数据具备场景复杂多变,障碍物种类繁多,环境极端恶劣等特点,因此为了实现对采集到的海量矿区自动驾驶数据的高效使用,可以通过构建场景数据库的方式,对采集到的数据在不同维度进行分类,使得获得的Clip数据具备类别标签,以方便后续的数据使用,从而可以实现对自动驾驶数据的有效管理。
[0074] 可选地,确定有效自动驾驶数据之后,自动驾驶数据构建装置可以将有效自动驾驶数据的类别标签存储至场景数据库,将所述有效自动驾驶数据存储至数据存储库,所述场景数据库与所述数据存储库之间存在映射关系。
[0075] 具体地,继续参考图1,当需要使用自动驾驶数据时,可以先通过场景数据库确定想要的类别标签,然后基于选择的类别标签从数据存储库中提取对应的自动驾驶数据,从而实现对自动驾驶数据的高效管理和应用。
[0076] 可选地,如图5所示,通过对采集的第一数据进行数据处理和标签构建,可以实现数据清洗分类,得到无价值数据、低价值数据和有效自动驾驶数据。无价值数据包含长时间静止数据、严重损坏数据、重复上传数据等,自动驾驶数据构建装置可以将无价值数据放入回收站,并在预定时间段后自动清理;低价值数据包含大量未添加标签的源文件,数据再次读取概率低,自动驾驶数据构建装置可以将低价值数据存入长期归档冷数据,以节约存储成本;有效自动驾驶数据包含大量标签文件数据,需要频繁读取,自动驾驶数据构建装置可以将有效自动驾驶数据挂载得到服务器上以备使用。
[0077] 本发明实施例中,可以在满足预设触发条件的情况下,采集矿区场景的第一数据,由于第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,因此,可以实现极端场景下数据的自动化采集;可以对所述第一数据进行目标处理,得到第二数据,并确定第二数据的类别标签,由于类别标签包括场景标签、障碍物标签以及环境标签,因此可以实现有效自动驾驶数据的分类管理,从而提高管理效率。
[0078] 上述主要从方法的度对本发明实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0079] 本发明实施例提供的面向矿区场景的自动驾驶数据构建方法,执行主体可以为面向矿区场景的自动驾驶数据构建装置,或者该面向矿区场景的自动驾驶数据构建装置中的用于面向矿区场景的自动驾驶数据构建的控制模块。本发明实施例中以面向矿区场景的自动驾驶数据构建装置执行面向矿区场景的自动驾驶数据构建方法为例,说明本发明实施例提供的面向矿区场景的自动驾驶数据构建装置。
[0080] 需要说明的是,本发明实施例可以根据上述方法示例对面向矿区场景的自动驾驶数据构建装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0081] 如图6所示,本发明实施例提供一种面向矿区场景的自动驾驶数据构建装置600。该面向矿区场景的自动驾驶数据构建装置600包括:采集模块601、处理模块602以及标签模块603;所述采集模块601,用于在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;所述处理模块602,用于对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;所述标签模块603,用于确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。
[0082] 可选地,所述第一数据还包括:周期性数据、补采数据以及仿真数据;所述对所述第一数据进行目标处理,得到第二数据之前,所述采集模块601,还用于接收用户的第一输入;响应于所述第一输入,执行以下至少一项操作:按照预设周期采集自动驾驶数据,得到所述周期性数据;确定低质量数据,并采集所述低质量数据的补采数据;采集仿真驾驶系统产生的所述仿真数据,并对所述仿真数据进行真实数据域转换。
[0083] 可选地,在所述第一数据包括所述困难感知场景数据的情况下,所述预设触发条件为检测到用户驾驶操作;在所述第一数据包括所述异常分布数据的情况下,所述预设触发条件为矿区感知模型输出的感知结果的不确定度大于第二阈值;在所述第一数据包括所述稀缺类数据的情况下,所述预设触发条件为矿区感知模型基于所述稀缺类数据输出的感知结果的置信度大于第四阈值。
[0084] 可选地,所述在满足预设触发条件的情况下,采集矿区场景的第一数据之前,所述标签模块603,用于基于场景数据库的类别标签确定样本数量小于第三阈值的稀缺类数据;将所述稀缺类数据的置信度阈值设置为所述第四阈值;其中,所述场景数据库用于分类存储自动驾驶数据的类别标签。
[0085] 可选地,所述无效数据过滤处理用于通过数据校验清洗损坏数据和静止数据,以过滤无效数据;所述数据切分处理用于通过切分数据得到长度相同的数据片段;所述时间同步处理用于实现不同来源数据的时间同步;所述数据解析处理用于区分不同来源的数据。
[0086] 可选地,所述标签模块603,用于通过场景分类模型确定所述第二数据的场景标签;通过矿区感知模型识别所述第二数据所包含的障碍物种类,以得到所述第二数据的障碍物标签;通过人工标注的方式确定所述第二数据的环境标签。
[0087] 可选地,所述确定所述第二数据的类别标签之后,所述标签模块603,还用于将所述有效自动驾驶数据的类别标签存储至场景数据库,将所述有效自动驾驶数据存储至数据存储库,所述场景数据库与所述数据存储库之间存在映射关系。
[0088] 本发明实施例中,可以在满足预设触发条件的情况下,采集矿区场景的第一数据,由于第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,因此,可以实现极端场景下数据的自动化采集;可以对所述第一数据进行目标处理,得到第二数据,并确定第二数据的类别标签,由于类别标签包括场景标签、障碍物标签以及环境标签,因此可以实现有效自动驾驶数据的分类管理,从而提高管理效率。
[0089] 图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface) 720、存储器(memory) 730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行面向矿区场景的自动驾驶数据构建方法,该方法包括:在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。
[0090] 此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0091] 另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的面向矿区场景的自动驾驶数据构建方法,该方法包括:在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。
[0092] 又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的面向矿区场景的自动驾驶数据构建方法,该方法包括:在满足预设触发条件的情况下,采集矿区场景的第一数据,所述第一数据包括以下至少一项:困难感知场景数据、异常分布数据、稀缺类数据,所述困难感知场景数据为感知结果准确度小于第一阈值的场景数据,所述异常分布数据为感知结果的不确定度大于第二阈值的数据,所述稀缺类数据为样本数量小于第三阈值的数据;对所述第一数据进行目标处理,得到第二数据,所述目标处理包括无效数据过滤处理、数据切分处理、时间同步处理以及数据解析处理;确定所述第二数据的类别标签,并将添加了类别标签的所述第二数据确定为有效自动驾驶数据;其中,所述类别标签包括场景标签、障碍物标签以及环境标签。
[0093] 以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0094] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0095] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
QQ群二维码
意见反馈