首页 / 专利库 / 人工智能 / 机器人视觉 / 场景分类器训练方法、装置、场景识别方法及机器人

场景分类器训练方法、装置、场景识别方法及机器人

阅读:1020发布:2020-07-31

专利汇可以提供场景分类器训练方法、装置、场景识别方法及机器人专利检索,专利查询,专利分析的服务。并且本 申请 涉及 机器人 视觉领域,具体而言,涉及一种场景分类器训练方法、装置、场景识别方法及机器人。本申请 实施例 提供的场景分类器训练方法,能够针对从目标场景获取的每张第一场景图像,将第一场景图像输入预设识别模型,以对第一场景图像进行 降维 处理,获得第一场景图像的特征数据,再确定与目标场景对应的场景分类器,并利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练。本申请实施例提供的场景分类器训练方法能够降低添加新场景的复杂程度。,下面是场景分类器训练方法、装置、场景识别方法及机器人专利的具体信息内容。

1.一种场景分类器训练方法,其特征在于,包括:
针对从目标场景获取的每张第一场景图像,将所述第一场景图像输入预设识别模型,以对所述第一场景图像进行降维处理,获得所述第一场景图像的特征数据;
确定与所述目标场景对应的场景分类器;
利用所述第一场景图像的实际标识,以及所述特征数据,对所述场景分类器进行训练。
2.根据权利要求1所述的场景分类器训练方法,其特征在于,所述方法还包括:
获取样本数据集,所述样本数据集中包括多张第二场景图像,以及所述多张第二场景图像的实际标识;
利用所述多张第二场景图像,以及所述多张第二场景图像的实际标识,对预设的机器学习模型进行训练,获得所述预设识别模型。
3.根据权利要求1所述的场景分类器训练方法,其特征在于,所述确定与所述目标场景对应的场景分类器,包括:
监测是否具有场景切换指令生成;
在每生成一条场景切换指令时,创建一个初始分类器,作为与所述目标场景对应的场景分类器。
4.根据权利要求3所述的场景分类器训练方法,其特征在于,所述方法还包括:
判断输入的权限验证信息是否与预设验证信息匹配;
当输入的权限验证信息与预设验证信息匹配时,生成权限解指令;
在生成权限解锁指令后,执行所述监测是否具有场景切换指令生成的步骤。
5.根据权利要求1所述的场景分类器训练方法,其特征在于,所述利用所述第一场景图像的实际标识,以及所述特征数据,对所述场景分类器进行训练,包括:
将所述特征数据输入所述场景分类器,以获取所述场景分类器输出的所述第一场景图像的机器标识;
根据所述第一场景图像的实际标识和所述机器标识,获得损失值;
根据所述损失值,对所述场景分类器的权重参数进行调整,以对所述场景分类器进行训练。
6.一种场景分类器训练装置,其特征在于,包括:
第一获取模,用于针对从目标场景获取的每张第一场景图像,将所述第一场景图像输入预设识别模型,以对所述第一场景图像进行降维处理,获得特征数据;
确定模块,用于确定与所述目标场景对应的场景分类器;
第一训练模块,用于利用所述第一场景图像的实际标识,以及所述特征数据,对所述场景分类器进行训练。
7.一种场景识别方法,其特征在于,包括:
获取第三场景图像;
将所述第三场景图像输入场景识别模型,以获取所述场景识别模型输出的第三场景图像的标识结果,所述场景识别模型包括权利要求1~5中任意一项所述的预设识别模型,以及经过权利要求1~5中任意一项所述的场景分类器训练方法训练获得的场景分类器。
8.根据权利要求7所述的场景识别方法,其特征在于,所述方法还包括:
从预设的场景地图中,确定出与所述标识结果对应的目标位置
根据所述目标位置在所述预设的场景地图中的位置,确定机器人在目标场景中的实际位置。
9.一种机器人,其特征在于,包括处理器和存储器,所述存储器上存储有计算机程序,所述处理器用于执行所述计算机程序,以实现权利要求1~5中任意一项所述的场景分类器训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被执行时,可实现权利要求1~5中任意一项所述的场景分类器训练方法。

说明书全文

场景分类器训练方法、装置、场景识别方法及机器人

技术领域

[0001] 本申请涉及机器人视觉领域,具体而言,涉及一种场景分类器训练方法、装置、场景识别方法及机器人。

背景技术

[0002] 目前,随着深度神经网络的泛化能精度和准确率的不断提高,已被广泛应用于各个行业,例如,机器人视觉领域,包括目标检测、行人识别、场景识别、光学字符识别(Optical Character Recognition,OCR)等。
[0003] 但是,深度神经网络也存在分类集合限制的缺陷,即只能识别经过训练的类别,如需要添加新类别,需要再一次执行训练数据采集、标注、训练等步骤。以机器人场景识别为例,机器人到达某目标场景后,需要通过摄像头从目标场景获取场景图像,然后,人工标注厨房、客厅、卧室、走廊等标识,最后,输入到预设的深度神经网络进行训练,到达另一目标场景后,需要再次通过摄像头从目标场景获取场景图像,然后,人工标注客厅、卧室、走廊等语义标识,最后,输入到预设的深度神经网络进行训练,然而,训练数据收集、标注往往需要大量人工投入,因此,增加了添加新场景的复杂程度。发明内容
[0004] 本申请实施例的目的在于,提供一种场景分类器训练方法、装置、场景识别方法及机器人,以降低添加新场景的复杂程度。
[0005] 第一方面,本申请实施例提供的场景分类器训练方法,包括:
[0006] 针对从目标场景获取的每张第一场景图像,将第一场景图像输入预设识别模型,以对第一场景图像进行降维处理,获得第一场景图像的特征数据;
[0007] 确定与目标场景对应的场景分类器;
[0008] 利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练。
[0009] 本申请实施例提供的场景分类器训练方法,能够针对从目标场景获取的每张第一场景图像,将第一场景图像输入预设识别模型,以对第一场景图像进行降维处理,获得第一场景图像的特征数据,再确定与目标场景对应的场景分类器,并利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练。由于识别模型是预先创建的,而每个目标场景都具有对应的场景分类器,因此,当更换一个目标场景时,便能够通过重复执行本申请实施例提供的场景分类器训练方法实现对对应的场景分类器的训练,从而有效降低了添加新场景的复杂程度。
[0010] 结合第一方面,本申请实施例还提供了第一方面的第一种可选的实施方式,场景分类器训练还包括:
[0011] 获取样本数据集,样本数据集中包括多张第二场景图像,以及多张第二场景图像的实际标识;
[0012] 利用多张第二场景图像,以及多张第二场景图像的实际标识,对预设的机器学习模型进行训练,获得预设识别模型。
[0013] 本申请实施例提供的场景分类器训练方法还包括获取样本数据集,样本数据集中包括多张第二场景图像,以及多张第二场景图像的实际标识,以及利用多张第二场景图像,以及多张第二场景图像的实际标识,对预设的机器学习模型进行训练,获得预设识别模型。因此,针对每个目标场景而言,都能够通过该预设识别模型,对从该目标场景获取的每张第一场景图像进行降维处理,而无需获得新的预设识别模型,因此,能够进一步的降低添加新场景的复杂程度。
[0014] 结合第一方面,本申请实施例还提供了第一方面的第二种可选的实施方式,确定与目标场景对应的场景分类器,包括:
[0015] 监测是否具有场景切换指令生成;
[0016] 在每生成一条场景切换指令时,创建一个初始分类器,作为与目标场景对应的场景分类器。
[0017] 本申请实施例提供的场景分类器训练方法中,确定与目标场景对应的场景分类器,包括:监测是否具有场景切换指令生成,以及在每生成一条场景切换指令时,创建一个初始分类器,作为与目标场景对应的场景分类器。因此,只有在监测到具有场景切换指令生成时,才会创建一个初始分类器,作为与目标场景对应的场景分类器,避免了场景分类器误生成的情况出现,以提高场景分类器训练方法的可靠性。
[0018] 结合第一方面的第二种可选的实施方式,本申请实施例还提供了第一方面的第三种可选的实施方式,场景分类器训练还包括:
[0019] 判断输入的权限验证信息是否与预设验证信息匹配;
[0020] 当输入的权限验证信息与预设验证信息匹配时,生成权限解指令;
[0021] 在生成权限解锁指令后,执行监测是否具有场景切换指令生成的步骤。
[0022] 本申请实施例提供的场景分类器训练方法还包括,判断输入的权限验证信息是否与预设验证信息匹配,以及当输入的权限验证信息与预设验证信息匹配时,生成权限解锁指令,且在生成权限解锁指令后,执行监测是否具有场景切换指令生成的步骤,同样能够避免场景分类器误生成的情况出现,以进一步提高场景分类器训练方法的可靠性。
[0023] 结合第一方面的第三种可选的实施方式,本申请实施例还提供了第一方面的第四种可选的实施方式,场景分类器训练方法还包括:
[0024] 按预设时间间隔,获取机器人的授权时长,授权时长为从机器人生成权限解锁指令的时刻至当前时刻的时长;
[0025] 当授权时长大于预设等待时长时,生成权限锁定指令,以停止执行监测是否具有场景切换指令生成的步骤。
[0026] 本申请实施例提供的场景分类器训练方法还包括,按预设时间间隔,获取机器人的授权时长,授权时长为从机器人生成权限解锁指令的时刻至当前时刻的时长,当授权时长大于预设等待时长时,生成权限锁定指令,以停止执行监测是否具有场景切换指令生成的步骤,同样能够避免场景分类器误生成的情况出现,以更进一步地提高场景分类器训练方法的可靠性。
[0027] 结合第一方面,本申请实施例还提供了第一方面的第五种可选的实施方式,利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练,包括:
[0028] 将特征数据输入场景分类器,以获取场景分类器输出的第一场景图像的机器标识;
[0029] 根据第一场景图像的实际标识和机器标识,获得损失值;
[0030] 根据损失值,对场景分类器的权重参数进行调整,以对场景分类器进行训练。
[0031] 本申请实施例提供的场景训练方法中,利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练,包括:将特征数据输入场景分类器,以获取场景分类器输出的第一场景图像的机器标识,根据第一场景图像的实际标识和机器标识,获得损失值,以及根据损失值,对场景分类器的权重参数进行调整,以对场景分类器进行训练。由于特征数据是对第一场景图像进行降维处理之后获得的,因此,能够简化场景分类器的训练过程,从而进一步降低添加新场景的复杂程度。
[0032] 结合第一方面的第五种可选的实施方式,本申请实施例还提供了第一方面的第六种可选的实施方式,根据第一场景图像的实际标识和机器标识,获得损失值,包括:
[0033] 计算第一场景图像的实际标识与机器标识之间的语义相似度;
[0034] 根据语义相似度,获得损失值。
[0035] 本申请实施例的场景训练方法中,根据第一场景图像的实际标识和机器标识,获得损失值,包括:计算第一场景图像的实际标识与机器标识之间的语义相似度,以及根据语义相似度,获得损失值,计算过程简单从而能够更进一步地降低添加新场景的复杂程度。
[0036] 第二方面,本申请实施例提供的场景分类器训练装置,包括:
[0037] 第一获取模,用于针对从目标场景获取的每张第一场景图像,将第一场景图像输入预设识别模型,以对第一场景图像进行降维处理,获得特征数据;
[0038] 确定模块,用于确定与目标场景对应的场景分类器;
[0039] 第一训练模块,用于利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练。
[0040] 本申请实施例提供的场景分类器训练装置与上述场景分类器训练方法具有同样的有益效果,此处不再赘述。
[0041] 第三方面,本申请实施例提供的场景识别方法,包括:
[0042] 获取第三场景图像;
[0043] 将第三场景图像输入场景识别模型,以获取场景识别模型输出的第三场景图像的标识结果,场景识别模型包括上述第一方面,以及第一方面的任意一种可选的实施方式提供的预设识别模型,以及经过上述第一方面,以及第一方面的任意一种可选的实施方式提供的场景分类器训练方法训练获得的场景分类器。
[0044] 本申请实施例中提供的场景识别方法,能够获取第三场景图像,并将第三场景图像输入场景识别模型,以获取场景识别模型输出的第三场景图像的标识结果,场景识别模型包括上述第一方面,以及第一方面的任意一种可选的实施方式提供的预设识别模型,以及经过上述第一方面,以及第一方面的任意一种可选的实施方式提供的场景分类器训练方法训练获得的场景分类器。由于本申请实施例提供的场景分类器训练方法能够有效降低添加新场景的复杂程度,因此,同样降低了本申请实施例提供的场景识别方法的复杂程度。
[0045] 结合第三方面,本申请实施例还提供了第三方面的第一种可选的实施方式,场景识别方法还包括:
[0046] 从预设的场景地图中,确定出与标识结果对应的目标位置
[0047] 根据目标位置在预设的场景地图中的位置,确定机器人在目标场景中的实际位置。
[0048] 本申请实施例提供的场景识别方法还包括,从预设的场景地图中,确定出与标识结果对应的目标位置,以及根据目标位置在预设的场景地图中的位置,确定机器人在目标场景中的实际位置。如此,当机器人无法定位时,便能够通过本申请实施例提供的场景识别方法实现可靠定位,从而扩展了本申请实施例提供的场景识别方法的可应用范围。
[0049] 第四方面,本申请实施例提供的机器人,包括处理器和存储器,存储器上存储有计算机程序,处理器用于执行计算机程序,以实现上述第一方面,以及第一方面的任意一种可选的实施方式提供的场景分类器训练方法。
[0050] 本申请实施例提供的场景分类器训练装置与上述场景分类器训练方法具有同样的有益效果,此处不再赘述。
[0051] 第五方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被执行时,可实现上述第一方面,以及第一方面的任意一种可选的实施方式提供的场景分类器训练方法。
[0052] 本申请实施例提供的场景分类器训练装置与上述场景分类器训练方法具有同样的有益效果,此处不再赘述。附图说明
[0053] 为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0054] 图1为本申请实施例提供的一种机器人的示意性结构框图
[0055] 图2为本申请实施例提供的一种场景分类器训练方法的步骤流程图
[0056] 图3为本申请实施例提供的一种场景识别方法的步骤流程图。
[0057] 图4为本申请实施例提供的一种场景分类器训练装置的示意性结构框图。
[0058] 附图标记:100-机器人;110-处理器;120-存储器;130-摄像装置;200-场景分类器训练装置;210-第一获取模块;220-确定模块;230-第一训练模块。

具体实施方式

[0059] 为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
[0060] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0061] 请参阅图1,为本申请实施例提供的一种应用场景分类器训练方法、装置及场景识别方法的机器人100的示意性结构框图。本申请实施例中,机器人100可以是,但不限于服务机器人、工业机器人,在结构上,机器人100可以包括处理器110、存储器120和摄像装置130。
[0062] 处理器110分别与存储器120和摄像装置130直接或间接地电性连接,以实现数据的传输或交互,例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。场景分类器训练装置200包括至少一个可以软件固件(Firmware)的形式存储在存储器120中或固化在机器人100的操作系统(Operating System,OS)中的软件模块。处理器110用于执行存储器120中存储的可执行模块,例如,场景分类器训练装置200所包括的软件功能模块及计算机程序等,以实现场景分类器训练方法。处理器110可以在接收到执行指令后,执行计算机程序。
[0063] 其中,处理器110可以是一种集成电路芯片,具有信号处理能力。处理器110也可以是通用处理器,例如,可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、分立或晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。此外,通用处理器可以是微处理器或者任何常规处理器等。
[0064] 存储器120可以是,但不限于,随机存取存储器(Random Access Memory,RAM)、只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦可编程序只读存储器(Erasable Programmable Read-Only Memory,EPROM),以及电可擦编程只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)。存储器120用于存储程序,处理器110在接收到执行指令后,执行该程序。
[0065] 本申请实施例中,摄像装置130设置于机器人100的机身,用于采集场景图像。
[0066] 应当理解,图1所示的结构仅为示意,本申请实施例提供的机器人100还可以具有比图1更少或更多的组件,或是具有与图1所示不同的配置。此外,图1所示的各组件可以通过软件、硬件或其组合实现。
[0067] 请参阅图2,图2为本申请实施例提供的场景分类器训练方法的流程示意图,该方法应用于图1所示的机器人100。所应说明的是,本申请实施例提供的场景分类器训练方法不以图2及以下所示的顺序为限制,以下结合图2对场景分类器训练方法的具体流程及步骤进行描述。
[0068] 步骤S100,针对从目标场景获取的每张第一场景图像,将第一场景图像输入预设识别模型,以对第一场景图像进行降维处理,获得第一场景图像的特征数据。
[0069] 本申请实施例中,目标场景可以是,但不限于某个商场、酒店、私宅。第一场景图像可以是目标场景中包括的任意区域的图像。例如,当目标场景为商场时,第一场景图像可以为商场入口、商品展示区A、商品展示区B等区域的图像,当目标场景为酒店时,第一场景图像可以为大厅、后厨、餐厅、客房A、客房B等区域的图像,当目标场景为私宅时,第一场景图像可以为厨房、客厅、卧室、走廊等区域的图像。
[0070] 此外,本申请实施例中,预设识别模型可以是预先创建,并经过训练的深度神经网络模型。基于此,本申请实施例提供的场景分类器训练方法还可以包括步骤S001和步骤S002。
[0071] 步骤S001,获取样本数据集,样本数据集中包括多张第二场景图像,以及多张第二场景图像的实际标识。
[0072] 本申请实施例中,样本数据集为公开数据集,而样本数据集中包括的第二场景图像可以是从多个样本场景获取的样本图像,其中,多个样本场景需要包括多种类型的场景,例如,商场、酒店、私宅场景等类型的场景。此外,可以理解的是,本申请实施例中,样本场景无需包含前述目标场景,也即,当目标场景为酒店A时,样本场景中可以不包括酒店A。
[0073] 本申请实施例中,第二场景图像的实际标识为第二场景图像对应场景区域的区域标识。例如,当第二场景图像为从商场获取的样本图像时,其实际标识可能为“商场入口”、“商品展示区A”、“商品展示区A”等标识,当第二场景图像为从酒店获取的样本图像时,其实际标识可能为“大厅”、“后厨”、“餐厅”、“客房A”、“客房B”等标识,当第二场景图像为从私宅获取的样本图像时,其实际标识可能为“厨房”、“客厅”、“卧室”、“走廊”等标识。此外,需要说明的是,本申请实施例中,第二场景图像的实际标识可以以文本形式存在,也可以通过文本表示模型转换后,以数值化形式存在,本申请实施例对此不作具体限制。
[0074] 步骤S002,利用多张第二场景图像,以及多张第二场景图像的实际标识,对预设的机器学习模型进行训练,获得预设识别模型。
[0075] 本申请实施例中,预设的机器学习模型为深度神经网络模型。利用多张第二场景图像,以及多张第二场景图像的实际标识,对预设的机器学习模型进行训练,获得预设识别模型之后,便能够将第一场景图像输入预设识别模型,第一场景图像依次通过预设识别模型的卷积层、池化层和全连接层之后,获得第一场景图像的特征数据。可以理解的是,本申请实施例中,特征数据为对第一场景图像进行降维处理之后,用于表征第一场景图像中包括的多个实际物体特征的特征向量
[0076] 步骤S200,确定与目标场景对应的场景分类器。
[0077] 本申请实施例中,目标场景与场景分类器存在一一对应关系。基于此,针对步骤S200,在预先确定目标场景数量的前提下,作为一种可选的实施方式,可以预先创建同等数量个场景分类器,并设定目标场景与场景分类器的对应关系,例如,当目标场景包括酒店A、酒店B和酒店C时,可以预先创建场景分类器A、场景分类器B和场景分类器C,且设定目标场景与场景分类器的对应关系:酒店A对应场景分类器A,酒店B对应场景分类器B,酒店C对应场景分类器C。
[0078] 通过上述设置,步骤S200可以包括步骤S201和步骤S202两个子步骤。
[0079] 步骤S201,监测是否具有场景切换指令生成。
[0080] 本申请实施例中,场景切换指令可以是机器人响应用户操作生成。
[0081] 步骤S202,在每生成一条场景切换指令时,从场景切换指令中解析出对应的分类器标识,以根据分类器标识,确定与目标场景对应的场景分类器。
[0082] 针对步骤S200,在预先无法确定目标场景数量的前提下,作为第二种可选的实施方式,其又可以包括步骤S211和步骤S212两个子步骤。
[0083] 步骤S211,监测是否具有场景切换指令生成。
[0084] 本申请实施例中,场景切换指令可以是机器人响应用户操作生成。
[0085] 步骤S212,在每生成一条场景切换指令时,创建一个初始分类器,作为与目标场景对应的场景分类器。
[0086] 此外,需要说明的是,本申请实施例中,场景分类器可以是,但不限于支持向量机(Support Vector Machine,SVM)、随机森林分类器。
[0087] 基于步骤S201和步骤S211,本申请实施例提供的场景分类器识别方法还可以包括步骤S400和步骤S500,以避免场景分类器误生成的情况出现,从而提高场景分类器训练方法的可靠性。
[0088] 步骤S400,判断输入的权限验证信息是否与预设验证信息匹配。
[0089] 本申请实施例中,权限验证信息可以是字符密码、生物特征信息,其中,生物特征信息可以包括,但不限于人脸信息、指纹信息、虹膜信息。当权限验证信息为字符密码时,预设验证信息同样为字符密码,当权限验证信息为生物特征信息时,预设验证信息同样为生物特征信息。
[0090] 步骤S500,当输入的权限验证信息与预设验证信息匹配时,生成权限解锁指令,在生成权限解锁指令后,执行监测是否具有场景切换指令生成的步骤。
[0091] 同样,为了避免场景分类器误生成的情况出现,从而进一步提高场景分类器训练方法的可靠性。本申请实施例提供的场景分类器识别方法还可以包括步骤S600和步骤S700。
[0092] 步骤S600,按预设时间间隔,获取机器人的授权时长,授权时长为从机器人生成权限解锁指令的时刻至当前时刻的时长。
[0093] 步骤S700,当授权时长大于预设等待时长时,生成权限锁定指令,以停止执行监测是否具有场景切换指令生成的步骤。
[0094] 步骤S300,利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练。
[0095] 本申请实施例中,第一场景图像的实际标识为第一场景图像对应场景区域的区域标识。例如,当第一场景图像为从商场获取的样本图像时,其实际标识可能为“商场入口”、“商品展示区A”、“商品展示区A”等标识,当第一场景图像为从酒店获取的样本图像时,其实际标识可能为“大厅”、“后厨”、“餐厅”、“客房A”、“客房B”等标识,当第一场景图像为从私宅获取的样本图像时,其实际标识可能为“厨房”、“客厅”、“卧室”、“走廊”等标识。此外,需要说明的是,本申请实施例中,第一场景图像的实际标识可以以文本形式存在,也可以通过文本表示模型转换后,以数值化形式存在,本申请实施例对此不作具体限制。
[0096] 本申请实施例中,第一场景图像的实际标识可以通过场景地图获得。基于此,本申请实施例提供的场景分类器训练方法还可以包括步骤S010和步骤S020。
[0097] 步骤S010,创建与目标场景对应的场景地图,场景地图中包括多个场景区域,多个场景区域具有对应的区域标识。
[0098] 实际实施时,可以通过即时定位与地图构建(Simultaneous Localization And Mapping,SLAM)算法创建与目标场景对应的场景地图,同时,为场景地图中包括的每个场景区域添加对应的区域标识。
[0099] 步骤S020,确定第一场景图像的采集位置所在的场景区域,根据场景区域对应的区域标识,获得第一场景图像的实际标识。
[0100] 本申请实施例中,确定第一场景图像的采集位置所在的场景区域之后,可以直接将场景区域对应的区域标识,作为第一场景图像的实际标识。在获得第一场景图像的实际标识之后,便可以执行步骤300,以下将以场景分类器为SVM为例,对步骤S300的具体流程进行说明。当场景分类器为SVM时,步骤S300可以包括步骤S310、步骤S320和步骤S330。
[0101] 步骤S310,将特征数据输入场景分类器,以获取场景分类器输出的第一场景图像的机器标识。
[0102] 本申请实施例中,第一场景图像的机器标识可以以文本形式存在,也可以通过文本表示模型转换后,以数值化形式存在,本申请实施例对此不作具体限制。
[0103] 步骤S320,根据第一场景图像的实际标识和机器标识,获得损失值。
[0104] 本申请实施例中,可以通过预设损失函数,计算第一场景图像的实际标识与机器标识之间的语义相似度,再根据语义相似度,获得损失值。可以理解的是,本申请实施例中,损失值与语义相似度呈反比例关系。
[0105] 步骤S330,根据损失值,对场景分类器的权重参数进行调整,以对场景分类器进行训练。
[0106] 需要说明的是,在实际实施过程中,可以依次重复执行上述步骤S100、步骤S200和步骤S300,以对场景分类器的权重参数进行多次调整,使场景分类器不断优化,直至步骤S300中获得的损失值小于预设损失阈值为止。此外,还需要说明的是,在实际实施过程中,也可以预选获得多张第一场景图像,分别将多张第一场景图像输入预设识别模型,以对多张第一场景图像进行降维处理,获得多张第一场景图像的特征数据,在确定与目标场景对应的场景分类器之后,利用多张第一场景图像的实际标识,以及多张第一场景图像的特征数据,对所述场景分类器进行训练,也即,重复执行上述步骤S100,再执行上述步骤S200,最后,重复执行上述步骤S300,同样可以实现对场景分类器的权重参数进行多次调整,使场景分类器不断优化的目的。
[0107] 基于与上述场景分类器训练方法同样的发明构思,本申请实施例还提供了一种场景识别方法,请参阅图3,本申请实施例提供的场景识别方法包括步骤S1000和步骤S2000。
[0108] 步骤S1000,获取第三场景图像。
[0109] 步骤S2000,将第三场景图像输入场景识别模型,以获取场景识别模型输出的第三场景图像的标识结果,场景识别模型包括上述预设识别模型,以及经过上述第场景分类器训练方法训练获得的场景分类器。
[0110] 本申请实施例中,第三场景图像可以是目标场景中包括的任意区域的图像,当获得第三场景图像之后,便可以将第三场景图像输入场景识别模型,以获取场景识别模型输出的第三场景图像的标识结果,此后,从预设的场景地图中,确定出与标识结果对应的目标位置,并根据目标位置在场景地图中的位置,确定机器人在目标场景中的实际位置。
[0111] 通过上述设置,当机器人无法定位时,便能够通过本申请实施例提供的场景识别方法实现可靠定位,从而扩展了本申请实施例提供的场景识别方法的可应用范围。
[0112] 基于与上述场景分类器训练方法同样的发明构思,本申请实施例还提供了一种场景分类器训练装置200,请参阅图4,本申请实施例提供的场景分类器训练装置200包括第一获取模块210、确定模块220和第一训练模块230。
[0113] 第一获取模块210,用于针对从目标场景获取的每张第一场景图像,将第一场景图像输入预设识别模型,以对第一场景图像进行降维处理,获得特征数据。
[0114] 关于第一获取模块210的描述具体可参考对图2中所示的步骤S100的详细描述,也即,步骤S100可以由第一获取模块210执行。
[0115] 确定模块220,用于确定与目标场景对应的场景分类器。
[0116] 关于确定模块220的描述具体可参考对图2中所示的步骤S200的详细描述,也即,步骤S200可以由确定模块220执行。
[0117] 本申请实施例中,确定模块220可以包括监测单元和创建单元。
[0118] 监测单元,用于监测是否具有场景切换指令生成。
[0119] 关于监测单元的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S211的详细描述,也即,步骤S211可以由监测单元执行。
[0120] 创建单元,用于在每生成一条场景切换指令时,创建一个初始分类器,作为与目标场景对应的场景分类器。
[0121] 关于创建单元的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S212的详细描述,也即,步骤S212可以由创建单元执行。
[0122] 第一训练模块230,用于利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练。
[0123] 关于第一训练模块230的描述具体可参考对图2中所示的步骤S300的详细描述,也即,步骤S300可以由第一训练模块230执行。
[0124] 本申请实施例中,第一训练模块230可以包括标识单元、获取单元和训练单元。
[0125] 标识单元,用于将特征数据输入场景分类器,以获取场景分类器输出的第一场景图像的机器标识。
[0126] 关于标识单元的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S310的详细描述,也即,步骤S310可以由标识单元执行。
[0127] 获取单元,用于根据第一场景图像的实际标识和机器标识,获得损失值。
[0128] 关于获取单元的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S320的详细描述,也即,步骤S320可以由获取单元执行。
[0129] 训练单元,用于根据损失值,对场景分类器的权重参数进行调整,以对场景分类器进行训练。
[0130] 关于训练单元的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S320的详细描述,也即,步骤S320可以由训练单元执行。
[0131] 本申请实施例提供的场景分类器训练装置200还可以包括第二获取模块和第二训练模块。
[0132] 第二获取模块,用于获取样本数据集,样本数据集中包括多张第二场景图像,以及多张第二场景图像的实际标识。
[0133] 关于第二获取模块的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S001的详细描述,也即,步骤S001可以由第二获取模块执行。
[0134] 第二训练模块,用于利用多张第二场景图像,以及多张第二场景图像的实际标识,对预设的机器学习模型进行训练,获得预设识别模型。
[0135] 关于第二训练模块的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S002的详细描述,也即,步骤S002可以由第二训练模块执行。
[0136] 本申请实施例提供的场景分类器训练装置200还可以包括验证模块和生成模块。
[0137] 验证模块,用于判断输入的权限验证信息是否与预设验证信息匹配。
[0138] 关于验证模块的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S400的详细描述,也即,步骤S400可以由验证模块执行。
[0139] 生成模块,用于当输入的权限验证信息与预设验证信息匹配时,生成权限解锁指令,以使监测单元在生成权限解锁指令后,执行监测是否具有场景切换指令生成的步骤。
[0140] 关于生成模块的描述具体可参考上述场景分类器训练方法相关实施例中关于步骤S500的详细描述,也即,步骤S500可以由生成模块执行。
[0141] 此外,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被执行时,可实现上述方法实施例中提供的采集分类器训练方法,具体可参见上述方法实施例,此处不再赘述。
[0142] 综上所述,本申请实施例提供的场景分类器训练方法、装置及机器人,能够针对从目标场景获取的每张第一场景图像,将第一场景图像输入预设识别模型,以对第一场景图像进行降维处理,获得第一场景图像的特征数据,再确定与目标场景对应的场景分类器,并利用第一场景图像的实际标识,以及特征数据,对场景分类器进行训练。由于识别模型是预先创建的,而每个目标场景都具有对应的场景分类器,因此,当更换一个目标场景时,便能够通过重复执行本申请实施例提供的场景分类器训练方法,实现对对应的场景分类器的训练,从而有效降低了添加新场景的复杂程度。
[0143] 本申请实施例中提供的场景识别方法,能够获取第三场景图像,并将场景图像输入场景识别模型,以获取场景识别模型输出的第三场景图像的标识结果,场景识别模型包括上述场景分类器训练方法实施例中所提供的预设识别模型,以及上述场景分类器训练方法实施例中所提供的经过训练的场景分类器,由于本申请实施例提供的场景分类器训练方法能够有效降低添加新场景的复杂程度,因此,同样降低了本申请实施例提供的场景识别方法的复杂程度。
[0144] 在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0145] 另外,在本申请每个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是每个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0146] 所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请每个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、RAM、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
[0147] 以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0148] 以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
[0149] 需要说明的是,在本申请实施例中,诸如“第一”、“第二”和“第三”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈