首页 / 专利库 / 电脑编程 / 图像处理 / 图像处理的方法及装置

图像处理的方法及装置

阅读:2发布:2020-09-03

专利汇可以提供图像处理的方法及装置专利检索,专利查询,专利分析的服务。并且本 申请 实施例 提供一种 图像处理 的方法及装置,涉及图像处理技术领域,在获取一场所的至少一张图片后,可以将至少一张图片输入该对象统计模型,利用该对象统计模型将至少一张图片切分为多张仅包括一待统计对象的待统计图片,并根据待统计图片的 质量 特征对多张待统计图片过滤,对过滤后的待统计图片进行识别,得到场所的目标对象特征和/或目标对象个数,因为根据质量特征对多张待统计图片过滤可以过滤掉质量较差的图片,避免质量差的多张待统计图片对统计结果的影响,因此根据本申请实施例的对象统计模型可以统计得到准确的目标对象特征和/或目标对象个数,且整个统计过程不需要人工参与,统计的效率较高。,下面是图像处理的方法及装置专利的具体信息内容。

1.一种图像处理的方法,其特征在于,应用于电子设备,所述方法包括:
获取一场所的至少一张图片;
将所述至少一张图片输入预先训练的对象统计模型;
利用所述对象统计模型将所述至少一张图片切分为多张待统计图片,每张所述待统计图片仅包括一待统计对象;以及,根据所述待统计图片的质量特征对所述多张待统计图片过滤;以及,对过滤后的待统计图片进行识别,得到所述场所的目标对象特征和/或目标对象个数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取包括各目标对象的标注信息的样本图片;
将所述多张样本图片切分为多张待统计样本图片,每张所述待统计样本图片仅包括一所述目标对象;
根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤;
根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤包括:
针对每张所述待统计样本图片,识别所述待统计样本图片的质量特征;
根据各所述目标对象的标注信息对所述待统计样本图片进行分组,每个分组中包含具有相同目标对象的待统计样本图片;
针对每个分组,根据该分组中待统计样本图片的质量特征确定质量最高的待统计样本图片;将质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值;以及,将所有分组中,过滤参数阈值最低的值作为目标过滤参数;
根据所述目标过滤参数对多张待统计样本图片过滤,得到过滤后的待统计样本图片。
4.根据权利要求2或3所述的方法,其特征在于,所述根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型,包括:
根据神经网络模型中预设的相似度阈值对过滤后的待统计样本图片进行识别,得到预测识别结果;所述预测识别结果包括:识别对象特征和/或识别对象个数;
在预测识别结果与样本实际结果的差异不满足损失函数的情况下,调整所述神经网络模型的相似度参数,直到重新预测的识别结果与样本实际结果相符,得到所述对象统计模型。
5.根据权利要求3所述的方法,其特征在于,所述根据所述待统计图片的质量特征对所述多张待统计图片过滤,包括:
将所述多张待统计图片中,质量特征的参数低于所述目标过滤参数的待统计图片过滤掉。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述目标对象为人脸。
7.根据权利要求6所述的方法,其特征在于,所述质量特征包括以下至少一种:遮光度、模糊度、光照、人脸度、人脸尺寸。
8.根据权利要求1-3任一项所述的方法,其特征在于,所述获取一场所的至少一张图片,包括:
从拍摄设备中获取所述场所的至少一张图片,所述拍摄设备设置与所述场所中。
9.一种图像处理的装置,其特征在于,应用于电子设备,包括:
图片获取模,用于获取一场所的至少一张图片;
输入模块,用于将所述至少一张图片输入预先训练的对象统计模型;
统计模块,用于利用所述对象统计模型将所述至少一张图片切分为多张待统计图片,每张所述待统计图片仅包括一待统计对象;以及,根据所述待统计图片的质量特征对所述多张待统计图片过滤;以及,对过滤后的待统计图片进行识别,得到所述场所的目标对象特征和/或目标对象个数。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括对象统计模型训练模块,用于:
获取包括各目标对象的标注信息的样本图片;
将所述多张样本图片切分为多张待统计样本图片,每张所述待统计样本图片仅包括一所述目标对象;
根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤;
根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型。
11.根据权利要求10所述的装置,其特征在于,所述对象统计模型训练模块,具体用于:
针对每张所述待统计样本图片,识别所述待统计样本图片的质量特征;
根据各所述目标对象的标注信息对所述待统计样本图片进行分组,每个分组中包含具有相同目标对象的待统计样本图片;
针对每个分组,根据该分组中待统计样本图片的质量特征确定质量最高的待统计样本图片;将质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值;以及,将所有分组中,过滤参数阈值最低的值作为目标过滤参数;
根据所述目标过滤参数对多张待统计样本图片过滤,得到过滤后的待统计样本图片。
12.根据权利要求10或11所述的装置,其特征在于,所述对象统计模型训练模块,具体还用于:
根据神经网络模型中预设的相似度阈值对过滤后的待统计样本图片进行识别,得到预测识别结果;所述预测识别结果包括:识别对象特征和/或识别对象个数;
在预测识别结果与样本实际结果的差异不满足损失函数的情况下,调整所述神经网络模型的相似度参数,直到重新预测的识别结果与样本实际结果相符,得到所述对象统计模型。
13.根据权利要求11所述的装置,其特征在于,所述统计模块具体用于:
将所述多张待统计图片中,质量特征的参数低于所述目标过滤参数的待统计图片过滤掉。
14.根据权利要求9-11任一项所述的装置,其特征在于,所述目标对象为人脸。
15.根据权利要求14所述的装置,其特征在于,所述质量特征包括以下至少一种:遮光度、模糊度、光照、人脸角度、人脸尺寸。
16.根据权利要求9-11任一项所述的装置,其特征在于,所述图片获取模块,具体用于:
从拍摄设备中获取所述场所的至少一张图片,所述拍摄设备设置与所述场所中。
17.一种电子设备,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8任一项所述的方法的指令。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,计算机指令用于使所述计算机执行如权利要求1-8任一项所述的方法。

说明书全文

图像处理的方法及装置

技术领域

[0001] 本申请涉及图像处理领域的人工智能,尤其涉及一种图像处理的方法及装置。

背景技术

[0002] 无论在商场、演唱会等商业场所,还是在会议室等会议场所,通常都需要对场所内的人数进行统计。
[0003] 现有技术中,进行人数统计时,通常是基于人工统计,不仅效率低,而且准确率也不高。发明内容
[0004] 本申请实施例提供一种图像处理的方法及装置,以解决现有技术中统计人数时效率和准确率较低的技术问题。
[0005] 本申请实施例第一方面提供一种图像处理的方法,包括:
[0006] 获取一场所的至少一张图片;
[0007] 将所述至少一张图片输入预先训练的对象统计模型;
[0008] 利用所述对象统计模型将所述至少一张图片切分为多张待统计图片,每张所述待统计图片仅包括一待统计对象;以及,根据所述待统计图片的质量特征对所述多张待统计图片过滤;以及,对过滤后的待统计图片进行识别,得到所述场所的目标对象特征和/或目标对象个数。
[0009] 本申请实施例中预先训练得到对象统计模型,在获取一场所的至少一张图片后,可以将至少一张图片输入该对象统计模型,利用该对象统计模型将至少一张图片切分为多张仅包括一待统计对象的待统计图片,并根据待统计图片的质量特征对多张待统计图片过滤,对过滤后的待统计图片进行识别,得到场所的目标对象特征和/或目标对象个数,因为根据质量特征对多张待统计图片过滤可以过滤掉质量较差的图片,避免质量差的多张待统计图片对统计结果的影响,因此根据本申请实施例的对象统计模型可以统计得到准确的目标对象特征和/或目标对象个数,且整个统计过程不需要人工参与,统计的效率较高。
[0010] 可选的,所述方法还包括:
[0011] 获取包括各目标对象的标注信息的样本图片;
[0012] 将所述多张样本图片切分为多张待统计样本图片,每张所述待统计样本图片仅包括一所述目标对象;
[0013] 根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤;
[0014] 根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型。
[0015] 本申请实施例中,在模型训练时,先根据样本图片的质量特征和标注信息对待统计样本图片进行过滤,再根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到对象统计模型,一方面可以避免质量较差的图片对模型训练的准确度的影响,另一方面过滤后的待统计样本图片数量会减少,在根据过滤后的待统计样本图片训练对象统计模型时,可以节约计算资源,提升训练对象统计模型的效率。
[0016] 可选的,所述根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤包括:
[0017] 针对每张所述待统计样本图片,识别所述待统计样本图片的质量特征;
[0018] 根据各所述目标对象的标注信息对所述待统计样本图片进行分组,每个分组中包含具有相同目标对象的待统计样本图片;
[0019] 针对每个分组,根据该分组中待统计样本图片的质量特征确定质量最高的待统计样本图片;将质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值;以及,将所有分组中,过滤参数阈值最低的值作为目标过滤参数;
[0020] 根据所述目标过滤参数对多张待统计样本图片过滤,得到过滤后的待统计样本图片。
[0021] 本申请实施例中,在每个分组中,将该分组中质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值,并将所有分组中,过滤参数阈值最低的值作为目标过滤参数,进而将低于目标过滤参数的待统计样本图片过滤掉,则可以保证每个目标对象至少保留一张待统计图片,且尽可能多的过滤了质量差的待统计图片。
[0022] 可选的,所述根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型,包括:
[0023] 根据神经网络模型中预设的相似度阈值对过滤后的待统计样本图片进行识别,得到预测识别结果;所述预测识别结果包括:识别对象特征和/或识别对象个数;
[0024] 在预测识别结果与样本实际结果的差异不满足损失函数的情况下,调整所述神经网络模型的相似度参数,直到重新预测的识别结果与样本实际结果相符,得到所述对象统计模型。
[0025] 可选的,所述根据所述待统计图片的质量特征对所述多张待统计图片过滤,包括:
[0026] 将所述多张待统计图片中,质量特征的参数低于所述目标过滤参数的待统计图片过滤掉。
[0027] 可选的,所述目标对象为人脸。本申请实施例的对象统计模型,可以统计出该场所中的人数,以及每个人的人脸图像。
[0028] 可选的,所述质量特征包括以下至少一种:遮光度、模糊度、光照、人脸度、人脸尺寸。
[0029] 可选的,所述获取一场所的至少一张图片,包括:
[0030] 从拍摄设备中获取所述场所的至少一张图片,所述拍摄设备设置与所述场所中。
[0031] 本申请实施例第二方面提供一种图像处理的装置,包括:
[0032] 图片获取模,用于获取一场所的至少一张图片;
[0033] 输入模块,用于将所述至少一张图片输入预先训练的对象统计模型;
[0034] 统计模块,用于利用所述对象统计模型将所述至少一张图片切分为多张待统计图片,每张所述待统计图片仅包括一待统计对象;以及,根据所述待统计图片的质量特征对所述多张待统计图片过滤;以及,对过滤后的待统计图片进行识别,得到所述场所的目标对象特征和/或目标对象个数。
[0035] 可选的,所述装置还包括对象统计模型训练模块,用于:
[0036] 获取包括各目标对象的标注信息的样本图片;
[0037] 将所述多张样本图片切分为多张待统计样本图片,每张所述待统计样本图片仅包括一所述目标对象;
[0038] 根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤;
[0039] 根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型。
[0040] 可选的,所述对象统计模型训练模块,具体用于:
[0041] 针对每张所述待统计样本图片,识别所述待统计样本图片的质量特征;
[0042] 根据各所述目标对象的标注信息对所述待统计样本图片进行分组,每个分组中包含具有相同目标对象的待统计样本图片;
[0043] 针对每个分组,根据该分组中待统计样本图片的质量特征确定质量最高的待统计样本图片;将质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值;以及,将所有分组中,过滤参数阈值最低的值作为目标过滤参数;
[0044] 根据所述目标过滤参数对多张待统计样本图片过滤,得到过滤后的待统计样本图片。
[0045] 可选的,所述对象统计模型训练模块,具体还用于:
[0046] 根据神经网络模型中预设的相似度阈值对过滤后的待统计样本图片进行识别,得到预测识别结果;所述预测识别结果包括:识别对象特征和/或识别对象个数;
[0047] 在预测识别结果与样本实际结果的差异不满足损失函数的情况下,调整所述神经网络模型的相似度参数,直到重新预测的识别结果与样本实际结果相符,得到所述对象统计模型。
[0048] 可选的,所述统计模块具体用于:
[0049] 将所述多张待统计图片中,质量特征的参数低于所述目标过滤参数的待统计图片过滤掉。
[0050] 可选的,所述目标对象为人脸。
[0051] 可选的,所述质量特征包括以下至少一种:遮光度、模糊度、光照、人脸角度、人脸尺寸。
[0052] 可选的,所述图片获取模块,具体用于:
[0053] 从拍摄设备中获取所述场所的至少一张图片,所述拍摄设备设置与所述场所中。
[0054] 本申请实施例第三方面提供一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前述第一方面任一项所述的方法。
[0055] 本申请实施例第四方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如前述第一方面中任一项所述的方法。
[0056] 综上所述,本申请实施例相对于现有技术的有益效果:
[0057] 本申请实施例中提供了一种图像处理的方法及装置,预先训练得到对象统计模型,在获取一场所的至少一张图片后,可以将至少一张图片输入该对象统计模型,利用该对象统计模型将至少一张图片切分为多张仅包括一待统计对象的待统计图片,并根据待统计图片的质量特征对多张待统计图片过滤,对过滤后的待统计图片进行识别,得到场所的目标对象特征和/或目标对象个数,因为根据质量特征对多张待统计图片过滤可以过滤掉质量较差的图片,避免质量差的多张待统计图片对统计结果的影响,因此根据本申请实施例的对象统计模型可以统计得到准确的目标对象特征和/或目标对象个数,且整个统计过程不需要人工参与,统计的效率较高。附图说明
[0058] 图1为本申请实施例提供的图像处理的方法适用的系统架构示意图;
[0059] 图2为本申请实施例提供的图像处理的方法的流程示意图;
[0060] 图3为本申请实施例提供的图像处理的一种具体方法流程示意图;
[0061] 图4为本申请实施例提供的图像处理的另一种具体方法流程示意图;
[0062] 图5为本申请提供的图像处理装置的装置实施例的结构示意图;
[0063] 图6是用来实现本申请实施例的图像处理的方法的电子设备的框图

具体实施方式

[0064] 以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0065] 本申请实施例的图像处理方法可以应用于电子设备,电子设备可以包括:手机、平板电脑笔记本电脑、台式电脑或者服务器等电子设备。本申请实施例对应用的具体设备不作具体限定。
[0066] 本申请实施例所描述的对象统计模型可以是基于深度学习的神经网络模型,对象统计模型可以输出至少一张图片中所包含的待统计对象的对象特征和/或对象个数。示例性的,待统计的对象可以为至少一张图片中包括的不同的人脸等,人脸特征可以为人脸图像等,对象统计模型可以输出识别到的所有不同的人脸图像,或输出识别到的至少一张图片中所包含的不同的人脸的个数,或同时输出人脸图像和个数,本申请实施例对此不作具体限定。
[0067] 本申请实施例所描述的待统计图片的质量特征可以反映识别待统计图片中的待统计对象的难易,即待统计图片的质量特征的参数越高,识别该待统计图片的待统计对象越容易和准确。示例性的,以待统计对象为人脸为例,质量特征可以包括遮光度、模糊度、光照、人脸角度和人脸尺寸中的至少一个,本申请实施例对质量特征不作具体限定。
[0068] 如图1所示,图1为本申请实施例提供的方法所适用的应用场景架构示意图。
[0069] 本申请实施例中,可以预先在服务器12训练对象统计模型,训练的具体方式将在后续的实施例中详细说明,在此不再赘述。
[0070] 服务器12完成对象统计模型的训练后,可以将对象统计模型可以以插件、应用程序(application,APP)等形式进行封装,电子设备11可以通过加载等方式从服务器12中获取对象统计模型,并将对象统计模型设置在电子设备11中,进而电子设备11在获取一场所的至少一张图片后,可以将至少一张图片输入该对象统计模型,利用该对象统计模型将至少一张图片切分为多张仅包括一待统计对象的待统计图片,并根据待统计图片的质量特征对多张待统计图片过滤,对过滤后的待统计图片进行识别,得到场所的目标对象特征和/或目标对象个数,因为根据质量特征对多张待统计图片过滤可以过滤掉质量较差的图片,避免质量差的多张待统计图片对统计结果的影响,因此根据本申请实施例的对象统计模型可以统计得到准确的目标对象特征和/或目标对象个数,且整个统计过程不需要人工参与,统计的效率较高。
[0071] 可以理解,电子设备11也可以执行训练对象统计模型的步骤,则电子设备11不需要与服务器进行交互,具体应用中,还可以根据实际的应用场景采用其他的网络架构,本申请实施例对此不作具体限定。
[0072] 如图2所示,图2为本申请实施例提供的图像处理的方法的流程示意图。
[0073] 该方法具体可以包括:
[0074] 步骤S101:获取一场所的至少一张图片。
[0075] 本申请实施例中,场所可以是商场、会议室等任何可能需要统计目标对象的场所,本申请实施例对场所不作具体限定。场所中设置有拍摄设备,通过拍摄设备的摄像头可以拍摄到该场所的至少一张图片。
[0076] 本申请实施例中,电子设备中可以预先存储一场地的至少一张图片,则电子设备可以从本地获取一场所的至少一张图片。电子设备也可以从可移动设备(如移动硬盘、U盘等)获取一场所的至少一张图片。电子设备也可以提供用户界面,在用户界面中接收用户上传的一场地的至少一张图片。电子设备还可以通过与安装在该场所的拍摄设备的交互获取该场所的至少一张图片。本申请实施例对此不作具体限定。
[0077] 在本申请实施例的一种可选实现方式中,所述获取一场所的至少一张图片,包括:从拍摄设备中获取所述场所的至少一张图片,所述拍摄设备设置与所述场所中。
[0078] 本申请实施例中,拍摄设备可以电子设备进行任意形式的通信,示例的,拍摄设备可以以有线方式与电子设备通信,也可以以无线方式与电子设备通信,比如,无线通信可以为:蓝牙通信、红外通信、近场通信、局域网通信等,本申请实施例对此不作具体限定。
[0079] 本申请实施例中,拍摄设备可以按照一定频率拍摄场所的至少一张图片,并将拍摄的图片发送给电子设备。拍摄设备也可以在接收到电子设备的拍摄指令后,拍摄场所的至少一张图片,并将拍摄的图片发送给电子设备。拍摄设备还可以按照一定频率拍摄场所的至少一张图片,并存储在拍摄设备本地,电子设备可以根据需求从拍摄设备获取至少一张图片。本申请实施例对电子设备获取一场所的至少一张图片的具体方式不作限定。
[0080] 步骤S102:将所述至少一张图片输入预先训练的对象统计模型。
[0081] 本申请实施例中,电子设备中预先设置有该对象统计模型,具体的对象统计模型的设置方式可以参照图1对应的实施例的说明,在此不再赘述。电子设备在获取该至少一张图片后,可以将该至少一张图片输入该预先训练的对象统计模型。
[0082] 可选的,训练对象统计模型可以包括:
[0083] 获取包括各目标对象的标注信息的样本图片;将所述多张样本图片切分为多张待统计样本图片,每张所述待统计样本图片仅包括一所述目标对象;根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤;根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型。
[0084] 本申请实施例中,样本图片可以是包括至少一个目标对象的图片,获取样本图片的方式可以类似于步骤S101中获取图片的方式,在此不再赘述。
[0085] 样本图片中所包括的目标对象的标注信息可以是标注工具标注的,也可以是人工标注的,标注信息可以是该目标对象的编码、名称、代号等,本申请实施例对标注信息不作具体限定。
[0086] 本申请实施例中,一个具体的目标对象对应一个标注信息。示例性的,以目标对象为人脸为例,不同形态的人脸A都对应一个标注信息a,不同形态的人脸B都对应一个标注信息b,使得通过标注信息可以对不同的目标对象进行区分。
[0087] 本申请实施例中,样本图片中可能包括多个目标对象,因此,可以分别将每张样本图片切分为多张待统计样本图片,每张待统计样本图片仅包括一个目标对象,则后续可以通过对待统计样本图片的识别,确定目标对象特征和个数。
[0088] 本申请实施例中,考虑到被识别的图片质量会和诸多因素相关,包括摄像头部署地点的光照条件、摄像头的角度等实际场景导致拍摄到的图片的光照、模糊度、目标对象大小、遮挡程度等相关,在对质量较差的图片识别时,可能会出现识别错误,进而导致统计结果不准确,因此,在模型训练时,先根据样本图片的质量特征和标注信息对待统计样本图片进行过滤,再根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到对象统计模型,一方面可以避免质量较差的图片对模型训练的准确度的影响,另一方面过滤后的待统计样本图片数量会减少,在根据过滤后的待统计样本图片训练对象统计模型时,可以节约计算资源,提升训练对象统计模型的效率。
[0089] 步骤S103:利用所述对象统计模型将所述至少一张图片切分为多张待统计图片,每张所述待统计图片仅包括一待统计对象;以及,根据所述待统计图片的质量特征对所述多张待统计图片过滤;以及,对过滤后的待统计图片进行识别,得到所述场所的目标对象特征和/或目标对象个数。
[0090] 本申请实施例中,对象统计模型可以将至少一张图片切分为多张仅包括一个待统计对象的待统计图片,并检测每张待统计图片的质量特征,根据预先训练时设定的过滤策略对多张待统计图片进行过滤,以及对过滤后的待统计图片进行识别,得到该场所中的目标对象特征和/或目标对象个数。
[0091] 本申请实施例中,对过滤后的待统计图片进行识别,得到该场所中的目标对象特征和/或目标对象个数的具体实现可以是:依次两个为一组比对过滤后的待统计图片,如果一组图片的相似度大于或等于模型训练时得到的相似度阈值,则可以认为该组图片为同一个目标对象,如果一组图片的相似度小于模型训练时得到的相似度阈值,则可以认为该组图片为两个目标对象,在完成所有的两两比对后,可以得到过滤后的待统计图片中具体包括多少个目标对象,以及各目标对象的图像特征。以目标对象为人脸为例,通过本申请实施例的对象统计模型,可以统计出该场所中的人数,以及每个人的人脸图像。
[0092] 可选的,所述根据所述待统计图片的质量特征对所述多张待统计图片过滤,包括:将所述多张待统计图片中,质量特征的参数低于目标过滤参数的待统计图片过滤掉。
[0093] 本申请实施例中,目标过滤参数是对象统计模型在训练阶段中训练得到的,将质量特征的参数低于目标过滤参数的待统计图片过滤掉,即可以得到质量特征较好的待统计图片,也可保证每个目标对象至少有保留一张图片。目标过滤参数具体的训练过程将在后续实施例中具体说明,在此不再赘述。
[0094] 综上所述,本申请实施例中提供了一种图像处理的方法及装置,预先训练得到对象统计模型,在获取一场所的至少一张图片后,可以将至少一张图片输入该对象统计模型,利用该对象统计模型将至少一张图片切分为多张仅包括一待统计对象的待统计图片,并根据待统计图片的质量特征对多张待统计图片过滤,对过滤后的待统计图片进行识别,得到场所的目标对象特征和/或目标对象个数,因为根据质量特征对多张待统计图片过滤可以过滤掉质量较差的图片,避免质量差的多张待统计图片对统计结果的影响,因此根据本申请实施例的对象统计模型可以统计得到准确的目标对象特征和/或目标对象个数,且整个统计过程不需要人工参与,统计的效率较高。
[0095] 在本申请实施例的一种可选实现方式中,如图3所示,所述根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤包括:
[0096] 步骤S301:针对每张所述待统计样本图片,识别所述待统计样本图片的质量特征。
[0097] 本申请实施例中,可以根据实际的应用场景确定待统计图片的质量特征的具体内容,本申请实施例对此不作具体限定。
[0098] 示例性的,所述目标对象为人脸,所述质量特征包括以下至少一种:遮光度、模糊度、光照、人脸角度、人脸尺寸。
[0099] 遮光度越高可以表明图片质量越差,比如,遮光度的取值范围[0~1],0为无遮挡,1是完全遮挡,可以设定左眼被遮挡的阈值:0.6,右眼被遮挡的阈值:0.6,鼻子被遮挡的阈值:0.7,嘴巴被遮挡的阈值:0.7,左脸颊被遮挡的阈值:0.8,右脸颊被遮挡的阈值:0.8,下巴被遮挡阈值:0.6,高于任一个阈值都可以认为图片的质量差。
[0100] 模糊度越高可以表明图片质量越差,比如模糊度的取值范围[0~1],0是最清晰,1是最模糊。可以设定模糊度阈值为0.7,高于模糊度阈值可以认为图片的质量差。
[0101] 光照越弱可以表明图片质量越差,比如光照的取值范围[0~255],脸部光照的灰度值,0表示光照不好,可以设定光照阈值为40,低于光照阈值可以认为图片的质量差。
[0102] 人脸角度可以包括俯仰角度、平面选择角度等,角度越大可以表明图片质量越差,比如人脸角度可以包括:三维旋转之俯仰角度[-90(上),90(下)];平面内旋转角[-180(逆时针),180(顺时针)];三维旋转之左右旋转角[-90(左),90(右)],可以设定各角度阈值为20度,任一个角度大于20度可以认为图片的质量差。
[0103] 人脸尺寸越小可以表明图片质量越差。比如,人脸部分的大小,可以设定为不小于100*100像素,超出该范围可以认为图片的质量差。
[0104] 可以理解,具体应用中,还可以根据各待统计样本图片的质量特征输出图片的质量特征分布,本申请实施例对此不作具体限定。
[0105] 步骤S302:根据各所述目标对象的标注信息对所述待统计样本图片进行分组,每个分组中包含具有相同目标对象的待统计样本图片。
[0106] 本申请实施例中,待统计样本图片中的标注信息可以真实的反映待统计样本图片中的目标对象特征和目标对象个数。因此,根据标注信息可以将待统计样本图片进行分组,使得每个分组中包含具有相同目标对象的待统计样本图片。
[0107] 步骤S303:针对每个分组,根据该分组中待统计样本图片的质量特征确定质量最高的待统计样本图片;将质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值;以及,将所有分组中,过滤参数阈值最低的值作为目标过滤参数。
[0108] 步骤S304:根据所述目标过滤参数对多张待统计样本图片过滤,得到过滤后的待统计样本图片。
[0109] 本申请实施例中,考虑到在统计场所中的目标对象个数时,既不希望因为质量差的图片的影响,造成将同一个目标对象判定为不同的目标对象的现象发生,也不希望因为将质量差的图片全部过滤后,造成将一部分目标对象漏统计的现象,因此,本申请实施例中,采用了尽可能过滤质量差的待统计图片,且每个目标对象至少保留一张待统计图片的过滤策略。
[0110] 具体的,在每个分组中,将该分组中质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值,并将所有分组中,过滤参数阈值最低的值作为目标过滤参数,进而将低于目标过滤参数的待统计样本图片过滤掉,则可以保证每个目标对象至少保留一张待统计图片,且尽可能多的过滤了质量差的待统计图片。
[0111] 在本申请实施例的一种可选实现方式中,如图4所示,所述根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型,包括:
[0112] 步骤S401:根据神经网络模型中预设的相似度阈值对过滤后的待统计样本图片进行识别,得到预测识别结果;所述预测识别结果包括:识别对象特征和/或识别对象个数。
[0113] 步骤S402:在预测识别结果与样本实际结果的差异不满足损失函数的情况下,调整所述神经网络模型的相似度参数,直到重新预测的识别结果与样本实际结果相符,得到所述对象统计模型。
[0114] 本申请实施例中,神经网络模型中预设的相似度阈值可以是根据经验设置的,可以理解,相似度阈值越高,即匹配的要求越严格,则最终识别出的目标对象个数就可能偏多,反之可能偏少,因此,需要进行多次的迭代训练,得到最终的适于对象统计的相似度阈值。
[0115] 本申请实施例中,损失函数可以根据实际的应用场景设定,示例性的,若预测识别结果与样本实际结果的差值大于损失阈值,可以认为预测识别结果与样本实际结果的差异不满足损失函数。
[0116] 图5为本申请提供的图像处理的装置一实施例的结构示意图。如图5所示,本实施例提供的图像处理的装置包括:
[0117] 图片获取模块51,用于获取一场所的至少一张图片;
[0118] 输入模块52,用于将所述至少一张图片输入预先训练的对象统计模型;
[0119] 统计模块53,用于利用所述对象统计模型将所述至少一张图片切分为多张待统计图片,每张所述待统计图片仅包括一待统计对象;以及,根据所述待统计图片的质量特征对所述多张待统计图片过滤;以及,对过滤后的待统计图片进行识别,得到所述场所的目标对象特征和/或目标对象个数。
[0120] 可选的,所述装置还包括对象统计模型训练模块,用于:
[0121] 获取包括各目标对象的标注信息的样本图片;
[0122] 将所述多张样本图片切分为多张待统计样本图片,每张所述待统计样本图片仅包括一所述目标对象;
[0123] 根据所述样本图片的质量特征和所述标注信息对所述待统计样本图片进行过滤;
[0124] 根据过滤后的待统计样本图片和损失函数调整神经网络模型的参数,训练得到所述对象统计模型。
[0125] 可选的,所述对象统计模型训练模块,具体用于:
[0126] 针对每张所述待统计样本图片,识别所述待统计样本图片的质量特征;
[0127] 根据各所述目标对象的标注信息对所述待统计样本图片进行分组,每个分组中包含具有相同目标对象的待统计样本图片;
[0128] 针对每个分组,根据该分组中待统计样本图片的质量特征确定质量最高的待统计样本图片;将质量最高的待统计样本图片的质量特征的参数作为该分组的过滤参数阈值;以及,将所有分组中,过滤参数阈值最低的值作为目标过滤参数;
[0129] 根据所述目标过滤参数对多张待统计样本图片过滤,得到过滤后的待统计样本图片。
[0130] 可选的,所述对象统计模型训练模块,具体还用于:
[0131] 根据神经网络模型中预设的相似度阈值对过滤后的待统计样本图片进行识别,得到预测识别结果;所述预测识别结果包括:识别对象特征和/或识别对象个数;
[0132] 在预测识别结果与样本实际结果的差异不满足损失函数的情况下,调整所述神经网络模型的相似度参数,直到重新预测的识别结果与样本实际结果相符,得到所述对象统计模型。
[0133] 可选的,所述统计模块具体用于:
[0134] 将所述多张待统计图片中,质量特征的参数低于所述目标过滤参数的待统计图片过滤掉。
[0135] 可选的,所述目标对象为人脸。
[0136] 可选的,所述质量特征包括以下至少一种:遮光度、模糊度、光照、人脸角度、人脸尺寸。
[0137] 可选的,所述图片获取模块,具体用于:
[0138] 从拍摄设备中获取所述场所的至少一张图片,所述拍摄设备设置与所述场所中。
[0139] 本申请实施例中提供了一种图像处理的方法及装置,预先训练得到对象统计模型,在获取一场所的至少一张图片后,可以将至少一张图片输入该对象统计模型,利用该对象统计模型将至少一张图片切分为多张仅包括一待统计对象的待统计图片,并根据待统计图片的质量特征对多张待统计图片过滤,对过滤后的待统计图片进行识别,得到场所的目标对象特征和/或目标对象个数,因为根据质量特征对多张待统计图片过滤可以过滤掉质量较差的图片,避免质量差的多张待统计图片对统计结果的影响,因此根据本申请实施例的对象统计模型可以统计得到准确的目标对象特征和/或目标对象个数,且整个统计过程不需要人工参与,统计的效率较高。
[0140] 本申请各实施例提供的图像处理的装置可用于执行如前述各对应的实施例所示的方法,其实现方式与原理相同,不再赘述。
[0141] 根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
[0142] 如图6所示,是根据本申请实施例的图像处理的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
[0143] 如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
[0144] 存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的图像处理的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图像处理的方法。
[0145] 存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图像处理的方法对应的程序指令/模块(例如,附图5所示的图片获取模块51、输入模块52和统计模块53)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的图像处理的方法。
[0146] 存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据图像处理的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至图像处理的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0147] 图像处理的方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
[0148] 输入装置603可接收输入的数字或字符信息,以及产生与图像处理的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
[0149] 此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0150] 这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0151] 为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0152] 可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
[0153] 计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
[0154] 根据本申请实施例的技术方案,预先训练得到对象统计模型,在获取一场所的至少一张图片后,可以将至少一张图片输入该对象统计模型,利用该对象统计模型将至少一张图片切分为多张仅包括一待统计对象的待统计图片,并根据待统计图片的质量特征对多张待统计图片过滤,对过滤后的待统计图片进行识别,得到场所的目标对象特征和/或目标对象个数,因为根据质量特征对多张待统计图片过滤可以过滤掉质量较差的图片,避免质量差的多张待统计图片对统计结果的影响,因此根据本申请实施例的对象统计模型可以统计得到准确的目标对象特征和/或目标对象个数,且整个统计过程不需要人工参与,统计的效率较高。
[0155] 应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
[0156] 上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈