首页 / 专利库 / 人工智能 / 图像识别 / 一种基于多模板的图像识别方法

一种基于多模板的图像识别方法

阅读:1048发布:2020-06-04

专利汇可以提供一种基于多模板的图像识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 图像识别 方法,包括:接收待识别的图像;利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分;基于所述类别得分判断图像区域中是否包含所识别的物体。,下面是一种基于多模板的图像识别方法专利的具体信息内容。

1.一种图像识别方法,包括:
接收待识别的图像;
利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分,其中所述两个模板尺寸相同,并且所述两个模板为通过模板训练过程得到的对称模板,所述对称模板是模板训练过程中成对出现的模板,所述模板训练过程包括:根滤波器初始化:对于每个目标类别,根据训练数据集中目标矩形框大小的统计值,自动选择根滤波器的尺寸;根滤波器更新:给定上一步训练得到的初始根滤波器,对于训练集中的每个矩形框,在根滤波器和矩形框重叠50%以上的条件下,找到滤波器得分最高的一个位置;部件滤波器初始化:根据上面训练的根滤波器初始化八个部件滤波器,首先选择面积a,使得8a等于根滤波器面积的80%,使用穷举方法从根滤波器中选出面积为a的、区域中所有单元的正权重平方和最大的矩形区域,将此区域的所有权重清零然后继续选择,直到选出八个矩形区域;模型更新:通过构建新的训练数据三元组(,...,)其中xi为样本,yi为样本类别,zi是上一次迭代学习到的模型中最适合xi的标签来更新模型;
基于所述类别得分判断图像区域中是否包含所识别的物体,
其中利用两个模板同时对所述图像进行卷积计算包括:
A)以所述图像的起始位置为起点,沿x轴方向和y轴方向取与模板大小等同的图像区域;
B)将所述图像区域分别与所述两个模板进行卷积计算,得到所述图像区域分别与两个模板对应的类别得分;
C)使起点坐标沿x轴方向加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;
D)判断所取的图像区域沿x轴方向是否超出图像的范围,如果所取的图像区域沿x轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至D),直到所取的图像区域沿x轴方向超出图像的范围,则前进到步骤E);
E)将起点坐标的x值置为起始位置坐标值并将y值增加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;
F)判断所取的图像区域沿y轴方向是否超出图像的范围,如果所取的图像区域沿y轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至E),直到所取的图像区域沿y轴方向超出图像的范围。
2.如权利要求1所述方法,其特征在于,所述两个模板通过特定程序和大量数据集训练得到。
3.如权利要求1所述方法,其特征在于,中央处理单元从图像读取要进行卷积计算的图像区域的像素值矩阵,并且在所述中央处理单元的控制下由图像处理单元完成图像区域与两个模板的卷积计算。
4.如权利要求3所述方法,其特征在于,图像区域与模板的卷积计算包括模板每点的值与图像区域相对应的值相乘,得到的值再求和,最终得到的和作为该图像区域的类别得分。
5.如权利要求1所述方法,其特征在于,当某一图像区域的类别得分大于特定阈值时,则判断该图像区域中包含所识别的物体;当某一图像区域的类别得分小于或等于特定阈值时,则判断该图像区域中不包含所识别的物体。
6.如权利要求5所述方法,其特征在于,通过统计训练图片集中所有正样本目标得分降序排序后的前95%的位置分数作为模板的所述特定阈值。

说明书全文

一种基于多模板的图像识别方法

技术领域

[0001] 本发明涉及图像处理领域,尤其涉及一种基于多模板的图像识别方法。

背景技术

[0002] 卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,与传统的BP神经网络相比,具有识别效率高、旋转缩放不变性好等优点,已在数字图像处理及人脸识别等各个领域得到了广泛的应用。
[0003] 传统卷积神经网络模型的应用原理为:首先,根据待输入图像的属性设计卷积神经网络模板架构,所设计的卷积神经网络模板架构为多层结构,包括1个输入层,在输入层之后,按各种顺序排布有若干个卷积层和若干个降采样层,最后为输出层。其中,输入层用于接收原始图像;每个卷积层包括多个相同尺寸的特征图,并且,每个特征图的像素,对应于前一层指定的若干特征图相应窗口位置的像素集合;每个降采样层包括多个相同尺寸的特征图,并且,降采样层的每张特征图,对应于前一层卷积层的一张特征图,降采样层的特征图像素对应于前一层相应特征图的采样区域。某一层节点与前一层节点和后一层节点之间通过边相互连接。
[0004] 在搭建得到上述具有特定网络架构的卷积神经网络模板后,当需要识别某一图片时,需要对上述的卷积神经网络模板进行训练,训练过程为:初始化卷积神经网络模板的参数为随机值,包括:边的权重值以及卷积核的值等;然后,将训练样本输入卷积神经网络模板,对卷积神经网络模板反复“刺激”,不断调整边的权重值以及卷积核的值等,直到训练得到可识别该图片的卷积神经网络模板。在后续应用中,只需要将待分析图片或其他样本输入到训练好的卷积神经网络模板中,即可达到分类和智能识别的目的。
[0005] 为了从复杂场景中分开并识别出每个物体,需要使用大量的模板对图像进行遍历卷积计算,其计算量大,计算时间长,很难实现实时物体识别

发明内容

[0006] 针对现有技术中,从复杂场景中分开并识别出每个物体,需要使用大量的模板对图像进行遍历卷积计算,计算时间过长的问题,本发明提出了一种图像识别方法,包括:接收待识别的图像;利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分;基于所述类别得分判断图像区域中是否包含所识别的物体。
[0007] 进一步地,该方法还包括在利用两个模板同时对所述图像进行卷积计算之前,判断所述两个模板尺寸相同,如果所述两个模板尺寸不同,则所述方法终止。
[0008] 进一步地,所述两个模板为对称模板。
[0009] 进一步地,所述两个模板通过特定程序和大量数据集训练得到。
[0010] 进一步地,利用两个模板同时对所述图像进行卷积计算包括:按照特定规律,使所述两个模板逐个像素地遍历整个图像。
[0011] 进一步地,按照特定规律,使所述两个模板逐个像素地遍历整个图像包括:
[0012] A)以所述图像的起始位置为起点,沿x轴方向和y轴方向取与模板大小等同的图像区域;
[0013] B)将所述图像区域分别与所述两个模板进行卷积计算,得到所述图像区域分别与两个模板对应的类别得分;
[0014] C)使起点坐标沿x轴方向加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;
[0015] D)判断所取的图像区域沿x轴方向是否超出图像的范围,如果所取的图像区域沿x轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至D),直到所取的图像区域沿x轴方向超出图像的范围,则前进到步骤E);
[0016] E)将起点坐标的x值置为起始位置坐标值并将y值增加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;
[0017] F)判断所取的图像区域沿y轴方向是否超出图像的范围,如果所取的图像区域沿y轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至E),直到所取的图像区域沿y轴方向超出图像的范围。
[0018] 进一步地,中央处理单元从图像读取要进行卷积计算的图像区域的像素值矩阵,并且在所述中央处理单元的控制下由图像处理单元完成图像区域与两个模板的卷积计算。
[0019] 进一步地,图像区域与模板的卷积计算包括模板每点的值与图像区域相对应的值相乘,得到的值再求和,最终得到的和作为该图像区域的类别得分。
[0020] 进一步地,当某一图像区域的类别得分大于特定阈值时,则判断该图像区域中包含所识别的物体;当某一图像区域的类别得分小于或等于特定阈值时,则判断该图像区域中不包含所识别的物体。
[0021] 进一步地,通过统计训练图片集中所有正样本目标得分降序排序后的前95%的位置分数作为模板的所述特定阈值。
[0022] 根据本发明提供的方案,同时使用两个模板进行卷积,减少了数据的读取次数,对于整张图像的计算而言,能节省大量的数据读取时间,显著提高识别速度。附图说明
[0023] 为了进一步阐明本发明的各实施例的以上和其它优点和特征,将参考附图来呈现本发明的各实施例的更具体的描述。可以理解,这些附图只描绘本发明的典型实施例,因此将不被认为是对其范围的限制。在附图中,为了清楚明了,相同或相应的部件将用相同或类似的标记表示。
[0024] 图1示出待识别图像和模板的示意图。
[0025] 图2示出使模板遍历整张图像的流程图
[0026] 图3示出根据本发明的一个实施例的识别人模板的示意图。
[0027] 图4示出根据本发明的实施例的使用两个模板同时对图像进行卷积遍历的流程图400。

具体实施方式

[0028] 在以下的描述中,参考各实施例对本发明进行描述。然而,本领域的技术人员将认识到可在没有一个或多个特定细节的情况下或者与其它替换和/或附加方法、材料或组件一起实施各实施例。在其它情形中,未示出或未详细描述公知的结构、材料或操作以免使本发明的各实施例的诸方面晦涩。类似地,为了解释的目的,阐述了特定数量、材料和配置,以便提供对本发明的实施例的全面理解。然而,本发明可在没有特定细节的情况下实施。此外,应理解附图中示出的各实施例是说明性表示且不一定按比例绘制。
[0029] 在本说明书中,对“一个实施例”或“该实施例”的引用意味着结合该实施例描述的特定特征、结构或特性被包括在本发明的至少一个实施例中。在本说明书各处中出现的短语“在一个实施例中”并不一定全部指代同一实施例。
[0030] 首先,介绍使用模板处理图像的过程中用到的相关概念:
[0031] 模板指的是矩阵方,其数学含义是一种卷积计算。
[0032] 卷积计算:可看作是加权求和的过程,使用到的图像区域中的每个像素分别与卷积核(即,权矩阵)的每个元素对应相乘,所有乘积之和作为区域中心像素的新值。
[0033] 卷积核:卷积时使用到的权用一个矩阵表示,该矩阵与使用的图像区域大小相同,其行、列都是奇数,是一个权矩阵。
[0034] 卷积计算示例:
[0035] 3*3的像素区域R与卷积核G的卷积计算:
[0036] 假设R为3*3的像素区域,卷积核为G:
[0037]
[0038] 卷积和=R1G1+R2G2+R3G3+R4G4+R5G5+R6G6+R7G7+R8G8+R9G9
[0039] 本发明提出使用模板计算图像的类别得分,基于类别得分检测是否为识别的物体。下面结合图1和图2介绍计算图像的类别得分的具体过程。
[0040] 图1示出待识别图像和模板的示意图。如图1所示,矩形方框110为图像,由若干像素点组成,该图像具有特定宽度和高度。阴影方框120为模板。将模板120与所覆盖区域的图像进行卷积计算,即模板每点的值与所覆盖区域图像相对应的值相乘,得到的值再求和,最终得到的和作为该图像区域的类别得分。类别得分表示该区域与模板的响应强度,响应强度越大得分越高,反之得分越小。
[0041] 在对图像进行识别的过程中,需要使模板遍历整张图像。图2示出使模板遍历整张图像的流程图。
[0042] 首先,在步骤210,接收一张待处理的图像。接下来,使模板从该图像的起始位置开始进行卷积计算遍历。例如,设图像的起始位置的坐标为(0,0),以起始位置(0,0)为起点,从起点开始沿x轴方向和y轴方向取与模板大小等同的图像区域。
[0043] 在步骤220,将该区域与模板进行卷积,即,将该区域的像素值分别与两个模板的对应值相乘再求和,得到该图像区域针对该模板的类别得分。
[0044] 在步骤230,使起点坐标沿x轴方向加1,以位置(1,0)为起点沿x轴方向和y轴方向取与模板大小等同的图像区域。
[0045] 在步骤240,判断所取的图像区域沿x轴方向是否超出图像的范围。如果所取的图像区域未超出图像的范围,则返回步骤220,将所取得的图像区域与模板进行卷积,得到该图像区域针对该模板的类别得分。
[0046] 接下来,在步骤220至240之间循环,直到判断所取的图像区域超出图像的范围,则转向步骤250,将起点坐标的x值设置为起始位置坐标值,y值增加1。从新的起点位置开始沿x轴方向和y轴方向取与模板大小等同的图像区域。在步骤260,判断所取的图像区域沿y轴方向是否超出图像的范围。如果所取的图像区域未超出图像的范围,则返回步骤220,将所取得的图像区域与模板进行卷积,得到该图像区域针对该模板的类别得分。接下来,在步骤220至250之间循环,直到判断所取的图像区域沿y轴方向超出图像的范围,则整张图像卷积完成。
[0047] 在本发明的实施例中,所使用的模板通过特定程序和大量数据集训练得到。下面结合具体示例简要介绍模板的训练过程。
[0048] 在本发明的实施例中,把利用包含大量用矩形框标注目标实例的图片来训练可变形部件模板的问题简化为二分类问题,然后使用SVM对目标进行训练分类。图3示出根据本发明的一个实施例的识别人模板的示意图。一个检测模板含有1个根滤波器和8个部件滤波器,模板阈值是通过统计训练图片集中所有正样本目标得分降序排序后的前95%的位置分数作为检测模板的阈值。
[0049] 模板训练
[0050] 根滤波器初始化:对于每个目标类别,根据训练数据集中目标矩形框大小的统计值,自动选择根滤波器的尺寸。
[0051] 根滤波器更新:给定上一步训练得到的初始根滤波器,对于训练集中的每个矩形框,在根滤波器和矩形框显著重叠(重叠50%以上)的条件下,找到滤波器得分最高的一个位置。
[0052] 部件滤波器初始化:使用一种简单的启发式方法根据上面训练的根滤波器初始化八个部件滤波器。首先选择面积a,使得8a等于根滤波器面积的80%。使用穷举方法从根滤波器中选出面积为a的具有最大该区域中所有cell单元的正权重平方和的矩形区域,将此区域的所有权重清零然后继续选择,直到选出八个矩形区域。
[0053] 模型更新:通过构建新的训练数据三元组(,...,)其中xi为样本,yi为样本类别,zi是上一次迭代学习到的模型中最适合xi的标签来更新模型。对于训练数据集中每个正样本矩形框,在保证至少50%重叠的情况下用现有检测器在所有可能位置和尺度进行检测,在其中选出具有最高得分的位置作为此矩形框对应的正样本,放入样本缓冲区中。
[0054] 在不包含目标物体的图片中选择检测得分高的位置作为负样本,不断向样本缓冲区中添加负样本直到文件最大限制。在缓冲区中的正负样本上训练新的模型,所有样本都有部件位置标注。
[0055] 为了从复杂场景中分开并识别出每个物体,需要使用大量的模板对图像进行遍历卷积计算。为了提高类别识别的速率,并考虑模板的相似性,在模板训练过程中,有时训练出的模板成对出现,即,对称的模板,因此在每次进行卷积计算时,同时使用两个模板进行卷积,减少了数据的读取次数,对于整张图像的计算而言,能节省大量的数据读取时间,显著提高识别速度。
[0056] 图4示出根据本发明的实施例的使用两个模板同时对图像进行卷积遍历的流程图400。
[0057] 在步骤401,接收待识别的图像。
[0058] 在步骤402,判断所使用两个模板尺寸是否相同。如果两个模板的尺寸不同,则流程终止。
[0059] 如果两个模板的尺寸相同,则在步骤403,从起始位置利用两个模板同时对图像进行卷积计算。两个模板同时遍历整张图像。例如,设图像的起始位置的坐标为(0,0),以起始位置(0,0)为起点,从起点开始沿x轴方向和y轴方向取与模板大小等同的图像区域。将该区域分别与两个模板进行卷积计算,即,将该区域的像素值分别与两个模板的对应值相乘再求和,得到该图像区域分别与两个模板对应的类别得分。
[0060] 在实际应用中,可由中央处理单元(CPU)从图像读取要进行卷积计算的区域的像素值矩阵,R(0,0),分别利用两个模板进行卷积计算S1(0,0)=R(0,0)⊙G1和S2(0,0)=R(0,0)⊙G2。由于图形处理单元(GPU)在矩阵运算方面表现出的良好特性,因此可在CPU的控制下由GPU完成卷积计算。然后,使起点坐标沿x轴方向加1,以位置(1,0)为起点沿x轴方向和y轴方向取与模板大小等同的图像区域,并判断所取的图像区域沿x轴方向是否超出图像的范围,如果所取的图像区域未超出图像的范围,则将该区域分别与两个模板进行卷积,得到S1(1,0)=R(1,0)⊙G1和S2(1,0)=R(1,0)⊙G2,然后逐个像素递增并判断所取的图像区域沿x轴方向是否超出图像的范围,如果所取的图像区域未超出图像的范围,则进行卷积计算。当所取的图像区域沿x轴方向超出图像的范围时,将x值置为0,y值增加1,从新的起点位置(0,y)开始沿x轴方向和y轴方向取与模板大小等同的图像区域,并判断所取的图像区域沿y轴方向是否超出图像的范围,如果所取的图像区域未超出图像的范围,则将该区域分别与两个模板进行卷积,得到该区域的类别得分,接下来,沿x轴方向逐个像素递增进行卷积计算。当所取的图像区域沿x轴方向超出图像的范围时,将x值置为0,y值增加1。依次循环,直到所取的图像区域沿y轴方向超出图像的范围,整张图像卷积完成。
[0061] 在步骤404,利用每个图像区域的类别得分判断该图像区域中是否包含所识别的物体。当某一图像区域的类别得分大于特定阈值时,则判断该图像区域中包含所识别的物体。当某一图像区域的类别得分小于或等于特定阈值时,则判断该图像区域中不包含所识别的物体。
[0062] 以上结合图4描述了使用两个相同尺寸的模板同时遍历整张图像,两个相同尺寸的模板可以是对称模板。并且本领域的技术人员应该意识到,使用两个相同尺寸的模板同时遍历整张图像的方式不限于在步骤403中介绍的方式。例如,模板可首先沿y轴方向遍历图像,然后在沿x轴方向增加一个像素,再次沿y轴方向遍历图像,直至整张图像卷积完成。
[0063] 在本发明的另一个实施例中,对图像进行卷积遍历的起点并非是图像的起始位置或坐标原点,而是从图像的中心区域中的某一像素点(xi,yi)开始取与模板大小等同的图像区域,然后将该区域与模板进行卷积计算,得到该图像区域针对该模板的类别得分。接下来,按照特定规律逐个像素向图像的外围区域平移,从而遍历整个图像。例如,可首先在像素点(xi,yi)所在行上逐个像素递增和/或递减获取与模板大小等同的图像区域并进行卷积计算,然后使行数递增和/或递减一个像素,在该行上逐个像素递增和/或递减获取与模板大小等同的图像区域并进行卷积计算,直至整张图像卷积完成。
[0064] 尽管上文描述了本发明的各实施例,但是,应该理解,它们只是作为示例来呈现的,而不作为限制。对于相关领域的技术人员显而易见的是,可以对其做出各种组合、变型和改变而不背离本发明的精神和范围。因此,此处所公开的本发明的宽度和范围不应被上述所公开的示例性实施例所限制,而应当仅根据所附权利要求书及其等同替换来定义。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈