首页 / 专利库 / 多媒体工具与应用 / 宏模块 / 像素 / 背景像素 / 一种字符识别方法及装置

一种字符识别方法及装置

阅读:1028发布:2020-07-10

专利汇可以提供一种字符识别方法及装置专利检索,专利查询,专利分析的服务。并且本 申请 实施例 提供了一种字符识别方法及装置,涉及 图像处理 技术领域,包括:确定待识别图像中包含环绕型字符的圆形区域的第一圆心;获得环绕型字符的内接圆的第一半径和外接圆的第二半径;根据第一半径和第二半径,确定被第一直线穿过、相邻两条边分别与 水 平、竖直方向平行的矩形区域;以预设的 角 度为旋转角度步长且以第一圆心为旋 转轴 点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,提取每次旋转后位于矩形区域的图像内容的特征;依据所提取的特征形成特征曲线,获取特征曲线上属于极大值的特征;对所获取的特征所表征的图像内容进行字符识别。应用本申请实施例提供的方案进行字符识别,能够实现对环绕型字符的识别。,下面是一种字符识别方法及装置专利的具体信息内容。

1.一种字符识别方法,其特征在于,所述方法包括:
确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,所述内接圆的圆心和外接圆的圆心均为所述第一圆心;
根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与平方向、竖直方向平行的矩形区域,其中,所述第一直线为:经过所述第一圆心的竖直直线;
以预设的度为旋转角度步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次所述环绕型字符所在区域,并提取每次旋转后位于所述矩形区域的图像内容的特征;
依据所提取的特征,形成特征曲线,并获取所述特征曲线上属于极大值的特征;
对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
2.根据权利要求1所述的方法,其特征在于,所述提取每次旋转后位于所述矩形区域的图像内容的特征,包括:
统计待处理图像内容中前景点的数量,作为第一数量,其中,所述待处理图像内容为:
每次旋转后位于所述矩形区域的图像内容;
统计所述待处理图像内容中满足预设条件的前景点的数量,作为第二数量,其中,所述预设条件为:沿水平方向相邻的像素点均为前景点或者沿竖直方向的相邻像素点均为前景点;
在所述第一数量不等于零的情况下,计算所述第二数量相对于所述第一数量的比值,作为所述待处理图像内容的特征。
3.根据权利要求2所述的方法,其特征在于,在所述获得识别结果之后,还包括:
确定所述特征曲线上连续不大于预设值的取值形成的曲线区间;
按照所述预设的旋转方向、所获取特征与所述曲线区间在所述特征曲线上的相对位置关系,调整所获得识别结果中字符的排序。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,包括:
按照以下表达式计算矩形区域的边长L:
L=R2-R1+2P
其中,R1表示所述第一半径,R2表示所述第二半径,P表示预设取值;
按照以下表达式计算所述矩形区域的左下角顶点的坐标:
CL_X=CO_X-L/2
CL_Y=CO_Y+R1-P
其中,CL_X、CL_Y表示所述左下角顶点的横、纵坐标,CO_X、CO_Y表示所述第一圆心的横、纵坐标;
根据所述左下角顶点的坐标,确定边长均为L、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,包括:
确定所述圆形区域内的图形区域以及非环绕型字符所在区域;
将所述圆形区域的区域边界、所述图形区域以及非环绕型字符所在区域中包含的像素点设置为背景点;
获得所述第一圆心与所述圆形区域内前景点之间的最小距离,作为所述环绕型字符的内接圆的第一半径;
获得所述第一圆心与所述圆形区域内前景点之间的最大距离,作为所述环绕型字符的外接圆的第二半径。
6.一种字符识别装置,其特征在于,所述装置包括:
圆心确定模,用于确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
半径获得模块,用于获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,所述内接圆的圆心和外接圆的圆心均为所述第一圆心;
区域确定模块,用于根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,其中,所述第一直线为:经过所述第一圆心的竖直直线;
特征提取模块,用于以预设的角度为旋转角度步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次所述环绕型字符所在区域,并提取每次旋转后位于所述矩形区域的图像内容的特征;
特征获取模块,用于依据所提取的特征,形成特征曲线,并获取所述特征曲线上属于极大值的特征;
字符识别模块,用于对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
7.根据权利要求6所述的装置,其特征在于,所述特征提取模块,具体用于:
以预设的角度为旋转步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向对所述环绕型字符所在区域逐次进行旋转;
统计待处理图像内容中前景点的数量,作为第一数量,其中,所述待处理图像内容为:
每次旋转后位于所述矩形区域的图像内容;
统计所述待处理图像内容中满足预设条件的前景点的数量,作为第二数量,其中,所述预设条件为:沿水平方向相邻的像素点均为前景点或者沿竖直方向的相邻像素点均为前景点;
在所述第一数量不等于零的情况下,计算所述第二数量相对于所述第一数量的比值,作为所述待处理图像内容的特征。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
区间确定模块,用于确定所述特征曲线上连续不大于预设值的取值形成的曲线区间曲线;
排序调整模块,用于按照所述预设的旋转方向、所获取特征与所述曲线区间在所述特征曲线上的相对位置关系,调整所获得识别结果中字符的排序。
9.根据权利要求6所述的装置,其特征在于,所述区域确定模块,具体用于:
按照以下表达式计算矩形区域的边长L:
L=R2-R1+2P
其中,R1表示所述第一半径,R2表示所述第二半径,P表示预设取值;
按照以下表达式计算所述矩形区域的左下角顶点的坐标:
CL_X=CO_X-L/2
CL_Y=CO_Y+R1-P
其中,CL_X、CL_Y表示所述左下角顶点的横、纵坐标,CO_X、CO_Y表示所述第一圆心的横、纵坐标;
根据所述左下角顶点的坐标,确定边长均为L、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述半径获得模块,具体用于:
确定所述圆形区域内的图形区域以及非环绕型字符所在区域;
将所述圆形区域的区域边界、所述图形区域以及非环绕型字符所在区域中包含的像素点设置为背景点;
获得所述第一圆心与所述圆形区域内前景点之间的最小距离,作为所述环绕型字符的内接圆的第一半径;
获得所述第一圆心与所述圆形区域内前景点之间的最大距离,作为所述环绕型字符的外接圆的第二半径。
11.一种电子设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现权利要求1-5任一所述的方法步骤。
12.一种机器可读存储介质,其特征在于,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现权利要求1-5任一所述的方法步骤。

说明书全文

一种字符识别方法及装置

技术领域

[0001] 本申请涉及图像处理技术领域,特别是涉及一种字符识别方法及装置。

背景技术

[0002] 随着人工智能技术的发展,越来越多应用场景会涉及到字符识别。
[0003] 现有技术中进行字符识别时,一般是对平放置的字符进行识别。
[0004] 然而,有些应用场景中需要对环绕型字符进行识别,例如,需要对圆形图章图像中的环绕型字符进行识别等。
[0005] 鉴于此,需要提供一种能够识别环绕型字符的字符识别方案。发明内容
[0006] 本申请实施例的目的在于提供一种字符识别方法及装置,以实现对环绕型字符的识别。具体技术方案如下:
[0007] 第一方面,本申请实施例提供了一种字符识别方法,所述方法包括:
[0008] 确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
[0009] 获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,所述内接圆的圆心和外接圆的圆心均为所述第一圆心;
[0010] 根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,其中,所述第一直线为:经过所述第一圆心的竖直直线;
[0011] 以预设的度为旋转角度步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次所述环绕型字符所在区域,并提取每次旋转后位于所述矩形区域的图像内容的特征;
[0012] 依据所提取的特征,形成特征曲线,并获取所述特征曲线上属于极大值的特征;
[0013] 对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
[0014] 第二方面,本申请实施例提供了一种字符识别装置,所述装置包括:
[0015] 圆心确定模,用于确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
[0016] 半径获得模块,用于获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,所述内接圆的圆心和外接圆的圆心均为所述第一圆心;
[0017] 区域确定模块,用于根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,其中,所述第一直线为:经过所述第一圆心的竖直直线;
[0018] 特征提取模块,用于以预设的角度为旋转角度步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次所述环绕型字符所在区域,并提取每次旋转后位于所述矩形区域的图像内容的特征;
[0019] 特征获取模块,用于依据所提取的特征,形成特征曲线,并获取所述特征曲线上属于极大值的特征;
[0020] 字符识别模块,用于对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
[0021] 第三方面,本申请实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现本申请实施例所述的字符识别方法步骤。
[0022] 第四方面,本申请实施例提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现本申请实施例所述的字符识别方法步骤。
[0023] 由以上可见,应用本申请实施例提供的方案进行字符识别时,以预设的角度为旋转角度步长、且以环绕型字符所在圆形区域的圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于矩形区域的图像内容的特征,依据所提取的特征,形成特征曲线,并获取特征曲线上属于极大值的特征,对所获取的特征所表征的图像内容进行字符识别,获得识别结果。由于上述矩形区域是被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。又由于上述第一直线为经过环绕型字符所在圆形区域的圆心的竖直直线。所以,当环绕型字符旋转至上述矩形区域后可以被认为是水平放置的字符,进而能够对位于上述矩形区域内的字符进行识别,从而实现对环绕型字符的识别。附图说明
[0024] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025] 图1为本申请实施例提供的一种字符识别方法的流程示意图;
[0026] 图2为本申请实施例提供的另一种字符识别方法的流程示意图;
[0027] 图3a为本申请实施例提供的内接圆和外接圆示意图;
[0028] 图3b为本申请实施例提供的第一种边缘图像
[0029] 图3c为本申请实施例提供的第二种边缘图像;
[0030] 图3d为本申请实施例提供的第三种边缘图像;
[0031] 图3e为本申请实施例提供的第四种边缘图像;
[0032] 图3f为本申请实施例提供的第五种边缘图像;
[0033] 图4为本申请实施例提供的一种字符识别装置的结构示意图;
[0034] 图5为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

[0035] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0036] 由于具体应用场景中需要对环绕型字符进行识别,为此本申请实施例提供了一种字符识别方法及装置。
[0037] 本申请的一个实施例中,提供了一种字符识别方法,该方法可以应用于电子设备。该方法包括:
[0038] 确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
[0039] 获得环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,上述内接圆的圆心和外接圆的圆心均为所述第一圆心;
[0040] 根据第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,其中,上述第一直线为:经过所述第一圆心的竖直直线;
[0041] 以预设的角度为旋转角度步长、且以第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于矩形区域的图像内容的特征;
[0042] 依据所提取的特征,形成特征曲线,并获取上述特征曲线上属于极大值的特征;
[0043] 对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
[0044] 由于上述矩形区域是被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。又由于上述第一直线为经过环绕型字符所在圆形区域的圆心的竖直直线。所以,当环绕型字符旋转至上述矩形区域后可以被认为是水平放置的字符,进而能够对位于上述矩形区域内的字符进行识别,从而实现对环绕型字符的识别。
[0045] 下面通过具体实施例对本申请实施例提供的字符识别方法进行详细说明。
[0046] 参见图1,图1为本申请实施例提供的一种字符识别方法的流程示意图,上述方法包括以下S101-S106。
[0047] S101:确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心。
[0048] 环绕型字符是沿圆弧排布的字符。例如,参见图3a,图中沿圆周排布的字符“UVWX印章士贸易有限公司”为环绕型字符。
[0049] 其中,上述环绕型字符中包括的字符可以是中文字符、日文字符、韩文字符等方块形字符,还可以是英文字符、法文字符、德文字符等非方块形字符。
[0050] 本申请的一个实施例中,可以依据圆形识别方法(例如,基于Hough变换的圆形识别方法)识别待识别图像中的圆形,然后再检测该圆形内是否沿圆周存在前景点。若检测出的圆形内沿圆周存在前景点,则可以认为该圆形所围成的区域为包含环绕型字符的圆形区域。
[0051] 本领域技术人员可以理解的是,在图像中,图像的内容可以被划分为前景和背景。其中,前景是指图像中起主体作用的对象,背景是指图像中除前景之外的内容。图像中的前景和背景可以是根据不同的应用场景而确定的。例如,在视频监控场景中,前景可以是图像中的人、汽车等对象,图像中除人、汽车之外的建筑物、树木等则为背景,而在字符识别场景中,前景为字符,图像中除字符外的内容则为背景。
[0052] 基于此,图像中用于描述前景的像素点可以称为前景点,用于描述背景的像素点可以称为背景点。
[0053] 具体的,在检测图像中是否存在前景点时,可以基于对象识别技术检测图像中是否存在作为前景的对象,若存在,则可以认为图像中存在前景点。
[0054] 具体实现过程中可以结合应用场景采用现有技术中任何一种对象识别技术实现对象检测,这里不再详述。
[0055] 具体的,可以采用对待识别图像进行Hough变换的方式检测待识别图像中的圆形。另外,采用Hough变换除了可以检测出待识别图像中的圆形外,还可以确定出所检测到圆形的圆心,也就是上述第一圆心。
[0056] S102:获得上述环绕型字符的内接圆的第一半径和外接圆的第二半径。
[0057] 其中,上述内接圆的圆心和外接圆的圆心均为第一圆心。
[0058] 由于字符具有一定的高度,又由于环绕型字符沿圆弧排布,因此,可以认为环绕型字符具有内接圆和外接圆。其中,内接圆可以理解为上述环绕型字符靠近上述第一圆心的一侧对应的圆形。外接圆可以理解为上述环绕型字符远离上述第一圆心的一侧对应的圆形。
[0059] 例如,参见图3a,示出了环绕型字符的内接圆和外接圆。其中,图3a中“UVWX印章士贸易有限公司”为环绕型字符,图中环绕型字符外侧的粗虚线所示的圆形为环绕型字符的外接圆,图中环绕型字符内侧的细虚线所示的圆形为环绕型字符的内接圆。
[0060] 值得一提的是,上述内接圆和外接圆并非实际存在于待识别图像中的圆形,而是虚拟出来的圆形。
[0061] 鉴于上述情况,本申请的一个实施例中,获得环绕型字符的内接圆的第一半径和外接圆的第二半径时,可以先确定上述圆形区域内的图形区域以及非环绕型字符所在区域,将上述圆形区域的区域边界、上述图形区域以及非环绕型字符所在区域中包含的像素点设置为背景点,这样可以使得上述圆形区域内除用于描述环绕型字符的像素点为前景点外,其它像素点被设置为背景点。
[0062] 在上述基础上,可以获得第一圆心与上述圆形区域内前景点之间的最小距离,作为上述环绕型字符的内接圆的第一半径,并获得第一圆心与上述圆形区域内前景点之间的最大距离,作为上述环绕型字符的外接圆的第二半径。
[0063] 具体的,上述图形区域可以是包括星形图形的区域,也可以是星形图形组成的区域等。
[0064] 在一个实施例中,可以采用对上述圆形区域进行SWT(Stationary Wavelet Transform,平稳小波变换)的方式,确定上述圆形区域内的图形区域。上述圆形区域为图像区域,对上述圆形区域进行SWT处理,也就是对图像区域进行SWT处理,然后对处理结果进行图形区域检测,以确定该圆形区域的图形区域。具体的,可以根据现有技术中的图形区域检测方式,对处理结果进行图形区域检测,这里不再详述。
[0065] 另外,还可以采用对上述圆形区域进行边缘提取的方式,确定上述圆形区域内的图形区域。其中,进行边缘提取时可以采用现有技术中任何边缘提取算法实现,这里不再详述。然后可以根据边缘提取结果中连通域的形状等信息确定上述圆形区域内的图形区域。
[0066] 本申请的一个实施例中,上述圆形区域内的非环绕型字符所在区域可以通过以下方式确定:
[0067] 采用现有的对水平排列的字符进行识别的方式,或者对竖直排列的字符进行识别的方式,对上述圆形区域进行非环绕型字符识别,这种情况下,可以认为能够被成功进行字符识别的区域为非环绕型字符所在区域。
[0068] 下面结合具体实例对上述实施例进行说明。
[0069] 参见图3b-图3d,其中,图3b中圆形的边缘线即为上述包含环绕型字符的圆形区域边界,五角星形所在区域为上述图形区域,“YZ分公司”所在区域为非环绕型字符所在区域。将上述圆形区域的边界和五角星形中包含的像素点设置为背景点后的图像如图3c所示。将非环绕型字符中的包含的像素点设置为背景点后的图像如图3d所示。
[0070] 另外,图3e中短的黑色线表示上述第一半径,长的黑色线表示上述第二半径。
[0071] S103:根据第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。
[0072] 其中,上述第一直线为:经过第一圆心的竖直直线。
[0073] 具体的,上述矩形区域可以位于上述第一圆心的上侧,也可以位于上述第一圆心的下侧。
[0074] 本申请的一个实施例中,上述矩形区域中位于第一直线两侧的区域可以是相等的,也就是,上述矩形区域是以第一直线为对称轴的轴对称图像区域。当然,本申请实施例中也并不限定上述矩形区域中位于第一直线两侧的区域严格相等。
[0075] 基于上述描述,本申请的一个实施例中,可以通过以下步骤A-C确定上述矩形区域。
[0076] 步骤A:按照以下表达式计算矩形区域的边长L:
[0077] L=R2-R1+2P
[0078] 其中,R1表示第一半径,R2表示第二半径,P表示预设取值。
[0079] 上述预设取值P可以根据后续旋转过程带来的像素偏移确定。本申请的一种实现方式中,后续旋转过程带来的像素偏移越大,上述P的取值可以设置的越大,例如,上述P的取值可以设置为8、9、10等,上述P的单位可以是像素点。反之,后续旋转过程带来的像素偏移越小,上述P的取值可以设置的越小,例如,上述P的取值可以设置为2、3、4等。这样在计算矩形区域的边长时,引入上述P,可以有效减轻后续旋转过程带来的像素偏移。
[0080] 步骤B:按照以下表达式计算上述矩形区域的左下角顶点的坐标:
[0081] CL_X=CO_X-L/2
[0082] CL_Y=CO_Y+R1-P
[0083] 其中,CL_X、CL_Y表示上述左下角顶点的横、纵坐标,CO_X、CO_Y表示第一圆心的横、纵坐标。
[0084] 步骤C:根据上述左下角顶点的坐标,确定边长均为L、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。
[0085] 这样按照上述步骤A-C确定出来的矩形区域,从水平方向来讲,位于环绕型字符所在圆形区域水平方向的中间,从竖直方向来讲,对应于环绕型字符在竖直方向上最高的区域。而环绕型字符中水平居中且竖直最高的字符一般为水平放置的字符。
[0086] 例如,参见图3f,图中框于“士”这一字符外的矩形框所围成的区域即为上述矩形区域
[0087] S104:以预设的角度为旋转角度步长、且以第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于矩形区域的图像内容的特征。
[0088] 在这里,“连续旋转至少一次”是指以第一圆心为旋转轴点,以起始位置(若未进行过旋转)/上一次旋转后的位置(若进行过旋转)作为起始旋转位置,旋转至少一次。
[0089] 以图3f中环绕型字符所在区域沿顺时针方向连续旋转3次为例。将图3f中环绕型字符所在区域沿顺时针方向旋转一次,此时假设“章”这一字符位于矩形区域内,此为旋转1次。然后将“章”这一字符位于矩形区域内的图像中环绕型字符所在区域沿顺时针方向旋转一次,此时假设“印”这一字符位于矩形区域内,此为旋转2次。最后将“印”这一字符位于矩形区域内的图像中环绕型字符所在区域沿顺时针方向旋转一次,此时假设“X”这一字符位于矩形区域内,此为旋转3次。
[0090] 具体的,上述预设的角度可以根据具体应用场景中对精度的要求设定。例如,对精度要求较高,则可以将上述预设的角度设置为较小的值,但是这样计算速度会较慢,反之若对精度要求较低,则可以将上述预设的角度设置为较大的值,这样可以在满足精度要求的同时,加快计算速度。
[0091] 例如,上述预设的角度可以设置为3度、5度等等。
[0092] 上述预设的旋转方向可以为逆时针方向,也可以为顺时针方向。具体可以依据应用场景中字符被书写的习惯而设定。例如,应用场景中字符被书写的习惯的是从左向右书写,则上述预设的旋转方向可以为逆时针方向。
[0093] 上述环绕型字符所在区域可以是整个上述圆形区域,还可以仅仅是包含环绕型字符的区域,也就是,上述圆形区域的一部分,本申请并不对此进行限定。
[0094] 另外,对上述环绕型字符所在区域进行旋转时,可以在旋转一周,也就是360度后,结束旋转。
[0095] 再者,由于本申请实施例提供的方案进行字符识别的思想是:当环绕型字符中的每一字符被旋转至上述矩形区域后,被转变为近似水平放置的字符,从而可以实现字符识别,鉴于这样的情况,在上述环绕型字符均位于上述第一直线的左边,或者均位于上述第一直线的右边等情况下,也可以在旋转180度后结束旋转。
[0096] 提取旋转后位于上述矩形区域的图像内容的特征方式在下述图2所示的实施例中进行描述,这里暂不详述。
[0097] S105:依据所提取的特征,形成特征曲线,并获取特征曲线上属于极大值的特征。
[0098] 上述S104可以得到多个特征,这些特征是以具体取值呈现的,也就是上述S104可以得到多个特征的取值,这种情况下可以采用曲线拟合的方式,对上述S104得到的各个特征的取值进行曲线拟合,从而得到一条特征曲线。其中,这条特征曲线上的每一点均为旋转过程中位于矩形区域的图像内容的特征的取值。这条特征曲线上的极大值点为特征曲线上的点,所以上述极大值点的取值也为位于矩形区域的图像内容的特征的取值,也就是,上述极大值点的取值对应于矩形区域的图像内容的特征的取值,极大值点的取值也表征图像内容所具有的特征。又由于特征曲线上的极大值点是特征曲线上局部取值最大的点,所以,极大值点的取值对应的矩形区域的图像内容的特征的取值也是环绕型字符区域旋转过程中位于矩形区域的图像内容的特征的局部最大取值。再者,特征的取值越大,说明该特征所表征的图像内容越具有丰富的特征,因此,这些极大值点的取值所表征的图像内容具有局部最丰富的特征。
[0099] 另外,环形字符在旋转过程中,上述矩形区域内包含一个字符的全部区域时,矩形区域内图像内容的特征能够反映整个字符的特征,特征较为丰富,而上述矩形区域内仅仅包含一个字符的部分区域时,矩形区域内图像内容的特征则仅仅能够反映部分字符的特征,因此,特征不会很丰富。鉴于此,当环形字符旋转至上述矩形区域后,矩形区域内图像内容的特征会达到局部最丰富。
[0100] 从上述内容可以得知,上述特征曲线上属于极大值的特征可以被认为是完整字符位于上述矩形区域后矩形区域内图像内容的特征。
[0101] S106:对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
[0102] 本步骤中,所获取的特征为上述S105中获取的特征曲线上属于极大值的特征,也就是,被认为是完整字符被旋转至上述矩形区域后矩形区域内图像内容的特征。又由于上述矩形区域是被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,而上述第一直线为经过环绕型字符所在圆形区域的圆心的竖直直线。所以,上述所获取的特征所表征的图像内容中不仅可以被认为包含完整的字符,还可以被认为所包含完整字符是水平放置的。这种情况下,可以采用现有的字符识别方式进行字符识别。
[0103] 由以上可见,应用上述各个实施例提供的方案进行字符识别时,以预设的角度为旋转角度步长、且以环绕型字符所在圆形区域的圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于矩形区域的图像内容的特征,依据所提取的特征,形成特征曲线,并获取特征曲线上属于极大值的特征,对所获取的特征所表征的图像内容进行字符识别,获得识别结果。由于上述矩形区域是被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。又由于上述第一直线为经过环绕型字符所在圆形区域的圆心的竖直直线。所以,当环绕型字符旋转至上述矩形区域后可以被认为是水平放置的字符,进而能够对位于上述矩形区域内的字符进行识别,从而实现对环绕型字符的识别。
[0104] 本申请的一个实施例中,参见图2,图2提供了另一种字符识别方法的流程示意图,与上述图1所示实施例相比,上述S104可以通过以下S104A-S104D实现。
[0105] S104A:以预设的角度为旋转角度步长、且以第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次上述环绕型字符所在区域。
[0106] S104B:统计待处理图像内容中前景点的数量,作为第一数量。
[0107] 其中,上述待处理图像内容为:每次旋转后位于上述矩形区域的图像内容。
[0108] S104C:统计待处理图像内容中满足预设条件的前景点的数量,作为第二数量。
[0109] 其中,上述预设条件为:沿水平方向相邻的像素点均为前景点或者沿竖直方向的相邻像素点均为前景点。
[0110] 假设,一个像素点为Pic(x,y),则沿水平方向相邻的像素点为:Pic(x-1,y)和Pic(x+1,y),沿竖直方向相邻的像素点为:Pic(x,y-1)和Pic(x,y+1)。
[0111] 在此基础上,满足上述预设条件的前景点是指:
[0112] 在Pic(x,y)为前景点的情况下,Pic(x-1,y)和Pic(x+1,y)均为前景点,或者Pic(x,y-1)和Pic(x,y+1)均为前景点。
[0113] 在另外的示例中,上述预设条件为:沿水平方向相邻的像素点均为前景点和沿竖直方向的相邻像素点均为前景点。
[0114] S104D:在第一数量不等于零的情况下,计算第二数量相对于第一数量的比值,作为待处理图像内容的特征。
[0115] 本申请的一个实施例中,上述第一数量等于零时,可以直接设置上述待处理图像内容的特征为零。
[0116] 需要说明的是,在执行上述S104A-S104D的过程中,可以先通过上述S104A进行一次旋转,然后针对旋转后位于上述矩形区域的图像内容执行上述S104B-S104D,在执行完上述S104B-S104D之后,返回上述S104A继续进行旋转操作,如此循环直至满足结束旋转的结束条件。
[0117] 例如,上述结束条件可以是已旋转过360度,或者已旋转过预先设定的其他角度,如,180度等等。
[0118] 由于上述环绕型字符在待识别图像中的位置是任意的,所以所识别出的第一个字符不一定是环绕型字符中的第一个字符,所以在完成字符识别后,还可以对识别出的各个字符的顺序进行调整。
[0119] 又由于沿预设的旋转方向,环绕型字符的第一个字符到最后一个字符之间虽然存在字符,但是沿上述旋转方向的反方向,环绕型字符的第一个字符与最后一个字符之间可能是不存在字符的。例如,参见图3f,沿顺时针方向,环绕型字符“UVWX印章士贸易有限公司”中第一个字符“U”到最后一个字符“司”之间存在字符“V”、“W”、“X”“印”、“章”、“士”、“贸”、“易”、“有”、“限”、“公”、“司”。而沿顺时针方向的反方向也就是逆时针方向,上述第一个字符“U”到最后一个字符“司”之间不存在字符。当不存在字符的区域旋转至上述矩形区域后,由于矩形区域内图像内容简单,所以矩形区域内图像内容的特征的取值较小。
[0120] 鉴于此,本申请的一个实施例中,在获得识别结果之后,还可以确定特征曲线上连续不大于预设值的取值形成的曲线区间,并按照预设的旋转方向、所获取特征与上述曲线区间在特征曲线上的相对位置关系,调整所获得识别结果中字符的排序。
[0121] 其中,所获取特征与上述曲线区间在特征曲线上的相对位置可能是所获取特征在上述曲线区间之前,也可能是所获取特征在上述曲线区间之后。
[0122] 由于上述曲线区间内的取值均不大于预设值,而特征曲线上的每一点均为旋转过程中位于矩形区域的图像内容的特征,也就是,曲线区间内的每一取值均为每一点均为旋转过程中位于矩形区域的图像内容的特征,则说明上述曲线区间内的每一取值所表征的图像内容较为简单、可能不包含字符。从而可以认为上述曲线区间对应于环绕型字符中、沿上述旋转方向的反方向从第一个字符到最后一个字符之间的图像区域。
[0123] 具体的,在确定上述曲线区间时,可以是确定区间长度不小于预设长度的曲线区间。由于一些字符较为简单或者相邻字符之间间隙大,当这些情况下的图像区域旋转至上述矩形区域后,所得到的矩形区域内图像内容的特征会比较小,所以上述特征曲线上有可能出现较短的曲线区间。为排除此种情况,可以设定一预设长度,当确定的曲线区间小于此预设长度时,认为该曲线区间是由于字符较为简单或者相邻字符之间间隙大而获得。虽然这些较短的曲线区间内取值都不大于上述预设值,但是这些较短的曲线区间并非对应于沿上述旋转方向的反方向从第一个字符到最后一个字符之间不包含字符的区域,因此,应用上述方式可以有效排除这类连续区间。
[0124] 当某一曲线区间的区间长度不小于预设长度时,则曲线区间则是对应于矩形区域的图像内容中不包含字符的区域。
[0125] 具体的,上述预设值可以为零。
[0126] 由于上述预设的旋转方向可以是顺时针方向,也可以是逆时针方向,下面在假设字符是按照从左到右的顺序排列的情况下,分情况进行说明。
[0127] 第一种情况,上述预设的旋转方向为逆时针方向
[0128] 这种情况下,在确定出上述曲线区间之后,可以将所获取特征中位于上述曲线区间之后的第一个特征所表征图像内容的识别结果,作为环绕型字符中的第一个字符。也就是,按照所确定出特征从左到右的排列顺序,所获取特征中位于上述曲线区间之后的特征所表征的图像内容的识别结果为环绕型字符中的前一段字符,而位于上述曲线区间之前的特征所表征的图像内容的识别结果为环绕型字符中的后一段字符,然后拼接前一段字符和后一段字符,得到最终的识别结果。
[0129] 例如,对图3f中的环绕型字符进行识别时,按照逆时针方向旋转,则“士贸易有限公司”这几个字符所在区域中图像内容的特征位于曲线区间之前,而“UVWX印章”这几个字符所在区域中图像内容的特征位于曲线区间之后,“U”是上述曲线区间之后的第一个特征所表征图像内容的识别结果,U、V、W、X、印、章这六个字符是依次被识别的,士、贸、易、有、限、公、司这七个字符是依次被识别的,但是是在U、V、W、X、印、章这六个字符之前识别的,上述各个字符被识别的顺序和上述预设的排列顺序一致。将U、V、W、X、印、章这六个字符的识别结果和士、贸、易、有、限、公、司这七个字符的识别结果进行拼接,即可得到调序之后的识别结果。
[0130] 第二种情况,上述预设的旋转方向为顺时针方向
[0131] 这种情况下,在确定出上述曲线区间之后,可以将所获取特征中位于上述曲线区间之前的最后一个特征所表征图像内容的识别结果,作为环绕型字符中的第一个字符。也就是,按照所确定出特征从右到左的排列顺序,所确定出的特征中位于上述曲线区间之前的特征所表征的图像内容的识别结果为环绕型字符的前一段字符,而位于上述曲线区间之后的特征所表征的图像内容的识别结果为环绕型字符中的后一段字符。
[0132] 一个示例中,以后一段字符在前、前一段字符在后的方式,拼接前一段字符与后一段字符,获取拼接后字符的反向字符,得到最终的识别结果。
[0133] 例如,对图3f中的环绕型字符进行识别时,按照顺时针方向旋转,则“士章印XWVU”这几个字符所在区域中图像内容的特征位于曲线区间之前,而“司公限有易贸”这几个字符所在区域中图像内容的特征位于曲线区间之后,“U”是上述曲线区间之前的第一个特征所表征图像内容的识别结果,士、章、印、X、W、V、U这七个字符是依次被识别的,司、公、限、有、易、贸、这六个字符是依次被识别的,但是是在士、章、印、X、W、V、U这七个字符之后识别的,上述各个字符被识别的顺序和上述预设的排列顺序相反。以后一段字符在前、前一段字符在后的方式,拼接士、章、印、X、W、V、U这七个字符的识别结果和司、公、限、有、易、贸这六个字符的识别结果,得到拼接后字符“司、公、限、有、易、贸、士、章、印、X、W、V、U”。然后按照从右到左的顺序反向,获取拼接后字符的反向字符,也就是得到“U、V、W、X、印、章、士、贸、易、有、限、公、司”,即可得到调序之后的识别结果。
[0134] 在另一个示例中,可以分别获取前一段字符的反向字符和后一段字符的反向字符,然后再拼接前一段字符的反向字符和后一段字符的反向字符,得到最终的识别结果。
[0135] 例如,对图3f中的环绕型字符进行识别时,按照顺时针方向旋转,则“士章印XWVU”这几个字符所在区域中图像内容的特征位于曲线区间之前,而“司公限有易贸”这几个字符所在区域中图像内容的特征位于曲线区间之后,“U”是上述曲线区间之前的第一个特征所表征图像内容的识别结果,士、章、印、X、W、V、U这七个字符是依次被识别的,司、公、限、有、易、贸这六个字符是依次被识别的,但是是在士、章、印、X、W、V、U这七个字符之后识别的,上述各个字符被识别的顺序和上述预设的排列顺序相反。获取将士、章、印、X、W、V、U这七个字符的反向字符:U、V、W、X、印、章、士,以及获取司、公、限、有、易、贸这六个字符的反向字符:贸、易、有、限、公、司,拼接前一段字符的反向字符和后一段字符的反向字符得到“U、V、W、X、印、章、士、贸、易、有、限、公、司”,即可得到调序之后的识别结果。
[0136] 与上述字符识别方法相对应,本申请实施例还提供了一种字符识别装置。
[0137] 参见图4,图4提供了一种字符识别装置的结构示意图,该装置包括:
[0138] 圆心确定模块401,用于确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
[0139] 半径获得模块402,用于获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,所述内接圆的圆心和外接圆的圆心均为所述第一圆心;
[0140] 区域确定模块403,用于根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,其中,所述第一直线为:经过所述第一圆心的竖直直线;
[0141] 特征提取模块404,用于以预设的角度为旋转角度步长、且以第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于矩形区域的图像内容的特征;
[0142] 特征获取模块405,用于依据所提取的特征,形成特征曲线,并获取所述特征曲线上属于极大值的特征;
[0143] 字符识别模块406,用于对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
[0144] 本申请的一个实施例中,所述特征提取模块404,具体用于:
[0145] 以预设的角度为旋转步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向对所述环绕型字符所在区域逐次进行旋转;
[0146] 统计待处理图像内容中前景点的数量,作为第一数量,其中,所述待处理图像内容为:每次旋转后位于所述矩形区域的图像内容;
[0147] 统计所述待处理图像内容中满足预设条件的前景点的数量,作为第二数量,其中,所述预设条件为:沿水平方向相邻的像素点均为前景点或者沿竖直方向的相邻像素点均为前景点;
[0148] 在所述第一数量不等于零的情况下,计算所述第二数量相对于所述第一数量的比值,作为所述待处理图像内容的特征。
[0149] 本申请的一个实施例中,所述装置还包括:
[0150] 区间确定模块,用于确定所述特征曲线上连续不大于预设值的取值形成的曲线区间;
[0151] 排序调整模块,用于按照所述预设的旋转方向、所获取特征与所述曲线区间在所述特征曲线上的相对位置关系,调整所获得识别结果中字符的排序。
[0152] 本申请的一个实施例中,所述区域确定模块403,具体用于:
[0153] 按照以下表达式计算矩形区域的边长L:
[0154] L=R2-R1+2P
[0155] 其中,R1表示所述第一半径,R2表示所述第二半径,P表示预设取值;
[0156] 按照以下表达式计算所述矩形区域的左下角顶点的坐标:
[0157] CL_X=CO_X-L/2
[0158] CL_Y=CO_Y+R1-P
[0159] 其中,CL_X、CL_Y表示所述左下角顶点的横、纵坐标,CO_X、CO_Y表示所述第一圆心的横、纵坐标;
[0160] 根据所述左下角顶点的坐标,确定边长均为L、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。
[0161] 本申请的一个实施例中,所述半径获得模块402,具体用于:
[0162] 确定所述圆形区域内的图形区域以及非环绕型字符所在区域;
[0163] 将所述圆形区域的区域边界、所述图形区域以及非环绕型字符所在区域中包含的像素点设置为背景点;
[0164] 获得所述第一圆心与所述圆形区域内前景点之间的最小距离,作为所述环绕型字符的内接圆的第一半径;
[0165] 获得所述第一圆心与所述圆形区域内前景点之间的最大距离,作为所述环绕型字符的外接圆的第二半径。
[0166] 由以上可见,应用上述各个实施例提供的方案进行字符识别时,以预设的角度为旋转角度步长、且以环绕型字符所在圆形区域的圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于矩形区域的图像内容的特征,依据所提取的特征,形成特征曲线,并获取特征曲线上属于极大值的特征,对所获取的特征所表征的图像内容进行字符识别,获得识别结果。由于上述矩形区域是被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。又由于上述第一直线为经过环绕型字符所在圆形区域的圆心的竖直直线。所以,当环绕型字符旋转至上述矩形区域后可以被认为是水平放置的字符,进而能够对位于上述矩形区域内的字符进行识别,从而实现对环绕型字符的识别。
[0167] 与上述字符识别方法相对应,本申请实施例还提供了一种电子设备。
[0168] 参见图5,图5提供了一种电子设备的结构示意图,上述电子设备包括:处理器501和机器可读存储介质502,所述机器可读存储介质502存储有能够被所述处理器501执行的机器可执行指令,所述处理器501被所述机器可执行指令促使:实现本申请实施例提供的字符识别方法的步骤。
[0169] 本申请的一个实施例中,提供了一种字符识别方法,该方法包括:
[0170] 确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
[0171] 获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,所述内接圆的圆心和外接圆的圆心均为所述第一圆心;
[0172] 根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,其中,所述第一直线为:经过所述第一圆心的竖直直线;
[0173] 以预设的角度为旋转角度步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于所述矩形区域的图像内容的特征;
[0174] 依据所提取的特征,形成特征曲线,并获取所述特征曲线上属于极大值的特征;
[0175] 对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
[0176] 需要说明的是,上述处理器501被机器可执行指令促使实现的字符识别方法的其他实施例,与前述方法实施例部分所提及的实施例相同,这里不再赘述。
[0177] 由以上可见,应用本实施例提供的电子设备进行字符识别时,由于上述矩形区域是被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。又由于上述第一直线为经过环绕型字符所在圆形区域的圆心的竖直直线。所以,当环绕型字符旋转至上述矩形区域后可以被认为是水平放置的字符,进而能够对位于上述矩形区域内的字符进行识别,从而实现对环绕型字符的识别。
[0178] 与上述字符识别方法相对应,本申请实施例还提供了一种机器可读存储介质,该机器可读存储介质存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现本申请实施例提供的字符识别方法的步骤。
[0179] 本申请的一个实施例中,提供了一种字符识别方法,该方法包括:
[0180] 确定待识别图像中包含环绕型字符的圆形区域的圆心,作为第一圆心;
[0181] 获得所述环绕型字符的内接圆的第一半径和外接圆的第二半径,其中,所述内接圆的圆心和外接圆的圆心均为所述第一圆心;
[0182] 根据所述第一半径和第二半径,确定被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域,其中,所述第一直线为:经过所述第一圆心的竖直直线;
[0183] 以预设的角度为旋转角度步长、且以所述第一圆心为旋转轴点,沿预设的旋转方向连续旋转至少一次环绕型字符所在区域,并提取每次旋转后位于所述矩形区域的图像内容的特征;
[0184] 依据所提取的特征,形成特征曲线,并获取所述特征曲线上属于极大值的特征;
[0185] 对所获取的特征所表征的图像内容进行字符识别,获得识别结果。
[0186] 需要说明的是,上述机器可执行指令促使上述处理器实现的字符识别方法的其他实施例,与前述方法实施例部分所提及的实施例相同,这里不再赘述。
[0187] 由以上可见,执行本实施例提供的机器可读存储介质中存储的机器可执行指令进行字符识别时,由于上述矩形区域是被第一直线穿过、且相邻两条边分别与水平方向、竖直方向平行的矩形区域。又由于上述第一直线为经过环绕型字符所在圆形区域的圆心的竖直直线。所以,当环绕型字符旋转至上述矩形区域后可以被认为是水平放置的字符,进而能够对位于上述矩形区域内的字符进行识别,从而实现对环绕型字符的识别。
[0188] 需要说明的是,上述机器可读存储介质可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,上述机器可读存储介质还可以是至少一个位于远离前述处理器的存储装置。
[0189] 上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0190] 在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0191] 本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备和机器可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0192] 以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈