首页 / 专利库 / 专利权 / 国际初步审查 / 国际初步审查要求 / 选定 / 字符识别方法和字符识别装置

字符识别方法和字符识别装置

阅读:220发布:2021-06-15

专利汇可以提供字符识别方法和字符识别装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种字符识别方法和字符识别装置。该字符识别方法包括:获取 阈值 数组;从阈值数组中选取第一阈值作为 选定 阈值;采用选定阈值对字符图像进行二值化处理,得到字符图像的二值图像;对二值图像进行字符识别,得到识别结果;计算识别结果的 置信度 ;判断识别结果的置信度是否大于置信度预定值,如果识别结果的置信度大于置信度预定值,则将识别结果作为字符图像的识别结果;以及如果识别结果的置信度不大于置信度预定值,则从阈值数组中选取第二阈值,采用第二阈值替换第一阈值作为选定阈值。通过本发明,解决了传统的字符识别方法仅适用于识别图像 对比度 高的原稿,而对 图像对比度 低的原稿识别率较低的问题。,下面是字符识别方法和字符识别装置专利的具体信息内容。

1.一种字符识别方法,其特征在于,包括:
获取阈值数组,其中,所述阈值数组包括多个阈值;
从所述阈值数组中选取第一阈值作为选定阈值;
步骤a,采用所述选定阈值对字符图像进行二值化处理,得到所述字符图像的二值图像;
步骤b,对所述二值图像进行字符识别,得到识别结果;
步骤c,计算所述识别结果的置信度
步骤d,判断所述识别结果的置信度是否大于置信度预定值,
如果所述识别结果的置信度大于所述置信度预定值,则将所述识别结果作为所述字符图像的识别结果;以及
如果所述识别结果的置信度不大于所述置信度预定值,则从所述阈值数组中选取第二阈值,采用所述第二阈值替换所述第一阈值作为所述选定阈值,并返回执行所述步骤a。
2.根据权利要求1所述的字符识别方法,其特征在于,
所述步骤a还包括:切分所述二值图像,得到N个切分区域,其中,所述N个切分区域中的每一个切分区域分别与一个待识别字符相对应,
所述步骤b包括:对所述N个切分区域进行字符识别,得到分别对应于所述N个切分区域的N个识别结果,
所述步骤c包括:计算所述N个识别结果的置信度,
所述步骤d包括:判断所述N个识别结果的置信度是否均大于置信度预定值,如果所述N个识别结果的置信度均大于所述置信度预定值,则确定所述识别结果的置信度大于所述置信度预定值,
如果所述N个识别结果中任意一个的置信度不大于所述置信度预定值,则确定所述识别结果的置信度不大于所述置信度预定值。
3.根据权利要求2所述的字符识别方法,其特征在于,
在选取所述第一阈值作为所述选定阈值时,如果所述N个识别结果中任意一个的置信度不大于所述置信度预定值,所述方法还包括:
记录第一切分区域的识别结果和第二切分区域,其中,所述第一切分区域为所述N个识别结果中置信度大于所述置信度预定值的识别结果对应的切分区域,所述第二切分区域为所述N个识别结果中置信度不大于所述置信度预定值的识别结果对应的切分区域,在选取所述第二阈值作为所述选定阈值时:
所述步骤a包括:采用所述第二阈值作为所述选定阈值对所述字符图像进行二值化处理,得到所述字符图像的二值图像,切分所述二值图像,得到N个切分区域,所述步骤b包括:对所述N个切分区域中与所述第二切分区域对应的切分区域进行字符识别。
4.根据权利要求1所述的字符识别方法,其特征在于,在采用选定阈值对字符图像进行二值化处理之前,所述方法还包括:
获取所述字符图像的直方图;
对所述字符图像的直方图进行计算,得到基础阈值;以及
以所述基础阈值为中心阈值进行拓展得到所述阈值数组。
5.根据权利要求4所述的字符识别方法,其特征在于,采用以下方式由所述基础阈值为中心阈值进行拓展得到所述阈值数组TH:
TH={T0,T0+Δ,T0-Δ,T0+2Δ,T0-2Δ,…},
其中,Δ为所述阈值数组TH中相邻阈值之间的差值,T0为所述基础阈值。
6.一种字符识别装置,其特征在于,包括:
获取单元,用于获取阈值数组,其中,所述阈值数组包括多个阈值;
二值化处理单元,用于采用选定阈值对字符图像进行二值化处理,得到所述字符图像的二值图像;
识别单元,用于对所述二值图像进行字符识别,得到识别结果;
计算单元,用于计算所述识别结果的置信度;
判断单元,判断所述识别结果的置信度是否大于置信度预定值,其中,如果所述识别结果的置信度大于所述置信度预定值,则将所述识别结果作为所述字符图像的识别结果;
选取单元,用于从所述阈值数组中选取第一阈值或第二阈值作为所述选定阈值,其中,首先选取所述第一阈值作为所述选定阈值,在所述第一阈值作为所述选定阈值时,如果所述识别结果的置信度不大于所述置信度预定值,则从所述阈值数组中选取所述第二阈值。
7.根据权利要求6所述的字符识别装置,其特征在于,
所述二值化处理单元还用于切分所述二值图像,得到N个切分区域,其中,所述N个切分区域中的每一个切分区域分别与一个待识别字符相对应,
所述识别单元还用于对所述N个切分区域进行字符识别,得到分别对应于所述N个切分区域的N个识别结果,
所述计算单元还用于计算所述N个识别结果的置信度,
所述判断单元还用于判断所述N个识别结果的置信度是否均大于置信度预定值,如果所述N个识别结果的置信度均大于所述置信度预定值,则确定所述识别结果的置信度大于所述置信度预定值,如果所述N个识别结果中任意一个的置信度不大于所述置信度预定值,则确定所述识别结果的置信度不大于所述置信度预定值。
8.根据权利要求7所述的字符识别装置,其特征在于,还包括:
记录单元,用于在选取所述第一阈值作为所述选定阈值时,如果所述N个识别结果中任意一个的置信度不大于所述置信度预定值,记录第一切分区域的识别结果和第二切分区域,其中,所述第一切分区域为所述N个识别结果中置信度大于所述置信度预定值的识别结果对应的切分区域,所述第二切分区域为所述N个识别结果中置信度不大于所述置信度预定值的识别结果对应的切分区域,
其中,所述二值化处理单元还用于在选取所述第二阈值作为所述选定阈值时,采用所述第二阈值作为所述选定阈值对所述字符图像进行二值化处理,得到所述字符图像的二值图像,切分所述二值图像,得到N个切分区域,
其中,所述识别单元还用于对所述N个切分区域中与所述第二切分区域对应的切分区域进行字符识别。
9.根据权利要求6所述的字符识别装置,其特征在于,所述获取单元包括:
获取模,用于在采用选定阈值对字符图像进行二值化处理之前,获取所述字符图像的直方图;
计算模块,用于对所述字符图像的直方图进行计算,得到基础阈值;
拓展模块,用于以所述基础阈值为中心阈值进行拓展得到所述阈值数组。
10.根据权利要求9所述的字符识别装置,其特征在于,所述拓展模块用于采用以下方式由所述基础阈值为中心阈值进行拓展得到所述阈值数组TH:
TH={T0,T0+Δ,T0-Δ,T0+2Δ,T0-2Δ,…},
其中,Δ为所述阈值数组TH中相邻阈值之间的差值,T0为所述基础阈值。

说明书全文

字符识别方法和字符识别装置

技术领域

[0001] 本发明涉及字符识别领域,具体而言,涉及一种字符识别方法和字符识别装置。

背景技术

[0002] 传统的字符识别方法包括:a)扫描获取原稿的灰度图像;b)通过对获取到的图像的灰度直方图的分析和计算来得到阈值,根据阈值对灰度图像进行二值化处理得到二值图像;c)对二值图像进行字符切割,对切割的字符和模板字符进行对比,选取与模板字符最相近的字符为识别字符。
[0003] 在传统的字符识别方法中,进行阈值计算的方法有Otsu方法、NiBlack方法、最小误差法或最大熵方法等。发明人发现,无论采用哪种方法获得的阈值,在对灰度图像进行二值化处理时均存在一定的局限性。具体的,对于对比度低的原稿,使用单一阈值对原稿图像二值化时容易产生失真现象。比如,当需要进行字符识别的原稿为纸币时,由于纸币在使用过程中容易受到磨损、污染或涂鸦,因此,纸币图像的对比度较低,如图1a所示的纸币号码区域图像,由于字符“C”所在区域受到污染,当利用传统的字符识别方法使用单一阈值对图1a所示图像进行二值化处理得到图1b所示的二值图像,从图中可以看出,很难准确识别出字符“C”。因此,传统的字符识别方法仅适用于识别图像对比度高的原稿,而对图像对比度低的原稿识别率较低。

发明内容

[0004] 本发明的主要目的在于提供一种字符识别方法和字符识别装置,以解决传统的字符识别方法仅适用于识别图像对比度高的原稿,而对图像对比度低的原稿识别率较低的问题。
[0005] 为了实现上述目的,根据本发明的一个方面,提供了一种字符识别方法。该字符识别方法包括:获取阈值数组,其中,阈值数组包括多个阈值;从阈值数组中选取第一阈值作为选定阈值;步骤a,采用选定阈值对字符图像进行二值化处理,得到字符图像的二值图像;步骤b,对二值图像进行字符识别,得到识别结果;步骤c,计算识别结果的置信度;步骤d,判断识别结果的置信度是否大于置信度预定值,如果识别结果的置信度大于置信度预定值,则将识别结果作为字符图像的识别结果;以及如果识别结果的置信度不大于置信度预定值,则从阈值数组中选取第二阈值,采用第二阈值替换第一阈值作为选定阈值,并返回执行步骤a。
[0006] 进一步地,步骤a还包括:切分二值图像,得到N个切分区域,其中,N个切分区域中的每一个切分区域分别与一个待识别字符相对应。步骤b包括:对N个切分区域进行字符识别,得到分别对应于N个切分区域的N个识别结果。步骤c包括:计算N个识别结果的置信度。步骤d包括:判断N个识别结果的置信度是否均大于置信度预定值,如果N个识别结果的置信度均大于置信度预定值,则确定识别结果的置信度大于置信度预定值,如果N个识别结果中任意一个的置信度不大于置信度预定值,则确定识别结果的置信度不大于置信度预定值。
[0007] 进一步地,在选取第一阈值作为选定阈值时,如果N个识别结果中任意一个的置信度不大于置信度预定值,该方法还包括:记录第一切分区域的识别结果和第二切分区域,其中,第一切分区域为N个识别结果中置信度大于置信度预定值的识别结果对应的切分区域,第二切分区域为N个识别结果中置信度不大于置信度预定值的识别结果对应的切分区域。在选取第二阈值作为选定阈值时:步骤a包括:采用第二阈值作为选定阈值对字符图像进行二值化处理,得到字符图像的二值图像,切分二值图像,得到N个切分区域,步骤b包括:对N个切分区域中与第二切分区域对应的切分区域进行字符识别。
[0008] 进一步地,在采用选定阈值对字符图像进行二值化处理之前,该方法还包括:获取字符图像的直方图;对字符图像的直方图进行计算,得到基础阈值;以基础阈值为中心阈值进行拓展得到阈值数组。
[0009] 进一步地,采用以下方式由基础阈值为中心阈值进行拓展得到阈值数组TH:
[0010] TH={T0,T0+Δ,T0-Δ,T0+2Δ,T0-2Δ,…},
[0011] 其中,Δ为阈值数组TH中相邻阈值之间的差值,T0为基础阈值。
[0012] 为了实现上述目的,根据本发明的另一方面,提供了一种字符识别装置。该字符识别装置包括:获取单元,用于获取阈值数组,其中,阈值数组包括多个阈值;二值化处理单元,用于采用选定阈值对字符图像进行二值化处理,得到字符图像的二值图像;识别单元,用于对二值图像进行字符识别,得到识别结果;计算单元,用于计算识别结果的置信度;判断单元,判断识别结果的置信度是否大于置信度预定值,其中,如果识别结果的置信度大于置信度预定值,则将识别结果作为字符图像的识别结果;选取单元,用于从阈值数组中选取第一阈值或第二阈值作为选定阈值,其中,首先选取第一阈值作为选定阈值,在第一阈值作为选定阈值时,如果识别结果的置信度不大于置信度预定值,则从阈值数组中选取第二阈值。
[0013] 进一步地,二值化处理单元还用于切分二值图像,得到N个切分区域,其中,N个切分区域中的每一个切分区域分别与一个待识别字符相对应,识别单元还用于对N个切分区域进行字符识别,得到分别对应于N个切分区域的N个识别结果,计算单元还用于计算N个识别结果的置信度,判断单元还用于判断N个识别结果的置信度是否均大于置信度预定值,如果N个识别结果的置信度均大于置信度预定值,则确定识别结果的置信度大于置信度预定值,如果N个识别结果中任意一个的置信度不大于置信度预定值,则确定识别结果的置信度不大于置信度预定值。
[0014] 进一步地,该字符识别装置还包括:记录单元,用于在选取第一阈值作为选定阈值时,如果N个识别结果中任意一个的置信度不大于置信度预定值,记录第一切分区域的识别结果和第二切分区域,其中,第一切分区域为N个识别结果中置信度大于置信度预定值的识别结果对应的切分区域,第二切分区域为N个识别结果中置信度不大于置信度预定值的识别结果对应的切分区域,其中,二值化处理单元还用于在选取第二阈值作为选定阈值时,采用第二阈值作为选定阈值对字符图像进行二值化处理,得到字符图像的二值图像,切分二值图像,得到N个切分区域,其中,识别单元还用于对N个切分区域中与第二切分区域对应的切分区域进行字符识别。
[0015] 进一步地,获取单元包括:获取模块,用于在采用选定阈值对字符图像进行二值化处理之前,获取字符图像的直方图;计算模块,用于对字符图像的直方图进行计算,得到基础阈值;拓展模块,用于以基础阈值为中心阈值进行拓展得到阈值数组TH。
[0016] 进一步地,拓展模块用于采用以下方式由基础阈值为中心阈值进行拓展得到阈值数组TH:
[0017] TH={T0,T0+Δ,T0-Δ,T0+2Δ,T0-2Δ,…},
[0018] 其中,Δ为阈值数组TH中相邻阈值之间的差值,T0为基础阈值。
[0019] 通过本发明,对识别字符进行置信度评估,通过置信度的评估结果对阈值动态调整,只有置信度符合要求的识别字符为最终的识别字符,解决了传统的字符识别方法仅适用于识别图像对比度高的原稿,而对图像对比度低的原稿识别率较低的问题。附图说明
[0020] 构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0021] 图1a是对比度较低的纸币号码区域图像的示意图;
[0022] 图1b是利用传统的阈值计算方法得到的阈值对图1a中图像进行二值化处理得到的二值图像的示意图;
[0023] 图2是根据本发明一实施例的字符识别装置的模块组成示意图;
[0024] 图3是根据本发明第一实施例的字符识别方法的流程图
[0025] 图4是根据本发明第二实施例的字符识别方法的流程图;
[0026] 图5是根据本发明第三实施例的字符识别方法的流程图;
[0027] 图6a是根据本发明一实施例的字符图像的示意图;
[0028] 图6b是图6a中字符图像的灰度直方图;
[0029] 图7是根据本发明第一实施例的字符识别方法中利用不同阈值对字符图像进行二值化处理和字符识别结果之间的关系图;以及
[0030] 图8是根据本发明第二实施例的字符识别方法中利用不同阈值对字符图像进行二值化处理和字符识别结果之间的关系图。

具体实施方式

[0031] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0032] 图2是本发明一实施例的字符识别装置的模块组成示意图。如图所示,该字符识别装置10包括:获取单元11、选取单元12、二值化处理单元13、识别单元14、计算单元15和判断单元16。
[0033] 获取单元11,用于获取阈值数组TH,其中,阈值数组TH包括多个阈值。例如,可以先对输入的原始图像进行计算以得到基础阈值T0,其中,原始图像为待识别字符所在区域的灰度图像,如在识别纸币的冠字号时,原始图像为纸币冠字号所在区域的灰度图像,也称为字符图像。然后由基础阈值T0计算得到多个阈值,从而由基础阈值T0拓展得到阈值数组TH,优选地,阈值数组TH中的阈值是以基础阈值T0为中心阈值扩展得到的。
[0034] 二值化处理单元13,用于采用选定阈值对字符图像进行二值化处理,得到字符图像的二值图像。选定阈值为从阈值数组TH中选取得到的阈值。利用阈值数组TH中的某一数据对字符图像进行二值化处理,把以灰度表示的字符图像转换为仅包括以“0”表示的白像素和“1”表示的黑像素的二值图像,比如,利用基础阈值T0对字符图像进行二值化处理,则把字符图像中灰度值大于等于T0的像素转换为像素“0”,把字符图像中灰度值小于T0的像素转换为像素“1”。
[0035] 识别单元14,用于对二值图像进行字符识别,得到识别结果。
[0036] 计算单元15,用于计算识别结果的置信度。计算每个识别字符的置信度C,把计算得到的置信度C与置信度预定值进行比较,如果置信度C大于置信度预定值,表示识别的字符可信,如果C小于等于置信度预定值,表示识别的字符不可信,需要重新进行识别,其中,置信度C表示识别结果的可信度,其数值越大,则识别结果的可信度越高。
[0037] 判断单元16,判断识别结果的置信度是否大于置信度预定值,其中,如果识别结果的置信度大于置信度预定值,则将识别结果作为字符图像的识别结果。
[0038] 选取单元12,用于从阈值数组TH中选取第一阈值或第二阈值作为选定阈值,其中,首先选取第一阈值作为选定阈值,在第一阈值作为选定阈值时,如果识别结果的置信度不大于置信度预定值,则从阈值数组中选取第二阈值。这里的第一阈值和第二阈值仅仅是举例描述,可以是阈值数组TH中的任意两个不同的阈值,即,在阈值数组TH中存储有多个阈值,选取单元12从阈值数组TH中依次选取阈值对字符图像进行二值化处理,直到二值化处理之后的二值图像的识别结果的置信度C大于置信度预定值。
[0039] 优选地,二值化处理单元13还用于切分二值图像,得到N个切分区域,其中,N个切分区域中的每一个切分区域分别与一个待识别字符相对应,此时,识别单元14还用于对N个切分区域进行字符识别,得到分别对应于N个切分区域的N个识别结果,计算单元15还用于计算N个识别结果的置信度,判断单元16还用于判断N个识别结果的置信度是否均大于置信度预定值,如果N个识别结果的置信度均大于置信度预定值,则确定识别结果的置信度大于置信度预定值,如果N个识别结果中任意一个的置信度不大于置信度预定值,则确定识别结果的置信度不大于置信度预定值。识别单元14通过对切分区域进行字符识别,可以得到每个切分区域对应的字符,从而得到二值图像对应的字符串,如对纸币冠字号区域进行识别,得到包括多个字符和数字的纸币冠字号。
[0040] 优选地,字符识别装置还包括:记录单元17,用于在选取第一阈值作为选定阈值时,如果N个识别结果中任意一个的置信度不大于置信度预定值,记录第一切分区域的识别结果和第二切分区域,其中,第一切分区域为N个识别结果中置信度大于置信度预定值的识别结果对应的切分区域,第二切分区域为N个识别结果中置信度不大于置信度预定值的识别结果对应的切分区域。此时,二值化处理单元13还用于在选取第二阈值作为选定阈值时,采用第二阈值作为选定阈值对字符图像进行二值化处理,得到字符图像的二值图像,切分二值图像,得到N个切分区域,识别单元14还用于对N个切分区域中与第二切分区域对应的切分区域进行字符识别。
[0041] 获取单元12可以进一步包括:获取模块121,用于在采用选定阈值对字符图像进行二值化处理之前,获取字符图像的直方图;计算模块122,用于对字符图像的直方图进行计算,得到基础阈值;拓展模块123,用于以基础阈值为中心阈值进行拓展得到阈值数组TH,该拓展模块可以采用以下方式由基础阈值为中心阈值进行拓展得到阈值数组TH:
[0042] TH={T0,T0+Δ,T0-Δ,T0+2Δ,T0-2Δ,…},
[0043] 其中,Δ为阈值数组TH中相邻阈值之间的差值,T0为基础阈值。
[0044] 以下对本发明实施例提供的字符识别方法进行介绍。需要说明的是,本发明实施例提供的字符识别方法可以通过本发明实施例的字符识别装置来执行。相应地,本发明实施例提供的字符识别装置也可以用于本发明实施例的字符识别方法。本发明实施例的字符识别装置可以是计算机、打印机、扫描设备等。
[0045] 图3是根据本发明第一实施例的字符识别方法的流程图。如图3所示,该字符识别方法包括以下步骤:
[0046] 步骤S11,获取阈值数组,其中,阈值数组包括多个阈值。
[0047] 阈值数组中的多个阈值可以是预先设置或存储的,也可以是在字符识别的过程中通过一个基础阈值计算得到的。
[0048] 步骤S12,从阈值数组中选取第一阈值作为选定阈值。
[0049] 从阈值数组中任意选取一个阈值作为第一阈值,如果阈值数组是通过一个基础阈值拓展得到的,优选地,可以选取该基础阈值作为第一阈值。
[0050] 步骤S13,采用选定阈值对字符图像进行二值化处理,得到字符图像的二值图像。
[0051] 步骤S14,对二值图像进行字符识别,得到识别结果。
[0052] 步骤S15,计算识别结果的置信度。
[0053] 步骤S16,判断识别结果的置信度是否大于置信度预定值。如果识别结果的置信度大于置信度预定值,则执行步骤S17。如果识别结果的置信度不大于置信度预定值,则执行步骤S18。
[0054] 步骤S17,将识别结果作为字符图像的识别结果。
[0055] 步骤S18,从阈值数组中选取第二阈值,采用第二阈值替换第一阈值作为选定阈值,并返回执行步骤S13。
[0056] 从阈值数组中任意选取一个与第一阈值不同的阈值作为第二阈值,如果阈值数组是通过一个基础阈值拓展得到的,优选地,该第二阈值为与基础阈值最临近的一个阈值。
[0057] 优选地,步骤S13还包括:切分二值图像,得到N个切分区域,其中,N个切分区域中的每一个切分区域分别与一个待识别字符相对应。步骤S14包括:对N个切分区域进行字符识别,得到分别对应于N个切分区域的N个识别结果。步骤15包括:计算N个识别结果的置信度。步骤16包括:判断N个识别结果的置信度是否均大于置信度预定值,如果N个识别结果的置信度均大于置信度预定值,则确定识别结果的置信度大于置信度预定值,如果N个识别结果中任意一个的置信度不大于置信度预定值,则确定识别结果的置信度不大于置信度预定值。
[0058] 优选地,在选取第一阈值作为选定阈值时,如果N个识别结果中任意一个的置信度不大于置信度预定值,该方法还包括:记录第一切分区域的识别结果和第二切分区域,其中,第一切分区域为N个识别结果中置信度大于置信度预定值的识别结果对应的切分区域,第二切分区域为N个识别结果中置信度不大于置信度预定值的识别结果对应的切分区域。在选取第二阈值作为选定阈值时:步骤S13包括:采用第二阈值作为选定阈值对字符图像进行二值化处理,得到字符图像的二值图像,切分二值图像,得到N个切分区域,步骤S14包括:对N个切分区域中与第二切分区域对应的切分区域进行字符识别。
[0059] 图4是根据本发明第二实施例的字符识别方法的流程图。该实施例可以作为图3所示第一实施例的一种优选实施方式,如图4所示,具体处理过程如下:
[0060] 步骤S21,根据字符图像的直方图,确定基础阈值T0,得到阈值数组TH。
[0061] 该步骤S21可以作为图3所示步骤S11的一种优选实施方式。
[0062] 如图6a所示,对字符图像30进行处理,得到如图6b所示的字符图像30的灰度直方图,其中,坐标系的横轴为像素的灰度值,纵轴为具有各种灰度值的像素占总像素数的比例,可以利用现有技术中的任意一种阈值计算方法,得到原始图像的基础阈值T0,如通过Ostu算法(出处N.Otsu,“A threshold selection method from grey-levelhistograms”,IEEE Trans.Syst.,Man,Cybern.,vol.SMC-1,pp.62-66,Jan.1979)得到基础阈值T0。为了满足对不同对比度图像的二值化,因此,需要设置多个阈值,多个阈值的获得方法是在以基础阈值T0为中心阈值扩展得到的。优选的,从T0扩展为T0±n*Δ,由此得到由多个阈值组成的阈值数组TH,TH={T0,T0+Δ,T0-Δ,T0+2Δ,T0-2Δ,…},Δ为相邻阈值之间的差值,优选取值为0x10,当然也可以取比0x10更小的数值。阈值数组TH的数据个数可以根据需要设定,经测试验证,阈值数组包括5个数据、Δ等于0x10能够达到识别准确率的要求,从而得到阈值数组TH={T0,T0+0x10,T0-0x10,T0+0x20,T0-0x20}。如图6b所示,基础阈值T0等于0x41,阈值数组TH的第二个数据T0+Δ为0x51,阈值数组TH的第三个数据T0-Δ为0x31。
[0063] 步骤S22,令阈值T等于阈值数组TH的第一个数据。
[0064] 该步骤S22可以作为图3所示步骤S12的一种优选实施方式。
[0065] 令阈值T等于阈值数组TH的第一个数据,本实施例中,TH的第一个数据为T0,第二个数据为T0+Δ,第三个数据为T0-Δ,第四个数据为T0+2Δ,第五个数据为T0-2Δ,因此首先令阈值T=T0对字符图像进行二值化处理。
[0066] 步骤S23,使用阈值T对字符图像进行二值化处理。
[0067] 该步骤S23可以作为图3所示步骤S13的一种优选实施方式。
[0068] 使用阈值T对字符图像进行二值化,以得到字符图像的二值图像。如图7所示,二值图像40是以阈值0x41对图6a中字符图像30进行二值化得到的图像,二值图像50是以阈值0x51对图6a中字符图像30进行二值化得到的图像,二值图像60是以阈值0x31对图6a中字符图像30进行二值化得到的图像。
[0069] 步骤S24,切分二值图像得到N个切分区域。
[0070] 对二值图像进行切分,得到N个切分区域,每一个切分区域与一个待识别字符相对应。如图7所示,对二值图像40进行切分时得到10个切分区域。对二值图像进行切分时,常用的切分方式为利用二值图像的垂直投影,结合字符间距、字符宽度、字符高度等,对二值图像进行切割。
[0071] 步骤S25,对第一个切分区域进行字符识别。
[0072] 对N个切分区域,按照一定的顺序,如从左到右的顺序,进行字符识别。首先从第一个切分区域开始字符识别,如图7所示,对二值图像40的切分区域进行处理时,从左边的第一个切分区域开始处理。
[0073] 提取第一切分区域的特征向量,计算特征向量与标准模板向量的欧式距离:
[0074]
[0075] 其中,D为特征向量与标准模板向量的欧式距离,Di为与第i个标准模板向量的欧式距离,V是字符的特征向量,Vj是特征向量的第j个分量,Ni是第i个标准模板向量,而Ni,j是Ni的第j个分量,i的取值范围为1~k,k为标准模板向量的数量,如对纸币的冠字号进行识别时,冠字号包括从0~9的10个数字及从A~Z的26个字母,则k=36。
[0076] 对k个欧式距离D1、D2、…、Dk-1、Dk进行排序,得到最小的欧式距离,选择与最小的欧式距离对应的标准模板向量所代表的字符作为被识别字符的识别结果。
[0077] 上述步骤S24和步骤S25可以作为图3所示步骤S14的一种优选实施方式。
[0078] 步骤S26,计算置信度C。
[0079] 计算置信度,以C表示,C=1-Dx/Dy,其中,Dx为最小的欧式距离,Dy为次小的欧式距离。
[0080] 图3所示步骤S15中的置信度C也可以采用上述方式进行计算。
[0081] 步骤S27,判定置信度C是否大于置信度预定值。
[0082] 该步骤S27可以作为图3所示步骤S16的一种优选实施方式。
[0083] 把计算得到的置信度C与置信度预定值进行比较,其中,置信度预定值是利用字符识别方法中的标准模板向量对字符进行识别时经试验得到的数值,它表示置信度小于置信度预定值的识别字符是不可信的,其取值范围为[0,1],如等于0.2,当置信度C大于置信度预定值时,表示识别结果可信,则转到步骤S29;如果置信度C小于等于置信度预定值,表示识别结果不可信,则转到步骤S28。如图7所示,设置信度预定值为0.2,进行第一次识别时,对二值图像40的10个切分区域从左向右进行识别,前四个切分区域分别被识别为如字符串42所示的字符“Z”“J”“5”“7”,四个识别结果的置信度依次为0.597321、0.614531、0.502632和0.165150,由于第一个切分区域到第三个切分区域的识别结果的置信度均大于置信度预定值,表明第一个切分区域到第三个切分区域的识别结果是可信的,因此,每识别一个切分区域后执行步骤S29,对下一个切分区域进行识别;在对二值图像40的第四个切分区域41识别时,由于二值图像40的第四个切分区域41的识别结果的置信度小于置信度预定值,表明识别结果(如字符421所示的字符“7”)不可信,因此,对二值图像40的第四个切分区域进行符识别后,转到步骤S28,令阈值T等于阈值数组TH的下一个数据(即阈值数组TH的第二个数据)。
[0084] 当令阈值T等于阈值数组TH的第二个数据进行第二次识别时,二值图像50的第一个切分区域至第四个切分区域分别被识别为如字符串52所示的字符“Z”“J”“5”“7”,四个识别结果的置信度依次为0.589010、0.552231、0.538618和0.002581,由于二值图像50的第一个切分区域至第三个切分区域的识别结果的置信度均大于置信度预定值,表明二值图像50的第一个切分区域到第三个切分区域的识别结果是可信的,因此,每识别一个切分区域后执行步骤S29,对下一个切分区域进行识别;在对二值图像50的第四个切分区域
51识别时,由于二值图像50的第四个切分区域51的识别结果的置信度小于置信度预定值,表明识别结果(如字符521所示的字符“7”)不可信,因此,对二值图像50的第四个切分区域进行字符识别后,转到步骤S28,令阈值T等于阈值数组TH的下一个数据(即阈值数组TH的第三个数据)。
[0085] 当令阈值T等于阈值数组TH的第三个数据进行第三次字符识别时,二值图像60的10个切分区域从左向右分别被识别为如字符串62所示的字符
“Z”“J”“5”“7”“5”“1”“9”“6”“9”“5”,每个识别结果的置信度依次为0.504003、
0.588911、0.586431、0.503960、0.540323、0.733446、0.640636、0.562679、0.634037 和
0.332221,由于全部10个切分区域的识别结果的置信度均大于置信度预定值,因此,10个切分区域的识别结果均是可信的,则进行二值图像60的第一个切分区域至第十个切分区域的字符识别时,每识别一个切分区域后执行步骤S29,对下一个切分区域进行识别,直至所有切分区域均完成识别。
[0086] 步骤S28,令阈值T等于阈值数组TH的下一个数据。
[0087] 当识别结果不可信时,表示以当前的阈值T进行二值化处理得到的二值图像的质量达不到字符识别的要求,则取阈值数组TH的下一个数据为阈值T,重新进行二值化处理及字符识别。
[0088] 结合图6a、图7和图8说明利用不同的阈值T对字符图像进行二值化处理时得到不同质量的二值图像。如果待处理的字符图像为图6a中的字符图像30,阈值数组TH为{0x41,0x51,0x31,0x61,0x21},当以阈值数组TH的第一个数据0x41为阈值对字符图像30进行二值化处理时得到二值图像40,以阈值数组TH的第二个数据0x51为阈值对字符图像30进行二值化处理时得到二值图像50,以阈值数组TH的第三个数据0x31为阈值对字符图像30进行二值化处理时得到二值图像60,从中可以看出二值图像60的质量最好、二值图像
40的质量次之、二值图像50的质量最差。
[0089] 步骤S29,判定是否处理完所有的切分区域。
[0090] 判定所有的切分区域是否全部处理完,如共有N个切分区域,在处理第一个切分区域之前,将用于记录已处理的切分区域数的计数器的值设为0,每次处理完一个切分区域,将用于记录已处理的切分区域数的计数器的值就加1,当已处理的切分区域数小于N时,表示未处理完所有的切分区域,则转到步骤S30;当已处理的切分区域数等于N时,表示已处理完所有的切分区域,则本次字符识别过程结束。
[0091] 步骤S30,对下一个切分区域进行字符识别。
[0092] 当还有未处理的切分区域时,则取下一个切分区域进行字符识别,如本次处理的切分区域为从左边开始的第一个切分区域,则下一次处理的切分区域为从左边开始的第二个切分区域。
[0093] 提取下一个切分区域的特征向量,计算特征向量与标准模板向量的欧式距离Di,对k个欧式距离D1、D2、…、Dk-1、Dk进行排序,选择与最小的欧式距离对应的标准模板向量所代表的字符作为被识别字符的识别结果。
[0094] 本实施例提供的字符识别方法,对识别字符进行置信度评估,通过置信度的评估结果对阈值动态调整,只有置信度符合要求的识别字符为最终的识别字符,从而保证了识别字符的准确度。
[0095] 图5是根据本发明第三实施例的字符识别方法的流程图,该实施例也可以作为图3所示第一实施例的一种优选实施方式。具体处理过程如下:
[0096] 步骤S41至步骤S43同步骤S21至步骤S23。
[0097] 步骤S44,切分二值图像,得到N个切分区域,将N个切分区域设定为待识别区域。
[0098] 对二值图像进行切分,得到N个切分区域,如图8所示,对二值图像40进行切分时得到10(N=10)个切分区域,将这N个切分区域设定为待识别区域。
[0099] 步骤S45,对第一个待识别区域进行字符识别。
[0100] 如果待识别区域为N个切分区域,则第一个待识别区域为N个切分区域中的第一个区域,如图8所示,对二值图像40的10个切分区域进行处理时,按照从左向右的顺序进行处理时,则左边第一个切分区域41为第一个待识别区域。
[0101] 如果待识别区域为M个识别失败的切分区域,则第一个待识别区域为M个识别失败的切分区域中的第一个区域,如图8所示,由于第一次识别时二值图像40的第四个切分区域41识别失败,因此,进行第二次识别时,第一个待识别区域为二值图像50中与第一次识别时识别失败的二值图像40的第四个切分区域41对应的区域,即二值图像50的切分区域51;由于第二次识别时二值图像50的第四个切分区域51识别失败,因此,进行第三次识别时,第一个待识别区域为二值图像60中与第二次识别时识别失败的二值图像50的第四个切分区域51对应区域,即二值图像60的第四个切分区域61。
[0102] 提取第一待识别区域的特征向量,计算特征向量与标准模板向量的欧式距离Di,对k个欧式距离D1、D2、…、Dk-1、Dk进行排序,选择与最小的欧式距离对应的标准模板向量所代表的字符为第一个待识别区域的识别字符。
[0103] 步骤S46,计算置信度C。
[0104] 同步骤S26。
[0105] 步骤S47,判定置信度C是否大于置信度预定值。
[0106] 把计算得到的置信度C与置信度预定值进行比较,其中,置信度预定值为小于1的数值,当置信度C大于置信度预定值时,表示识别结果可信,则转到步骤S48;如果置信度C小于等于置信度预定值时,表示待识别区域的识别结果不可信,则转到步骤S49。
[0107] 如图8所示,进行第一次识别时,二值图像40的10个切分区域从左向右分别识别为如字符串44所示的字符“Z”“J”“5”“7”“5”“1”“9”“6”“9”和“5”,每个识别结果的置信度C依次为0.597321、0.614531、0.502632、0.165150、0.662693、0.716749、0.651325、0.504233、0.616645和0.436257,置信度预定值为0.2,由于只有第四个切分区域41的识别结果的置信度小于置信度预定值,其余9个切分区域的识别结果的置信度均大于置信度预定值,因此,对第四个切分区域41进行字符识别后,转到步骤S49,记录第四个切分区域为识别失败的区域;对第一个切分区域至第三个切分区域以及第五个切分区域至第十个切分区域进行字符识别后,每完成一切分区域的识别,就转到步骤S48,将该切分区域对应的字符记录为可信的识别字符。
[0108] 进行第二次识别时,二值图像50的切分区域51的识别结果(如字符54所示的字符“7”)的置信度为0.002581,由于该识别结果的置信度小于置信度预定值,因此,对切分区域51进行字符识别后,转到步骤S49,记录该切分区域为识别失败的区域。
[0109] 进行第三次识别时,二值图像60的切分区域61的识别结果(如字符64所示的字符“7”)的置信度为0.503960,由于该识别结果的置信度大于置信度预定值,因此,对切分区域61进行字符识别后,转到步骤S48,将该切分区域对应的字符记录为可信的识别字符。
[0110] 步骤S48,记录可信的识别字符
[0111] 记录每次识别时已识别结果可信的字符与对应的切分区域序号。如图8所示,进行第一次识别时,二值图像40的第一个切分区域至第三个切分区域以及第五个切分区域至第十个切分区域的识别结果可信,则记录识别字符与所在切分区域的对应关系。比如记录字母“Z”与第一个切分区域对应、字母“J”与第二个切分区域对应等。
[0112] 步骤S49,记录识别失败的切分区域
[0113] 记录每次识别时识别失败的切分区域,如图8所示,进行第一次识别时,由于二值图像40的第四个切分区域41的识别结果不可信,即该切分区域识别失败,因此,第一次识别时记录二值图像40的第四个切分区域41为识别失败的切分区域;进行第二次识别时,由于二值图像50的第四个切分区域51的识别结果不可信,因此,第二次识别时记录该切分区域为识别失败的切分区域。
[0114] 步骤S50,判定是否处理完所有的待识别区域
[0115] 如图8所示,当待识别区域为二值图像40中的所有切分区域(10个切分区域)时,则本次(即第一次)识别的待识别区域为10个;当待识别区域为二值图像50的第四个切分区域51时,则本次(即第二次)识别的待识别区域为1个区域。如果未处理完所有的待识别区域,则转到步骤S51;否则,转到步骤S52。
[0116] 步骤S51,对下一个待识别区域进行字符识别
[0117] 当还有未进行识别的待识别区域时,则对下一个待识别区域进行字符识别,如本次处理的待识别区为二值图像40的10个切分区域,当第一个待识别区域为左边开始的第一个切分区域时,则下一待识别区域为左边开始的第二个切分区域。
[0118] 提取下一个待识别区域的特征向量,计算其特征向量与标准模板向量的欧式距离Di,对k个欧式距离D1、D2、…、Dk-1、Dk进行排序,选择与最小的欧式距离对应的标准模板向量所代表的字符为下一个待识别区域的识别字符。
[0119] 步骤S52,判断是否有识别失败的切分区域
[0120] 根据本次识别时是否记录识别失败的切分区域来判断本次字符识别是否有识别失败的区域。如图8所示,进行第一次识别时,步骤S49记录了二值图像40的第四个切分区域41为识别失败的切分区域,因此,第一次识别结束后有识别失败的切分区域;进行第二次识别时,步骤S49记录二值图像50的第四个切分区域为识别失败的切分区域,因此第二次识别结束后有识别失败的切分区域;进行第三次识别时,由于没有记录有识别失败的切分区域,因此,第三次识别结束后没有识别失败的切分区域。
[0121] 当有识别失败的切分区域时,则转到步骤S53;当没有识别失败的切分区域时,则字符识别过程结束。其中,字符图像的最终识别结果为多次字符识别的可信识别字符的组合,如图8所示,字符图像的识别结果(字符串70)为第一次识别的识别结果45与第三次识别的识别结果65的组合,即用第三次识别的可信识别字符替代第一次识别时识别失败的切分区域的识别字符。
[0122] 步骤S53,令阈值T等于阈值数组TH的下一个数据。
[0123] 同步骤S28。
[0124] 步骤S54,使用阈值T对字符图像进行二值化处理。
[0125] 同步骤S23。
[0126] 步骤S55,切分二值图像,得到N个切分区域,选择M个识别失败的区域为待识别区域
[0127] 如图8所示,对二值图像50进行切分时,得到10个切分区域,由于上一次(即第一次)识别时第四个切分区域识别失败,因此,本次(即第二次)识别的待识别区域为10个切分区域中的与上一次识别失败对应的切分区域,即二值图像50的第四个切分区域51;同样地,对二值图像60进行切分时,得到10个切分区域,由于上一次(即第二次)识别时二值图像50的第四个切分区域识别失败,因此,本次(即第三次)识别的待识别区域为10个切分区域中的与上一次识别失败对应的切分区域,即二值图像60的第四切分区域61。
[0128] 显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件软件结合。
[0129] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈