首页 / 专利库 / 数学与统计 / 聚类分析 / 一种字符分割方法、装置以及计算机可读存储介质

一种字符分割方法、装置以及计算机可读存储介质

阅读:976发布:2020-05-12

专利汇可以提供一种字符分割方法、装置以及计算机可读存储介质专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种字符分割方法、装置及计算机可读存储介质。其中,字符分割方法包括:获取字符区域图像,并将所述字符区域图像转换为灰度图像;利用模糊C均值聚类 算法 对所述灰度图像进行 聚类分析 ,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;利用投影法从所述二值图像中获取至少一个字符 定位 块 ;根据所述字符定位块的 位置 信息对所述字符区域图像进行字符分割。利用这种方法和装置,对于图像 质量 较差的字符区域图像,能够实现更为准确的字符分割效果。,下面是一种字符分割方法、装置以及计算机可读存储介质专利的具体信息内容。

1.一种字符分割方法,其特征在于,包括:
获取字符区域图像,并将所述字符区域图像转换为灰度图像;
利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;
利用投影法从所述二值图像中获取至少一个字符定位
根据所述至少一个字符定位块的位置信息对所述字符区域图像进行字符分割。
2.如权利要求1所述的字符分割方法,其中利用模糊C均值聚类算法对所述灰度图像进行聚类分析之前,还包括:
利用canny算子对所述灰度图像进行边缘检测,得到边缘图像
利用霍夫变换方程对所述边缘图像进行直线检测,得到所述边缘图像的边界线;
根据所述边界线去除所述灰度图像的边界部分。
3.如权利要求2所述的字符分割方法,其中利用canny算子对所述灰度图像进行边缘检测之前,还包括:
检测所述灰度图像的图像质量特征;
由所述灰度图像的图像质量特征自适应地调整所述canny算子的参数;
其中,所述图像质量特征包括全局对比度和/或全局灰度均值。
4.如权利要求2所述的字符分割方法,其中利用canny算子对所述灰度图像进行边缘检测之前,所述方法还包括:
对所述灰度图像进行滤波处理;
其中,所述滤波处理包括中值滤波和/或高斯滤波。
5.如权利要求1所述的字符分割方法,其中利用模糊C均值聚类算法对所述灰度图像进行聚类分析之前,还包括:
对所述灰度图像进行对数变换。
6.如权利要求1所述的字符分割方法,其中利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,包括:
利用所述模糊C均值聚类算法对所述灰度图像进行聚类以获取C个簇;
根据所述C个簇的聚类中心分别确定所述C个簇的属性;
确定所述灰度图像的任意一个像素点分别对应于所述C个簇的C个隶属度;
根据所述隶属度对所述C个簇进行排序以确定其中的N个簇,并根据所述N个簇的属性确定所述灰度图像的任意一个像素点的属性;
根据所述灰度图像的任意一个像素点的属性对所述灰度图像进行二值化处理;
其中,所述C、N为正整数,且所述C大于所述N。
7.如权利要求1所述的字符分割方法,其中利用投影法从所述二值图像中获取至少一个字符定位块之后,所述方法包括:
检测所述至少一个字符定位块中的每一个字符定位块的前景像素面积;
根据所述前景像素面积从所述至少一个字符定位块中检测出干扰块,并从所述至少一个字符定位块中剔除所述干扰块;
其中,所述干扰块的所述前景像素面积至少小于所述至少一个字符定位块中的M个字符定位块的所述前景像素面积,其中所述M为预设字符个数。
8.如权利要求1所述的字符分割方法,其中利用垂直投影法从所述二值图像中获取至少一个字符定位块之后,所述方法包括:
利用非最近抑制算法从所述至少一个字符定位块中剔除干扰块。
9.如权利要求7或8所述的字符分割方法,其中根据所述至少一个字符定位块的位置信息对所述字符区域图像进行字符分割,包括:
确定所述至少一个字符定位块的平均宽度;
若在所述至少一个字符定位块中存在宽度小于所述平均宽度的目标字符定位块,则根据所述目标字符定位块的位置信息与所述平均宽度对所述字符区域图像进行字符分割。
10.一种字符分割装置,其特征在于,包括:
获取模块,用于获取字符区域图像,并将所述字符区域图像转换为灰度图像;
聚类模块,用于利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;
定位模块,用于利用投影法从所述二值图像中获取至少一个字符定位块;
分割模块,用于根据所述至少一个字符定位块的位置信息对所述字符区域图像进行字符分割。
11.如权利要求10所述的字符分割装置,其中,还包括:
边缘检测模块,用于利用canny算子对所述灰度图像进行边缘检测,得到边缘图像;
直线检测模块,用于利用霍夫变换方程对所述边缘图像进行直线检测,得到所述边缘图像的边界线;
边界去除模块,用于根据所述边界线去除所述灰度图像的边界部分。
12.如权利要求11所述的字符分割装置,其中,所述边缘检测模块还包括:
质量检测模块,用于检测所述灰度图像的图像质量特征;
参数调整模块,用于由所述灰度图像的图像质量特征自适应地调整所述canny算子的参数;
其中,所述图像质量特征至少包括:全局对比度和/或全局灰度均值。
13.如权利要求11所述的字符分割装置,其中,所述装置还包括:
滤波模块,用于对所述灰度图像进行滤波处理;
其中,所述滤波处理包括中值滤波和/或高斯滤波。
14.如权利要求10所述的字符分割装置,其中,还包括:
对数变换模块,用于对所述灰度图像进行对数变换。
15.如权利要求10所述的字符分割装置,其中所述聚类模块还用于:
利用所述模糊C均值聚类算法对所述灰度图像进行聚类以获取C个簇;
根据所述C个簇的聚类中心分别确定所述C个簇的属性;
确定所述灰度图像的任意一个像素点分别对应于所述C个簇的C个隶属度;
根据所述隶属度对所述C个簇进行排序以确定其中的N个簇,并根据所述N个簇的属性确定所述灰度图像的任意一个像素点的属性;
根据所述灰度图像的任意一个像素点的属性对所述灰度图像进行二值化处理;
其中,所述C、N为正整数,且所述C大于所述N。
16.如权利要求10所述的字符分割装置,其中,所述装置包括第一剔除模块,用于:
检测所述至少一个字符定位块中的每一个字符定位块的前景像素面积;
根据所述前景像素面积从所述至少一个字符定位块中检测出干扰块,并从所述至少一个字符定位块中剔除所述干扰块;
其中,所述干扰块的所述前景像素面积至少小于所述至少一个字符定位块中的M个字符定位块的所述前景像素面积,其中所述M为预设字符个数。
17.如权利要求10所述的字符分割装置,其中,所述装置包括第二剔除模块,用于:
利用非最近抑制算法从所述至少一个字符定位块中剔除干扰块。
18.如权利要求10所述的字符分割装置,其中所述分割模块还用于:
确定所述至少一个字符定位块的平均宽度;以及
若在所述至少一个字符定位块中存在宽度小于所述平均宽度的目标字符定位块,则根据所述目标字符定位块的位置信息与所述平均宽度对所述字符区域图像进行字符分割。
19.一种字符分割装置,其特征在于,包括:
一个或者多个多核处理器
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或者多个多核处理器执行时,使得所述一个或多个多核处理器实现:
获取字符区域图像,并将所述字符区域图像转换为灰度图像;
利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;
利用投影法从所述二值图像中获取至少一个字符定位块;
根据所述至少一个字符定位块的位置信息对所述字符区域图像进行字符分割。
20.一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被多核处理器执行时,使得所述多核处理器执行如权利要求1-9中任一项所述的方法。

说明书全文

一种字符分割方法、装置以及计算机可读存储介质

技术领域

[0001] 本发明属于图像识别技术领域,具体涉及一种字符分割方法、装置以及计算机可读存储介质。

背景技术

[0002] 本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术
[0003] 目前新型的电子类仪表已经得到广泛的应用,但是在工业环境下依然存在很多老式的数字仪表,因为生产环境,不允许有中断,无法替换成新式的电子仪表。针对上述情况,一个常见的解决方案是通过在老式计量表上安装摄像头以采集图像后再进行远程抄表。其中,字符分割功能作为远程抄表系统的基础与核心,直接决定了系统的好坏。
[0004] 目前的字符分割方法中,通常会将对计量表的字符区域图像进行二值化处理,然后利用投影的方式得到分割后的字符。其中二值化的方法通常有:1、边缘检测法;2、直方图阈值法;3、聚类技术。
[0005] 发明人在实现上述方案的过程中,发现以下技术问题:
[0006] 在实际生产环境中,表盘会存在锈迹、污渍、反光等问题,进而所采集得到如图2所示出的图像。进一步地,在进行字符分割时,若采用上述边缘检测法,若选择宽松的参数设置(可以得到更完整的字符边缘),会混入较多由污渍或反光等因素产生的伪边缘,而严格的参数设置则很可能丢失字符的边缘信息。而若采用另外两种方法则存在比较严重的字符粘连问题。这均会直接影响字符的分割效果,进而影响后续的字符识别精度。并且,由于表盘的字符间边界不够清楚,在字符之间产生了由拍摄效果而导致的横线,进而使字符变成了相连状态,导致很难用轮廓检测的方法进行字符分割。

发明内容

[0007] 针对上述现有技术中难以对图像质量较差的图像进行字符分割的问题,提出了一种字符分割方法、装置及计算机可读存储介质,利用这种方法和装置,能够解决上述问题。
[0008] 本发明提供了以下方案。
[0009] 第一方面,提供一种字符分割方法,包括:获取字符区域图像,并将所述字符区域图像转换为灰度图像;利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;利用投影法从所述二值图像中获取至少一个字符定位;根据所述字符定位块的位置信息对所述字符区域图像进行字符分割。
[0010] 优选地,其中利用模糊C均值聚类算法对所述灰度图像进行聚类分析之前,还包括:利用canny算子对所述灰度图像进行边缘检测,得到边缘图像;利用霍夫变换方程对所述边缘图像进行直线检测,得到所述边缘图像的边界线;根据所述边界线去除所述灰度图像的边界部分。
[0011] 优选地,其中利用canny算子对所述灰度图像进行边缘检测之前,还包括:检测所述灰度图像的图像质量特征;由所述灰度图像的图像质量特征自适应地调整所述canny算子的参数;其中,所述图像质量特征至少包括:全局对比度和/或全局灰度均值。
[0012] 优选地,其中利用canny算子对所述灰度图像进行边缘检测之前,所述方法还包括:对所述灰度图像进行滤波处理;其中,所述滤波处理包括中值滤波和/或高斯滤波。
[0013] 优选地,其中利用模糊C均值聚类算法对所述灰度图像进行聚类分析之前,还包括:对所述灰度图像进行对数变换。
[0014] 优选地,其中利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,包括:利用所述模糊C均值聚类算法对所述灰度图像进行聚类以获取C个簇;根据所述C个簇的聚类中心分别确定所述C个簇的属性;确定所述灰度图像的任意一个像素点分别对应于所述C个簇的C个隶属度;根据所述隶属度对所述C个簇进行排序以确定其中的N个簇,并根据所述N个簇的属性确定所述灰度图像的任意一个像素点的属性;根据所述灰度图像的任意一个像素点的属性对所述灰度图像进行二值化处理;其中,所述C、N为正整数,且所述C大于所述N。
[0015] 优选地,其中利用投影法从所述二值图像中获取至少一个字符定位块之后,所述方法包括:检测所述至少一个字符定位块中的每一个字符定位块的前景像素面积;根据所述前景像素面积从所述至少一个字符定位块中检测出干扰块,并从所述至少一个字符定位块中剔除所述干扰块;其中,所述干扰块的所述前景像素面积至少小于所述至少一个字符定位块中的M个字符定位块的所述前景像素面积,其中所述M为预设字符个数。
[0016] 优选地,其中利用垂直投影法从所述二值图像中获取至少一个字符定位块之后,所述方法包括:利用非最近抑制算法从所述至少一个字符定位块中剔除干扰块。
[0017] 优选地,其中根据所述至少一个字符定位块的位置信息对所述字符区域图像进行字符分割,包括:确定所述至少一个字符定位块的平均宽度;若在所述至少一个字符定位块中存在宽度小于所述平均宽度的目标字符定位块,则根据所述目标字符定位块的位置信息与所述平均宽度对所述字符区域图像进行字符分割。
[0018] 第二方面,提供一种字符分割装置,包括:获取模块,用于获取字符区域图像,并将所述字符区域图像转换为灰度图像;聚类模块,用于利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;定位模块,用于利用投影法从所述二值图像中获取至少一个字符定位块;分割模块,用于根据所述至少一个字符定位块的位置信息对所述字符区域图像进行字符分割。
[0019] 优选地,还包括:边缘检测模块,用于利用canny算子对所述灰度图像进行边缘检测,得到边缘图像;直线检测模块,用于利用霍夫变换方程对所述边缘图像进行直线检测,得到所述边缘图像的边界线;边界去除模块,用于根据所述边界线去除所述灰度图像的边界部分。
[0020] 优选地,所述边缘检测模块还包括:质量检测模块,用于检测所述灰度图像的图像质量特征;参数调整模块,用于由所述灰度图像的图像质量特征自适应地调整所述canny算子的参数;其中,所述图像质量特征至少包括:全局对比度和/或全局灰度均值。
[0021] 优选地,所述装置还包括:滤波模块,用于对所述灰度图像进行滤波处理;其中,所述滤波处理包括中值滤波和/或高斯滤波。
[0022] 优选地,还包括:对数变换模块,用于对所述灰度图像进行对数变换。
[0023] 优选地,其中所述聚类模块还用于:利用所述模糊C均值聚类算法对所述灰度图像进行聚类以获取C个簇;根据所述C个簇的聚类中心分别确定所述C个簇的属性;确定所述灰度图像的任意一个像素点分别对应于所述C个簇的C个隶属度;根据所述隶属度对所述C个簇进行排序以确定其中的N个簇,并根据所述N个簇的属性确定所述灰度图像的任意一个像素点的属性;根据所述灰度图像的任意一个像素点的属性对所述灰度图像进行二值化处理;其中,所述C、N为正整数,且所述C大于所述N。
[0024] 优选地,所述装置包括第一剔除模块,用于:检测所述至少一个字符定位块中的每一个字符定位块的前景像素面积;根据所述前景像素面积从所述至少一个字符定位块中检测出干扰块,并从所述至少一个字符定位块中剔除所述干扰块;其中,所述干扰块的所述前景像素面积至少小于所述至少一个字符定位块中的M个字符定位块的所述前景像素面积,其中所述M为预设字符个数。
[0025] 优选地,所述装置包括第二剔除模块,用于:利用非最近抑制算法从所述至少一个字符定位块中剔除干扰块。
[0026] 优选地,其中所述分割模块还用于:确定所述至少一个字符定位块的平均宽度;若在所述至少一个字符定位块中存在宽度小于所述平均宽度的目标字符定位块,则根据所述目标字符定位块的位置信息与所述平均宽度对所述字符区域图像进行字符分割。
[0027] 第三方面,提供一种字符分割装置,其特征在于,包括:一个或者多个多核处理器存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或者多个多核处理器执行时,使得所述一个或多个多核处理器实现:获取字符区域图像,并将所述字符区域图像转换为灰度图像;利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;利用投影法从所述二值图像中获取至少一个字符定位块;根据所述至少一个字符定位块的位置信息对所述字符区域图像进行字符分割。
[0028] 第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被多核处理器执行时,使得所述多核处理器执行如上述的方法。
[0029] 第五方面,还提供了一种智能抄表系统,包括:计量表,用于在表盘上显示字符;摄像装置,用于拍摄计量表的表盘以获取字符区域图像;字符分割装置,电连接至摄像装置,用于执行上述的方法。
[0030] 本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本发明中的字符分割方案通过采用模糊C均值聚类算法对原始的字符区域图像进行二值化处理,从而能够获得消除了多数污渍、反光等干扰的二值图像,进而可以利用投影法从该二值图像中获取更为准确的字符分割位置。由此,对于图像质量较差的字符区域图像,能够实现更为准确的字符分割效果。
[0031] 应当理解,上述说明仅是本发明技术方案的概述,以便能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举说明本发明的具体实施方式。附图说明
[0032] 通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文所述的优点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:
[0033] 图1为根据本发明一实施例的字符分割方法的流程示意图;
[0034] 图2为本发明实施例中的一种灰度图像的示意图;
[0035] 图3为本发明实施例中的一种二值图像的示意图;
[0036] 图4为本发明实施例中的多个字符定位块的示意图;
[0037] 图5为本发明实施例中的字符分割后所获得的字符图像的示意图;
[0038] 图6为根据本发明实施例的一种具有上下边界的灰度图像的示意图;
[0039] 图7为根据本发明实施例的一种边缘图像的示意图;
[0040] 图8为根据本发明实施例的字符分割装置的结构示意图;
[0041] 图9为根据本发明另一实施例的字符分割装置的结构示意图。
[0042] 在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

[0043] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0044] 在本发明中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。
[0045] 另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0046] 图1为根据本申请一实施例的字符分割方法100的流程示意图,该字符分割方法100用于将计量表的字符区域图像分割为为便于执行后续处理(如字符识别)的字符图像,在该流程中,从设备度而言,执行主体可以是一个或者多个电子设备,更具体地可以是与这些设备中的摄像头关联的处理模块;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。
[0047] 图1中的流程可以包括以下步骤101~步骤104。
[0048] 步骤101:获取字符区域图像,并将字符区域图像转换为灰度图像。
[0049] 具体地,该计量表包括但不限于生活中常见的表、电表、燃气表,比如可以是字轮型水表。进一步地,该计量表的字符区域图像可以是单字符图像或多字符图像,可以通过面对着该计量表的表盘而设置的摄像装置而获取,当然该字符区域图像也可以有其它来源,例如来自其它设备,或者也可以是现成的图像,本实施例对此不进行限制。进一步地,所获取的字符区域图像可以是RGB格式,进而在获取字符区域图像之后,可以通过浮点算法、整数方法、移位方法、平均值法等多种方式确定字符区域图像中各个像素点的灰度值,并利用该灰度值代替像素点中红绿蓝三通道的像素值,从而得到灰度图像。
[0050] 举例来说,参见图2,示出了一个字符区域图像的灰度图像,在该字符区域图像中从左到右依次显示了7个字符“0”、“0”、“0”、“0”、“1”、“1”、“1”。可以看出,上述多个字符之间边界不够清楚,并且由于摄影头的感光元件分辨率不够导致出现字符区域图像出现横纹,进而使得各个字符变成了相连状态,并因此难以正确地进行字符分割。
[0051] 步骤102:利用模糊C均值对灰度图像进行聚类分析,并根据聚类分析的结果对灰度图像执行二值化处理,得到二值图像;
[0052] 具体地,模糊c均值聚类(fuzzy c-means,以下简称FCM)算法是一种无监督的模糊聚类方法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。本实施例通过模糊集合的概念,可以把聚类生成的簇看成模糊集合,进而获取灰度图像中每个像素点属于每个类的隶属度,每个像素点隶属于簇的隶属度就是[0,1]区间里面的值,且每个像素点隶属于多个簇的隶属度的总和等于1。应理解,FCM算法是普通C均值算法的改进,普通C均值算法对于数据的划分是硬性的,硬聚类把每个待识别的对象严格的划分某类中,具有非此即彼的性质,而FCM则是柔性的模糊聚类,这种模糊聚类建立了样本对类别的不确定描述,更能客观的反应客观世界。
[0053] 举例来说,图3示出了基于上述方案对图2的灰度图像进行聚类分析以及二值处理后所得到的二值图像。其中,在经过上述聚类之后,可以利用每个簇的聚类中心将每个簇与两个预设类之一进行关联,该两个预设类可以是前景与背景。然后,针对每个像素点选取具有最高隶属度的N个簇,并根据该N个簇所关联的预设类判断该像素点是前景像素点或背景像素点。进一步地,在上述聚类分析获得每一个像素点是前景像素点或背景像素点之后据此对灰度图像执行二值化处理,从而获得凸显出了目标轮廓的二值图像。
[0054] 步骤103:利用投影法从二值图像中获取至少一个字符定位块;
[0055] 具体地,上述投影法是通过对二值图像的像素点的分布直方图进行分析,从而找出相邻字符的分界点并据此进行分割,将上述二值图像中对应于不同字符的图像区域相互切分开,并将每一个图像区域中的背景区域尽可能多地去除。其中,上述投影法具体包括垂直投影和水平投影,本实施例中优选采用垂直投影,并基于垂直投影图中投影值为0的投影位置而确定该至少一个字符定位块。
[0056] 举例来说,参见图4,即示出了对图3的二值图像进行垂直投影之后分割获得的多个字符定位块。其中,该多个字符定位块中可能存在由于噪点而导致产生的干扰块,因此本实施例可以设置字符宽度阈值,进而将宽度小于该字符宽度阈值的字符定位块作为干扰块剔除,也可以采用其他方案剔除该干扰块,本申请对此不作具体限定。
[0057] 步骤104:根据至少一个字符定位块的位置信息对字符区域图像进行字符分割。
[0058] 参见图5,示出了根据图4中所获取的多个字符定位块的位置信息从图2中所示出的字符区域图像进行字符分割后,所获得的多个字符图像。
[0059] 本发明中,通过采用模糊C均值聚类算法对原始的字符区域图像进行二值化处理,从而能够获得消除了多数污渍、反光等干扰的二值图像,进而可以利用投影法从该二值图像中获取更为准确的字符分割位置。由此,对于图像质量较差的字符区域图像,能够实现更为准确的字符分割效果。
[0060] 基于图1的字符分割方法,本申请的一些实施例还提供了该字符分割方法的一些具体实施方案,以及扩展方案,下面进行说明。
[0061] 在一种实施方式中,在步骤102之前,方法100还可以包括:利用canny算子对灰度图像进行边缘检测,得到边缘图像;利用霍夫变换方程对边缘图像进行直线检测,得到边缘图像的边界线;以及,根据边界线去除灰度图像的边界部分。
[0062] 具体地,参见图6,示出了一个包含长矩形字符框的灰度图像,在该灰度图像中从左到右依次显示了7个字符“0”、“0”、“0”、“0”、“1”、“1”、“1”,并在字符的上侧和下侧示出了该计量表的长矩形字符框。因此,本实施例可以利用canny算子对该灰度图像进行边缘检测以获取边缘图像,目的在于定位灰度图像中用于展示字符的字符框的边界。可选地,上述canny算子也可以被替换为:Roberts算子、Laplace算子、Prewitt算子、Sobel算子、Rosonfeld算子和Kirsch算子中的一种或多种。可选地,由于本实施例中的边缘检测的目的在于定位灰度图像中用于展示字符的字符框的位置,因此在本实施例中采用具有高抗噪性的边缘检测参数以避免检测出过多的伪边缘。进一步地,由于该字符框形成包括边界分明的长直线,因此本实施例可以利用霍夫变换方程对边缘图像进行直线检测,从而获取对应字符框的分界线。进一步地,由于该字符框对后续的字符分割步骤存在不利影响,因此本实施例可以将该灰度图像中对应于分界线的位置以外的部分去除,从而避免在后续的字符分割过程中影响分割效果。
[0063] 举例来说,参见图7,示出了对图6中的包含长矩形字符框的灰度图像进行边缘检测后所获得的边缘图像。可以看出,在图7示出的边缘图像的上下侧边缘处具有较为明显的直线,进而可以通过霍夫变换方程轻易检测得到边界线。进一步地,可以在图6中根据所检测到的边界线的位置将相应的边界部分去除,从而获取图2中所示出的灰度图像。可选地,还可以在步骤103之前对该二值图像进行水平投影,并根据水平投影图中投影值为0的投影位置而将该对应于字符框的上侧边缘和下侧边缘截取并去除。
[0064] 相较于前述实施方式,本实施方式通过边缘检测以及直线检测,可以避免由于字符区域图像中携带有字符框而导致的字符分割错误,进而提高了字符分割的准确度。
[0065] 在一种实施方式中,在利用canny算子对灰度图像进行边缘检测过程中,还可以包括:检测灰度图像的图像质量特征;由灰度图像的图像质量特征自适应地调整canny算子的参数。
[0066] 具体地,上述图像质量特征可以包括:全局对比度、全局灰度均值等用于表示图像质量的特征值。具体地,为了进一步解决边缘检测过程中难以兼顾抗噪性和检测精度这一问题,本发明实施例可以根据灰度图像的图像质量特征而自适应地确定该canny算子中的参数,该图像质量特征比如是全局对比度,该canny算子中的参数比如是高阈值和/或低阈值。举例来说,若检测出灰度图像的全局对比度更低,则推测该灰度图像的清晰度较低,采用更高的高阈值和/或低阈值;若检测出灰度图像的全局对比度更高,则推测该灰度图像的清晰度较高,则采用较低的高阈值和/或低阈值。
[0067] 应理解,该canny算子需要应用双阈值(Double-Threshold)检测来确定真实的和潜在的边缘,举例来说,如果一个像素的梯度大于高阈值,则被认为是边缘像素点,如果小于低阈值,则被认为是非边缘像素点,若该像素点的梯度位于两者之间,则只有当其与边缘像素连接时才认为其是边缘像素点。然而在传统canny算子中,高阈值与低阈值是人为确定的,并且高/低阈值的比例是固定的,这造成canny算子应用的局限性。基于此,本实施例中采用根据灰度图像的图像质量特征而自适应地调整高阈值与低阈值的方法,相较于前述实施方式,减少了周边大量无用不真实的边界信息,降低了噪声对缺陷边缘识别的影响,对后续的霍夫变换过程起到至关重要的作用。可选地,也可以预先训练出参数模型,进而使得能根据当前进行字符分割的字符区域图像的质量而自适应地调节参数。
[0068] 在一种实施方式中,为了减少噪声对边缘检测的影响,在利用canny算子对灰度图像进行边缘检测之前,方法100还可以包括:对灰度图像进行滤波处理;其中,滤波处理为中值滤波处理和/或高斯滤波处理。
[0069] 具体地,为了尽可能减少噪声对边缘检测结果的影响,所以必须滤除噪声以防止由噪声引起的错误检测。因此本实施例使用高斯滤波器和/或中值滤波器对灰度图像进行卷积,以减少明显的噪声影响、平滑图像。其中高斯滤波是一种线性平滑滤波,适用于消除高斯噪声。中值滤波是一种非线性平滑滤波,其将所处理的图像中每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值,中值滤波对脉冲噪声有良好的滤除作用,且在滤除噪声的同时,能够保护信号的边缘,使之不被模糊。
[0070] 相较于前述实施方式,本实施方式通过对灰度图像进行高斯滤波处理和/或中值滤波处理,可以减小由于计量表上的污渍或反光而带来的噪声影响,进而提高了后续进行边缘检测的准确度。
[0071] 在一种实施方式中,为了进一步消除噪点对于聚类的不利影响,在执行步骤102之前,方法100还可以包括:对灰度图像进行对数变换。其中,上述对灰度图像进行对数变换的目的在于增高灰度图像中的对比度。具体地,该对数变换可以将灰度图像的低灰度值部分扩展,将其高灰度值部分压缩,从而达到强调图像低灰度部分的目的,因此对于整体对比度偏低并且灰度值偏低的图像具有较好的增强效果。
[0072] 在一种实施方式中,为了得到进一步消除了多数污渍、反光等干扰的二值图像,步骤102可以包括:根据C个簇的聚类中心分别确定C个簇的属性;确定灰度图像的任意一个像素点分别对应于C个簇的C个隶属度;进一步地,根据隶属度对C个簇进行排序以确定其中的N个簇,并根据N个簇的属性确定灰度图像的任意一个像素点的属性,其中,C、N为正整数,且C大于N;根据灰度图像的任意一个像素点的属性对灰度图像进行二值化处理。
[0073] 具体地,上述C和N是可调整的动态参数,可以组合出各种不同的限。进一步地,根据C个簇的聚类中心分别确定该C个簇的属性具体可以通过判断每一个簇的聚类中心的灰度值是否超过预设阈值来确定每一个簇的属性为前景或背景。进一步地,根据隶属度对C个簇进行排序以确定其中的N个簇具体可以是选取具有最高隶属度的N个簇;进一步地,根据N个簇的属性确定灰度图像的任意一个像素点的属性是指综合考虑该N个簇的属性的来
判断灰度图像的任意一个像素点的属性。比如,针对某一像素点,只有当其所对应的该N个簇的属性均为前景时才判断该像素点为前景像素点,否则均判断该像素点为背景像素点。
又比如,针对某一像素点,当其所对应的该N个簇中,超过预定比例的簇的属性为前景时,判断该像素点为前景像素点,否则均判断该像素点为背景像素点。
[0074] 举例来说,预设C=5,N=2,预设规则为:只有当某一像素点所对应的该N个簇的属性均为前景时才判断该像素点为前景像素点,否则均判断该像素点为背景像素点。基于此,可以利用FCM输出该灰度图像中的每一个像素点对于5个簇(C1、C2、C3、C4、C5)的隶属度以及每个簇的聚类中心。进一步地,该聚类中心表示的是每个类的平均特征,可以通过该聚类中心判断每个簇对应于背景类还是前景类,例如:C1属于前景、C2属于前景、C3属于背景、C4属于背景、C5=属于背景。进一步地,针对该灰度图像中的像素点A、可以得到其分别对五个簇(C1、C2、C3、C4、C5)的隶属度为(b1、b2、b3、b4、b5),若其中,b2>b3>b1>b4>b5,则从中选取排序前2名的隶属度b2与b3,并根据与所选取的隶属度相对应的两类簇C2与C3综合判断该像素点A为前景像素点还是背景像素点,因此基于上述预设规则判断像素点A为背景像素点。
[0075] 相较于前述实施方式,本实施方式可以在保留字符基本轮廓的情况下进一步减少二值图像中的噪点,进一步优化了字符分割效果。
[0076] 在一种实施方式中,参见图3,在所获得的至少一个字符定位块中,存在若干个由噪点而导致的干扰块,为了更准确地消除上述干扰块,在步骤103之后,方法100还可以包括:检测至少一个字符定位块中的每一个字符定位块的前景像素面积;根据前景像素面积从至少一个字符定位块中检测出干扰块,并从至少一个字符定位块中剔除干扰块;其中,该干扰块的前景像素面积至少小于至少一个字符定位块中的M个字符定位块的前景像素面积,其中M为预设字符个数。
[0077] 具体地,该前景像素面积指的是字符定位块中前景像素点所占据的面积。可选地,为了进一步节省计算量,可以对每一个字符定位块进行水平投影以获取字符高度,并根据该字符定位块的宽度以及该字符高度推算出该前景像素面积。进一步地,该预设字符个数M是根据该计量表的表盘预先确认好的。进一步地,如图4所示,由噪点而导致的干扰块通常具有较少的前景像素点,因此可以基于前景像素面积对至少一个字符定位块进行从大到小的排序,并选取前M个字符定位块参与到后续步骤104中,并将剩余的字符定位块作为干扰块剔除。
[0078] 相较于前述实施方式,本实施方式根据每一个字符定位块的前景像素面积来确认由噪点而导致产生的干扰块,避免了将对应于真实字符的、且字符宽度较小的字符定位块误检测为干扰块的情况,可以实现更准确的剔除效果,进一步优化了字符分割效果。
[0079] 在一种实施方式中,参见图3,在所获得的至少一个字符定位块中,存在若干个由噪点而导致的干扰块,为了更准确地消除上述干扰块,在步骤103之后,方法100还可以包括:利用非最近抑制算法(Non Nearest Suppression,以下简称NNS)从至少一个字符定位块中剔除干扰块。
[0080] 具体地,上述利用NMS算法从至少一个字符定位块中剔除干扰块具体可以包括:找到上述二值图像中最左边的前景像素点和最右边的前景像素点,根据二者的位置信息以及二者之间的宽度确定对应于每一个字符的字符黄金中心,进一步地,选取与每一个字符的字符黄金中心距离最近的字符定位块参与到后续步骤104中,并将剩余的字符定位块作为干扰块剔除。
[0081] 相较于前述实施方式,本实施方式能够准确且简单地剔除由于噪点而导致的干扰块,进一步优化了字符分割效果。
[0082] 在一种实施方式中,由于某些字符的宽度较小(比如数字“1”或“7”),容易导致字符分割不全。基于此,步骤104具体还可以包括:确定至少一个字符定位块的平均宽度;其中,若在所述至少一个字符定位块中存在宽度小于平均宽度的目标字符定位块,则根据目标字符定位块的位置信息与平均宽度对字符区域图像进行字符分割。从而避免了字符分割不全的情况出现。
[0083] 图8为根据本申请一实施例的字符分割装置80的结构示意图,用于执行图1所示出的字符分割方法。
[0084] 如图8所示,字符分割装置80包括获取模块801,用于:
[0085] 获取字符区域图像,并将字符区域图像转换为灰度图像。具体地,该计量表包括但不限于生活中常见的水表、电表、燃气表,比如可以是字轮型水表。进一步地,该计量表的字符区域图像可以是单字符图像或多字符图像,可以通过面对着该计量表的表盘而设置的摄像装置而获取,当然该字符区域图像也可以有其它来源,例如来自其它设备,或者也可以是现成的图像,本实施例对此不进行限制。进一步地,所获取的字符区域图像可以是RGB格式,进而在获取字符区域图像之后,可以通过浮点算法、整数方法、移位方法、平均值法等多种方式确定字符区域图像中各个像素点的灰度值,并利用该灰度值代替像素点中红绿蓝三通道的像素值,从而得到灰度图像。
[0086] 举例来说,参见图2,示出了一个字符区域图像的灰度图像,在该字符区域图像中从左到右依次显示了7个字符“0”、“0”、“0”、“0”、“1”、“1”、“1”。可以看出,上述多个字符之间边界不够清楚,并且由于摄影头的感光元件分辨率不够导致出现字符区域图像出现横纹,进而使得各个字符变成了相连状态,并因此存在难以正确地进行字符分割的问题。
[0087] 如图8所示,字符分割装置80包括聚类模块802,用于:
[0088] 利用模糊C均值对灰度图像进行聚类分析,并根据聚类分析的结果对灰度图像执行二值化处理,得到二值图像。具体地,模糊c均值聚类(fuzzy c-means,以下简称FCM)算法是一种无监督的模糊聚类方法,它的思想就是使得被划分到同一簇的对象之间相似度最
大,而不同簇之间的相似度最小。本实施例通过模糊集合的概念,可以把聚类生成的簇看成模糊集合,进而获取灰度图像中每个像素点属于每个类的隶属度,其中每个像素点隶属于簇的隶属度就是[0,1]区间里面的值,每个像素点隶属于多个簇的隶属度的总和等于1。应理解,FCM算法是普通C均值算法的改进,普通C均值算法对于数据的划分是硬性的,硬聚类把每个待识别的对象严格的划分某类中,具有非此即彼的性质,而FCM则是柔性的模糊聚类,这种模糊聚类建立了样本对类别的不确定描述,更能客观的反应客观世界。
[0089] 举例来说,图3示出了基于上述方案对图2的灰度图像进行聚类分析以及二值处理后所得到的二值图像。其中,在经过上述聚类之后,可以利用每个簇的聚类中心将每个簇与两个预设类之一进行关联,该两个预设类可以是前景与背景。然后,针对每个像素点选取具有最高隶属度的N个簇,并根据该N个簇所关联的预设类判断该像素点是前景像素点或背景像素点。进一步地,在上述聚类分析获得每一个像素点是前景像素点或背景像素点之后据此对灰度图像执行二值化处理,从而获得凸显出了目标轮廓的二值图像。
[0090] 如图8所示,字符分割装置80包括定位模块803,用于:
[0091] 利用投影法从二值图像中获取至少一个字符定位块。具体地,上述投影法是通过对二值图像的像素点的分布直方图进行分析,从而找出相邻字符的分界点并据此进行分割,将上述二值图像中对应于不同字符的图像区域相互切分开,并将每一个图像区域中的背景区域尽可能多地去除。其中,上述投影法具体包括垂直投影和水平投影,本实施例中优选采用垂直投影,并基于垂直投影图中投影值为0的投影位置而确定该至少一个字符定位块。
[0092] 举例来说,参见图4,即示出了对图3的二值图像进行垂直投影之后分割获得的多个字符定位块。其中,该多个字符定位块中可能存在由于噪点而导致产生的干扰块,因此本实施例可以设置字符宽度阈值,进而将宽度小于该字符宽度阈值的字符定位块作为干扰块剔除,也可以采用其他方案剔除该干扰块,本申请对此不作具体限定。
[0093] 如图8所示,字符分割装置80包括分割模块804,用于:
[0094] 根据至少一个字符定位块的位置信息对字符区域图像进行字符分割。参见图5,示出了根据图4中所获取的多个字符定位块的位置信息从图2中所示出的字符区域图像进行字符分割后,所获得的多个字符图像。
[0095] 本发明中,通过采用模糊C均值聚类算法对原始的字符区域图像进行二值化处理,从而能够获得消除了多数污渍、反光等干扰的二值图像,进而可以利用投影法从该二值图像中获取更为准确的字符分割位置。由此,对于图像质量较差的字符区域图像,能够实现更为准确的字符分割效果。
[0096] 基于图8的字符分割装置,本申请的一些实施例还提供了该字符分割装置的一些具体实施方案,以及扩展方案,下面进行说明。
[0097] 在一种实施方式中,字符分割装置80还可以包括:
[0098] 边缘检测模块,用于利用canny算子对灰度图像进行边缘检测,得到边缘图像;以及,直线检测模块,用于利用霍夫变换方程对边缘图像进行直线检测,得到边缘图像的边界线;以及,边界去除模块,用于根据边界线去除灰度图像的边界部分。
[0099] 具体地,参见图6,示出了一个包含长矩形字符框的灰度图像,在该灰度图像中从左到右依次显示了7个字符“0”、“0”、“0”、“0”、“1”、“1”、“1”,并在字符的上侧和下侧示出了该计量表的长矩形字符框。因此,本实施例可以利用canny算子对该灰度图像进行边缘检测以获取边缘图像,目的在于定位灰度图像中用于展示字符的字符框的边界。可选地,上述canny算子也可以被替换为:Roberts算子、Laplace算子、Prewitt算子、Sobel算子、Rosonfeld算子和Kirsch算子中的一种或多种。可选地,由于本实施例中的边缘检测的目的在于定位灰度图像中用于展示字符的字符框的位置,因此在本实施例中采用具有高抗噪性的边缘检测参数以避免检测出过多的伪边缘。进一步地,由于该字符框形成包括边界分明的长直线,因此本实施例可以利用霍夫变换方程对边缘图像进行直线检测,从而获取对应字符框的分界线。进一步地,由于该字符框对后续的字符分割步骤存在不利影响,因此本实施例可以将该灰度图像中对应于分界线的位置以外的部分去除,从而避免在后续的字符分割过程中影响分割效果。
[0100] 举例来说,参见图7,示出了对图6中的包含长矩形字符框的灰度图像进行边缘检测后所获得的边缘图像。可以看出,在图7示出的边缘图像的上下侧边缘处具有较为明显的直线,进而可以通过霍夫变换方程轻易检测得到边界线。进一步地,可以在图6中根据所检测到的边界线的位置将相应的边界部分去除,从而获取图2中所示出的灰度图像。可选地,还可以对该二值图像进行水平投影,并根据水平投影图中投影值为0的投影位置而将该对应于字符框的上侧边缘和下侧边缘截取并去除。
[0101] 相较于前述实施方式,本实施方式通过采用边缘检测模块、直线检测模块以及边界去除模块,可以避免由于字符区域图像中携带有字符框而导致的字符分割错误,进而提高了字符分割的准确度。
[0102] 在一种实施方式中,上述边缘检测模块还可以包括质量检测模块与参数调整模块。其中质量检测模块可以用于检测灰度图像的图像质量特征;参数调整模块可以用于由灰度图像的图像质量特征自适应地调整canny算子的参数。具体地,上述图像质量特征可以包括:全局对比度、全局灰度均值等用于表示图像质量的特征值。具体地,为了进一步解决边缘检测过程中难以兼顾抗噪性和检测精度这一问题,本发明实施例可以根据灰度图像的图像质量特征而自适应地确定该canny算子中的参数,该图像质量特征比如是全局对比度,该canny算子中的参数比如是高阈值和/或低阈值。举例来说,若检测出灰度图像的全局对比度更低,则推测该灰度图像的清晰度较低,采用更高的高阈值和/或低阈值;若检测出灰度图像的全局对比度更高,则推测该灰度图像的清晰度较高,则采用较低的高阈值和/或低阈值。
[0103] 应理解,该canny算子需要应用双阈值(Double-Threshold)检测来确定真实的和潜在的边缘,举例来说,如果一个像素的梯度大于高阈值,则被认为是边缘像素点,如果小于低阈值,则被认为是非边缘像素点,若该像素点的梯度位于两者之间,则只有当其与边缘像素连接时才认为其是边缘像素点。然而在传统canny算子中,高阈值与低阈值是人为确定的,并且高/低阈值的比例是固定的,这造成canny算子应用的局限性。基于此,本实施例中采用根据灰度图像的图像质量特征而自适应地调整高阈值与低阈值的方法,相较于前述实施方式,减少了周边大量无用不真实的边界信息,降低了噪声对缺陷边缘识别的影响,对后续的霍夫变换过程起到至关重要的作用。可选地,也可以预先训练出参数模型,进而使得能根据当前进行字符分割的字符区域图像的质量而自适应地调节参数。
[0104] 在一种实施方式中,为了减少噪声对边缘检测的影响,字符分割装置80还可以包括滤波模块,用于:
[0105] 在利用canny算子对灰度图像进行边缘检测之前,对灰度图像进行滤波处理;其中,滤波处理为中值滤波处理和/或高斯滤波处理。具体地,为了尽可能减少噪声对边缘检测结果的影响,所以必须滤除噪声以防止由噪声引起的错误检测。因此本实施例使用高斯滤波器和/或中值滤波器对灰度图像进行卷积,以减少明显的噪声影响、平滑图像。其中高斯滤波是一种线性平滑滤波,适用于消除高斯噪声。中值滤波是一种非线性平滑滤波,其将所处理的图像中每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中
值,中值滤波对脉冲噪声有良好的滤除作用,且在滤除噪声的同时,能够保护信号的边缘,使之不被模糊。
[0106] 相较于前述实施方式,本实施方式通过对灰度图像进行高斯滤波处理和/或中值滤波处理,可以减小由于计量表上的污渍或反光而带来的噪声影响,进而提高了后续进行边缘检测的准确度。
[0107] 在一种实施方式中,为了进一步消除噪点对于聚类的不利影响,字符分割装置80还可以包括对数变换模块,用于:
[0108] 对灰度图像进行对数变换。其中,上述对灰度图像进行对数变换的目的在于增高灰度图像中的对比度。具体地,该对数变换可以将灰度图像的低灰度值部分扩展,将其高灰度值部分压缩,从而达到强调图像低灰度部分的目的,因此对于整体对比度偏低并且灰度值偏低的图像具有较好的增强效果。
[0109] 在一种实施方式中,为了得到进一步消除了多数污渍、反光等干扰的二值图像,聚类模块802可以进一步用于:
[0110] 根据C个簇的聚类中心分别确定C个簇的属性;确定灰度图像的任意一个像素点分别对应于C个簇的C个隶属度;进一步地,根据隶属度对C个簇进行排序以确定其中的N个簇,并根据N个簇的属性确定灰度图像的任意一个像素点的属性,其中,C、N为正整数,且C大于N;根据灰度图像的任意一个像素点的属性对灰度图像进行二值化处理。具体地,上述C和N是可调整的动态参数,可以组合出各种不同的门限。进一步地,根据C个簇的聚类中心分别确定该C个簇的属性具体可以通过判断每一个簇的聚类中心的灰度值是否超过预设阈值来确定每一个簇的属性为前景或背景。进一步地,根据隶属度对C个簇进行排序以确定其中的N个簇具体可以是选取具有最高隶属度的N个簇;进一步地,根据N个簇的属性确定灰度图像的任意一个像素点的属性是指综合考虑该N个簇的属性的来判断灰度图像的任意一个像素点的属性。比如,针对某一像素点,只有当其所对应的该N个簇的属性均为前景时才判断该像素点为前景像素点,否则均判断该像素点为背景像素点。又比如,针对某一像素点,当其所对应的该N个簇中,超过预定比例的簇的属性为前景时,判断该像素点为前景像素点,否则均判断该像素点为背景像素点。
[0111] 举例来说,预设C=5,N=2,预设规则为:只有当某一像素点所对应的该N个簇的属性均为前景时才判断该像素点为前景像素点,否则均判断该像素点为背景像素点。基于此,可以利用FCM输出该灰度图像中的每一个像素点对于5个簇(C1、C2、C3、C4、C5)的隶属度以及每个簇的聚类中心。进一步地,该聚类中心表示的是每个类的平均特征,可以通过该聚类中心判断每个簇对应于背景类还是前景类,例如:C1属于前景、C2属于前景、C3属于背景、C4属于背景、C5=属于背景。进一步地,针对该灰度图像中的像素点A、可以得到其分别对五个簇(C1、C2、C3、C4、C5)的隶属度为(b1、b2、b3、b4、b5),若其中,b2>b3>b1>b4>b5,则从中选取排序前2名的隶属度b2与b3,并根据与所选取的隶属度相对应的两类簇C2与C3综合判断该像素点A为前景像素点还是背景像素点,因此基于上述预设规则判断像素点A为背景像素点。
[0112] 相较于前述实施方式,本实施方式可以在保留字符基本轮廓的情况下进一步减少二值图像中的噪点,进一步优化了字符分割效果。
[0113] 在一种实施方式中,参见图3,在所获得的至少一个字符定位块中,存在若干个由噪点而导致的干扰块,为了更准确地消除上述干扰块,字符分割装置80还可以包括第一剔除模块,用于:
[0114] 检测至少一个字符定位块中的每一个字符定位块的前景像素面积;根据前景像素面积从至少一个字符定位块中检测出干扰块,并从至少一个字符定位块中剔除干扰块;其中,该干扰块的前景像素面积至少小于至少一个字符定位块中的M个字符定位块的前景像素面积,其中M为预设字符个数。具体地,该前景像素面积指的是字符定位块中前景像素点所占据的面积。可选地,为了进一步节省计算量,可以对每一个字符定位块进行水平投影以获取字符高度,并根据该字符定位块的宽度以及该字符高度推算出该前景像素面积。进一步地,该预设字符个数M是根据该计量表的表盘预先确认好的。进一步地,如图4所示,由噪点而导致的干扰块通常具有较少的前景像素点,因此可以基于前景像素面积对至少一个字符定位块进行从大到小的排序,并选取前M个字符定位块输入分割模块804,并将剩余的字符定位块作为干扰块剔除。
[0115] 相较于前述实施方式,本实施方式根据每一个字符定位块的前景像素面积来确认由噪点而导致产生的干扰块,避免了将对应于真实字符的、且字符宽度较小的字符定位块误检测为干扰块的情况,可以实现更准确的剔除效果,进一步优化了字符分割效果。
[0116] 在一种实施方式中,参见图3,在所获得的至少一个字符定位块中,存在若干个由噪点而导致的干扰块,为了更准确地消除上述干扰块,字符分割装置80还可以包括第二剔除模块,用于:
[0117] 利用非最近抑制算法(Non Nearest Suppression,以下简称NNS)从至少一个字符定位块中剔除干扰块。具体地,上述利用NMS算法从至少一个字符定位块中剔除干扰块具体可以包括:找到上述二值图像中最左边的前景像素点和最右边的前景像素点,根据二者的位置信息以及二者之间的宽度确定对应于每一个字符的字符黄金中心,进一步地,选取与每一个字符的字符黄金中心距离最近的字符定位块参输入分割模块804,并将剩余的字符定位块作为干扰块剔除。
[0118] 相较于前述实施方式,本实施例能够准确且简单地剔除由于噪点而导致的干扰块,进一步优化了字符分割效果。
[0119] 在一种实施方式中,由于某些字符的宽度较小(比如数字“1”或“7”),容易导致字符分割不全。基于此,上述分割模块804还可以还用于:
[0120] 确定至少一个字符定位块的平均宽度;其中,若在所述至少一个字符定位块中存在宽度小于平均宽度的目标字符定位块,则根据目标字符定位块的位置信息与平均宽度对字符区域图像进行字符分割,从而避免了字符分割不全的情况出现。
[0121] 图9为根据本申请一实施例的字符分割装置的结构示意图,用于执行图1所示出的字符分割方法,该装置包括:
[0122] 至少一个处理器;以及,
[0123] 与至少一个处理器通信连接的存储器;其中,
[0124] 存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:
[0125] 获取字符区域图像,并将所述字符区域图像转换为灰度图像;利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;利用投影法从所述二值图像中获取至少一个字符定位块;根据所述字符定位块的位置信息对所述字符区域图像进行字符分割。
[0126] 根据本申请的一些实施例,提供了与以上字轮型计量表的字符分割方法的非易失性计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令设置为在由处理器运行时执行:
[0127] 获取字符区域图像,并将所述字符区域图像转换为灰度图像;利用模糊C均值聚类算法对所述灰度图像进行聚类分析,并根据所述聚类分析的结果对所述灰度图像执行二值化处理,得到二值图像;利用投影法从所述二值图像中获取至少一个字符定位块;根据所述字符定位块的位置信息对所述字符区域图像进行字符分割。
[0128] 根据本申请的一些实施例,提供了一种智能抄表系统,包括:计量表,用于在表盘上显示字符;摄像装置,用于拍摄该计量表的表盘以获取字符区域图像;字符分割装置,电连接至摄像装置,用于执行图1所示出的字符分割方法。
[0129] 本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。
[0130] 本申请实施例提供的装置、设备和计算机可读存储介质与方法是一一对应的,因此,装置、设备和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和计算机可读存储介质的有益技术效果。
[0131] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0132] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0133] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0134] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0135] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0136] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0137] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
[0138] 虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈