专利汇可以提供一种结合最大极值稳定区域和笔画宽度变化的文本定位方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种结合最大极值稳定区域和笔画宽度变化的文本方法,使用MSER对图像进行文本检测;然后对图像进行边缘化处理;并沿边缘 像素 点的梯度方向计算笔画宽度值;使用形态学操作去除噪点、填充间隙并计算获得连通域;最后根据规则过滤非文本域并合并连通域。本发明的优点在于:本发明通过MSER检测获取粗糙文本域,结合边缘化处理、笔画宽度变化特征及形态学操作,实现了在自然场景图像中进行文本 定位 ,经实验证明,本发明准确率高,有利于之后文本分割和文本识别工作,在自然场景文本定位领域中具有十分明显的实用意义,可广泛推广使用。,下面是一种结合最大极值稳定区域和笔画宽度变化的文本定位方法专利的具体信息内容。
1.一种结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述文本定位方法包括如下步骤:
(1)利用MSER进行对文本域进行检测:对原始图像进行灰度化,并用0-255的整数来表示图像中各像素点的灰度值;在图像灰度值范围内任取一阈值,灰度值小于阈值的像素点定义为黑色,大于阈值的像素点为白色,当阈值为0时,整个图像为白色,在阈值从0到255变化过程中,黑色区域稳定不变且区域梯度最小,则该区域为最大稳定极值区域;
(2)Canny算子边缘化处理图像:利用高斯滤波器平滑图像,对滤波后的图像计算其梯度幅度和梯度方向,对梯度幅度进行非极大值抑制,找出图像梯度中的局部极大值点,并将非局部最大值点置零,以此细化图像边缘,用双阈值算法检测和连接边缘;
(3)获取图像笔画宽度特征:对每一个边缘像素点,在垂直于边缘的梯度方向上定义一条射线,沿射线方向寻找对应的另一边缘像素点,在梯度方向上找到另一边缘像素点,且该点的梯度方向与原梯度方向近似相反,则这两个边缘像素点的距离被认为是笔画宽度;未找到对应像素点或对应像素点梯度方向不近似相反,则丢弃该射线,在更为复杂的笔画环境中,沿未舍弃的射线计算所有像素点的笔画宽度中值m,并将射线上所有笔画宽度值大于m的像素点笔画宽度中值都设为m;
(4)形态学运算处理图像:对图像使用开、闭运算,开运算先对图像进行腐蚀操作,去除图像的边缘毛刺,然后进行膨胀操作,填充图像细小缝隙和小孔,闭运算先进行膨胀操作,填补图像的断裂区域,轮廓缺口,然后进行腐蚀操作,平滑图像边缘;
(5)候选文本域生成:将文本像素点根据规则聚集成候选文本域,相邻像素点笔画宽度值在阈值范围内则归为同一连通域,计算连通域的宽高比及面积比,将超过阈值范围的连通域作为非文本域滤除;
(6)文本域合并:对单字文本域作进一步过滤,相邻单字文本域内笔画宽度均值比、高度比、及像素点颜色均值比超过阈值,将偏差较大的连通域作为噪声滤除,将剩余连通域聚集成连,形成连续文本域。
2.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述利用MSER进行对文本域进行检测的步骤中,最大稳定极值区域是一种依赖于区域内部和边界像素关系,根据稳定性判定条件来获取最大稳定极值区域的算法;对于输入图像进行灰度化,在0-255的图像灰度值范围内任取一阈值,Q1,….,Qi,…是一系列嵌套极值区域,且 满足q(i)=|Qi+Δ\Qi-Δ|/|Qi|在i*有局部最小值,则Qi*是最大极值稳定区域MSER。
3.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述的Canny算子边缘检测是基于最优化思想的边缘检测算子,该算法采用合适的二维高斯函数分别按行和列对图像进行平滑去噪,计算图像梯度的幅度和方向,并通过对梯度幅度的最大值抑制,来找到图像梯度中的局部极大值点,置零非局部极大值点,使边缘得以细化,采用T1、T2双阈值算法检测,用T1来获得每一条线段,用T2来在线段两边寻找断裂处,并连接边缘;其中,所述二维高斯函数为:
I(x,y)=G(x,y)*f(x,y);
所述梯度幅度和梯度方向的计算公式为:
θ(x,y)=arctan(gy/gx);其中σ是高斯曲线的标准差,(gx,gy)表示梯度。
4.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述笔画宽度计算的步骤中,所述笔画宽度值为dswt;所述笔画宽度值的计算步骤包括:将每个边缘像素点p的梯度方向称为dp,梯度方向dp垂直于边缘方向,定义一条射线r=p+n·dp,n>0,沿射线方向找另一个边缘像素点q,若q的梯度方向dq与dp近似相反(dq=-dp+π/6),则该像素点笔画宽度值dswt为: 其中xp、yp分别
是像素点p的横、纵坐标,xq、yq分别是像素点q的横、纵坐标;在更为复杂的笔画环境中,上述计算流程获得的笔画宽度值并不准确,沿未舍弃的射线计算所有像素点的笔画宽度中值m,并将射线上所有笔画宽度值大于m的像素点笔画宽度中值都设为m。
5.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述利用形态学运算处理图像的步骤中,主要包括了开、闭运算,开运算先对图像进行腐蚀操作,去除图像的边缘毛刺,然后进行膨胀操作,填充图像细小缝隙和小孔,闭运算先进行膨胀操作,填补图像的断裂区域,轮廓缺口,然后进行腐蚀操作,平滑图像边缘;
所述的开运算记为 定义为: 所述的闭运算记为A·B,定义为:
其中A为图像,B为结构元素。
6.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述候选文本域生成的步骤中,主要通过计算连通域属性并设置规则和阈值来滤除非文本域,所包括的规则有:笔画宽度方差、宽高比、面积比;所述笔画宽度方差用来判断像素点是否属于同一连通域,若笔画宽度值相似,则将这像素点归为同一连通域。笔画宽
2
度值均值μswt与方差σswt的计算公式为:
其中N是连通域内像素点总数,
是第i个像素点的笔画宽度值;所述宽高比用来滤除因噪声干扰而产生的细小狭长的连通域,连通域宽高比r=dheight/dwidth,宽高比阈值为2;所述面积比用来过滤面积过大或过小的连通域,连通域面积比阈值为2。
7.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述文本域合并的步骤中,对单字候选域作进一步筛选,并将剩余单字连通域聚集成链,形成连续的文本域,单字连通域的筛选条件有笔画宽度比、高度比、颜色均值差;所述笔画宽度比用来判断相邻单字文本域是否属于同一文本域,相邻单字文本域笔画宽度比阈值为2;所述高度比用来判断相邻单字文本域是否属于同一水平方向文本域,相邻单字文本域高度比阈值为2;所述颜色均值用来判断相邻单字文本域是否属于同一文本域,相邻单字文本域颜色均值差阈值为40。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
X射线图像诊断装置 | 2020-05-12 | 345 |
X射线图像诊断装置 | 2020-05-12 | 259 |
X射线图像诊断装置 | 2020-05-12 | 563 |
X射线图像诊断装置 | 2020-05-12 | 456 |
X射线图像诊断装置及X射线装置 | 2020-05-11 | 90 |
X射线图像诊断装置 | 2020-05-12 | 943 |
X射线图像诊断装置 | 2020-05-11 | 52 |
X射线图像拍摄方法 | 2020-05-11 | 980 |
X射线透视图像装置 | 2020-05-11 | 461 |
X射线图像处理装置及X射线图像处理方法 | 2020-05-13 | 964 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。