专利汇可以提供一种复杂表格及其内部手写数字识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种复杂表格及其内部手写数字识别方法,首先对复杂表格模板进行预处理、直线检测、 角 点集的行列分类排序、模板表格定来实现对单元格的结构描述。在获得 电子 手写表格后,对其进行倾斜矫正并与模板表格适配,获得其单元格 位置 描述。随后,对每个单元格进行处理,去除边线的同时,尽可能完整地保留单元格内的字符。然后,提取单元格中数字图像,通过对数据集训练好的分类器,对数字图像进行识别。最后,对手写字符进行后处理,将识别结果填入模板表格中。本发明简单易实现,识别效果较好,为今后自动识别并录入表格提供了良好的解决方案。,下面是一种复杂表格及其内部手写数字识别方法专利的具体信息内容。
1.一种复杂表格及其内部手写数字识别方法,其特征在于,包括以下步骤:
步骤1:对模板表格进行直线检测、角点检测,以解析扫描表格中的每个单元格结构间的拓扑关系,实现模板表格结构描述;
步骤2:对纸质手写表格转成的电子手写表格进行预处理,即对纸质手写表格经扫描转成的电子手写表格进行位置标定、倾斜矫正、噪点剔除预处理,使电子手写表格结构与步骤
1得到模板表格结构一致;
步骤3:对步骤2中电子手写表格的每个单元格进行去除边线处理:
3.1.对表格四周设置边线检测范围;本例设置的范围是R,即只在这个范围内判断是否存在边线,并同时设置4个大小的标志数组,用于记录是否从上下左右检测到边线,初始化为false,设置检测边线的区间宽度w,和轮询判别的宽度wide;
3.2.设置一次边线检测的roi区域分别为:
lineROI[0]=Mat(textarea,Rect(0,j,textarea.cols,w));lineROI[1]=Mat(textarea,Rect(j,0,w,textarea.rows));lineROI[2]=Mat(textarea,Rect(textarea.cols-w-j,0,w,textarea.rows));
lineROI[3]=Mat(textarea,Rect(0,textarea.rows-w-j,textarea.cols,w));
其中j的范围是[0,wide],即轮询3.1中设置的大小范围,textarea为待处理的单元格图像,本文设置的roi宽度为w;
此步骤中有两种判别方式,可酌情选取其中一种;第一种:首先判断此位置的标志位,即检测到了边线,为false,便在此区域中直线检测算法检测是否存在边线,若存在,则用背景色白色覆盖此roi区域和下一个roi区域,标志该位置的标志位为true确保再次循环到此位置不再执行检测算法,如此循环wide次;第二种:同样循环检测四个边线是否存在边线,检测到边线后先不处理,而是设置标志位记录location=j,大于0小于wide,位置已经首先检测到边线,继续进行循环检测,直到再次检测不到边线后跳出循环,再次覆盖记录,即location=j;四个位置全部记录到后,统一对[0,location+temp]区域置白,其中temp为适当的扩充区域;
3.3.若有一边没有检测到边线,便对此位置在原表格图像中扩充wide个像素点重新提取识别区域,并再次提取单元格后执行此步骤,直到4条边都被检测到并去除成功;
步骤4:对步骤3得到的单元格,将其中的数字图像提取出来,对字符分割预处理及分割成独立字符;
步骤5:对大量数字文本提取特征并训练得到分类器,将步骤4得到的独立字符送入分类器进行识别,得到识别结果;
步骤6:对步骤5得到的手写字符进行后处理,包括对于小数点、写字符常出现特殊情况的字符进行特殊处理,最后将识别出来的数字自动录入到电子表格对应位置;
上述步骤1的具体步骤为:
1.1 将预先获得的模板表格图像二值化,设置滑窗、步长为t,选取适当阈值,设置的检测最短线段长度,进行霍夫变换,得到线段集;判断L中的直线位置是否在误差范围内,是则连接,否则不相连;
1.2 将该图像进行Shi-tomasi角点检测,得到初步角点集;对角点集去噪后,排序规则为:两角点若不在同一个水平线上,两角点的y值相减小于10则认为在同一水平线上,则y坐标小的排序靠前,若在同一水平线上,则比较两者的垂直距离,若两者不在同一垂直线上,两角点的x值相减小于10则认为在同一垂直线上,则x坐标小的排序靠前;最后设置二维动态数组存储结果,维数按水平线从小到大排列,同一维内的一维数组按照垂直距离从小到大排列存储,得到规范角点集Corner;
1.3 设置5个参数标定单元格,分别是:行yint类型,列xint类型,几行合并rowMergeint类型,几列合并colMergeint类型,单元格的范围rectRect类型;设置一个与列分类verticalcorners的二维动态数组维数和大小一致的指针数组verlink,将列分类结果分别指向筛选后的角点集Corner得到verlink,同时记录Corner中的点位于哪一列,以及记录该点是否与下一点有直线相连;而后再按照同样的思路进行行分类,将列分类结果分别指向筛选后的角点集Corner得到horilink,记录Corner中的点位于哪一行,以及该点与该行的下一点是否有直线相连;进一步的,借助上面的数组进行单元格定位,以行分类位基准进行定位,从第一个点开始遍历,各点判断方式如下:
1.3.1 首先判断某点p1是否在行上有下一点q1相连,若是进行步骤1.3.2,不是结束此次循环;
1.3.2 判断该点p1与该列下一点p2是否相连,若是则进行步骤1.3.3,不是结束此次循环;
1.3.3 则判断q1是否在列上有下一点q2相连,若是则进行步骤1.3.4,不是则进入步骤
5;
1.3.4 循环判断p2是否能够经过有限次数连接到q2,若是则定位一个单元格,将相应数据计算压入记录表格的动态数组,跳出循环;若不是进入步骤1.3.5;
1.3.5 判断p2与q2行数大小,若p2.row>q2.row,则q2继续寻找在列上下一个相连的点,若p2.row=q2.row,p2与q2同时寻找下一个在列上相连的点,若p2.row
3.根据权利要求1所述的一种复杂表格及其内部手写数字识别方法,其特征在于,所述步骤4提取单元格中数字图像具体如下:对步骤3得到的已经去除单元格边线的ROI单元格采取放大图像和二值化处理方式得到待识别数字的ROI区域,将单个的字符取出并按取出顺序排列。
4.根据权利要求1所述的一种复杂表格及其内部手写数字识别方法,其特征在于,所述步骤5对数字文本提取特征并训练得到分类器具体如下:采用MNIST数字字符集作为训练样本,对字符集每个数字集筛选出字符规则的3000个样本,采用轮廓法提取出每个样本的字符;同时对10个字符总共30000个样本采用KNN算法进行训练,得到分类器,并利用该分类器对步骤4提取的数字进行识别。
5.根据权利要求1所述的一种复杂表格及其内部手写数字识别方法,其特征在于,所述步骤6对手写字符进行后处理具体为:
对于小数点的处理方式如下:若得到的识别字符的数组长度大于1,则可能存在小数点,首先选出最小高度minh的图像,并求其余待识别字符的图像平均高度aveh,若minh
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
图像获取方法和图像展示方法、装置及设备 | 2020-05-08 | 965 |
一种基于深度学习的遥感影像自动标注方法 | 2020-05-08 | 447 |
基于深度神经网络的行人步态分割方法 | 2020-05-11 | 701 |
一种显示方法、装置、设备和存储介质 | 2020-05-11 | 381 |
基于安全帽识别监控系统的配置系统、方法、设备及介质 | 2020-05-08 | 458 |
基于多尺度轻量化空洞卷积的光学遥感图像分割方法 | 2020-05-08 | 735 |
检测对象的方法、装置、电子设备和存储介质 | 2020-05-11 | 183 |
视频中目标物体的跟踪方法、装置、设备及存储介质 | 2020-05-08 | 190 |
田间图像中分割油菜花的方法、装置、设备及存储介质 | 2020-05-08 | 296 |
基于卫星视频的运动检测方法、装置、设备和存储介质 | 2020-05-08 | 922 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。