专利汇可以提供一种无切分的脱机手写汉字文本识别方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种无切分的脱机手写汉字文本识别方法,包括S1)对脱机手写汉字文本图像进行预处理;S2)构建空间变换网络模型;S3)构建深度 卷积神经网络 模型;S4)通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型;S5)通过分类器CTC输出序列征标签的概率分布;S6)采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。本发明通过采用空间变换网络、深度卷积神经网络和循环神经网络相结合的模型,能够针对偏移较大文本行进行校正处理和无切分的识别,提高复杂文本行识别的准确性和鲁棒性;整个模型 框架 基于 迭代 算法 求解,不需要复杂的过切分预处理,能够较好地减少过切分方法带来的损失,以及能够联合地优化整个模型参数,提高识别的准确率。,下面是一种无切分的脱机手写汉字文本识别方法专利的具体信息内容。
1.一种无切分的脱机手写汉字文本识别方法,其特征在于,包括以下步骤:
S1)、对脱机手写汉字文本图像进行预处理,预处理包括图像尺寸归一化处理、以及图像亮度值反转;
S2)、构建空间变换网络模型,通过该空间变换网络模型校正文本图像的偏移,该空间变换网络模型由定位网络、采样栅格、采样器构成;
S3)、构建深度卷积神经网络模型,通过该模型提取校正偏移文本图像的深度特征;
S4)、通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型,通过该模型对深度序列特征建模;
S5)、通过联结主义时间分类器CTC输出序列特征标签的概率分布,得到初步的识别结果;
S6)、采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。
2.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:所述的步骤S1)中,通过图像尺寸归一化处理将文本图像宽度处理为128,并通过图像亮度值反转将文本图像背景和汉字亮度进行反转,具体为:I(i,j)=255-X(i,j),其中,X(i,j)为文本图像第i行第j列像素位置对应的亮度值,I(i,j)为转后文本图像第i行第j列像素位置的亮度值。
3.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S2)中,具体包括以下步骤:
S201)、将预处理后的文本图像输入定位网络中,计算得到仿射变换参数θ,即θ=floc(I),其中,floc(I)是一个2层的全连接网络,I为预处理后的文本行图像;
S202)、通过仿射变换参数θ得到文本图像的坐标栅格 坐标点的仿射
变换如下:
其中, 是输入文本图像的采样点坐标,Aθ为仿射变换矩阵, 为输出栅格的坐标,并且, 和 当仿射变换矩阵 其中,s为缩放
分量,tx,ty为输出栅格像素坐标的偏移量,该变换矩阵可以实现裁剪、缩放、平移、旋转和倾斜等变换操作,这些变换实现了空间的注意力机制,使得变换后的图像更关注主要内容信息;
S203)、将文本图像的坐标栅格坐标与文本图像Y输入到采样器,得到校正偏移的文本图像V,即V=fsam(I,Tθ(G)),其中,fsam为采样器函数。
4.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S3)中,构建的深度卷积神经网络模型为一个18层的残差深度卷积神经网络,残差网络的学习表达式为:
F(x)=H(x)-x,
其中,F(x)为残差映射,H(x)为原始映射,从而根据残差网络结构y=F(x,{Wi})+x,提取图像特征y,其中,Wi为权值参数,x为输入。
5.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S4)中,所述的循环神经网络模型为2层双向的GRU(Gate Recurrent Unit)网络。
6.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S5)中,分类器CTC的映射关系为: 通过CTC层输出每一帧序列特征数
据的识别概率分布,其中,p(k|y)为序列特征k在序列特征y下的条件概率,p(l|y)为序列特征l在序列特征y下的条件概率,β(k)=l为序列k到序列y的映射,y=y1,...,yT为输入的特征序列,每一个 L′是包含所有识别的字符集和一个空白符号,CTC在输出序列时,移除重复项以及空白项。
7.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S6)中,通过在最大概率附近的几组数据中搜索最大概率路径l*=argmaxl∈DP(l|y)确定真实序列,其中,D是一个对应的字典;
由于可以在最大概率路径附近搜索最佳输出序列,将搜索路径限制在一个范围Nδ(l′)内,其中,δ表示最大的搜索距离,l′是无字典规则的序列,在最大概率路径附近搜索的路径可以表示为 从而得到最终的识别结果。
8.根据权利要求4所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:所述的18层的残差深度卷积神经网络模型由1个卷积层、16个残差单元和1个全局平均池化层构成。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种解析房产证照片内容的方法 | 2020-09-06 | 1 |
一种三维模具缺陷检测方法及装置 | 2020-12-11 | 0 |
基于深度学习的鱼类细粒度分类方法 | 2021-04-08 | 2 |
卷积神经网络压缩方法及人脸检测方法 | 2022-10-24 | 0 |
一种基于改进卷积神经网络的焊缝缺陷识别方法 | 2022-09-21 | 1 |
用于面部识别和视频分析以识别上下文视频流中的个人的装置和方法 | 2023-03-13 | 0 |
基于多标签分类的道路交通标志的识别方法 | 2021-06-20 | 1 |
一种面向智慧社区的多摄像机联动多目标追踪方法及系统 | 2020-09-04 | 0 |
基于卷积注意力的矩阵分解方法、装置及电子设备 | 2021-10-30 | 1 |
用於類神經網路計算的旋轉資料 | 2023-11-04 | 0 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。