专利汇可以提供基于深度学习的文字识别模型训练方法和识别方法专利检索,专利查询,专利分析的服务。并且一种基于 深度学习 的文字识别方法,包括:设计更深的多层 卷积神经网络 结构,把每一个字符作为一个类别;采用反向传播 算法 训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的 颜色 、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。,下面是基于深度学习的文字识别模型训练方法和识别方法专利的具体信息内容。
1.一种基于深度学习的字符识别模型的训练方法,包括以下步骤:
步骤S1,构建多层卷积神经网络,包括设置网络层数、卷积窗大小、每层节点数;定义一个输出层来输出字符分类的结果,每个类别标签定义一个输出结点;
步骤S2,训练所述多层卷积神经网络,从而得到字符识别模型,这里目标函数为输入图像的真实标签与所述字符识别模型预测结果的交叉熵;
步骤S3,增加所述多层卷积神经网络的卷积层层数得到新的多层卷积神经网络,用步骤S2得到的模型参数来初始化所述新的多层卷积神经网络卷积层的权重;
步骤S4,重复步骤S2与S3,即逐渐增加卷积层层数并训练,直到识别正确率不再提高为止,得到优化的字符识别模型;
步骤S5,使用维特比算法,从给定词典中求出所述字符识别模型中每个词语对应的分数,分数最高的即为识别出的词语,从而得到最终的字符识别模型。
2.根据权利要求1所述的基于深度学习的字符识别模型的训练方法,其中所述步骤S2中采用误差反向传播算法来训练所述多层卷积神经网络,从而得到字符识别模型。
3.根据权利要求1所述的基于深度学习的字符识别模型的训练方法,其中步骤S3所述增加所述多层卷积神经网络的卷积层层数的步骤中,每次增加2-3层卷积层。
4.根据权利要求3所述的基于深度学习的字符识别模型的训练方法,其中所述步骤S4中,最终采用多于12个卷积层、多于3个全连接层和2个最大值池化层的深度卷积神经网络,所述深度卷积神经网络中第一、二卷积层后面接局部响应归一化层。
5.一种基于深度学习的文字识别方法,包括以下步骤:
采用如权利要求1至4任意一项所述的基于深度学习的字符识别模型的训练方法对字符识别模型进行训练;
扫描待识别图像,利用上述步骤得到的所述字符识别模型对所述扫描得到的待识别图像进行识别,从给定词典中找出最有可能的词语。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
带宽压缩中的预测方法 | 2020-05-08 | 213 |
一种基于反演滑模控制的AGV路径跟踪方法 | 2020-05-11 | 0 |
一种无线体域网能耗和时延加权最小的安全路由选择方法 | 2020-05-08 | 982 |
一种基于区块链和竞拍博弈的网络资源安全共享方法 | 2020-05-08 | 582 |
储能式充电桩参与电网需求侧响应联合运行优化模型与求解算法 | 2020-05-08 | 238 |
一种电采暖设备接入的配电网供电能力优化方法和装置 | 2020-05-08 | 494 |
一种基于部件特征的航空发动机多故障并发诊断方法 | 2020-05-08 | 324 |
雨雪天气条件下的运动目标检测方法 | 2020-05-08 | 195 |
面向慢性病康复的精准运动大数据智能预测、分析及优化系统 | 2020-05-08 | 200 |
一种基于分布式编码的随机梯度下降优化方法 | 2020-05-11 | 565 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。