首页 / 专利库 / 软件 / 所见即所得 / 一种用于带摄像装置的移动终端上实现OCR功能的新型辅助定位技术

一种用于带摄像装置的移动终端上实现OCR功能的新型辅助定位技术

阅读:642发布:2020-11-12

专利汇可以提供一种用于带摄像装置的移动终端上实现OCR功能的新型辅助定位技术专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种用于带摄像头的移动终端实施光符识别(OCR)功能的针对待识别文字的辅助 定位 技术,可根据OCR功能具体实施的两种情况分别有如下步骤:其一,首先操作者利用移动终端对包含字符图像信息的物体进行拍摄;其次,启动辅助定位功能,屏幕上会出现十字 光标 。操作者移动光标,使其原点位于待识别文字内部或左下 角 ;最后,按确定键并自动识别。其二,操作者打开移动终端OCR拍摄功能,移动终端屏幕会显示出一个十字光标。然后,操作者调整拍摄的相对 位置 使光标原点落在待识别目标字符的内部或左下角;最后,拍摄图像并自动识别。本发明有益效果是,更准确选择待识别的选择范围,减小识别计算量,同时具有防止拍摄倾斜的作用,提高识别率。,下面是一种用于带摄像装置的移动终端上实现OCR功能的新型辅助定位技术专利的具体信息内容。

1、一种带摄像装置的移动终端对图片上字符进行识别的辅助定位方法,其中 图片是指包括名片、身份证、驾照、广告牌等,其辅助定位方法可以包括 如下步骤:
步骤1、操作者利用带摄像装置的移动终端拍摄目标,此时要求待识别字符在 拍摄后的图像中的位置没有较大的平或者垂直倾斜、翻转;
步骤2、移动终端操作者启动辅助定位功能,屏幕出现十字定位光标
步骤3、移动终端操作者通过操作按键移动定位光标原点到要识别的字符区 域内部,或者左下,定位于目标字符的左上角、右上角及右下角 等也在本公司申请专利覆盖范围内,然后确定;
步骤4、移动终端启动自动识别模,对选定的字符进行后续识别并输出识 别结果。
辅助定位方法也可以包括如下步骤:
步骤1、操作者启动带摄像装置的移动终端的拍摄功能,并且选择是OCR拍 摄。此时不同于一般的拍摄,在移动终端的显示器上会出现一个位 置固定的十字定位光标。
步骤2、操作者在拍摄前可以调整拍摄的相对位置使得十字光标的原点落在 要识别目标字符的内部区域,或者字符区域的左下角,定位于目标 字符的左上角、右上角及右下角等也在本公司申请的专利覆盖范围 内。同时调整待识别目标字符区域的底边与十字光标的横轴平行,待 识别字符区域的底边方向与十字光标的纵轴相垂直。
步骤3、确定位置后,操作者可以按下拍摄键或拍摄快
步骤4、移动终端进行拍摄之后,光符识别功能模块自动启动,分析并定 待识别内容,开始对字符进行自动识别,并输出识别结果。
2、根据权利要求1所述的辅助定位方法,其特征是:用于显示定位的光标是 十字形状的,光标的显示可以是虚线,也可以是实线;十字光标可大可小, 最大时十字光标可以穿过整个屏幕,且可带箭头即显示为十字坐标轴的形 式;光标上可以有计量刻度标识。
3、根据权利要求1所述的辅助定位方法,其特征是:当带摄像装置的移动终 端操作者启动定位功能以后,进行定位时,光标的原点可以置位于待识别 字符或者电话号码的内部位置,也可以置位于待识别的左下角、左上角、 右下角、右上角等部位,都在本专利申明范围内。
4、根据权利要求2所述的辅助定位方法,其特征是:十字光标的原点,可以 是一个实心原点,也可以是一个空心原点,等等可以明显表示的原点位置 的图形都在本专利声明范围内;十字光标的原点,也可以不必有明确标示 图形的原点。
5、据权利要求2所述的辅助定位方法,其特征是:十字光标的横、纵坐标 可以用来防止拍摄图像的倾斜,提高识别的准确度。带摄像装置的移动终 端操作者可以通过LCD上显示的所见即所得图象中的待识别字符区域的底 边方向与十字光标的横轴相平行,待识别字符区域的底边方向与十字光标 的纵轴相垂直来调整带摄像头终端的机位,使拍摄图像位置正确sa,以 便准确快速识别出结果。

说明书全文

所属技术领域

发明提供了一种用于带摄像装置的移动终端上实现OCR功能的新型辅 助定位技术。它通过一种带有原点的十字光标辅助定位方法来实现终端操作 者对待识别字符进行准确定位,结合OCR达到操作者快速获得信息的目的。

技术背景

现有的具有OCR功能的智能终端和PDA等设备,在对光符识别前定位技术的 实现方式上存在着一定的不便和缺陷,不能方便的定位到需要识别的字符上, 带来了识别过程计算量大、消耗时间长等缺点。

现有的OCR功能手机在进行名片识别定位时,已采用的方法既有用一根红 线压到目标字符上,也有直接识别名片上全部内容的方法,还有用一个矩形框 选择目标字符串的方法。

但是这些方法,都会存在一些缺陷。如利用一根红线压到目标字符上的方 法,比较方便,但是不能防止出现拍摄字符倾斜的问题,这样就造成了识别率 降低;而对于整个名片全部识别的办法,不但工作量加大,而且更加不能防止 拍摄图像的倾斜情况出现。同时因为有对操作者来说的许多无用信息存在,干 扰操作者获取感兴趣信息的过程;对于用矩形框定位情况,矩形框的大小不易 确定又给拍摄带来不便,过大则包括了不必要的内容,过小又不能完整包含要 识别的目标字符。

发明内容

本发明提供了一种用于带摄像装置的移动终端上实现OCR功能的新型辅助 定位技术,它通过一种带有原点的十字光标辅助定位方法来实现终端操作者对 待识别字符进行准确定位,结合OCR达到操作者快速获得信息的目的。通过该定 位方法,可以准确选择目标字符,缩小图像选择范围,提高运算速度、减小运 算量,同时由于十字光标的横坐标和纵坐标存在,还可以具有防止倾斜的作用。
人机交互界面实现上,该方法实现方式之一在拍摄后的OCR过程时采用 十字光标形式,可以把光标定位到目标字符区域内部或者左下(定位于目标 字符的左上角、右上角及右下角等也在本公司申请专利覆盖范围内),都可以 做到准确定位。同时在定位方式的算法上,采用了与此相适应的算法;该方法 实现方式之二在进行OCR目的拍摄前即显示十字光标,此时在操作者调整十字 光标原点至目标字符区域内部或者左下角(定位于目标字符的左上角、右上角 及右下角等也在本公司申请的专利覆盖范围内),都可以做到准确定位。同时在 定位方式的算法上,采用了与此相适应的算法。
本发明解决的问题:
首先,也是最主要的一个,就是辅助定位功能。对于名片识别,一般情况 下,拍摄的图像是整个名片,要做到对具体个别的号码,需要准确确定识别目 标,有多种方法可以采用,本专利采用的这种方法,通过定位到目标字符的内 部或者左下角(定位于目标字符的左上角、右上角及右下角等也在本公司申请 的专利覆盖范围内),就可以方便选定要识别的目标字符;
其次,本专利还有另一个优点,就是可以帮助带摄像装置的移动终端使用 者选择目标字符的同时,防止拍摄图像的倾斜。因为有十字光标的关系,操作 者可以通过与十字光标的纵坐标及横坐标的对比就可以通过目测检查到图像中 的字符区域是否处在正确位置
由于这种方法的采用,它具有了更好更强的功能,可以准确定位,而且可以 防止拍摄图像的倾斜。
本发明的有益效果是,更加准确的选择目标字符,缩小图像选择范围, 提高运算速度、减小运算量,同时由于十字光标的横纵坐标存在,还可以具 有防止倾斜的作用。
附图说明
附图1(包括a,b)为本发明的流程图
附图2为本发明的一种具体实施例的操作过程显示状态示意图;
附图3为本发明的一种具体实施例的操作过程显示状态示意图。

具体实施方式

下面将结合说明书附图及具体实施例对本发明作进一步详细说明。
实现方式之一:
第一步,操作者启动带摄像装置的移动终端的摄像功能,拍摄图像。此时 要求待识别字符在拍摄后的图像中的位置没有较大的平或者垂直倾斜、翻转。
第二步,带摄像装置的移动终端使用者启动辅助定位功能,在带摄像装置 的移动终端显示屏上出一个十字定位光标。定位光标的形状是十字形状的,横 坐标和纵坐标可以是实线,也可以是虚线,原点是一个实心或者空心的圆点。
第三步,带摄像装置的移动终端使用者通过操作按键移动定位光标原点到 待识别的字符区域(包括电话号码或者email等)内部,或者左下角(定位于 目标字符的左上角、右上角及右下角等也在本公司申请的专利覆盖范围内)。这 样可以方便的定位(具体情况看附图所示,图2、图3分别表示压到字符串中 心和字符串左下角)。操作按键可以使得定位光标在拍摄图像上向上下左右四个 方向移动,从而达到定待识别字符区域的目的。
通过这种辅助定位方法,可以缩小识别目标的范围,从而减小识别处理模 的运算量,提高运算速度,缩短运算时间。
第四步,确定好拍摄图像的位置后,带摄像装置的移动终端的操作者可 以按下确定键,则带摄像装置的移动终端的识别功能模块自动锁定要识别内 容,开始字符的自动识别。
实现方式之二:
第一步,操作者启动带摄像装置的移动终端的摄像功能,并且选择是OCR 拍摄。此时不同于一般的拍摄,在移动终端的显示器上会出现一个位置固定的 十字定位光标。
第二步,带摄像装置的移动终端的使用者通过调整拍摄的相对位置使得定 位光标原点到达待识别的字符区域(包括电话号码或者email等)内部,或者 左下角(定位于目标字符的左上角、右上角及右下角等也在本公司申请的专利 覆盖范围内)。这样可以方便的定位(具体情况看附图所示,图2、图3分别表 示压到待识别的字符区域中心和待识别的字符区域左下角)。同时,在调整拍摄 的相对位置时,带摄像装置的移动终端使用者需要根据十字光标的横坐标轴和 纵坐标轴,调整摄像头或者被拍摄目标的角度,使字符区域底边的方向和十字 光标的横坐标轴平行,字符区域底边的方向和十字光标的纵坐标轴垂直。
通过这种辅助定位方法,可以缩小识别目标的范围,从而减小识别处理模 块的运算量,提高运算速度,缩短运算时间。同时,可以防止拍摄的待识别的 字符区域图像发生倾斜。这样,在进行字符识别时,不会因为拍摄角度发生倾 斜而降低字符识别准确率。
第三步,确定好拍摄待识别的字符区域图像的位置和角度后,带摄像装置 的移动终端操作者可以按下确定键,拍摄图像。
第四步,操作者利用带摄像头的移动终端进行拍摄之后,光符识别功能模 块自动启动,分析并锁定待识别内容,开始对字符进行自动识别,并输出识别 结果。
本发明所描述带摄像头装置的移动终端的光符识别处理方法,并不仅仅限 于说明书和实施方式中所列运用,上述的这种方案也可以应用于其它可摄影电 子产品中,如数字相机,PDA,数字摄像机等等,它完全可以被适用于各种适 合本发明之领域,对于熟悉本领域的人员而言可容易地实现另外的优点和进行 修改,因此在不背离权利要求及等同范围所限定的一般概念的精神和范围的情 况下,本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示 例。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈