首页 / 专利库 / 电脑图像 / 霍夫变换 / 广义霍夫变换 / Character recognizing method

Character recognizing method

阅读:741发布:2020-07-19

专利汇可以提供Character recognizing method专利检索,专利查询,专利分析的服务。并且PURPOSE: To perform character recognition with high identification capability by setting the mean value of a signal ratio and the output of Hough transformation as a composite signal ratio, and performing identification evaluation corresponding to a value of composite signal ratio.
CONSTITUTION: Firstly, after smoothing, primary differential, and quadratic differential are performed from an image reading signal, and edge detection is performed, an ISBN code(International Standard Book Number) pattern is detected by applying pattern matching, and an area is selected. and generalized Hough transformation is performed in the area, then, the character recognition is performed. In other words, the character recognition is performed by detecting an edge point in the area selected as an ISBN code print area, generating a template for Hough transformation from the edge point, performing the Hough transformation by using the template, finding the maximum value on a Rough surface, and performing code recognition. Thereby, it is possible to surely perform the character recognition even when the template of one category is superimposed on another template.
COPYRIGHT: (C)1994,JPO&Japio,下面是Character recognizing method专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 入力された画像情報からエッジ点を検出するエッジ点検出工程と、 各認識カテゴリーの標準文字濃度画像のエッジ点からハフ変換用のテンプレートを作成し、登録するテンプレート登録工程と、 入力された画像情報の前記エッジ点に対してハフ変換を行いうハフ変換工程と、 前記画像情報のエッジ中、それがテンプレートの一部であるものを信号、それ以外をノイズとして、前記エッジ数に対する信号比率を求め、これとハフ変換の出力との平均値を複合信号比率とし、この値に応じて識別評価を行う認識工程とを含むことを特徴とする文字認識方法。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【産業上の利用分野】本発明は、文字認識方法に係り、
    特に1つのカテゴリーのテンプレートが他のカテゴリーのテンプレートの一部となる場合にも正確な読取りを行うことのできる文字認識方法に関する。

    【0002】

    【従来の技術】書籍コードの1つにISBNコード(国際標準図書番号)がある。 このISBNコードは、書籍裏面にOCR−Bフォントで印刷されており、印刷場所は書籍によって異なるが、次のように表現される。

    【0003】 ISBN4−? ? ? ? −? ? ? ? −$ (第1部分)(第2部分)(第3部分)(第4部分) ここで第1部分は国別記号、言語別で、4は日本語を表す。 第2部分は出版社記号を、第3部分は書名記号を、
    第4部分はチェック文字を表す。 出版社記号と書名記号の合計は、8桁である。 例えば出版社コード桁数最小で書名コード桁数最多の場合は以下のごとく表される。

    【0004】ISBN4−? ? −? ? ? ? ? ? −$ また、例えば出版社コード桁数最多で書名コード桁数最少の場合は以下のごとく表される。

    【0005】ISBN4−? ? ? ? ? ? ? −? −$ ところでこのようなISBNコード認識においては、作業者が肉眼でISBNコードを読取り、手入で伝票等に入力する方法、あるいは1冊1冊作業者がハンドスキャナで読み取り伝票などに自動入力する方法、さらにはバーコードリーダによりバーコードを読取り伝票などに自動入力する方法等が用いられている。 これらの方法のうち第1の手入力で行う方法は、人手によるため、効率が悪く、ミスが発生しやすいという問題がある。

    【0006】また第2のハンドスキャナによる方法は作業者がハンドスキャナをISBNコード印刷部分に正確に位置決めする必要があり、作業効率が悪いという問題がある。

    【0007】さらに第3のバーコードの読取りによる方法は、バーコードの印刷率が100%でないため、第1
    および第2の方法と併用しなければならず、これらの方法の問題をそのまま受け継ぐことになる上、併用することにより作業が繁雑となり効率が悪いという問題があった。

    【0008】このように書籍の多種多様化を伴う状況のなかで、ISBNコードの自動読取りが極めて重要視されるようになってきており、ISBNコードの自動読取りの研究が進められている。

    【0009】しかしながら、このようなISBNコードの自動読取りにおいては、文字色と背景色の多様性および背景デザインの多様性により2値化をベースとした文字認識では対応できないという問題、書籍コードの印刷場所についての制限が事実上ないため、全面について書籍コードをサーチする必要があり、扱うデータ量が大きく高速のサーチを行うことができない等のいろいろな問題があるが、コード自体は数字を主とするものであり、
    数字の誤認による書籍コードの誤認も深刻な問題となっている。

    【0010】通常一般化ハフ変換を用いて文字認識がなされるが、1つのカテゴリーのテンプレートが他のテンプレートの一部となる場合、例えば

    とするとハイフンはななの上部と完全に一致する。

    【0011】ここで

    とし1画素づつずらしながらエッジの方向が一致している個数を計数することにより、入力画像とテンプレートとが一致する画素数をハフ強度として求め、その最大値をマッチング画像であるとする方法がとられている。

    【0012】表1にその結果を示す。

    【0013】

    すなわち入力画像がハイフンであるとき、テンプレートをななとしたときもハイフンとしたときもハフ強度は同じになってしまい、識別が不可能となる。

    【0014】また、ハフ強度をテンプレートの画素数で割った値すなわち正規化ハフ強度を求めるという方法も提案されているが、今度は表1に示すように入力画像がななであるとき、テンプレートをななとしたときもハイフンとしたときも1となってしまい、識別が不可能となる。

    【0015】これは、書籍コード読取り装置のみならず、他の装置においても同様である。

    【0016】

    【発明が解決しようとする課題】このように、ハフ強度に基づいてテンプレートマッチングを行う場合も、正規化ハフ強度に基づいてマッチングを行う場合も、1つのカテゴリーのテンプレートが他のテンプレートの一部となる場合、識別不可能な場合が生じるという問題があった。

    【0017】本発明は、前記実情に鑑みてなされたもので、1つのカテゴリーのテンプレートが他のテンプレートの一部となる場合にも確実な文字認識を行うことのできる文字認識方法を提供することを目的とする。

    【0018】

    【課題を解決するための手段】そこで本発明では、入力画像のエッジ中、それがテンプレートの一部であるものを信号、それ以外をノイズとして、信号の数の入力画像の前記エッジ数に対する比すなわち信号比率を求め、これとハフ変換の出力との平均値を複合信号比率とし、この値に応じて識別評価を行うようにしている。

    【0019】

    【作用】ここでハフ変換の出力とは、信号数とテンプレート画像のエッジ数との比を示すものとする。

    【0020】本発明者は種々の実験結果から入力画像のエッジについて、再度ハフ変換を行うことによりそれが信号であるか否かを検出し、信号エッジ数とハフ強度との関係を測定した。 その結果多少のばらつきはあるが、
    両者はほぼ一定比率になっていることを発見した。 そこでハフ強度に一定比率を乗じて信号エッジ数を得、さらに信号エッジ数を入力文字有効領域内の前エッジ数で割ってその比を得、この値とハフ変換の出力(正規化ハフ強度)との平均値を算出し、正解カテゴリーと非正解カテゴリーとの比をとったとき、極めて正解が多くなるということを発見した。

    【0021】本発明はこの点に着目してなされたもので、信号比率とハフ変換の出力との平均値を複合信号比率とし、この値に応じて識別評価を行うようにしているため、識別力の高い文字認識を行うことが可能となる。

    【0022】

    【実施例】以下、本発明の実施例について図面を参照しつつ詳細に説明する。

    【0023】この装置は、図1に示すような書籍の裏面に印刷されているISBNコードを読み取る装置であり、特に入力画像のエッジ中、それがテンプレートの一部であるものを信号、それ以外をノイズとして、信号比率を求め、これとハフ変換の出力との平均値を複合信号比率とし、この値に応じて識別評価を行い、文字認識を行うようにしたことを特徴とする。

    【0024】まずこの装置の文字認識部の認識原理について説明する。

    【0025】この装置で、まず例えば

    の識別を行う場合を2表に示す。

    【0026】

    この表に示したように、ハフ強度や正規化ハフ強度のいずれをとっても を識別することはできない。 ところでハフ強度は入力画像とテンプレートとの一致度であるから、正規化ハフ強度は一致度をテンプレートの画素数で割ったものである。 そこで分母を換えて一致度を入力の画素数で割ったものを信号比率とする。 正規化ハフ強度の場合は、入力画像が(なな)、テンプレートが(ハイフン)のとき、


    1を出力し、これは良い出力ではない。 一方信号比率の場合は、入力画像が(ハイフン)テンプレートが(なな)のとき1を出力し、これは良い出力ではない。 ところがこのときに正規化ハフ強度は0.5を出力し、良い出力である。 このように正規化ハフ強度と信号比率は相補的な役割を果たす。 したがってこれらの平均値によればいずれの場合でも良い出力を得ることができる。

    【0027】次にこの文字認識部を用いた書籍コード読取り装置全体について説明する。 まずこの装置では図2
    に示すように走査線単位の間引きを行い、クラス間分散とクラス内分散との比を評価尺度とし、有効な特徴を持つ3組のラインを探し、これをテンプレートとして用いるようにしたことを特徴とする。 図2中1,2,3,4
    はエッジの方向を表す。

    【0028】この装置を用いた読取りのアルゴリズムを図3に示すように、まず画像読取り信号から平滑化、1
    次微分、2次微分を行いエッジ検出を行った後、パターンマッチングによりISBNコードパターンの検出を行い、領域を選択してその領域内で一般化ハフ変換を行い文字認識を行うようにしている。

    【0029】すなわち、文字認識に際しては、ISBN
    コード印刷領域として選択された領域のなかにあるエッジ点を検出して、そのエッジ点からハフ変換用テンプレートを作成しそのテンプレートを用いてハフ変換を行い、ハフ平面上で最大値を求め、コード認識を行う。

    【0030】図4は本発明実施例のISBNコード認識方法におけるエッジ検出工程を示すアルゴリズムである。

    【0031】まず、原画像(101)を平滑化フィルタを用いて平滑化を行う(ステップ102)。

    【0032】ついでこの画像情報の2次微分をとるために103Sに示すようなラプラシアンフィルタを用いて画像処理を行いラプラシアン画像を得る(ステップ10
    3)。 そして、この2次微分値を2値化し(ステップ104)、ラプラシアン画像上を走査しながら、2次微分値が0となる点を検出し、これを零クロス点とする(ステップ105)。

    【0033】この後、ソーベルマスクを用いて零クロス点に対してのみ1次微分を行いエッジ強度および方向を演算する(ステップ106)。 ここで強度M,および方向θは次式で表される。

    【0034】 強度M=sqrt(dx×dx+dy×dy) 方向θ=atan(dy/dx) さらにこの微分値に対してある閾値に対して2値化を行い(ステップ107)、閾値よりも大きいときにエッジ点を決定する(ステップ108)。

    【0035】次にISBNの検出について説明する。

    【0036】ここではISBNのキーパターンをテンプレートマッチングにより検出する。 まず図5(a) および
    (b) に示すように、ISBNの間引きテンプレートをエッジの方向画像に重ね合わせ、各画素毎にマッチング強度を求める。 そして、テンプレートマッチングを行い、
    誤差吸収フィルタによる平滑化を行った後最大値検出を行いこれをISBNの位置とする。

    【0037】次に、ISBNのテンプレートの走査線単位での間引きについて説明する。

    【0038】図6にフローチャート、図7に装置構成を示す。

    【0039】まずISBNテンプレートとなるべきノイズの無い画像を1つ選び、この画像の走査線を1本選び、真データと偽データとを用意し、真偽各データについてテンプレートとのマッチング度を求める。 真データのマッチング度と偽データマッチング度の分布を求め(図8)、真データと偽データとの分離度の評価基準(クラス間分散とクラス内分散との比)を評価尺度とし、全走査線に対してこの評価操作を行い(図9)、最適となる走査線を1本選び(ステップ201)、さらにこの選んだ走査線との組み合わせが最適となる1本を選び(ステップ202)、さらにこの走査線ともう1本の走査線との組み合わせが最適となる1本を選ぶ(ステップ202)。

    【0040】このようにして3本の走査線を選ぶ。

    【0041】このようにして選択した走査線の本数と、
    クラス間分散とクラス内分散との比を評価尺度とした最適度との関係を測定した結果を図10に曲線aで示す。
    曲線bは他のデータセットを用いた場合を示す。 これらの結果から3本以上であるとほぼ最適であることがわかる。

    【0042】なおここでは24本から特定の3本の走査線を選択したが、3本以上であればよい。 多くなればなるほど処理データ量は増大するがより高精度の検出が可能となる。 また3本であればデータ量が1/8となり高速化が可能となる。

    【0043】図11はこの実際の回路構成の一例である。

    【0044】このようにしてISBNのキーパターンが検出されると、その領域を基準として切り出し、この領域内での文字認識を行う。

    【0045】文字認識はエッジとその方向を特徴としたハフ変換をベースとして行う。

    【0046】但し、ハフ変換では1つのテンプレートが他のテンプレートの一部分すなわち(テンプレート間で包含関係があるとき)、例えば1と7のような場合に正しく分類できない。 このためエッジのテンプレートに一致する部分を信号それ以外をノイズとして、入力信号の信号比率を求め、これとハフ変換の出力との平均値で分類するようにしている。

    【0047】またISBNパターンの右にはハイフンを含めて通常13文字であるが、書籍コードの書式には一例を次に示すようにいくつかのパターンがあるために1
    4文字の認識を行う。

    【0048】 書式I ISBN4−? ? ? ? −? ? ? ? −$(標準書式) 書式2 ISBN−4−? ? ? ? −? ? ? ? −$ 書式3 ISBN−? ? ? ? −? ? ? ? −$ さらに少しでも文字エッジ有効領域が小さい方が認識能力と処理速度とに優れると考えられるため、14文字の認識はISBNの右隣の文字から順次行う。

    【0049】次に文字認識のアルゴリズムについて説明する。

    【0050】図12,図13および図14に示すように認識対象の文字がISBNパターンの右隣の文字(1文字目)であるならば、仮の文字中心位置を、ISBNパターンの中心位置より右へ、標準文字間隔の2.5倍の位置に設定する。 そしてそうでなければ、左の文字中心位置に対して、標準文字間隔だけ右の位置に仮の文字中心位置を設定する。

    【0051】そして図13および図14に示すように、
    仮文字中心位置を基準にして文字エッジ有効領域とハフ画像有効領域とを設定する。

    【0052】認識対象の文字が1文字目の文字であるならば(ステップ301)、対象カテゴリーを4と−のカテゴリーとする(ステップ302)。 一方認識対象の文字が1文字目の文字でなければ(ステップ303)、対象カテゴリーを0123456789x−の12カテゴリーとする(ステップ304)。

    【0053】そして各カテゴリーに対してハフ変換・平滑化を行ってハフ画像を作成し、ハフ画像中の最大強度をハフ強度、その位置をその対象カテゴリーに対する文字中心位置として検出する(ステップ305)。

    【0054】図12にステップ405で示すようにハフ強度をテンプレート自身のハフ強度でわったものを正規化ハフ強度として図15に示すようにその値を求める。

    【0055】ハフ強度にハフ強度からエッジ数への変換係数を掛けたものを信号エッジ数(ステップ403)、
    信号エッジ数を文字エッジ有効領域の全エッジ数で割ったものを信号比率(ステップ404)としてそれぞれ検出する(図16)。

    【0056】そして正規化ハフ強度と信号比率の平均値を分類の評価基準としその値を求める(ステップ40
    5)。

    【0057】評価基準の大きい順に第1候補と第2候補とを求め、第1候補の文字中心位置とする(ステップ4
    06)。

    【0058】認識対象文字が第2文字目以降の文字であれば、第2候補の評価基準と第1候補の評価基準との差を求め、この差が相対閾値以上の場合(ステップ30
    6)、リジェクトを出力する(ステップ307)。

    【0059】第1候補の正規化ハフ強度が絶対閾値以下の場合(絶対リジェクト)は(ステップ308)、ハイフンを出力し、仮の文字中心位置を真の文字中心位置とする(ステップ309)。

    【0060】第1候補の正規化ハフ強度が絶対閾値以下でない場合(絶対リジェクトでない)は(ステップ30
    8)、仮の文字中心位置を真の文字中心位置とする(ステップ307)。

    【0061】図15と図16との比較からも複合信号比率の方がより正しく分類することができることがわかる。

    【0062】このように本発明によれば、簡単な演算処理のみで識別力の高い文字認識を行うことができ容易かつ高精度の自動読取りを行うことができる。

    【0063】

    【発明の効果】本発明によれば、信号比率とハフ変換の出力との平均値を複合信号比率とし、この値に応じて識別評価を行うようにしているため、識別力の高い文字認識を行うことが可能となる。

    【図面の簡単な説明】

    【図1】本発明実施例の書籍コード読取り装置で読み取るべき書籍の面を示す図

    【図2】本発明実施例のISBNテンプレートの間引きを示す図

    【図3】本発明実施例の読取りのアルゴリズムの概要を示す図

    【図4】本発明実施例のエッジ検出のアルゴリズムを示す図

    【図5】ISBNコード領域のサーチを示す図

    【図6】テンプレートの走査線単位の間引きのフローチャートを示す図

    【図7】テンプレートの走査線単位の間引きのための装置構成を示す図

    【図8】ISBNパターンのマッチング度分布を示す図

    【図9】ISBNパターンの各走査線における評価値を示す図

    【図10】走査線の本数と、クラス間分散とクラス内分散との比を評価尺度とした最適度との関係を測定した結果を示す図

    【図11】同工程における実際の装置構成の一例を示す図

    【図12】文字認識のアルゴリズムを示す図

    【図13】文字認識の計算範囲を示す図

    【図14】文字認識の計算範囲を示す図

    【図15】正規化ハフ強度による文字認識結果を示す図

    【図16】複合信号比率による文字認識結果を示す図

    【符号の説明】

    101〜406 各ステップ

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈