首页 / 专利库 / 人工智能 / 体感交互 / 手势识别 / Device and method for character recognition

Device and method for character recognition

阅读:316发布:2022-10-29

专利汇可以提供Device and method for character recognition专利检索,专利查询,专利分析的服务。并且PURPOSE: To provide a specifying means for a recognition object area and an editing means for a recognition result for the character recognition device.
CONSTITUTION: The character recognition device is equipped with the pen 12 used for coordinate position input and the tablet 13 with a display and further equipped with an image display means 14 which displays an inputted image on the display of the tablet and a recognition object image data extracting means 15 which extracts recognition object image data by encircling a recognition object image area, including a recognition object character in an image displayed by the image display means 14, with an unspecific-shape closed curve by using the pen 12. Further, the device is equipped with an extracted character string recognizing means 16 which recognizes the characters in the extracted recognition object image data, an extracted character string display means 17 which displays the extracted character string on the display, a gesture recognizing means 18 which recognizes the gesture input of the pen 12 as an editing command, and an extracted character string editing means 19 which performs an editing process for the extracted character string.
COPYRIGHT: (C)1994,JPO&Japio,下面是Device and method for character recognition专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 座標位置を入力するためのペンと、 座標読み取り領域を有し、この座標読み取り領域上で動かされる前記ペンの軌跡の座標値を読み取るタブレットと、 文字領域を含む文書の画像データを入力する入力手段と、 前記タブレットの座標読み取り領域と対応付けられた表示領域を有する表示手段と、 前記表示領域に前記画像データを表示させる画像表示手段と、 入力された画像データを表示領域に表示しているとき領域抽出モードにあり、この領域抽出モードにおいて使用者が前記ペンで前記タブレットの座標読み取り領域上をなぞると、前記ペンで指定された範囲に相当する文字領域の画像データを抽出し表示するように制御する制御手段と、 前記制御手段により抽出された文字領域の画像データを文字コードに変換するデータ変換手段と、 抽出された文字領域を前記表示手段の表示領域に表示する抽出文字列表示手段とを備えた、文字認識装置。
  • 【請求項2】 前記表示手段の表示領域は、 前記タブレットの座標読み取り領域に重複するように前記タブレットに設けられていることを特徴とする、請求項1記載の文字認識装置。
  • 【請求項3】 前記制御手段は、領域抽出モードにあるときに、使用者が前記ペンを用いて前記タブレットの座標読み取り領域上に不定形閉曲線をなぞることによって、その不定形閉曲線の内部に含まれる全ての文字列を抽出することを特徴とする、請求項2記載の文字認識装置。
  • 【請求項4】 前記制御手段は、領域抽出モードにあるときに、使用者が前記ペンを用いて前記タブレットの座標読み取り領域上に不定形閉曲線をなぞることによって、少なくともその一部が前記不定形閉曲線の内部に含まれる文字列を行単位で抽出することを特徴とする、請求項2記載の文字認識装置。
  • 【請求項5】 前記制御手段は、領域抽出モードと文字編集モードとに切り換え可能であり、前記領域抽出モードにおいてペン操作により領域抽出処理が行われ、文字編集モードにおいては、使用者が前記ペンを用いて前記タブレット上に行う描画操作をコマンド入力として認識することを特徴とする、請求項1ないし請求項4のいずれかに記載の文字認識装置。
  • 【請求項6】 該文字認識装置は、さらに、 識別されたコマンドに基づいて、抽出された前記文字領域の文字データの編集処理を行う編集手段を備えることを特徴とする、請求項5記載の文字認識装置。
  • 【請求項7】 入力ペンとタブレットを用いて、表示装置に表示された画像中から所望の文字領域を抽出する文字認識方法であって、 表示された画像中の所望の文字領域を取り囲むように、
    入力ペンを用いてタブレットの座標読み取り領域上に不定形閉曲線を描くことによって、不定形閉曲線に囲まれた領域を黒画素とし、かつ不定形閉曲線の外側の領域を白画素とする抽出領域選択画像データを作成するステップと、 表示された前記画像の画像データと前記抽出領域選択画像データとの画素毎の論理積をとることによって所望の文字領域のみを表示する画像データを作成するステップとを備えた、文字認識方法。
  • 【請求項8】 入力ペンとタブレットを用いて、表示装置に表示された画像中から所望の文字領域を抽出する文字認識方法であって表示された画像中の所望の文字領域の少なくとも一部を含むように、入力ペンを用いてタブレットの座標読み取り領域上に不定形閉曲線を描くステップと、 前記不定形閉曲線に囲まれた領域から上下左右方向に画像データを走査し、白画素領域が所定範囲に渡って連続する位置を各々上限、下限、左限、右限として検出し、
    この範囲内にある画像データを所望の文字領域のみを表示する画像データとして抽出するステップとを備えた、
    文字認識方法。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【産業上の利用分野】本発明は、命令入手段として入力ペンとタブレットとを用いた文字認識装置及び文字認識方法に関するものである。

    【0002】

    【従来の技術】近年、文字認識装置を利用して文字や図形などを含む文書の修正・編集作業が一般的に行われている。 従来の文字認識装置は、文字領域の指定やコマンドの指定等の座標位置入力手段としてマウスを用いていた。 例えば、表示画面上に表示された入力画像中から特定の文字領域を抽出する場合には、使用者は、マウスを移動させて画面上のカーソルマークを矩形領域の始点と終点とに移動させて矩形領域を指定することによって、
    この矩形領域に囲まれた範囲内の文字領域を抽出するように操作していた。

    【0003】また、認識動作の実行や認識データの編集等を指示する場合には、予め表示されたメニューボタンまたは、使用者からの何らかの指示をきっかけに表示されるメニューボタンをマウスでクリックする操作を行っていた。

    【0004】

    【発明が解決しようとする課題】しかしながら、最近の文字認識装置に対しては、指示入力操作や編集命令入力操作等の操作性の向上が要求されている。 従来の文字認識装置に使用されているマウスは、キーボードに比べて操作が容易であるが、入力画像中の領域指定は矩形領域に限定されており、またマウスの形状が扱いにくいと感じられる場合があるなど、使用者にとって必ずしも扱い易い装置ではなかった。

    【0005】したがって、本発明は上記問題点に鑑みてなされたもので、特定の画像領域の認識動作や編集動作の指示操作性に優れた文字認識装置及び文字認識方法を提供することを目的とする。

    【0006】

    【課題を解決するための手段】請求項1の発明に係る文字認識装置は、座標位置を入力するためのペンと、座標読み取り領域を有し、この座標読み取り領域上で動かされる前記ペンの軌跡の座標値を読み取るタブレットと、
    文字領域を含む文書の画像データを入力する入力手段と、タブレットの座標読み取り領域と対応付けられた表示領域を有する表示手段と、表示領域に画像データを表示させる画像表示手段と、入力された画像データを表示領域に表示しているとき、領域抽出モードにあり、この領域抽出モードにおいて使用者がペンでタブレットの座標読み取り領域上をなぞると、ペンで指定された範囲に相当する文字領域の画像データを抽出し表示するように制御する制御手段と、制御手段により抽出された文字領域の画像データを文字コードに変換するデータ変換手段と、抽出された文字領域を表示手段の表示領域に表示する抽出文字列表示手段とを備えている。

    【0007】請求項2の発明に係る文字認識装置では、
    請求項1の文字認識装置に対して、さらに表示手段の表示領域が、タブレットの座標読み取り領域に重複するようにタブレットに設けられている。 請求項3の発明に係る文字認識装置では、請求項2の文字認識装置に対して、制御手段が、領域抽出モードにあるときに、使用者がペンを用いてタブレットの座標読み取り領域上に不定形閉曲線をなぞることによって、その不定形閉曲線の内部に含まれる全ての文字列を抽出するように制御動作を行う。

    【0008】請求項4の発明に係る文字認識装置では、
    請求項2の文字認識装置に対して、制御手段が、領域抽出モードにあるときに、使用者がペンを用いてタブレットの座標読み取り領域上に不定形閉曲線をなぞることによって、少なくともその一部が不定形閉曲線の内部に含まれる文字列を行単位で抽出するように制御動作を行う。

    【0009】請求項5の発明に係る文字認識装置では、
    請求項1ないし4の文字認識装置に対して、さらに制御手段が、領域抽出モードと文字編集モードとに切り換え可能であり、領域抽出モードにおいてペン操作により領域抽出処理が行われ、文字編集モードにおいては、使用者がペンを用いてタブレット上に行う描画操作をコマンド入力として認識するように制御動作を行う。

    【0010】請求項6の発明に係る文字認識装置は、請求項5の文字認識装置に対して、さらに、識別されたコマンドに基づいて、抽出された前記文字領域の文字データの編集処理を行う編集手段を備えている。 請求項7の発明は、入力ペンとタブレットを用いて、表示装置に表示された画像中から所望の文字領域を抽出する文字認識方法であって、表示された画像中の所望の文字領域を取り囲むように、入力ペンを用いてタブレットの座標読み取り領域上に不定形閉曲線を描くことによって、不定形閉曲線に囲まれた領域を黒画素とし、かつ不定形閉曲線の外側の領域を白画素とする抽出領域選択画像データを作成するステップと、表示された画像の画像データと抽出領域選択画像データとの画素毎の論理積をとることによって所望の文字領域のみを表示する画像データを作成するステップとを備えている。

    【0011】請求項8の発明は、入力ペンとタブレットを用いて、表示装置に表示された画像中から所望の文字領域を抽出する文字認識方法であって、表示された画像中の所望の文字領域の少なくとも一部を含むように、入力ペンを用いてタブレットの座標読み取り領域上に不定形閉曲線を描くステップと、不定形閉曲線に囲まれた領域から上下左右方向に画像データを走査し、白画素領域が所定範囲に渡って連続する位置を各々上限、下限、左限、右限として検出し、この範囲内にある画像データを所望の文字領域のみを表示する画像データとして抽出するステップとを備えている。

    【0012】

    【作用】請求項1に係る文字認識装置は、座標認識手段としてタブレットとペンを備え、タブレットの座標読み取り領域上をペンでなぞる動作によって紙に鉛筆書きするような感覚で任意形状の図形描画が可能である。 そして、制御手段は、領域抽出モードでは、ペン入力された描画領域を認識して、この領域に対応する画像データを抽出する。

    【0013】請求項2の文字認識装置は、タブレットの座標読み取り領域と表示画面が重複しているため、ペンを用いた画像抽出領域の指定が容易に行える。 請求項3
    及び請求項7の発明では、ペンで不定形閉曲線で取り囲んだ領域内の全ての画像データを抽出することができる。 請求項4及び請求項8の発明では、ペンを用いて大まかな領域を指定することにより、文章中の行間や段落などの区切りを検出して抽出するので、抽出しようとする領域を正確に指定しなくても、所望の領域を抽出することができる。

    【0014】請求項5及び請求項6の文字認識装置は、
    制御手段によって文字編集モードに切り換わると、ペンを用いて入力された描画図形をコマンド入力信号として受取り、その図形パターンを識別してコマンドが判断され、領域抽出モードで抽出された文字データに対して入力コマンドに対応した編集処理が行われる。

    【0015】

    【実施例】以下、本発明の実施例による文字認識装置について、図面を参照しながら説明する。 図1は、本発明の実施例における文字認識装置の構成を示すブロック図である。 図1を参照して、本発明による文字認識装置は、大別して、画像データを入力するための画像入力部10と、入力画像データを記憶する画像データ記憶部1
    1と、座標入力用のペン12と、ディスプレイ付きタブレット13と、画像データの抽出・編集動作を制御する制御部とを有する。

    【0016】画像入力部10は、外部ファイルやスキャナ等から画像データを読み込む動作を行う。 画像データ記憶部11は、入力された画像データを文字などの表示対象の黒画素を1、背景の白画素を0で示した2値のドットパターンで記憶する。 ディスプレイ付きタブレット13は、画像を表示する画面を有し、この画面上をペン12でポインティングしたりなぞったりすることにより、ペン12の軌跡座標値が読み取られる。 このディスプレイ付きタブレット13は、表示画像上を直接ペン1
    2で指定することができるため、紙に鉛筆書きするような感覚で操作でき、操作性に優れている。

    【0017】制御部は、主に領域抽出モード時に動作する認識対象画像データ抽出手段15、抽出文字列認識手段16、抽出文字列表示手段17と、主に文字編集モード時に動作するジェスチャ認識手段18、抽出文字列編集手段19とから構成される。 なお、後で詳述するが、
    領域抽出モードは入力された画像データの中から所望の文字列の画像データを抽出して表示する動作モードであり、文字編集モードは、入力ペンでコマンドを入力し、
    抽出した文字列に対して種々の編集動作を行う動作モードである。

    【0018】認識対象画像データ抽出手段15は、使用者がペン12で指示したタブレット13のディスプレイ上の領域座標を受取り、この領域に対応する文字領域の画像データを入力された画像データ中から抽出して抽出文字列認識手段16に出力する。 抽出文字列認識手段1
    6は、抽出された文字領域の画像データを文字単位で認識し、文字コードに変換し、抽出文字列表示手段17に出力するとともに保持する。

    【0019】抽出文字列表示手段17は、抽出した文字列をタブレット13のディスプレイ上に入力画像とは異なる表示領域、例えば異なるウインドウ等に表示する。
    ジェスチャ認識手段18は、文字編集モードにおいて、
    抽出文字列の表示領域に対して入力ペン12による描画入力動作が行われた場合に、描画図形から対応するコマンドを解釈する。

    【0020】抽出文字列編集手段19は、ジェスチャ認識手段18で認識したコマンドの内容に応じて抽出文字列に種々の編集動作を行う。 編集結果は、抽出文字列表示手段17によってディスプレイ上に表示される。 次に、この文字認識装置の動作について説明する。 図2ないし図4は、文字認識装置の動作手順を示す動作フローである。 図2に示すように、この文字認識装置の動作は、主に文字領域抽出動作と文字編集動作に分けられ、
    図3に文字領域抽出動作のフローが、また図4に文字編集動作のフローが示されている。

    【0021】まず、文字領域認識動作(領域抽出モード)について説明する。 画像入力手段10は、スキャナあるいはファイルから文字列を含む画像を読み込む(画像入力ステップ)。 画像記憶手段11は、画像入力手段10で読み込んだ画像を、文字などの黒画素を1、背景の白画素を0とした2値データで記憶する。

    【0022】画像表示手段14は画像記憶手段11で記憶している画像データをディスプレイつきタブレット1
    3のディスプレイ上に表示する(画像表示ステップ)。
    使用者は、ディスプレイつきタブレット13に表示された画像中で、認識したい文字を含む画像領域を、ペン1
    2を用いて抽出する。 ここで、文字画像領域の抽出方法には2つの方法がある。

    【0023】まず第1の方法について、図5を用いて説明する。 図5(a)に示すように、使用者は、入力ペン12を用いて画面上の抽出すべき文字領域の周囲を囲む不定形閉曲線20を描く。 認識対象画像データ抽出手段15は、不定形閉曲線20の軌跡の座標値等を求める。
    そして、図5(b)に示すような、入力画像領域と同じ大きさであって、不定形閉曲線の内部の全ての画素が黒画素であることを示す「1」であり、不定形閉曲線の外部の全ての画素が白画素であることを示す「0」から構成される選択領域画像データを作成する。 その後、入力画像データと選択領域画像データとの画素毎の論理積をとることにより、不定形閉曲線20で囲まれた領域以外の画素が白画素に変換され、図5(c)に示すように、
    不定形閉曲線20の内部の画像データのみが抽出される。

    【0024】さらに、第2の方法について図6を用いて説明する。 図6(a)に示すように、使用者は、ディスプレイつきタブレット13に表示された画像中で、抽出したい文字領域の一部にペン12を用いて不定形閉曲線21の印をつける。 認識対象画像データ抽出手段15
    は、不定形閉曲線21の座標情報を受け取って以下のように処理を行う。 図6(b)を参照して、認識対象画像データ抽出手段15は、まず不定形閉曲線21のx座標の最小値xmin、最大値xmax、y座標の最小値y
    min、最大値ymaxを求める。 次に、y座標の最小値yminを起点として、不定形閉曲線のx座標の最小値xminから最大値xmaxまでの範囲を上へ走査して、xminからxmaxまでの範囲の画素が全てが白画素「0」となる画素の行が、初めてNy行以上連続したy座標を認識対象領域の上限のy座標ysとする。 同様に、y座標の最大値ymaxを起点として、不定形閉曲線のx座標の最小値xminから最大値xmaxまでの範囲を下へ走査して、xminからxmaxまでの範囲の画素が全てが白画素「0」になる画素の行が、初めてNy行以上連続したy座標を認識対象領域の下限のy
    座標yeとする。

    【0025】今度は、x座標の最小値xminを起点として、不定形閉曲線のy座標の最小値yminから最大値ymaxまでの範囲を左へ走査して、yminからy
    maxまでの範囲の画素が全てが白画素「0」となる画素の行が、初めてNx行以上連続したx座標を認識対象領域の上限のx座標xsとする。 同様に、x座標の最大値xmaxを起点として、不定型閉曲線のy座標の最小値yminから最大値ymaxまでの範囲を右へ走査して、yminからymaxまでの範囲の画素が全てが白画素「0」になる画素の行が、初めてNx行以上連続したx座標を認識対象領域の下限のx座標xeとする。 そして、上限、下限のy座標、左限、右限のx座標で囲まれた画像ブロックを抽出文字領域の画像データとして抽出する。

    【0026】なお、第2の方法の他の例として、上下限及び左右限の走査は、不定形閉曲線21の重心位置(G
    x、Gy)から開始してもよい。 また、左右限の走査開始の起点をxmin、xmaxとし、上下限の走査開始の起点を重心位置Gyとしてもよい。 さらに、走査領域の幅や走査の順序は任意に設定してもよい。 このようにして抽出された文字領域の画像データは、抽出文字列認識手段16によって、画素単位の画像データから文字コードに変換され保持される。

    【0027】抽出文字列表示手段17は、抽出文字列認識手段16で抽出された文字列をタブレット13のディスプレイの画面上に表示する(抽出文字領域の表示ステップ)。 以上が領域抽出モードでの動作である。 つぎに、文字編集動作について説明する。 この動作モードでは、使用者がペン12でタブレット上をなぞって描画する動作(この動作をジェスチャと称する)からコマンドを認識して、抽出された文字列に対して種々の編集動作が行われる。

    【0028】まず、タブレット13のディスプレイ画面上の抽出文字列表示領域をペン12でなぞる動作はジェスチャとして受け付けられるように設定される。 そして、使用者がペン12で予め定められた図形をなぞると、その図形の座標値等の軌跡データがジェスチャ認識手段18に与えられる。 ジェスチャ認識手段18は、ジェスチャの意味を解釈して所定の処理コマンドを識別して、抽出文字列編集手段19に処理命令を与える。 ここで、図7は、ジェスチャ形状の例を示す図である。 図中、矢印はジェスチャの筆跡の向きを示している。

    【0029】図7(a)に例示するようなジェスチャA
    が描かれた場合、ジェスチャ認識手段18は、抽出文字列編集手段19にジェスチャAが描かれたこととジェスチャAの開始座標及び終了座標とを通知する。 抽出文字列編集手段19は、ジェスチャの開始座標及び終了座標とから、抽出文字列中のどの文字又は文字列が対象となるかを計算し、例えば、該当文字を反転表示するなどして選択されたことを表示する。

    【0030】また、ジェスチャAに続いて図7(b)に例示するようなジェスチャBが描かれた場合、ジェスチャ認識手段18は文字列の次候補への変換コマンド入力と認識する。 そして、抽出文字列編集手段19は、ジェスチャAによって選択されている文字を次候補に訂正する。 次候補とは現在表示されている候補文字の次に確からしい候補文字である。

    【0031】さらに、図7(c)に例示するようなジェスチャCの場合には、選択されている文字または文字列の選択候補を画面上に全て表示する。 さらに、図7
    (d)に例示するようなジェスチャDの場合には、選択されている文字又は文字列を削除する。 このような編集処理が行われた後、編集後の抽出文字列が抽出文字列表示手段17によってタブレット13のディスプレイ上に表示される。

    【0032】さらに、使用者の指示によって次の処理が行われる。 なお、上記実施例で説明したジェスチャは例示に過ぎず、種々の図形をコマンドと関連付けて使用することができる。 また、上記実施例では、ディスプレイ付きタブレットを使用したが、タブレットと分離したディスプレイ装置を使用してもかまわない。

    【0033】

    【発明の効果】このように、本発明の文字認識装置は、
    座標入力手段としてペンとタブレットを備え、領域抽出モード時には、タブレット上をペンでなぞることによって、画像表示手段に表示された画像上の所望の領域の画像データを抽出するように制御されるので、鉛筆書きの感覚で不定形閉曲線を用いた領域抽出指示が行え、文字認識動作の操作性が向上する。

    【0034】また、文字編集モードでは、抽出した文字領域の表示画面に対してペンを用いた描画動作をコマンド入力として受けとるように構成されているので、簡便な描画動作で文字列の編集動作の指示を容易に行わせることができる。 さらに、請求項7及び8に係る発明では、ペンでタブレット上に不定形閉曲線を描画することによって、所望の文字領域を認識することができるので、複雑な領域指定や大まかな領域指定が可能となり、
    操作性が向上する。

    【図面の簡単な説明】

    【図1】本発明の実施例における文字認識装置の構成を示すブロック図である。

    【図2】図1に示す文字認識装置の動作手順を示すメインフロー図である。

    【図3】図1に示す文字認識装置の動作手順を示すサブフロー図である

    【図4】図1に示す文字認識装置の動作手順を示すサブフロー図である

    【図5】本発明の文字認識装置の文字領域抽出動作の一例を説明するための模式図である。

    【図6】本発明の文字認識装置の文字領域抽出動作の他の例を説明するための模式図である。

    【図7】ジェスチャの形状の例を示す図である。

    【符号の説明】

    10 画像入力手段 11 画像記憶手段 12 ペン 13 ディスプレイつきタブレット 14 画像表示手段 15 認識対象画像データ抽出手段 16 抽出文字列認識手段 17 抽出文字列表示手段 18 ジェスチャ認識手段 19 抽出文字列編集手段

    ───────────────────────────────────────────────────── フロントページの続き (72)発明者 中尾 一郎 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈