Voice command recognizing image processor专利检索-音频指纹广播专利检索查询-专利查询网

Voice command recognizing image processor

阅读：231发布：2021-12-26

专利汇可以提供Voice command recognizing image processor专利检索，专利查询，专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a means for relaxing excess in the capacity of a storage medium such as a memory for previously registered audio dictionary data in the case of using a copy machine or a combined machine consisting of facsimile and printer to be operated while recognizing an audio input command from many and unspecified persons. SOLUTION: When registering reference data in the dictionary data, these data are registered while actually pressing the button of an operating part 101 or the like and when next using the same command, this device can be operated just by voice. In the case of performing registration, pattern machining is executed as well and when the same command as a registered command, any similar command or similar voice is inputted an alarm is issued to the user and in the case of dictionary data having high similarity, these data area more exactly recognized by any other judging element such as a fingerprint or palm.，下面是Voice command recognizing image processor专利的具体信息内容。

权利要求

【特許請求の範囲】

【請求項１】スイッチやボタン、テンキー、液晶タッチパネル等により、コピー操作やファクシミリの送信等のコマンドの入力を行う操作手段と、ＣＰＵ等の処理装置を使用し、前記操作手段からのコマンドにより画像処理の設定やプリント枚数等の設定を行い、画像入力手段、画像処理手段、画像出力手段等の動作の制御を行うドライバ手段と、ＣＣＤ等を使用し、前記ドライバ手段からの制御により、原稿の画像データをデジタルデータに変換し、画像処理部へ出力する画像入力手段と、ＡＳＩＣ等のハード回路や、前記ＣＰＵ等を使用したソフト的な処理等により、前記画像入力手段から入力されるデジタル画像データを、前記ドライバ手段からの画像処理の設定に応じて処理を行い、前記画像出力手段に出力を行う画像処理手段と、前記画像処理手段により処理された画像データを、レーザプリンタやインクジェットプリンタ等のプリンタによって出力を行う画像出力手段であって、この部分はブラウン管モニタや液晶モニタ、または前記操作手段部に使用されている前記液晶タッチパネルに表示を行ったり、
画像データとしてネットワーク上への出力、モデムを介してファクシミリ送信等を行うものも含む前記画像出力手段と、マイク等を使用し、音声の入力を行い、前記デジタルデータとして音声認識手段に送る音声入力手段と、前記音声入力手段からの音声データを入力し、辞書データへの登録や音声のパターンマッチング、コマンドへの変換等を行う音声認識手段と、より構成され、前記音声によるコマンドの認識を行い動作することを特徴とする音声コマンド認識画像処理装置。

【請求項２】前記音声認識手段は、前記音声入力手段からのデジタル音声データを入力する音声データ入力手段と、前記操作手段から入力されたコマンド情報の入力を行う操作部情報入力手段と、前記操作手段部情報と前記音声データとを対応させて、
メモリやハードディスク等の記憶媒体に記憶しておく辞書データ蓄積手段と、前記音声データ入力手段からのデータと、前記辞書データ蓄積手段からの音声辞書データとのパターンマッチングを行い、各コマンドに対する類似度を出力するパターンマッチング手段と、前記辞書情報の登録や通常コピー動作の情報を前記ドライバ手段から入力を行うドライバ情報入力手段と、前記パターンマッチング手段からの情報と、前記コマンド情報入力手段の情報とを受けて、通常コピーの場合は、入力された前記音声コマンドがいずれのコマンドに該当するかを判断し、コマンド出力手段に送るコマンド処理手段と、前記コマンド処理手段からのコマンド情報を、通常コピーの場合はドライバ手段や操作手段のモード表示部分へ送るコマンド出力手段と、より成ることを特徴とする請求項１記載の音声コマンド認識画像処理装置。

【請求項３】前記音声コマンド認識画像処理装置は、
前記辞書データ蓄積手段にデータを登録する際に、実際に操作しながら前記音声データの登録を行うことを特徴とする請求項１、２のいずれか記載の音声コマンド認識画像処理装置。

【請求項４】前記音声コマンド認識画像処理装置は、
前記音声データを登録する際に、前記辞書データ蓄積手段にデータに既登録のデータと同一データを登録しようとした場合、その旨を使用者に報知することを特徴とする請求項１、２、３のいずれか記載の音声コマンド認識画像処理装置。

【請求項５】前記音声コマンド認識画像処理装置は、
前記音声により設定を行う際に、未登録のコマンドを前記音声により設定しようとした場合、その未登録の旨を使用者に報知することを特徴とする請求項１ないし４のいずれか記載の音声コマンド認識画像処理装置。

【請求項６】前記音声コマンド認識画像処理装置は、
前記音声により設定を行う際に、その音声入力されたコマンドが複数のコマンドと類似していた場合、それらのコマンドを報知し、使用者に選択を促すことを特徴とする請求項１ないし５のいずれか記載の音声コマンド認識画像処理装置。

说明书全文

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、複写機及びファクシミリやプリンタ等の複合機、特にコマンドを入力するユーザインタフェイスに音声を用いているこの種の複合機械に関するものである。

【０００２】

【従来の技術】近年、パーソナルコンピュータやカーナビゲーション等に見られる様に、音声認識を利用したコマンド入力を行う機器が普及しつつあるが、従来の複写機及びファクシミリやプリンタ等の複合機には、以上のような機能を有するものはなかった。

【０００３】この種の音声認識を行うには、声紋や音声の区切り、音の高低等の“パターンマッチング”を行っている。このパターンマッチングとは、予めメモリ等の記憶媒体に使用するコマンドと、それを発声した時の音声データとが１対１に対応して、辞書として登録されており、入力された音声データが登録されている各コマンドと、どの程度一致しているかを類似度として算出し、
その値の最大のものをコマンドとして選択し、実行するという類のものである。

【０００４】

【発明が解決しようとする課題】しかしながら、前記複写機及びファクシミリやプリンタ等の複合機において、
前記のような音声認識によるコマンド入力を行うに当たっては、以下のような問題点がある。

【０００５】すなわち、音声認識でコマンドの入力を行う際には、予め使用する全てのコマンドを辞書に登録しておく必要がある。現在のコマンドの登録方法は、使用するコマンドの全てを１度読み乍ら、各キー操作と対応させて登録していかなくてはならなかった。

【０００６】従来のように、ある程度使用者が限定されているカーナビゲーションやパーソナルコンピュータ等では、登録するデータは概して個人的のものであり、１
人の音声データを入力するだけで良かった。

【０００７】しかしながら、複写機のように不特定多数の人が使用する機械の場合には、使用する可能性のある多くの人の音声辞書データを予め登録しておく必要があり、そのデータを記憶するために使用するメモリ等の記憶媒体の容量もそれなりに大きなものが必要となる。

【０００８】また、登録しておくコマンドも、人それぞれ使用頻度も異なり、人によっては結果的には全く使用しないコマンドがあっても、全てを登録しておく必要があり、それによっても結果的には、不要な記憶媒体の容量を使用することとなってしまう。

【０００９】本発明は、以上のような局面にかんがみてなされたもので、これらの問題点を解決することのできる音声コマンド認識画像処理装置の提供を目的としている。

【００１０】

【課題を解決するための手段】このため、本発明においては、以下の各項（１）〜（６）のいずれかに示すような音声コマンド認識画像処理装置を提供することにより、前記目的を達成しようとするものである。

【００１１】（１）スイッチやボタン、テンキー、液晶タッチパネル等により、コピー操作やファクシミリの送信等のコマンドの入力を行う操作手段と、ＣＰＵ等の処理装置を使用し、前記操作手段からのコマンドにより画像処理の設定やプリント枚数等の設定を行い、画像入力手段、画像処理手段、画像出力手段等の動作の制御を行うドライバ手段と、ＣＣＤ等を使用し、前記ドライバ手段からの制御により、原稿の画像データをデジタルデータに変換し、画像処理部へ出力する画像入力手段と、Ａ
ＳＩＣ等のハード回路や、前記ＣＰＵ等を使用したソフト的な処理等により、前記画像入力手段から入力されるデジタル画像データを、前記ドライバ手段からの画像処理の設定に応じて処理を行い、前記画像出力手段に出力を行う画像処理手段と、前記画像処理手段により処理がされた画像データを、レーザプリンタやインクジェットプリンタ等のプリンタによって出力を行う画像出力手段であって、この部分はブラウン管モニタや液晶モニタ、
または前記操作手段部に使用されている前記液晶タッチパネルに表示を行ったり、画像データとしてネットワーク上への出力、モデムを介してファクシミリ送信等を行うものも含む前記画像出力手段と、マイク等を使用し、
音声の入力を行い、前記デジタルデータとして音声認識手段に送る音声入力手段と、前記音声入力手段からの音声データを入力し、辞書データへの登録や音声のパターンマッチング、コマンドへの変換等を行う音声認識手段と、より構成され、前記音声によるコマンドの認識を行い動作することを特徴とする音声コマンド認識画像処理装置。

【００１２】（２）前記音声認識手段は、前記音声入力手段からのデジタル音声データを入力する音声データ入力手段と、前記操作手段から入力されたコマンド情報の入力を行う操作部情報入力手段と、前記操作手段部情報と前記音声データとを対応させて、メモリやハードディスク等の記憶媒体に記憶しておく辞書データ蓄積手段と、前記音声データ入力手段からのデータと、前記辞書データ蓄積手段からの音声辞書データとのパターンマッチングを行い、各コマンドに対する類似度を出力するパターンマッチング手段と、前記辞書情報の登録や通常コピー動作の情報を前記ドライバ手段から入力を行うドライバ情報入力手段と、前記パターンマッチング手段からの情報と、前記コマンド情報入力手段の情報とを受けて、通常コピーの場合は、入力された前記音声コマンドがいずれのコマンドに該当するかを判断し、コマンド出力手段に送るコマンド処理手段と、前記コマンド処理手段からのコマンド情報を、通常コピーの場合はドライバ手段や操作手段のモード表示部分へ送るコマンド出力手段と、より成ることを特徴とする前項（１）記載の音声コマンド認識画像処理装置。

【００１３】（３）前記音声コマンド認識画像処理装置は、前記辞書データ蓄積手段にデータを登録する際に、
実際に操作しながら前記音声データの登録を行うことを特徴とする前項（１）、（２）のいずれか記載の音声コマンド認識画像処理装置。

【００１４】（４）前記音声コマンド認識画像処理装置は、前記音声データを登録する際に、前記辞書データ蓄積手段にデータに既登録のデータと同一データを登録しようとした場合、その旨を使用者に報知することを特徴とする前項（１）、（２）、（３）のいずれか記載の音声コマンド認識画像処理装置。

【００１５】（５）前記音声コマンド認識画像処理装置は、前記音声により設定を行う際に、未登録のコマンドを前記音声により設定しようとした場合、その未登録の旨を使用者に報知することを特徴とする前項（１）ないし（４）のいずれか記載の音声コマンド認識画像処理装置。

【００１６】（６）前記音声コマンド認識画像処理装置は、前記音声により設定を行う際に、その音声入力されたコマンドが複数のコマンドと類似していた場合、それらのコマンドを報知し、使用者に選択を促すことを特徴とする前項（１）ないし（５）のいずれか記載の音声コマンド認識画像処理装置。

【００１７】

【作用】以上のような本発明構成により、前記問題点を解決した、新しい音声によるコマンド入力を行うことができる。すなわち、１）辞書データに参照するデータを登録する際は、実際に操作部のボタン等を押し乍ら登録することによって登録を行い、次回同じコマンドを使用する時には、音声のみで操作ができるようにすることによって、予め時間を割いて各使用者が全てのコマンドの登録を行う必要がなくなると共に、その機械を使用する各人が頻繁に使用するコマンドのみを登録することができる。これによって辞書に使用する記憶媒体の容量の削減を実現し得る。

【００１８】２）また、データ登録を行う際にも、パターンマッチングを行い、既登録のコマンドと同じコマンドを入力した時や、類似したコマンド、類似した音声が入力された場合には、表示や警告音等によって使用者に報知することにより、登録しようとしたコマンドが、正当に入力されるべきものであるか否かを確認することができる。

【００１９】３）また、音声による使用者の認識を行う際に、登録してある辞書データに、ある程度類似度の高いものが複数あった場合には、他の判定要素、例えば指紋や掌紋などによって、より正確に認識を行うようにすることにより、音声のみで使用者の認識を行うより、さらに正確に個人の識別を行うことが可能となる。

【００２０】

【発明の実施の形態】以下に、本発明の実施の形態を、
複数の実施例に基づき、それぞれ図面を参照して詳細に説明する。

【００２１】

【実施例】（第１の実施例）本発明に関る画像処理装置の具体的な第１の実施例を、複写機の事例を用いて説明する。図１に、本第１実施例の複写機の構成ブロック図を示す（図１は、後述する第２〜第５実施例にも共用するものとする）。

【００２２】１０１は操作部で、図８にその具体的な平面図例を示すように、各スイッチやボタン、テンキー、
液晶タッチパネル等によりコピー操作やファクシミリの送信等のコマンドの入力等を行う。図８における個々の構成要素の説明は、それぞれ図示註記に渡り、重複説明は省略する。

【００２３】１０２はドライバ部で、ＣＰＵ等の処理装置を使用し、操作部１０１からのコマンドによって、画像処理の設定やプリント枚数等の設定を行い、スキャナ部１０３、画像処理部１０４、プリンタ部１０５等の動作の制御を行う。

【００２４】１０３は画像入力部で、ＣＣＤ等を使用し、ドライバ部１０２からの制御によって、原稿の画像データをデジタルデータに変換し、画像処理部１０４へと出力する。

【００２５】１０４は画像処理部で、ＡＳＩＣ等のハード回路や、ＣＰＵ等を使用したソフト的な処理等によって、画像入力部１０３から入力されてくるデジタル画像データを、ドライバ部１０２からの画像処理の設定に応じて処理を行い、画像出力部１０５に出力を行う。

【００２６】１０５は画像出力部で、画像処理部１０４
によって処理が行われた画像データを、レーザプリンタやインクジェットプリンタ等のプリンタによって出力を行ったり、ブラウン管モニタや液晶モニタ、または操作部１０１に使用されているタッチパネル等に出力を行う。また、画像データとしてネットワーク上に出力を行ったり、モデムを介してファクシミリ送信を行うのもこの部分とする。

【００２７】１０６は音声入力部で、マイクロホン等を使用し、音声の入力を行い、デジタルデータとして音声認識部に送る。

【００２８】１０７は音声認識部で、音声入力部１０６
からの音声データを入力し、辞書データへの登録や音声のパターンマッチング、コマンドへの変換等を行う。変換されたコマンドは、操作部１０１からのコマンドと同様に、ドライバ部１０２へと送られる。

【００２９】次に、本発明の特徴である音声認識部１０
７についての詳細な説明を、その内部処理構成ブロック図を示す図２を用いて行う（本図も図１と共に、後述する第２〜第５実施例にも共用するものとする）。

【００３０】２０１は音声データ入力部で、この音声入力部２０１からのデジタル音声データを入力する。

【００３１】２０２は操作部情報入力部で、操作部１０
１から入力されたコマンド情報の入力を行う。

【００３２】２０３は辞書データ蓄積部で、操作部情報と音声データとを対応させて、メモリやハードディスク等の記憶媒体に記憶しておく。

【００３３】２０４はパターンマッチング部で、音声データ入力部２０１からのデータと、辞書データ蓄積部２
０３からの音声辞書データとのパターンマッチングを行い、各コマンドに対する類似度を出力する。

【００３４】例えば、入力された音声データが、「いちまい」であったとき、音声辞書データの「いちまい」との類似度は１００、「はちまい」との類似度は８０、
「さんまい」との類似度は３０、「コピー」との類似度は５、などと出力を行う。

【００３５】２０５はドライバ情報入力部で、辞書情報の登録や通常コピー動作等の情報をドライバ部１０２から入力を行う。

【００３６】２０６はコマンド処理部で、パターンマッチング部２０４からの情報とコマンド情報入力部２０５
の情報とを受けて、通常コピーの場合は、入力された音声コマンドがいずれのコマンドに相当するかを判断し、
コマンド出力部２０７に送る。また、辞書情報の登録時には、類似度の高いコマンドのいくつかをコマンド出力部２０７に送る等の処理を行う。

【００３７】２０７はコマンド出力部で、コマンド処理部２０６からのコマンド情報を、通常コピーの場合はドライバ部１０２や操作部１０１のモード表示部分へ送る。また、辞書情報の登録時には、類似したコマンドや警告音を発生する信号を操作部１０１へ送る。

【００３８】次に具体的な例を挙げて処理内容を説明する：音声コマンドの登録を行う際には、実際に所定のキーを押し乍ら発声を行う。この時、音声データ入力部２
０１からは、その時の音声データが、また、操作部情報入力部２０２からは、その時押されているキーの情報が入力される。

【００３９】例えば、「白黒コピーを１枚」行う時には、図８の「コピー」キーを押しながら、「コピー」と発声する。すると、操作部１０１からドライバ部１０２
に「コピー」というコマンドが伝えられると共に、音声認識部１０７の操作部情報入力部２０２にも同様にコマンドが伝えられる。

【００４０】また、音声入力部１０６からの音声データは、音声データ入力部２０１に入力され、コマンド情報と共に辞書データ蓄積部２０３に入力される。辞書データ蓄積部２０３では、「コピー」というコマンドに対応して、入力された音声データを記憶しておく。

【００４１】以下、同様に「白黒」というコマンドと音声データ、「１枚」というコマンドと音声データを登録すると同時に設定を行っていく。

【００４２】スタートキーを押しながら、「スタート」
と発声することによって、「スタート」という音声コマンドが登録されると共に、コピー出力を行うことができる。

【００４３】以上の作業により、実際にコピーを行いながら「コピー」、「白黒」、「１枚」、「スタート」といった音声コマンドが登録される。

【００４４】以上の音声コマンド登録時の動作シーケンスフローチャートは、図３のシーケンス実線矢印部分に該当する。音声入力（ステップＳ３０１）を、図２の音声データ入力部２０１で行い、その時の操作部の状況を操作部状況入力部２０２で検知し、キー入力が同時に行われているか否かの判断を行う（ステップＳ３０２）。

【００４５】キー入力が同時に行われている場合、音声データ登録モード（ステップＳ３０３）となる。パターンマッチング部２０４によって音声データのパターンマッチングを行い（ステップＳ３０４）、類似コマンドが無かった場合（ステップＳ３０５）には、入力された音声データをコマンドとして辞書データ蓄積部２０３に登録し（ステップＳ３０６）、そのコマンドを実行（ステップＳ３０７）する。

【００４６】なお、以上の各ステップにおけるＮＯを示すシーケンス点線矢印で示す各ステップの逐次詳細説明は、図示の通りであり逐次詳細の重複説明は省略する。

【００４７】以上の方法によって登録されたコマンドは、キー操作を行わなくても音声のみで使用することができることとなる。

【００４８】つまり、白黒コピーを１枚採りたい場合、
「コピー」と発声すれば「コピー」モードとなり、「白黒」と発声することによって「白黒」モードになる。その後、「１枚」、「スタート」と発声することによって、白黒コピーの動作を行うことができる。

【００４９】この時の音声コマンド実行時の動作シーケンスフローチャートは、図４のシーケンス実線矢印部分に該当する。音声入力（ステップＳ４０１）を図２の音声データ入力部２０１で行い、その時の操作部１０１の状況を操作部状況入力部２０２で検知し、キー入力が同時に行われているか否かの判断を行う（ステップＳ４０
２）。

【００５０】キー入力が同時に行われていない場合、音声データ実行モード（ステップＳ４０３）となる。パターンマッチング部２０４によって音声データのパターンマッチングを行い（ステップＳ４０４）、登録されているコマンドに類似したものが１つだけあった場合（ステップＳ４０５・Ｓ４０６）には、入力された音声データをコマンドとして実行（ステップＳ４０７）する。

【００５１】このときの音声コマンドの認識について、
詳細に説明する：音声コマンドの認識は、図２の音声データ入力部２０１からの音声データと、辞書データ蓄積部２０３に格納してある音声データとのパターンマッチングを、パターンマッチング部２０４によって行い、各コマンドとの類似度を算出しコマンド処理部２０６に出力する。この場合、登録してある辞書データと完全に一致していた場合、類似度を１００とする。

【００５２】例えば、「白黒」といった音声データ入力があった場合、辞書データ蓄積部２０３にある音声辞書データの「白黒」とは一致度が９５、「コピー」との一致度は５、「１枚」との一致度は１０、「スタート」との一致度は５、などといった情報がコマンド処理部２０
６に送られる。

【００５３】コマンド処理部２０６では、最も一致度の高いものを音声入力されたコマンドと判断して、コマンド出力部２０７に送る。

【００５４】コマンド出力部２０７では、そのコマンドをドライバ部１０２に送ることによって、本体の設定を行うこととなる。

【００５５】上記２つの動作フロー図３、４の組み合わせにより、次回カラーコピーを１枚とる場合、「コピー」と発声すれば「コピー」モードとなり、「カラー」
と発音しながら「カラー」キーを押すことによって「カラー」モードになると共に、新たに「カラー」という音声コマンドを登録する。

【００５６】その後「１枚」、「スタート」と発声することによって、「カラー」という発声コマンドを新たに登録すると共に、カラーコピーの動作をも行うことができる。

【００５７】以上のように音声コマンドのデータ入力を行うことによって、必要なコマンドを、必要な時に登録することができ、普段は使用しないコマンドの登録を防止することによって、辞書データ登録部２０３に使用する記憶媒体の容量増大を抑制することができる。

【００５８】なお、本実施例の音声コマンド実行時の図４各ステップにおける各シーケンス点線矢印で示す各ステップの逐次詳細説明は、図示の通りであり、逐次詳細の重複説明は省略する。

【００５９】（第２の実施例）本発明に係る第２の実施例を、それぞれ図１、図２を共用して説明する：もし、
音声コマンドとして登録されていないコマンドが入力された時の処理は、以下のようになる。

【００６０】まず、音声コマンドは図１、２における操作部１０１のキー図８が押されない状態で入力されることによって、新たな音声コマンドの登録ではないと判断できる。

【００６１】次に、図２におけるパターマッチング部２
０４によって登録されている音声辞書データとのパターンマッチングを行い、各コマンドとの類似度を算出しコマンド処理部２０６に送る。

【００６２】この場合、登録されているコマンドとは異なるため、類似度は全て低い値となる。完全に一致している場合、類似度を１００とした場合に、８０以上をコマンドの候補、８０未満は登録されていないコマンドの入力と判断すると、全てのマッチングを行った結果、登録されているコマンドの候補は無い状態となる。

【００６３】そのような場合、コマンド処理部によって入力された音声データは、登録されていないものと判断し、コマンド出力部２０７から、操作部１０１の液晶表示部に「未登録です。登録するキーを押して下さい。」
の表示を行うことによって、使用者に報知するようにドライバ部１０２に情報を送る。

【００６４】使用者は、未登録であることを確認した後、操作部１０１のキーを押すことにより新たにコマンドを登録することとなり、また同時にそのコマンドは実行され、次の処理に進む。

【００６５】以上の本第２実施例の音声登録時の動作シーケンスフローチャートは、図５のシーケンス実線矢印部分に該当する。音声入力（ステップＳ５０１）を図２
の音声データ入力部２０１で行い、その時の操作部１０
１の状況を操作部状況入力部２０２で検知し、キー入力が同時に行われているか否かの判断を行う（ステップＳ
５０２）。

【００６６】キー入力が同時に行われていない場合、音声データ実行モード（ステップＳ５０３）となる。パターンマッチング部２０４によって音声データのパターンマッチングを行い（ステップＳ５０４）、類似コマンドが無かった場合（ステップＳ５０６）には、コマンドが未登録であることを使用者にメッセージとして操作部１
０１から表示し（ステップＳ５０６）、その後キー入力のあったキーを音声コマンドとして登録する（ステップＳ５０７）。それと共にコマンドを実行する（ステップＳ５０８）。

【００６７】以上のように、音声コマンドのデータ入力を行うことによって、音声コマンドとして登録されていないコマンドが音声入力されたときに簡単に新たなコマンドとして登録することができる。

【００６８】本第２実施例の音声コマンド登録時図５の各ステップにおける各シーケンス点線矢印で示す各ステップの逐次詳細説明は図示の通りであり、逐次詳細の重複説明は省略する。

【００６９】（第３の実施例）次に本発明の第３の実施例をそれぞれ前記図１、図２を共用して説明する：音声コマンドの登録を行う場合、既に登録されているコマンドを更に登録しようとしてしまった時の動作について説明する。

【００７０】まず、音声コマンドが操作部１０１のキーが押された状態で入力されることによって、新たな音声コマンドの登録であると判断する。

【００７１】次に、パターンマッチング部２０４によって登録されている音声辞書データとのパターンマッチングを行い、各コマンドとの類似度を算出し、コマンド処理部２０６に送る。

【００７２】この場合、既に登録されているコマンドである場合、類似度の高い値となるコマンドが存在することとなる。

【００７３】そのような場合、コマンド出力部２０７から、操作部１０１の液晶表示部（図８）に、類似度の高かったコマンドを表示することによって、使用者に確認を促すように、ドライバ部１０２に情報を送る。

【００７４】具体例を挙げると、「１枚」というコマンドが既に登録されているにもかかわらず、再び登録しようとした場合、使用者は操作部１０１のキー（図８）を押しながら「１枚」と発声する。

【００７５】前記第１の実施例において説明した方法と同様に、音声認識部１０７によってパターンマッチングを行い、類似度の算出を行うと、「１枚」というコマンドの類似度が９０となり、８０以上をコマンドの候補、
８０未満は登録されていないコマンドの入力と判断すると、それはすでに登録されているコマンドと判断される。

【００７６】このような場合、図９にその一例を示すように液晶タッチパネル（図８）の表示部に「今のコマンドは「１枚」ですか？」という表示と「ＹＥＳ」、「Ｎ
Ｏ」の選択を行う表示とを行い、使用者に登録済みのデータと類似していることを報知する。

【００７７】「ＹＥＳ」のキーを押すことによって、使用者は、既に登録されていることが確認できると共に、
ドライバ部１０２は、入力されたコマンドを受け付けて、その後の処理を行うこととする。「ＮＯ」の場合は再登録となる。

【００７８】以上の動作シーケンスフローチャートは、
図６のシーケンス実線矢印部分に該当する。音声入力（ステップＳ６０１）を音声データ入力部２０１で行い、その時の操作部１０１の状況を操作部情報入力部２
０２で検知し、キー入力が同時に行われているか否かの判断を行う（ステップＳ６０２）。

【００７９】キー入力が同時に行われている場合、音声データ登録モード（ステップＳ６０３）となる。パターンマッチング部２０４によって音声データのパターンマッチングを行い（ステップＳ６０４）、類似コマンドがあった場合（ステップＳ６０５）には、コマンドが登録済みであることを使用者にメッセージとして操作部１０
１から示し（ステップＳ６０６）、その後「ＹＥＳ」のキー入力があったら（ステップＳ６０７）、コマンドを実行する（ステップＳ６０８）。

【００８０】以上のように、音声コマンドのデータ処理を行うことによって、すでに登録されているコマンドを更に登録しようとしてしまった時に、２重に登録してしまうことを防止することができる。

【００８１】なお、本第３実施例の音声コマンド登録時の図６各ステップにおけるシーケンス点線矢印で示す各ステップの逐次詳細説明は、図示の通りであり、逐次詳細の重複説明は省略する。

【００８２】（第４の実施例）次に本発明に係る第４の実施例を、それぞれ図１、図２を共用して説明する：未登録のコマンドを登録しようとした場合、既に登録されているコマンドと類似している音声データが入力された時の動作について説明する。

【００８３】まず、音声コマンドが操作部１０１のキーが押された状態で入力されることによって、新たな音声コマンドの登録であると判断する。

【００８４】次に、パターンマッチング部２０４によって登録されている音声辞書データとのパターンマッチングを行い、各コマンドとの類似度を算出し、コマンド処理部２０６に送る。

【００８５】この場合、既に登録されているコマンドで、類似度の高い値となるコマンドが存在した場合、コマンド出力部２０７から、操作部１０１の液晶表示部（図８）に、類似度の高かったコマンドを表示することによって使用者に確認を促すように、ドライバ部１０２
に情報を送る。

【００８６】具体例を挙げると、「８枚」というコマンドを新たに登録しようとした場合、使用者は操作部１０
１のキー（図８）を押しながら「８枚」と発音する。しかしながら、音声の仕方により、すでに登録済みの「１
枚」という音声コマンド共、類似度が大きくなったとする。

【００８７】前記第１の実施例において説明した方法と同様に、音声認識部１０７によってパターンマッチングを行い、類似度の算出を行うと、「１枚」というコマンドの類似度が８５となり、８０以上をコマンドの候補、
８０未満は登録されていないコマンドの入力と判断すると、それは既に登録されているコマンドと同じレベルの類似度と判断される。

【００８８】この場合、その後音声によるコマンド入力を行おうとした際に、誤認識し易くなる。

【００８９】このような場合、図１０にその一例を示すように、液晶タッチパネル（図８）の表示部に「今のコマンドは「１枚」と類似しています。登録し直しますか？」という表示と「ＹＥＳ」、「ＮＯ」の選択を行う表示とを行い、使用者に登録済みのデータと類似していることを報知する。

【００９０】「ＹＥＳ」のキーを選択すると、再登録を行うこととなるし、「ＮＯ」のキーを押すと、そのまま音声コマンドの登録を行うと共に、ドライバ部１０２
は、入力されたコマンドを受け付けて、その後の処理を行うこととする。

【００９１】以上の動作シーケンスのフローチャートは、前記第３実施例の図６の実線部分と同様にできる。
音声入力（ステップＳ６０１）を音声データ入力部２０
１で行い、その時の操作部１０１の状況を操作部状況入力部２０２で検知し、キー入力が同時に行われているか否かの判断を行う（ステップＳ６０２）。

【００９２】キー入力が同時に行われている場合、音声データ登録モード（ステップＳ６０３）となる。パターンマッチング部２０４によって音声データのパターンマッチングを行い（ステップＳ６０４）、類似コマンドがあった場合（ステップＳ６０５）には、類似したコマンドが登録済みであることを使用者にメッセージとして操作部１０１から示し（ステップＳ６０６）、その後キー入力のあったキーを音声データと対応したコマンドとして登録し（ステップＳ６０７）、コマンドを実行する（ステップＳ６０８）。

【００９３】以上のように、音声コマンドのデータ処理を行うことによって、新たに登録しようとした音声データが既に登録されているコマンドと類似していた時にも、正確に登録を行うことができる。

【００９４】なお、本第４実施例においても、各シーケンスの点線矢印で示す各ステップの詳細は、前記第３実施例におけると同様、詳細重複説明は省略する。

【００９５】（第５の実施例）さらに、本発明に係る第５の実施例を、それぞれ図１、２を共用して説明する：
音声コマンドの認識を行う場合、音声入力されたコマンドに対して、複数の類似したコマンドの候補が出てしまい、使用者の意志に反した動作をしてしまうことがある。そのような誤動作を防ぐために、以下のような処理を行う。

【００９６】まず、音声コマンドは、操作部１０１（図２、図８）のキーが押されない状態で入力されることによって、音声コマンドによる設定であると判断する。

【００９７】次に、パターンマッチング部２０４（図２）によって登録されている音声辞書データとのパターンマッチングを行い、各コマンドとの類似度を算出し、
コマンド処理部２０６に送る。

【００９８】この場合、実際に設定したいコマンドと類似した音声入力がなされた場合、類似度の高い値となるコマンドが複数存在することとなる。

【００９９】そのような場合、コマンド出力部２０７から、操作部１０１の液晶表示部に、類似度の高かった複数のコマンドを表示することによって、使用者に選択を促すようにドライバ部１０２に情報を送る。

【０１００】具体例を挙げると、「一枚」というコマンドを設定したいと思い、使用者は「１枚」と発音する。

【０１０１】しかしながら、登録時との発音の違い等により、仮に、「８枚」という音声コマンドとも類似度が大きくなったとする。

【０１０２】前記第１の実施例において説明した方法と同様に、音声認識部１０７によってパターンマッチングを行い、類似度の算出を行うと、「１枚」と云うコマンドの類似度が９０となり、「８枚」と云うコマンドの類似度が８５となったとする。類似度が８０以上をコマンドの候補、８０未満は登録されていないコマンドの入力と判断すると、両方共コマンドの候補として挙げられると判断される。

【０１０３】このような場合、図１１にその一例を示すように、液晶タッチパネルの表示部に「今のコマンドはどちらですか？１：「１枚」・２：「８枚」」と表示を行い、使用者にどちらのコマンドか選択して貰う。それによって選択された設定をドライバ部１０２は、入力されたコマンドとして、その後の処理を行うこととする。

【０１０４】以上の動作シーケンスフローチャートは、
図７動作シーケンス実線矢印部分のようになる。（前記第３、４実施例の図６の破線矢印部分の一部に相当する）。音声入力（ステップＳ７０１）を音声データ入力部２０１（図２）で行い、その時の操作部１０１の状況を操作部状況入力部２０２で検知し、キー入力が同時に行われているか否かの判断を行う（ステップＳ７０
２）。キー入力が同時に行われていない場合、音声デー実行モード（ステップＳ７０３）となる。パターンマッチング部２０４によって音声データのパターンマッチングを行い（ステップＳ７０４）、類似コマンドが複数あった場合、（ステップＳ７０５・Ｓ７０６）には、類似した複数のコマンドが登録済みであることを使用者にメッセージとして操作部１０１から示し（ステップＳ７０
７）、その後キー入力によって指定されたコマンド（ステップＳ７０８）を実行コマンドとして実行する（ステップＳ７０９）。

【０１０５】以上のように、音声コマンドのデータ処理を行うことによって、入力された音声コマンドとの類似度が高いものが複数登録されてた場合も、正確な設定ができることとなる。

【０１０６】

【発明の効果】以上説明したように、本発明によれば、
前記音声によるコマンドの認識を行い動作する画像処理装置において、辞書データ蓄積手段にデータを登録する際に、実際に操作し乍ら音声データの登録を行うことが必要なコマンドを、必要な時に登録することができ、普段は使用しないコマンドの登録を防止することによって、辞書データ蓄積手段に使用する記憶媒体の容量を抑えることが可能となる。

【０１０７】また音声データを登録する際に、前記辞書データ蓄積手段のデータに、既に登録されているデータと同じデータを登録しようとした場合、そのことを使用者に表示することによって、２重のデータ登録を防ぐことが可能となる。

【０１０８】また、音声によって設定を行う際に、未登録のコマンドを音声によって設定しようとした場合、未登録であることを使用者に表示し、その都度、登録を行っていくことが可能となる。

【０１０９】さらにまた、音声によって設定を行う際に、音声入力されたコマンドが、複数のコマンドと類似していた場合、それらのコマンドを表示し、使用者に選択を促すことにより、正確なコマンド入力が可能となる。

【図面の簡単な説明】

【図１】各実施例の複写機の構成ブロック図

【図２】図１の音声認識部の内部処理構成ブロック図

【図３】第１実施例の音声コマンド登録時の動作シーケンスフローチャート

【図４】第１実施例の音声コマンド実行時の動作シーケンスフローチャートを示す図である

【図５】第２実施例の音声コマンド登録時の動作シーケンスフローチャート

【図６】第３、第４実施例の音声コマンド登録時の動作シーケンスフローチャート

【図７】第５実施例の音声コマンド登録時の動作シーケンスフローチャート

【図８】図１複写機の操作部平面図例

【図９】第３実施例の操作部の液晶タッチパネルの表示例

【図１０】第４の実施例の操作部の液晶タッチパネルの表示例

【図１１】第５の実施例の操作部の液晶タッチパネルの表示例

【符号の説明】

１０１操作部１０２ドライバ部１０３画像入力部１０４画像処理部１０５画像出力部１０６音声入力部１０７音声認識部２０１音声データ入力部２０２操作部情報入力部２０３辞書データ蓄積部２０４パターンマッチング部２０５ドライバ情報入力部２０６コマンド処理部２０７コマンド出力部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. ⁷識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｎ 1/00 Ｇ０６Ｆ 3/16 ３２０Ｂ // Ｇ０６Ｆ 3/16 ３２０Ｂ４１Ｊ 29/00 ＪＦターム(参考） 2C061 AP01 AP03 AP04 AP07 AQ05 AQ06 CQ02 CQ04 CQ24 CQ25 2H027 GA19 GA20 GA25 GA26 ZA07 5B021 AA05 AA19 CC05 PP04 PP06 QQ02 QQ04 5C062 AA02 AA05 AB02 AB11 AB20 AB25 AB26 AB41 AB42 AC02 AC03 AC05 AC21 AC60 AE11 AF07 AF15 BA00 5D015 GG04 KK01 LL00

标题	发布/更新时间	阅读量
一种音频处理方法及装置	2020-05-11	613
一种对病人康复状况的智慧医疗监控和分析系统	2020-05-11	755
一种汽车车牌自动拆装系统及控制方法	2020-05-08	932
语音激活智能装置的误触发校正	2020-05-08	635
一种大数据可视化系统及方法	2020-05-11	886
提供连续和离散用户认证的移动装置	2020-05-11	893
一种基于物联网技术的智能化教学平台	2020-05-12	322
一种多功能笔记本	2020-05-11	925
一种用于信息采集的物联网装置	2020-05-13	244
一种自动追踪的高清录播一体机	2020-05-08	856

Voice command recognizing image processor

【発明の詳細な説明】

该功能需要专业版企业版VIP权限，您可以：