首页 / 专利库 / 人工智能 / 多模态界面 / Information processing method and device

Information processing method and device

阅读:155发布:2020-09-18

专利汇可以提供Information processing method and device专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To more easily input information using a multimodal user interface. SOLUTION: An M_ID corresponding to "unusable" and "recommended 1" in each set item is read, and images corresponding to "recommended 1" and "unusable" are read (S803). The image indicating "unusable " and the image indicating "recommended 1", both of which correspond to respective set items, are displayed in positions near the GUIs of the respective set items displayed on a display screen (S804). COPYRIGHT: (C)2005,JPO&NCIPI,下面是Information processing method and device专利的具体信息内容。

  • マルチモーダル・ユーザインターフェースを有し、夫々の入力モダリティーによって情報の入力が可能な情報処理装置が行う情報処理方法であって、
    前記情報処理装置に所定の処理を行わせる指示を入力する場合に、使用可能な入力モダリティーの中で、推奨される入力モダリティーに関する情報をメモリに保持する第1の保持工程と、
    前記情報処理装置に前記所定の処理を行わせるための指示を前記夫々の入力モダリティーの何れか1つのモダリティもしくは複数のモダリティの組み合わせを用いて入力する場合に推奨される入力モダリティーを、前記推奨される入力モダリティーに関する情報を用いてユーザに提示する提示工程とを備えることを特徴とする情報処理方法。
  • 前記提示工程では、前記推奨される入力モダリティーに関する情報を用いて、前記推奨される入力モダリティーを示す画像を所定の表示画面上に表示させることで、前記推奨される入力モダリティーをユーザに通知することを特徴とする請求項1に記載の情報処理方法。
  • 前記提示工程では、前記推奨される入力モダリティーに関する情報を用いて、前記推奨される入力モダリティーを示す音声を出力することで、前記推奨される入力モダリティーをユーザに通知することを特徴とする請求項1に記載の情報処理方法。
  • 更に、前記情報処理装置に所定の処理を行わせる指示を入力する場合に、使用不可能な入力モダリティーに関する情報をメモリに保持する第2の保持工程を備え、
    前記提示工程では更に、前記情報処理装置に前記所定の処理を行わせるための指示を前記夫々の入力モダリティーの何れか1つもしくは複数のモダリティの組み合わせを用いて入力する場合に使用不可能な入力モダリティーを、前記使用不可な入力モダリティーに関する情報を用いて、ユーザに提示することを特徴とする請求項1乃至3の何れか1項に記載の情報処理方法。
  • 前記提示工程では、前記使用不可能な入力モダリティーに関する情報を用いて、前記使用不可能な入力モダリティーを示す画像を所定の表示画面上に表示させることで、前記使用不可能な入力モダリティーをユーザに通知することを特徴とする請求項4に記載の情報処理方法。
  • 前記提示工程では、前記使用不可能な入力モダリティーに関する情報を用いて、前記使用不可能な入力モダリティーを示す音声を出力することで、前記使用不可能な入力モダリティーをユーザに通知することを特徴とする請求項4に記載の情報処理方法。
  • 更に、ユーザ毎に異なる個人情報を入力する入力工程と、
    前記入力工程で入力された前記個人情報に基づいて、ユーザを識別する識別工程を備え、
    前記第1の保持工程では、各ユーザ毎に推奨される入力モダリティーに関する情報をメモリに保持し、
    前記提示工程では、前記識別工程で識別したユーザに対する推奨される入力モダリティーに関する情報を前記メモリから特定し、当該特定した推奨される入力モダリティーに関する情報を用いて、前記識別工程で識別したユーザに対して推奨されるモダリティを当該ユーザに提示することを特徴とする請求項1に記載の情報処理方法。
  • 更に、注目ユーザに対して推奨される入力モダリティーに関する情報を、前記注目ユーザの操作履歴に応じて変更する変更工程を備えることを特徴とする請求項7に記載の情報処理方法。
  • マルチモーダル・ユーザインターフェースを有し、夫々の入力モダリティーによって情報の入力が可能な情報処理装置であって、
    前記情報処理装置に所定の処理を行わせる指示を入力する場合に、使用可能な入力モダリティーの中で、推奨される入力モダリティーに関する情報を保持する第1の保持手段と、
    前記情報処理装置に前記所定の処理を行わせるための指示を前記夫々の入力モダリティーの何れか1つのモダリティもしくは複数のモダリティの組み合わせを用いて入力する場合に推奨される入力モダリティーを、前記推奨される入力モダリティーに関する情報を用いてユーザに提示する提示手段とを備えることを特徴とする情報処理装置。
  • コンピュータに請求項1乃至8の何れか1項に記載の情報処理方法を実行させることを特徴とするプログラム。
  • 請求項10に記載のプログラムを格納することを特徴とするコンピュータ読み取り可能な記憶媒体。
  • 说明书全文

    【0001】
    【発明の属する技術分野】
    本発明は、マルチモーダル・ユーザインターフェースに係る技術に関するものである。
    【0002】
    【従来の技術】
    GUI入や音声入力といった複数種のモダリティーから、ユーザの所望のモダリティーでもって情報の入力を可能にするマルチモーダル・ユーザインターフェースは、ユーザにとって利便性が高いものである。
    【0003】
    従来から、複数のモダリティを備えたマルチモーダル・インタフェースを用いた技術はいくつか開示されている(例えば特許文献1乃至3を参照)。
    【0004】
    【特許文献1】
    特開平8−95734号公報【特許文献2】
    特開平11−288342号公報【特許文献3】
    特開2001−154852号公報【0005】
    【発明が解決しようとする課題】
    しかしながら、どの入力モダリティーを用いた入力が可能か、あるいは入力する情報によってはどの入力モダリティーが適しているかが、ユーザには判別が難しいという問題がある。
    【0006】
    本発明は以上の問題に鑑みてなされたものであり、マルチモーダル・ユーザインターフェースを用いて情報を入力する場合に、より簡便に情報を入力するための技術を提供することを目的とする。
    【0007】
    【課題を解決するための手段】
    本発明の目的を達成するために、例えば本発明の情報処理方法は以下の構成を備える。
    【0008】
    すなわち、マルチモーダル・ユーザインターフェースを有し、夫々の入力モダリティーによって情報の入力が可能な情報処理装置が行う情報処理方法であって、
    前記情報処理装置に所定の処理を行わせる指示を入力する場合に、使用可能な入力モダリティーの中で、推奨される入力モダリティーに関する情報をメモリに保持する第1の保持工程と、
    前記情報処理装置に前記所定の処理を行わせるための指示を前記夫々の入力モダリティーの何れか1つのモダリティもしくは複数のモダリティの組み合わせを用いて入力する場合に推奨される入力モダリティーを、前記推奨される入力モダリティーに関する情報を用いてユーザに提示する提示工程とを備えることを特徴とする。
    【0009】
    本発明の目的を達成するために、例えば本発明の情報処理装置は以下の構成を備える。
    【0010】
    すなわち、マルチモーダル・ユーザインターフェースを有し、夫々の入力モダリティーによって情報の入力が可能な情報処理装置であって、
    前記情報処理装置に所定の処理を行わせる指示を入力する場合に、使用可能な入力モダリティーの中で、推奨される入力モダリティーに関する情報を保持する第1の保持手段と、
    前記情報処理装置に前記所定の処理を行わせるための指示を前記夫々の入力モダリティーの何れか1つのモダリティもしくは複数のモダリティの組み合わせを用いて入力する場合に推奨される入力モダリティーを、前記推奨される入力モダリティーに関する情報を用いてユーザに提示する提示手段とを備えることを特徴とする。
    【0011】
    【発明の実施の形態】
    以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
    【0012】
    [第1の実施形態]
    図1は本実施形態に係る情報処理装置の基本構成を示す図である。 情報処理装置101は、通信部102、記憶部103、制御部104、音声入力部105、音声出力部106、操作部107、表示部108から構成される。
    【0013】
    通信部102は、インターネットやLANなどのネットワークを介して他の装置とのデータ通信を行うためのネットワークインターフェースである。 記憶部103は、各種の情報を保存するためのハードディスクドライブ装置や、情報処理装置101に各種の情報を提供するためのCD−ROMやDVD−ROMなどの記憶媒体などにより構成されている。 またこのハードディスクドライブ装置や記憶媒体には、各種のアプリケーションプログラム、ユーザインターフェース制御プログラム、テキスト解釈プログラム、音声認識結果格納部、操作ログ情報、そして各プログラムを実行する際に必要な各種のデータ等が記憶されており、これらは後段の制御部104の制御により、本装置に読み込まれる。
    【0014】
    制御部104はワークメモリやCPU、MPUなどにより構成されており、記憶部103に記憶されたプログラムやデータを読み出して各種の処理を実行する。 音声入力部105はマイクロフォンやA/D変換器等により構成されており、ユーザの音声をアナログ信号として入力し、デジタル信号に変換して後段の制御部104が有するワークメモリに出力する処理を行う。
    【0015】
    音声出力部106はスピーカやヘッドフォン、D/A変換器等により構成されており、制御部104の制御により音声データに従った音声信号をD/A変換し、音として外部に出力する処理を行う。 操作部107はボタン群やキーボード、マウス、タッチパネル、ペン、タブレット等の入力装置から構成され、各種の指示を本装置に入力するための入力インターフェースとして機能する。 表示部108は液晶ディスプレイ等の表示装置から構成され、画像や文字などにより構成される各種の情報を表示する。
    【0016】
    なお、表示部108としてタッチパネル式の表示装置を用いても良く、その場合、表示部108は操作部107としての機能(各種の指示を本装置に入力する機能)をも有することになる。 よって表示部108をタッチパネル式の表示装置とする場合には後述の説明において、「操作部107を操作する」といった記述は全て「表示部108上における操作」と読み替えるべきである。
    【0017】
    次に、以上の構成を有する情報処理装置が行う処理について説明する。 図2は、ユーザIDと、これに対応するテーブルIDとのセットを複数登録したテーブルの構成例を示す図である。 このテーブルIDに対応するテーブルの構成例を図3に示す。
    【0018】
    図3に示すテーブルにおいて、「入力モダリティー」に示す項目には、本装置に情報を入力するための複数種の入力モダリティーが記述されており、同図では「ハードキー」(操作部107に設けられた実際のボタン)、「GUI」(表示部108に表示されるGUI)、「音声」(音声入力部105を用いて入力する音声)が示されている。 また夫々の入力モダリティーにはID(M_ID)が付けられている。
    【0019】
    また同図のテーブルには、夫々の入力モダリティーが後述する各種のケースにおいて使用可能であるか否か、また、使用可能である場合に更に推奨されるべきものであるかを表示部108への画像表示、音声出力部106からの音声出力によってユーザに提示するために、「画像」の項目には各画像データファイル名が、「音声メッセージ」の項目には発声内容テキストファイル名が夫々記述されている。
    【0020】
    例えば入力モダリティーを「GUI」とする場合に、この入力モダリティーが使用可能である場合には表示部108に画像ファイル名「g_y.gif」の画像が表示され、音声出力部106からは発声内容テキストファイル名「g_y.txt」に従って音声合成された音声が出力されることになる。 また、この入力モダリティーが使用不可能である場合には表示部108に画像ファイル名「g_n.gif」の画像が表示され、音声出力部106からは発声内容テキストファイル名「g_n.txt」に従って音声合成された音声が出力されることになる。 また、この入力モダリティーが推奨されるものである場合には表示部108に画像ファイル名「g.gif」の画像が表示され、音声出力部106からは発声内容テキストファイル名「g.txt」に従って音声合成された音声が出力されることになる。
    【0021】
    上述の通り、図3に示すテーブルは各テーブルID毎に設けられている。 従って、夫々の入力モダリティーに対する画像、発声内容をユーザ毎に異ならせることができる。 この効果については後段の別の実施形態にて説明する。
    【0022】
    なお、図2,3に示すテーブルのデータ、図3に示すテーブルに記述された各画像ファイル名、発声内容テキストファイル名に対応する画像データ、テキストデータは記憶部103に記憶されているものとする。
    【0023】
    なお、本実施形態では音声出力部106から音声を出力するために、テキストデータに従って音声合成し、音声合成結果である音声を出力しているが、これに限定されるものではなく、図3に示すテーブルで、「音声メッセージ」の項目に発声内容の音声データファイル名を記述しておき、このファイル名に対応する音声データを記憶部103に記憶させても良い。 その場合、音声合成処理は不要となる。
    【0024】
    また本実施形態では、各テーブルIDはユーザID毎に設けているが、これに限定されるものではなく、ユーザの属性やユーザの習熟度ごとに設けても良い。
    以下では説明を簡単にするために、ユーザIDを0に設定し、全ユーザ共通のテーブル(テーブルT0)を用いる場合について説明する(従って図3に示すテーブル、及び後述の図4に示すテーブルは全ユーザ共通のものとなる)。 また以下の説明では本実施形態に係る情報処理装置をコピー機に適用した場合について説明するが、その場合、図1に示した構成は、コピー機において実際にコピー処理を行う部分以外の構成を示すものとなる。
    【0025】
    図4は、本実施形態に係る情報処理装置をコピー機に適用した場合に、記憶部103に新たに記憶すべきテーブルの構成例を示す図である。 同図のテーブルは、コピー機の設定項目と、その設定項目毎の、操作回数、操作時間、操作手順、使用可、使用不可、推奨1、推奨2、音声認識語彙が記述されたものである。 以下、同図を用いてこのテーブルについて更に詳しく説明する。
    【0026】
    「設定項目」は、コピー機において、操作可能な内容を示すもので、その項目には例えば同図に示すように、「用紙」(コピーする先の用紙のサイズを設定する項目)、「部数」(コピーする部数を設定する項目)などがある。
    【0027】
    「操作回数」、「操作時間」、「操作手順」の各項目は夫々更に「M1」と「M2」とに分けて設けられている。 ここでM1,M2は夫々図3に示す入力モダリティーID(M_ID)と対応しており、従って図4では、「操作回数」、「操作時間」、「操作手順」の各項目は夫々「GUI」と「音声」についての操作回数、操作時間、操作手順を示している。
    【0028】
    次に「操作回数」、「操作時間」、「操作手順」の夫々の項目について説明する。
    【0029】
    「操作回数」は各「設定項目」に記述された操作を行うための操作手順を構成するステップの数(回数)を示すものである。 例えば「A4」の用紙にコピーする設定を行う場合に、M_ID=M1の場合(入力モダリティーがGUIの場合)には3段階のステップで設定が完了することを示している。
    【0030】
    「操作時間」は各「設定項目」に記述された操作を行うために要する時間を示すものである。 例えば「A4」の用紙にコピーする設定を行う場合に、M_ID=M1の場合(入力モダリティーがGUIの場合)には7(単位は「秒」であっても良いし「分」であっても良い)の時間で設定が完了することを示している。
    【0031】
    「操作手順」は、各「設定項目」に記述された設定を各モダリティで行う際に、図5のテーブルに登録されている操作手順の中で最も推奨される操作手順を示すものである。 例えば、GUI(M_ID=M1)で「A4」の用紙にコピーする設定を行う場合には、L111に示す操作手順を最も推奨することを示す。 この「最も推奨される」とするための定義としては、例えば操作回数や設定時間などを鑑みて予めアプリケーション開発者が判断したものである。
    【0032】
    図5は各設定項目における操作手順を「操作1」、「操作2」、「操作3」、、、の順にステップ名をアプリケーション開発者が予め登録したものである。 同図において「設定手順」の項目には各操作手順を表す記号が記述されており、この記号は図4の「操作手順」で示されるものと対応している。
    【0033】
    従って、例えば「A4」の用紙にコピーする設定を行う場合には、M_ID=M1の場合(入力モダリティーがGUIの場合)、操作手順としてL111で示される手順が推奨される。 即ち、「PAPER_BUTTON_PRESS」、「A4_BUTTON_PRESS」、「CLOSE_BUTTON_PRESS」の3ステップの操作手順を推奨することを示している。 なお図5に示したテーブルのデータは記憶部103に予め記憶されているものとする。
    【0034】
    図4に戻って、「使用可」は各「設定項目」について使用可能な入力モダリティーを示すもので、例えば「A4」の用紙にコピーする設定を行う場合に入力可能なモダリティーはM1、M2で示される入力モダリティーであって、即ち「GUI」と「音声」でのみ「A4」の用紙にコピーする設定を行うことができる。
    【0035】
    「使用不可」は各「設定項目」について使用不可能な入力モダリティーを示すもので、例えば「A4」の用紙にコピーする設定を行う場合に入力不可能なモダリティーはM0で示される入力モダリティーであって、即ち「A4」の用紙にコピーする設定を「ハードキー」でもって行うことはできない。
    【0036】
    「推奨1」は各「設定項目」で最も推奨される入力モダリティー(アプリケーション開発者が予め最も推奨すると判断した入力モダリティー)を示すもので、例えば「A4」の用紙にコピーする設定を行う場合に最も推奨される入力モダリティーはM2であって、即ち「音声」で設定をL121の操作手順で入力することが最も推奨される。 この「最も推奨される」とするための定義としては、例えば操作回数や設定時間などを鑑みて予めアプリケーション開発者が判断したものである。
    【0037】
    「推奨2」は各「設定項目」で2番目に推奨される入力モダリティー(アプリケーション開発者が予め2番目に推奨すると判断した入力モダリティー)を示すもので、例えば「A4」の用紙にコピーする設定を行う場合に2番目に推奨される入力モダリティーはM1であって、即ち「GUI」で設定をL111の操作手順で入力することが2番目に推奨される。 この「2番目に推奨される」とするための定義についても、「最も推奨される」とするための定義と同様にして判断される。
    【0038】
    「音声認識語彙」は、音声入力する場合に、認識すべき語彙を示すものである。 例えば「A4」の用紙にコピーする設定を、音声入力でもって行う場合には制御部104は「A4」なる語を認識すべきである。 よってこの場合には「A4」の語を「音声認識語彙」として予め同図のテーブルに登録する必要がある。 従って、この「音声認識語彙」の項目には、夫々の「設定項目」を音声入力でもって行う場合に、制御部104が認識すべき語彙を記述する。
    【0039】
    なお、上述の「音声認識語彙」には「A4」と併せて「A4用紙」「A4の用紙」など、複数の語彙を登録してもよい。 また必ずしも語彙である必要はなく、音声認識のための文法や語彙が記述されたファイルの名前が登録されていても良い。 その場合、制御部104はその登録されたファイルに記述された語彙を認識し、文法が記述されている場合はその文法に従い語彙を認識する。
    【0040】
    図3に示すテーブルと同様に、図4に示すテーブルは各テーブルID毎に設けられている。 従って、夫々の「設定項目」に対する「操作回数」、「操作時間」、「操作手順」、「使用可」、「使用不可」、「推奨1」、「推奨2」、「音声認識語彙」をユーザ毎に異ならせることができる。 この効果については後段の別の実施形態にて説明する。
    【0041】
    以上説明した図4,5に示したテーブルのデータは予め作成され、記憶部103に記憶されているものとする。
    【0042】
    次に図4に示したテーブルに従って、表示部108に表示された、コピー及び各種の設定を行うための画面上に表示する情報について説明する。
    【0043】
    図6は、従来のマルチモーダル・ユーザインターフェースを備えるコピー機が有する表示部の表示画面に表示された、コピー及び各種の設定を行うための簡単な画面を示す図である。 表示画面600には、現在設定されている情報を表示するエリア601(エリア内には左から順に、現在設定されている倍率、用紙サイズ、コピー部数が表示される)、等倍設定ボタン602、倍率設定ボタン603、用紙設定ボタン604が表示される。 同図の画面はタッチパネル式のものであるので、各ボタンの画像の位置をユーザが指で指示することで、夫々のボタンに応じた処理が制御部104によって行われる。
    【0044】
    マルチモーダル・ユーザインターフェースを備える従来のコピー機では各種の設定を行うために、各ボタンを操作するか、もしくは音声で入力するか、もしくはボタンと音声を組み合わせて入力するかなどを行っていたが、ユーザはどれがより簡便で且つより短い時間で設定が行えるのかを、この画面から判断することは難しい。
    【0045】
    図7は本実施形態に係る情報処理装置を適用した上記コピー機の表示部108に表示された、コピー及び各種の設定を行うための簡単な画面を示す図である。 図6と同じ部分については同じ番号を付けており、その説明を省略する。 同図の画面700には、等倍設定、倍率設定、用紙設定を行う場合に、最も推奨される入力モダリティーを示す画像701,702,703が示されている。 また、部数設定を行う場合には、使用不可能な入力モダリティーを示す画像704が表示されている。
    【0046】
    画像701(「手」を示す画像)は推奨する入力モダリティーがGUIであることを示すためのもので、画像702、703(「吹き出し」を示す画像)は推奨する入力モダリティーが音声であることを示すためのもので、画像704(吹き出しの上に×が重畳された画像)は使用不可である入力モダリティーが音声であることを示すものである。
    【0047】
    図7に示した画像701乃至703については、図4に示したテーブルにおいて、設定項目「等倍」、「倍率」、「用紙選択」の各項目で「推奨1」に該当する部分を参照し、各M_IDに応じた画像(M1の場合には画像701、M2の場合には画像702(703))を図3に示すテーブルから特定して表示することで実現される。 なお、画像701乃至703のデータは記憶部103に予め記憶されている。
    【0048】
    また図7に示した画像704については、図4に示したテーブルにおいて、設定項目「部数」で「使用不可」に該当する部分を参照し、M_IDに応じた画像(M1、M2の2つがあり、同図ではM2のみを採用しているが、M1、またはM1とM2の両方を採用しても良い)を図3に示すテーブルから特定して表示することで実現される。 なお、画像704のデータは記憶部103に予め記憶されている。
    【0049】
    なお、使用不可の入力モダリティーを示す画像は他の項目についても同画面に表示しても良い。 例えば設定項目「用紙」で「使用不可」に該当するM_IDはM0であるため、「ハードキー使用不可」を示す画像をボタン604の画像の近傍に表示する。
    【0050】
    このように、図4を参照し、最も推奨される入力モダリティーを示す画像を表示することで、各設定を行う際に、どの入力モダリティーが使用可能であるかをユーザが認知することができると共に、複数種の入力モダリティーが使用可能である場合には、どの入力モダリティーが最も推奨されるものであるかを認知することができる。
    【0051】
    なお、本実施形態では最も推奨される入力モダリティーを示す画像を表示したが、これに限定されるものではなく、2番目に推奨される入力モダリティー(「推奨2」に該当するM_IDに対応する入力モダリティー)を示す画像を表示しても良い。 また、最も推奨される入力モダリティーを示す画像、2番目に推奨される入力モダリティーを示す画像、そして使用不可の入力モダリティーを示す画像とをと同じ画面内で表示する場合には、例えば、最も推奨される入力モダリティーを示す画像、2番目に推奨される入力モダリティーを示す画像、使用不可の入力モダリティーを示す画像の順に画像を小さくして表示するなど、ユーザが直感的に把握しやすい方法で表示を行うことも可能である。
    【0052】
    以上説明したコピー機が行う処理のフローチャートを図8に示す。 なお同図に示したフローチャートに従ったプログラムは、記憶部103に保存されており、これを制御部104が自身のワークエリアに読み出して実行することで、このコピー機は同図のフローチャートに従った処理を行うことになる。
    【0053】
    また同図のフローチャートに示した処理はメインの処理のサブルーチンとして実行され、表示部108の表示画面上にはコピー及び各種の設定を行うための画面(例えば図6に示す画面)が表示されているものとする。
    【0054】
    表示部108における画面表示あるいは画面の再読み込み(リフレッシュ)が行われる際に(ステップS802)、記憶部103に記憶されている図4に示すテーブルから各設定項目における「使用不可」、「推奨1」に該当するM_IDを読み込むと共に、図3に示すテーブルに記述された各画像のうち、「推奨1」、「使用不可」に該当する画像を読み込む(ステップS803)。
    【0055】
    そして表示部108の表示画面上に表示された各設定項目のGUIの近傍位置に、夫々の設定項目に対応する「使用不可」を示す画像、「推奨1」を示す画像を表示する(ステップS804)。 以上の処理を行うことで、例えば図7に示す画面が表示部108の表示画面上に表示されることになる。
    【0056】
    なお上記処理は画像表示にて推奨される入力モダリティー、使用不可である入力モダリティーをユーザに提示したが、音声によっても可能である。 その場合、図8に示したフローチャートのステップS803、S804の各ステップでは以下のような処理を行う。
    【0057】
    ステップS803において、記憶部103に記憶されている図4に示すテーブルから各設定項目における「使用不可」、「推奨1」に該当するM_IDを及び音声認識語彙を読み込むと共に、図3に示すテーブルに記述された各音声メッセージのうち、「推奨1」、「使用不可」に該当するテキストデータを読み込む(ステップS803)。
    【0058】
    そして夫々の設定項目に対応する「使用不可」を示す音声、「推奨1」を示す音声を上記テキストデータに従った音声合成結果として出力する(ステップS804)。 この音声の内容としては例えば「等倍の設定はGUIを推奨、倍率の設定は音声を推奨、…」とすれば良い。
    【0059】
    以上説明したように、第1の実施形態によれば、推奨される入力モダリティーを表示や音声によってユーザに提示するので、ユーザは入力モダリティーを適宜使い分けて操作を簡便に行うことができる。
    【0060】
    なお、マルチモーダル・ユーザインタフェースでは、複数備えられたモダリティのうち、どのモダリティを用いてもよい、という場合もあるが、複数のモダリティを組み合わせて使用する場合もある。 例えば「ここからここまで」とディスプレイに表示された地図上の2点をクリックしながら音声で入力するなどの例が挙げられる。 この場合には、推奨モダリティとして2つのモダリティの組み合わせ(GUI+音声)をユーザに提示する必要がある。
    【0061】
    [第2の実施形態]
    第1の実施形態では全ユーザ共通のテーブル(図3,4)を用いて推奨される入力モダリティーや使用不可である入力モダリティーをユーザに提示していたが、本実施形態では、夫々のユーザに個別のテーブルを用いた場合を例に取り説明する。 その場合、図3,4に示したテーブルが夫々のユーザ毎に設けられていることになる。 なお本実施形態では、各ユーザ毎にテーブルを設け、各ユーザ毎に異なる提示を行う以外については第1の実施形態と同じであるとする。
    【0062】
    本実施形態では、情報処理装置を使用する際にユーザが予め自身に付けられたIDを操作部107を用いて入力するものとする。 これにより制御部104は図2に示したテーブルを参照し、対応するテーブルIDを特定することができ、以下使用するテーブルを特定することができる。 なお、使用するテーブルを特定する方法はこれに限定されるものではなく、例えば以下のような形態も考えられる。
    【0063】
    夫々のユーザの指紋パターンや眼底パターンなどの個人固有の情報をユーザIDと対応させて予め情報処理装置に格納しておき、更に上記個人固有情報をユーザの指や目から読み取って情報処理装置に入力する装置(個人情報読み取り装置)を情報処理装置に接続しておく。 そして情報処理装置を使用するユーザは自身の個人固有情報を個人情報読み取り装置に読み取らせ、情報処理装置に入力する。 情報処理装置は入力された個人情報を識別し、保持しておいた夫々のユーザのものとをマッチングさせ、マッチしたユーザのユーザIDに対応するテーブルIDを特定する。
    【0064】
    そして、決定したテーブルIDに対応するテーブルのデータを用いて各ユーザ毎に異なる表示画面を表示部108の表示画面上に表示する。
    【0065】
    以上説明した、各ユーザ毎に異なるテーブルを用いて、夫々のユーザに応じたコピー及び各種の設定を行うための画面を表示するための処理のフローチャートを図9に示す。 なお同図に示したフローチャートに従ったプログラムは、記憶部103に保存されており、これを制御部104が自身のワークエリアに読み出して実行することで、このコピー機は同図のフローチャートに従った処理を行うことになる。
    【0066】
    また同図のフローチャートに示した処理はメインの処理のサブルーチンとして実行され、表示部108の表示画面上にはコピー及び各種の設定を行うための画面(例えば図6に示す画面)が表示されているものとする。
    【0067】
    表示部108における画面表示あるいは画面の再読み込み(リフレッシュ)が行われる際に(ステップS902)、予め入力されたユーザIDに対応するテーブルIDを図2に示したテーブルから特定し、更に特定したテーブルIDに対応するテーブル(例えば図4に示すテーブル)から、各設定項目における「使用不可」、「推奨1」に該当するM_IDを読み込むと共に、特定したテーブルIDに対応するテーブル(例えば図3に示すテーブル)に記述された各画像のうち、「推奨1」、「使用不可」に該当する画像を読み込む(ステップS903)。
    【0068】
    そして表示部108の表示画面上に表示された各設定項目のGUIの近傍位置に、夫々の設定項目に対応する「使用不可」を示す画像、「推奨1」を示す画像を表示する(ステップS904)。 以上の処理を行うことで、例えば図7に示す画面が表示部108の表示画面上に表示されることになる。
    【0069】
    なお上記処理は第1の実施形態と同様に、音声によっても推奨される入力モダリティー、使用不可の入力モダリティーの提示が可能である。 その場合、図9に示したフローチャートのステップS903、S904の各ステップでは以下のような処理を行う。
    【0070】
    ステップS903において、予め入力されたユーザIDに対応するテーブルIDを図2に示したテーブルから特定し、更に特定したテーブルIDに対応するテーブル(例えば図4に示すテーブル)から、各設定項目における「使用不可」、「推奨1」に該当するM_ID及び音声認識語彙を読み込むと共に、特定したテーブルIDに対応するテーブル(例えば図3に示すテーブル)に記述された各音声メッセージのうち、「推奨1」、「使用不可」に該当するテキストデータを読み込む。
    【0071】
    そしてステップS904では、夫々の設定項目に対応する「使用不可」を示す音声、「推奨1」を示す音声を上記テキストデータに従った音声合成結果として出力する(ステップS904)。 この音声の内容としては例えば「等倍の設定はGUIを推奨、倍率の設定は音声を推奨、…」とすれば良い。
    【0072】
    以上説明したように、第2の実施形態によれば第1の実施形態に加えて、ユーザ毎に推奨される入力モダリティーを提示することができるので、個々のユーザの属性や操作習熟度に合わせて、より的確な操作方法を提示することができる。 例えば、本来推奨されるべき入力モダリティーがGUIであったとしても、視覚障害を持つユーザにとってはこの入力モダリティーは推奨されるべきものではない。
    【0073】
    従って本実施形態に係る情報処理装置はこのような場合、視覚障害を有するユーザ用のテーブルを予め作成しておくことができる。 この視覚障害を持つユーザ用のテーブルとしては、図3に示すテーブルにおいて「画像」の項目を省いたテーブル、図4に示すテーブルにおいて推奨する入力モダリティーは全て音声とした(「推奨1」、「推奨2」のM_IDを全てM2とした)テーブルを、視覚障害を持つユーザのIDに関連づけて図2に示すテーブルに登録しておくと良い。 そしてこのようなテーブルを用いて音声により推奨される入力モダリティー、使用不可である入力モダリティーを音声にて視覚障害を有するユーザに提示すればよい。
    【0074】
    [第3の実施形態]
    上記第1,2の実施形態では、推奨される入力モダリティーは予め設定されていたが、これをユーザの操作履歴に応じて動的に変更するようにしても良い。 推奨される入力モダリティーをユーザの操作履歴に応じて動的に変更する処理のフローチャートを図10に示す。
    【0075】
    なお同図に示したフローチャートに従ったプログラムは、記憶部103に保存されており、これを制御部104が自身のワークエリアに読み出して実行することで、このコピー機は同図のフローチャートに従った処理を行うことになる。
    【0076】
    操作部107を用いた操作の入力を検知すると(ステップS1002)、制御部104に内蔵されている不図示のタイマーの状態を調べる(ステップS1003)。 タイマーがOFFならばタイマーをクリアしてONにする(ステップS1004)。 続いて、操作回数に1を足し、操作内容を図5に示すテーブルに追加記録する(ステップS1005)。 その操作により、設定が行われなかった場合には(ステップS1006)処理を終了し、設定が行われた場合には(ステップS1006)、予め入力された(もしくは予め決定されていた)ユーザIDに対応したテーブルを更新し、続いて全てのユーザに共通のテーブルを更新する(ステップS1007)。 ここで得点Gを(1)式のように定義する(T:操作時間、F:操作回数)。
    【0077】
    G=1/T+1/F (1)
    ステップS1007におけるユーザIDに対応したテーブルの更新としては、今回の操作における操作回数Fと操作時間Tとに基づく得点Gと、今回の操作におけるテーブル(図4)における操作回数F'と操作時間T'とに基づく得点G'とを比較し、得点の低い方の操作回数、操作時間、及びその操作手順(図5)を、得点の高い方の操作回数、操作時間、及びその操作手順(図5)に更新する。 同得点の場合は更新しない。
    【0078】
    例えば、GUI(M_ID=M1)で用紙を自動に設定した場合、今回の操作回数Fが2、操作時間Tが6ならば、得点G(=1/2+1/6=0.67)が、ユーザIDに対応したテーブルの得点G(=1/3+1/7=0.48)より高いので、操作回数2、操作時間6と、その操作手順を図4の「用紙」の設定項目中の「自動」に書き込む。
    【0079】
    「操作回数」、もしくは「操作時間」が更新されたことに伴い、推奨モダリティ(上述のテーブルにおける「推奨1」、「推奨2」)も変更を行う。 推奨モダリティの更新は、各モダリティの中で上述の得点Gが最も高いモダリティを「推奨1」に、上述の得点Gが2番目に高いモダリティを「推奨2」に更新する。 同得点のものがある場合は、先に参照したモダリティを優先する。 上記の用紙を自動に設定する例では、今回の操作によりGUI(M_ID=M1)の得点Gが0.67(=1/2+1/6)に更新された後、音声(M_ID=M2)の得点G(=1/2+1/3=0.83)と比較し、最も得点Gの高い音声(M_ID=M2)を「推奨1」に、2番目に得点Gの高いモダリティGUI(M_ID=M1)を「推奨2」に設定する(この例ではもともと音声を「推奨1」、GUIを「推奨2」としていたので更新はしない)。
    【0080】
    全てのユーザに共通のテーブルの更新は、各ユーザのテーブルの中から、得点Gが最も高いテーブルの操作回数、操作時間と、その操作手順を書き込む。 同得点のものがある場合は、先に参照した方を優先する。 あるいは、各ユーザのテーブルにおける操作回数と操作時間の平均値(ユーザ間の平均値)を算出してもよい。 この場合、操作手順は各ユーザのテーブルの中から、得点Gが最も高いテーブルの操作手順を書き込む。 同得点のものがある場合は、先に参照した方を優先する。
    【0081】
    全てのユーザに共通のテーブルにおいても、「操作回数」、もしくは「操作時間」が更新されたことに伴い、推奨モダリティ(上述のテーブルにおける「推奨1」、「推奨2」)も変更を行う。 推奨モダリティの更新は、各モダリティの中で上述の得点Gが最も高いモダリティを「推奨1」に、上述の得点Gが2番目に高いモダリティを「推奨2」に更新する。 同得点のものがある場合は、先に参照したモダリティを優先する。
    【0082】
    更新が終わるとタイマーをOFFにし、操作回数をクリアする(ステップS1008)。
    【0083】
    アプリケーションが推奨する推奨モダリティーや使用不可モダリティー等の提示は、第1の実施形態、あるいは第2の実施形態と同様の方法で行う。
    【0084】
    以上説明したように、第3の実施形態によれば、第1,2の実施形態に加えて、ユーザの過去の操作履歴に基づいて、動的に推奨する入力モダリティーを設定するので、より的確な操作方法を提示することができる。
    [第4の実施形態]
    上記実施形態において、使用可能な入力モダリティーを用いて所望の設定を行った場合に、その設定後により推奨される入力モダリティーがある場合にはその入力モダリティーをユーザに提示しても良い。
    【0085】
    その場合の処理のフローチャートを図12に示す。 なお同図に示したフローチャートに従ったプログラムは、記憶部103に保存されており、これを制御部104が自身のワークエリアに読み出して実行することで、このコピー機は同図のフローチャートに従った処理を行うことになる。
    【0086】
    図12に示したフローチャートにおいて、ステップS1202〜ステップS1207、ステップS1210は夫々、図10におけるステップS1002〜ステップS1007、ステップS1008と同じであり、図12に示したフローチャートは図10に示したフローチャートに、新たにステップS1208,S1209が付け加わった点が異なる。 従ってこのステップS1208、S1209について以下説明する。
    【0087】
    ステップS1208では、今回の操作における操作回数Fと操作時間Tとに基づく得点Gと、全てのユーザに共通のテーブルにおいて、今回ユーザが行った設定項目に対応する「推奨1」のモダリティの操作回数F'と操作時間T'とに基づく得点G'とを比較する。 共通のテーブルにおける「推奨1」のモダリティの得点G'に比べて今回の得点Gの方が低ければ、共通のテーブルにおける「推奨1」のモダリティの操作手順を読み込み、これを推奨モダリティと、その操作手順とする。
    【0088】
    そして、共通のテーブルにおける「推奨1」のモダリティの得点G'に比べて今回の得点Gの方が低ければステップS1209において、推奨モダリティによる操作手順(図5)を図11のように提示する。 共通のテーブルにおける推奨モダリティの得点G'に比べて今回の得点Gが同じもしくは高い場合(ステップS1208でNOの場合)は上記提示は行わない。
    【0089】
    図11は、ユーザが行った操作に対して、「A3」と音声入力可能であることを提示している画面の一例を示す図である。 例えばユーザが用紙をA3に設定する際に、GUIで操作回数2回、操作時間5秒で設定した場合の得点は1/2+1/5=0.7である。 これに対して、ユーザに共通のテーブルにおいて、「推奨1」のモダリティ(音声、M_ID=M2)の得点は1/2+1/3=0.83である。 今回の得点0.7は「推奨1」のモダリティの得点0.83に比べて低いので、音声を推奨モダリティに、その操作手順をL221とし、図11のようにより推奨する方法を提示する。
    【0090】
    ここで、上記推奨モダリティーによる操作手順(図5)を、音声メッセージを音声出力部106から出力してもよい。 例えば、「現在行った設定は、A3と音声でも入力することができます」のように読み上げる。 音声出力については既存の音声合成技術を用いる。
    【0091】
    以上説明したように、第4の実施形態によれば、ユーザが設定を行った後、その設定方法より適していると思われる推奨方法が提示されるので、ユーザは次回の操作から、より適した方法で設定することができる。
    [第5の実施形態]
    第1乃至4の実施形態では上記情報処理装置をコピー機に適用した場合について説明したが、本実施形態では、デジタルカメラに適用した場合について説明する。 当然本実施形態に係るデジタルカメラは、マルチモーダル・ユーザインターフェースを有するものである。
    【0092】
    情報処理装置をデジタルカメラに適用する場合、図4に示したテーブルの代わりに図13に示すテーブルを用いる。 図13は、本実施形態に係る情報処理装置をデジタルカメラに適用した場合に、記憶部103に新たに記憶すべきテーブルの構成例を示す図である。 同図のテーブルは、デジタルカメラの設定項目と、その設定項目毎の、操作回数、操作時間、操作手順、使用可、使用不可、推奨1、推奨2、音声認識語彙が記述されたものである。 以下、同図を用いてこのテーブルについて更に詳しく説明する。
    【0093】
    図13に示したテーブルは図4に示したテーブルとは設定項目が異なり、更にその設定項目に応じて他の記述が異なってはいるが、その使用方法については実質的には図4と同じ使用方法が適用される。
    【0094】
    図14,15は、デジタルカメラの表示部に表示された設定画面で、推奨されるモダリティーを示す画像を表示した画面例を示す図である。 何れの画面においても、上記実施形態と同様に、推奨する入力モダリティーを示す画像(図14では推奨される入力モダリティーが音声であることを示す画像、図15では推奨される入力モダリティーがハードキーであることを示す画像)が表示されている。
    【0095】
    また本実施形態においても上記実施形態と同様に、音声にて推奨される入力モダリティーをユーザに提示しても良い。
    【0096】
    また、デジタルカメラのように画面が小さい機器においては、機器にLED(発光ダイオード)などを取り付け、それぞれの操作における推奨モダリティーに対応したLEDを点灯させても良い。 例えば、メニューボタンが押されると、GUI画面上にメニューが表示される。 この時点で、そのメニュー選択において推奨する入力モダリティーLED(例えば音声を推奨ならば音声LED)を点灯させる。 あるいは各入力モダリティーに対応した色のLEDを点灯させるなどの方法も考えられる。
    【0097】
    [その他の実施形態]
    尚、本実施形態は、複数の機器(例えば、ホストコンピュータ、インターフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置等)に適用してもよい。
    【0098】
    また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。 この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本実施形態を構成することになる。 また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
    【0099】
    さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
    【0100】
    本実施形態を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートや機能構成に対応するプログラムコードが格納されることになる。
    【0101】
    【発明の効果】
    以上説明したように、本発明によれば、マルチモーダル・ユーザインターフェースを用いて情報を入力する場合に、より簡便に情報を入力することができる。
    【図面の簡単な説明】
    【図1】本発明の第1の実施形態に係る情報処理装置の基本構成を示す図である。
    【図2】ユーザIDと、これに対応するテーブルIDとのセットを複数登録したテーブルの構成例を示す図である。
    【図3】夫々のテーブルIDに対応するテーブルの構成例を示す図である。
    【図4】本発明の第1の実施形態に係る情報処理装置をコピー機に適用した場合に、記憶部103に新たに記憶すべきテーブルの構成例を示す図である。
    【図5】各設定項目における操作手順を「操作1」、「操作2」、「操作3」、、、の順にステップ名をアプリケーション開発者が予め登録したものを示す図である。
    【図6】従来のマルチモーダル・ユーザインターフェースを備えるコピー機が有する表示部の表示画面に表示された、コピー及び各種の設定を行うための簡単な画面を示す図である。
    【図7】本発明の第1の実施形態に係る情報処理装置を適用した上記コピー機の表示部108に表示された、コピー及び各種の設定を行うための簡単な画面を示す図である。
    【図8】本発明の第1の実施形態に係る情報処理装置を適用したコピー機が行う処理のフローチャートである。
    【図9】各ユーザ毎に異なるテーブルを用いて、夫々のユーザに応じたコピー及び各種の設定を行うための画面を表示するための処理のフローチャートである。
    【図10】推奨される入力モダリティーをユーザの操作履歴に応じて動的に変更する処理のフローチャートである。
    【図11】ユーザが行った操作に対して、「A3」と音声入力可能であることを提示している画面の一例を示す図である。
    【図12】使用可能な入力モダリティーを用いて所望の設定を行った場合に、その設定後により推奨される入力モダリティーがある場合に、その入力モダリティーをユーザに提示するための処理のフローチャートである。
    【図13】本発明の第5の実施形態に係る情報処理装置をデジタルカメラに適用した場合に、記憶部103に新たに記憶すべきテーブルの構成例を示す図である。
    【図14】デジタルカメラの表示部に表示された設定画面で、推奨されるモダリティーを示す画像を表示した画面例を示す図である。
    【図15】デジタルカメラの表示部に表示された設定画面で、推奨されるモダリティーを示す画像を表示した画面例を示す図である。

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈