首页 / 专利库 / 人工智能 / 多模态界面 / Network equipment controller

Network equipment controller

阅读:156发布:2020-10-27

专利汇可以提供Network equipment controller专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a network equipment controller for uniformly controlling a plurality of equipment units connected to a network through dialogue with a personified agent. SOLUTION: A home gateway 1 includes; a multi-modal interface 2 for selecting through dialogue any one of a plurality of input systems such as a network including telephone network, the Internet or the like, a camera, and a microphone; an equipment control database 20 for storing information on network equipment being connected to the network, command information, proprietor information, etc., related to each network equipment; and a controller 3 being constituted by a connection equipment control means 19 for controlling at least one of the plurality of network equipment sets using the multi-modal interface output. Further, based on sound information and semantically significant information obtained from a semantic understanding means 14, the multi- modal interface 2 includes a dialogue promotion means 16 for generating information to promote smooth dialogue by affording appropriate responses to the opposite person, determining proper response timing, etc.,下面是Network equipment controller专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 入力デバイスを対話形式により選択するマルチモーダルインターフェースと、 ネットワークに接続される複数のネットワーク機器の情報を格納する機器制御用データベース手段と、 前記マルチモーダルインターフェースの出力により前記複数のネットワーク機器のうち少なくとも1つを制御する接続機器制御手段とを備え、 前記マルチモーダルインターフェースは、 画像又は音声を認識する認識手段と、 声の抑揚、強さ、速さなどの音情報を獲得する音情報獲得手段と、 意味理解のための情報を格納する意味理解用データベース手段と、 前記認識手段による認識結果及び前記意味理解用データベース手段に格納されたデータに基づいて意味理解を行う意味理解手段と、 前記音情報と前記意味理解情報に基づいて対話を促す情報を生成する対話促進手段と、 前記対話促進手段からの出力を画像又は音声により合成して出力する合成手段と、 を備えることを特徴とするネットワーク制御装置。
  • 【請求項2】 前記機器制御用データベース手段は、前記ネットワーク機器の操作コマンド及び送信手順を格納しており、 前記接続機器制御手段は、ユーザとの対話の結果から前記操作コマンドを検索し、前記ネットワーク機器に送信することを特徴とする請求項1記載のネットワーク機器制御装置。
  • 【請求項3】 前記機器制御用データベースは、前記ネットワーク機器の使用制限に関する情報を格納しており、 前記接続機器制御手段は、前記使用制限に関する情報に基づいて操作権限のない機器の操作を排除することを特徴とする請求項1記載のネットワーク機器制御装置。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】本発明は、ユーザと情報処理機器との間で自然な対話を実現するマルチモーダルインタフェースを用いたネットワーク機器制御装置に関する。

    【0002】

    【従来の技術】近年、音声認識技術が発展し、テレビジョン受像機、ラジオ受信機、車載ナビゲーション、携帯電話、パーソナルコンピュータ(以下、PCという)等の機器に搭載されつつある。 音声認識装置は通常それぞれの機器の一部として内蔵されている。 この音声認識装置、手書き文字認識装置、マウス、ライトペン、タブレット等のポインティングデバイスなど、複数の入装置をコンピュータに接続して、ユーザがその局面局面において自分にとって最も都合の良い入力装置を使って入力できれば非常に使いやすいインタフェースとなる。 このように複数の異なる入力モードから、ユーザが任意の入力モードを選択し、組み合わせて自分の意図をシステムに伝えることができるインタフェースのことをマルチモーダルインタフェースという。

    【0003】また、前述の民生機器にはインターネットの発達により、ネットワークに接続される機器も増大しつつある。 インターネットを利用するためのアクセス手段が多様になり、ユーザがインターネットにアクセスするための端末やネットワークの選択肢が拡大している。
    インターネットを構築するには、企業内にLAN(Loca
    l Area Network)を構築し、次にインターネットとの接続を行うという手順が一般的である。 また、インターネットに接続する場合の回線の種類や接続形態は、大きく分けて、(1)自営専用線による接続、(2)公衆電話回線、
    ISDN(Integrated Services Digital Network:サービス総合デジタル網)デジタル通信モードを使用して接続する回線交換による接続、(3)ITU(Internation
    al Telecommunication Union:国際電気通信連合)−T
    で規定しているパケット交換接続やISDNパケット交換モードを使用するパケット交換接続がある。

    【0004】

    【発明が解決しようとする課題】このような従来のネットワーク機器を制御する制御装置にあっては、以下のような問題点があった。 例えば、特開平2−30267号公報には、電話からの自動応答に応じて、対話入力形式で番号・記号等を送信して機器の遠隔操作を行う遠隔操作装置が開示されている。 この方法は一般的ではあるが入力が煩雑になる。 また、家の中で使う際には別のインタフェースを用意する必要があり、統一的な制御ができないという問題点がある。 また、特開平11−3119
    96号公報に記載された音声装置及び遠隔操作可能なネットワーク機器は、音声認識の結果によりネットワークに接続された機器を制御するものである。 この装置では複数ユーザが使用することを前提としているが、認識結果が他のユーザの命令と競合した場合にどうするかについてはまったく触れられていない。 また、システムとのやりとりも常に同じ応答の仕方をするため、ユーザはシステムとのやり取りに飽きてしまい、使わなくなってしまうという問題もある。 また、状況によって機器に対するアクセス権を変化できるような仕組みが必要である。

    【0005】さらに、従来の電話だけでなく、マイク、
    カメラを備えたPC、テレビ電話、インターネットなど、ネットワーク機器を制御するための入力デバイスも多様化してきているが、入力デバイスごとにシステムを構築する必要があった。 本発明は、このような課題に鑑みてなされたものであって、擬人化エージェントとの対話によりネットワークに接続された複数の機器を統一的に制御することができるネットワーク機器制御装置を提供することを目的としている。

    【0006】

    【課題を解決するための手段】本発明のネットワーク機器制御装置は、例えば各種ネットワーク、カメラ、マイクロフォン等の複数の入力のうち1系統を対話形式により選択するマルチモーダルインターフェースと、ネットワークに接続されている複数のネットワーク機器の情報、該機器それぞれのコマンド情報、所有者情報などを格納する機器制御用データベースと、前記マルチモーダルインターフェースの出力により前記複数のネットワーク機器のうち少なくとも1つを制御する接続機器制御手段とを備え、前記マルチモーダルインターフェースは、
    ユーザの身振り(ジェスチャ)や顔の表情等を認識する画像認識、及び入力音声を認識する認識手段と、声の抑揚、強さ、速さなどの音情報を獲得する音情報獲得手段と、意味理解及びユーザごとの応答を変えるための情報を格納する意味理解用データベースと、前記認識手段による認識結果及び前記意味理解用データベースに格納されたデータに基づいて意味理解を行う意味理解手段と、
    前記音情報獲得手段により獲得した音情報と前記意味理解手段からの意味理解情報に基づいて相槌を打つ、応答タイミングを決定する等の対話を促す情報を生成する対話促進手段と、前記意味理解手段からの応答文を音声合成する音声合成手段と、対話相手となる擬人化エージェントを合成して出力する画像生成手段と、を備えることを特徴とする。

    【0007】このように構成された本発明のネットワーク機器制御装置は、自然言語による入力により、接続された機器を容易に遠隔繰作することができる。 対話機能による、認識できない部分のみを聞き返すことによりユーザに不快感を与えることなく認識精度を向上させ、対話を通じて同一ネットワーク上にある機器を操作することができる。 また、意味理解手段に個人情報、時間情報を持たせることでいろいろな対話応答が実現できる。 接続機器制御手段に個人情報に関するデータベースを接続することで機器の選定、制御セキュリティ等を実現できる。 インターネット等の回線を利用してネットワーク機器のメーカー及びメンテナンス会社より該当機器の保守を行うことができる。

    【0008】また、前記対話促進手段は、音声の強弱、
    音の高低の特徴、ユーザの身振り、音声認識の結果のうち少なくとも2つ以上を入力とし、音声としぐさで相槌を打つ情報を生成することで、人間と同じような応答を実現することが可能であり、スムーズな対話を実現することができる。

    【0009】また、前記意味理解用データベースは、ユーザ別のアクセス方法、時間情報、ユーザ名のうち少なくとも2つ以上を入力とし、該入力とは異なる応答情報を出力することで、アクセス方法、時間情報、ユーザ名などをキーとして異なった応答を生成することが可能であり、人間と話すようにストレスを感じない対話を実現することができる。

    【0010】また、前記機器制御用データベースは、例えば同一のネットワーク上に接続された機器の操作コマンド及び送信手順を格納しており、前記接続機器制御手段は、ユーザとの対話の結果から前記操作コマンドを検索し、前記接続機器に送信することで、処理手順を考えることなく接続機器を制御することが可能であり、音声対話によりネットワーク機器を制御することができる。

    【0011】また、前記機器制御用データベースは、例えば同一のネットワーク上に接続された機器の使用制限に関する情報を格納しており、前記接続機器制御手段は、前記使用制限に関する情報に基づいて操作権限のない機器の操作を排除することで、操作権限のない機器の操作を排除することが可能であり、安全性を確保することができる。

    【0012】また、前記機器制御用データベースは、同一のネットワーク上に接続された機器の操作方法に関する情報を格納するようにし、前記接続機器制御手段は、
    ユーザからの要求に応じてCG映像、ビデオ映像、合成音声のうち2つ以上を使って教示するように構成すれば、使用方法がわからないユーザにその方法を教示することが可能であり、新しい機器を接続してもすぐに使えるようになる。

    【0013】

    【発明の実施の形態】以下、添付図面を参照しながら本発明の好適なネットワーク機器制御装置の実施の形態について詳細に説明する。 図1は、本発明の実施の形態のネットワーク機器制御装置の構成を示すブロック図である。 ネットワーク機器制御装置として、マルチモータルインタフェースを用いたネットワーク機器制御装置に適用した例である。

    【0014】図1において、1はホームゲートウェイ、
    2はマルチモーダルインタフェース、3は制御部、4は音声入力デバイスであるマイクロフォン、5はCCDカメラ等のカメラ、6はインターネット網、7はアナログ電話網、8はISDN網、9は複数の接続機器である。

    【0015】ホームゲートウェイ1は、例えば音声データをLANのプロトコルであるIP(Internet Protoco
    l)パケットに変換し、IPネットワークを経由した音声通話を実現するものである。 ホームゲートウェイ1
    は、上記音声データのプロトコル変換等のIPゲートウェイを行うもので、同時接続が可能なように複数のポートを有する。

    【0016】特に、ホームゲートウェイ1は、個人認証、操作機器及び操作内容の特定を行い、必要なコマンド体系に変換し、該当ネットワーク機器に送信する。 マルチモーダルインタフェース2は、インターネット網6、アナログ電話網7、ISDN網8などのネットワーク網、CCDカメラ5、マイク4などの入力デバイスのうち、接続要求のあった1系統を選択し、その系統からの入力を受け付ける。

    【0017】図2は、ホームゲートウェイ1を構成するマルチモーダルインタフェース2の構成を示す図である。 図2において、マルチモーダルインタフェース2
    は、画像認識手段11、言語情報以外の音情報を認識する音声認識手段12、音情報獲得手段13、意味理解手段14、意味理解及びユーザごとの応答を変えるための情報を格納する対話用データベース(DB)15(意味理解用データベース)、対話促進手段16、音声合成手段17、及び画像生成手段18から構成される。

    【0018】画像認識手段11は、ユーザの身振り(ジェスチャ)や画像による個人認証を行う。 音声認識手段12は、ユーザのしゃべった内容を音声認識により獲得する。 音声認識の手法としては、ヒドンマルコフモデル(HMM:hidden Markov model)や連続DPマッチングによるキーワード認識などを用いる。 音情報獲得手段13は、声の抑揚、強さ、速さなどの音情報を獲得する。

    【0019】意味理解手段14は、画像認識手段11と音声認識手段12の認識結果に基づいて対話用データベース15に格納した個別情報を用いて意味理解を行う。
    対話促進手段16は、言語的意味のない情報を使い、相槌をうつ、あるいは応答のタイミングを生成するとともに、意味理解手段14からの応答文を音声合成手段17
    及び画像生成手段18を使って出力する。 音声合成手段17は、意味理解手段14からの応答文を音声合成する。 画像生成手段18は、対話相手となる擬人化エージェントを合成して出力する。

    【0020】図3は、ホームゲートウェイ1の制御部3
    の構成を示す図である。 図3において、制御部3は、マイクロコンピュータ等により構成され、さらに接続機器制御手段19、及び複数の機器制御用データベース20
    (機器制御用データベース手段)を備えて構成される。
    接続機器制御手段19は、意味理解手段14からの認識結果に基づいて機器制御用データベース20を用いて各ネットワーク機器(接続機器9)の制御を行う。

    【0021】機器制御用データベース20は、機器の制御コマンドを記録したデータベース、機器の処理手順を記録したデータベース、接続された機器すべての稼動状況を記録したデータベース、機器の使用優先度(プライオリティ)を記録したデータベース、前述のプライオリティを自動的に変更するルールを記録したデータベース、機器の使用制限に関する情報を記録したデータベース、ユーザに対応した機器リストを記録したデータベースなどから構成される。

    【0022】さらに、対話の際に用いる語彙、応答パターンを変えるためにデータベースを用いてもよい。 このデータベースの内容は簡単に追加・削除・修正を行うことができ、ユーザに合わせた応答を実現することができる。 本実施の形態のネットワーク機器制御装置は、ユーザとのインタフェースにマルチモーダルインタフェース2を用い、どのような入力デバイスからも対話形式により入力できるようにしたことを特徴としている。

    【0023】以下、上述のように構成されたネットワーク機器制御装置の動作を説明する。 ここではホームゲートウェイ1を家庭内ネットワーク(家庭内LAN)と広域ネットワークとの中継器と定義する。 また、このホームゲートウェイ1に接続しているネットワーク機器は、
    パソコンなどのコンピュータ、AV機器のほかホームネットワークに接続可能なすべての電子機器である。

    【0024】ユーザは、ホームゲートウェイ1に対し、
    音声認識手段及や映像認識手段を用いて入力を行う。 ホームゲートウェイ1はインターネット網6、アナログ電話網7、ISDN網8などのネットワーク網及びCCD
    カメラ5、マイク4などの入力デバイスのうち1系統を自動的に選択するマルチモーダルインタフェース2(入力選択手段)を用いて、接続要求のあった一系統を選択し、その系統からの入力を受け付ける。 入力はすべてマルチモーダルインタフェース2を使い、擬人化エージェントとの対話形式で行う。 ホームゲートウェイ1では、
    個人認証、操作機器及び操作内容の特定を行い、必要なコマンド体系に変換し、該当ネットワーク機器に送信する。

    【0025】マルチモーダルインタフェース2の画像認識手段11では、ユーザのジェスチャや画像による個人認証を行う。 画像認識手段11には、ユーザを識別するための顔の認識、身振り(ジェスチャ)の認識などが実装される。 音声認識手段12では、ユーザのしゃべった内容を音声認識により獲得する。

    【0026】意味理解手段14では、画像認識手段11
    と音声認識手段12の認識結果に基づいて意味理解を行う。 このとき、意味理解手段14は、ユーザ別の応答文を作成したり、「僕の」が何を意味するのかなど対話用データベース15に格納した個別情報を用いる。

    【0027】また、音情報獲得手段13では、声の抑揚、強さ、速さなどの情報を獲得する。 これらの言語的意味のない情報を使い、対話促進手段16において相槌をうつ、あるいは応答のタイミングを生成する。 同時に、意味理解手段14からの応答文を音声合成手段17
    及び画像生成手段18を使って出力する。 画像生成手段18では、対話相手となる擬人化エージェントを合成して出力する。

    【0028】音声認識の手法としては、ヒドンマルコフモデル(HMM)や連続DPマッチングによるキーワード認識などによる既存技術のどの方法を用いてもかまわない。 上記画像認識手段11、音声認識手段12、音情報獲得手段13及び意味理解手段14、対話用データベース15及び対話促進手段16の動作について、さらに具体的に説明する。

    【0029】情報獲得手段13では、ユーザの対話リズムを抽出し、適当なタイミングで相槌をいれるなど応答制御に必要な情報を獲得する。 ユーザが「僕の部屋のビデオ予約をしたいんだけど。」と発話した場合に、すべてのキーワードを認識できればシステムは「何時からですか?」とか「どの番組ですか?」と問い返すなど必要な情報を獲得できるように誘導すればよい。 一部又はすべてのキーワードを認識できなかった場合には、「○○
    さんの部屋の何を使うのですか? 」とか「どのビデオを使うのですか?」「何ですか?もう一度お願いします。」のように聞き返せばよい。 「今晩7時からの○○
    を録画しといて」という発話に対し、意味理解手段14
    と対話用データベース15及び対話促進手段16によって録画可能かどうかを判断する。 この場合には、インターネットテレビ番組表などを対話用データベース15にダウンロードしておき、ユーザの入力結果を使って検索を行う。 このとき、検索結果が0件の場合には検索条件を緩めて候補が見つかるまで検索する。 「今日、午後7
    時、番組名○○」で検索し、見つからなければ時間情報を緩める。 例えば、「今、番組名○○」での検索で候補が見つかれば、「○○は××からです。いいですか?」
    と応答すればよい。 見つからなければ「番組名○○」で検索する。

    【0030】このようにして間違いを訂正することができる。 すべての情報がそろった段階で、ユーザに対し確認を行うことで確実にネットワーク機器を制御することができる。 意味理解手段14において、ネットワーク機器の制御を行うことを認識した場合、その認識結果を制御部3の接続機器制御手段19に送る。

    【0031】図3において、機器制御用データベース2
    0は、機器の制御コマンドを記録したデータベース、機器の処理手順を記録したデータベース、接続された機器すべての稼動状況を記録したデータベース、機器の使用優先度(プライオリティ)を記録したデータベース、前述のプライオリティを自動的に変更するルールを記録したデータベース、機器の使用制限に関する情報を記録したデータベース、ユーザに対応した機器リストを記録したデータベースなどから構成され、接続機器制御手段1
    9は、これらの機器制御用データベース20を用いて意味理解手段14からの認識結果に基づいて接続機器9の制御を行う。

    【0032】対話の際に用いる語彙、応答パターンを変えるためにデータベースを用いてもよい。 このデータベースの内容は簡単に追加・削除・修正を行うことができ、ユーザに合わせた応答を実現することができる。 応答パターンを変える例を、図4のフローチャートを用いて説明する。

    【0033】図4は、対話の応答パターンを変える動作を示すフローチャートである。 まず、ステップS1で、
    本システムヘのアクセス開始時間を獲得する。 これにより時間帯によって応答の方法を変えることができる。 図5は、対話応答パターンを記録したデータベースの一例を示す図、図6は、交信履歴を格納するデータベースの一例を示す図である。

    【0034】図5に示すデータベースの例では、アクセスしたユーザことに時間に応じて応答パターンを変えることができる。 どの時間帯に誰がアクセスしても「こんにちは」「どうしました?」のような特定の応答では不自然である。 特に、特定ユーザ以外の人がアクセスした場合にも特定ユーザと同じ応答の仕方では対話としてもおかしい部分が発生する。 また、ここで獲得した時間情報はネットワーク機器の制御のためにも用いる。 例えば、図6に示すように家族Bについて時間17:00になると、パターンCの応答をするとともに機器AをON
    する動作を行う。 次いで、ステップS2でアクセス者(ユーザ)が誰であるのかを判別する。 ユーザ別のデータベースを用いることにより応答パターンをユーザの好みに変える、又はアクセス条件を変えることが実現される。

    【0035】図7は、ユーザ認証に関するデータベースの一例を示す図である。 図7に示すデータベースの例では、アクセスに使った電話等の番号「090-4xxx-yyyy」
    をキーにしてユーザを識別する。 このとき、応答用の画像パターン「Pattern A」、音声パターン「Pattern A」
    を切り替えてもよい。 また、画像認識や音声認識を使ってユーザを識別してもよい。

    【0036】次いで、ステップS3でネットワーク機器へのアクセスを許された家族であるのかを判別する。 ネットワーク機器へのアクセスを許された家族であれば、
    ステップS4以降でネットワーク機器の制御を行うための応答を行う。 すなわち、ステップS4でユーザの要求が何であるのかを認識し、ステップS5でネットワーク機器の制御であるか否かを判別する。 ネットワーク機器の制御であるときは、ホームゲートウェイ1の制御部3
    にその内容を送出する。 制御部3では、対話の内容にあわせて家庭内の電子機器の操作を行う。 例えば、伝言を残したければ、留守番電話のように音声及び画像データを保存しておく。 また、ビデオの録画を行いたければ、
    対象機器の選定、コマンドの作成等を行い、送出すればよい。 これらのタスクに関する操作は、制御部3により行われる。

    【0037】一方、ネットワーク機器へのアクセスを許された家族でなければ、ステップS6で登録されている知人であるか否かを判別する。 登録されている知人であれば、留守のときにはメッセージ録音を行ったり携帯電話に転送してもよいと判断してステップS7で応答語彙を選択し、ステップS8で応答制御を行う。 応答語彙の選択では、本システムが自動的に応答するための対話文を作成し、ステップS8において応答を行うものである。 図5に示したデータベースを用いた場合、時間情報に従った応答文を作り出すことができる。 例えば、深夜に未登録の人から電話があった場合には「今日はもう遅いので明日にしてくれませんか?」などと応答する。

    【0038】ステップS6で登録されている知人でなければ、まったく知らない第三者からの場合であると判断してステップS9で切断処理を行って本フローを終了する。 この切断処理では、留守であることを伝え、回線を切断する。 留守でなければ電話機接続させる。 また、人名を基に敬語を使うなど応対の仕方をかえてもよい。 家族の場合、対話の内容にあわせて家庭内の電子機器の操作を行う。 例えば、伝言を残したければ、留守番電話のように音声及び画像データを保存しておいてもよい。

    【0039】図8は、伝言内容を格納するデータベースの一例を示す図である。 図8に示すデータベースの例では、知人からの電話の内容を要約し、時間情報とともにテキスト情報又は音声情報で蓄えることにした。 図8では、ユーザ名「知人A」が相手先名「家族C」に時間2
    0:03に伝言内容「○○に××で待っています。」という電話内容が蓄えられている。 また、ビデオの録画を行いたければ、対象機器の選定、コマンドの作成等を行い、送出すればよい。 これらのタスクに関する操作は、
    制御部3により行われる。 この制御部3は、図3に示したように接続機器制御手段19と複数のデータベース2
    0から構成されている。 データベース20には、ネットワークに接続されている機器の情報、機器それぞれのコマンド情報、所有者情報などが格納されている。

    【0040】図9は、ネットワーク機器を制御するための動作を示すフローチャートである。 まず、ステップS
    11でユーザが誰であるのかユーザ名を検出する。 このユーザ名を用いてネットワーク機器操作のプライオリティ、使用制限等を検索する。 次いで、ステップS12で制御の対象となる機器の機種名を検出し、ステップS1
    3でその機器を制御できるか否かを判定する。 このステップS13の制御可否判定処理では、例えばテープの入っていないビデオデッキでの録画予約はできないという情報を検出すれば、ユーザにその情報を提示することができる。 また、この検出結果をデータベースに逐次記録しておけば、ユーザとの対話において時間をロスすることなく、ユーザに情報を提示することができる。 ステップS13で制御可能機器でないと判定したときはステップS14の制御不能応答処理に進むが、これについて説明する。

    【0041】図10は、接続機器の稼動状況を格納したデータベースの一例を示す図である。 図10に示す稼動状況データベースは、機器の名称、固有のIPアドレス、稼動状況から構成されている。 例えば、機器の名称「32C-PD1」については、固有のIPアドレス「1.233.2
    51.10」、稼動状況「Power(off)」が格納されている。
    それぞれの機器に制御信号を送信する前に機器の稼動状況を格納したデータベースを検索し、機器の状態を把握する必要がある。 電源が入っていない、又はつながっていないなど使用不可の状態の場合に制御コマンドを送信してもエラーを起こすことは予期できる。 この場合には、図9のステップS14で制御できない機器であることを伝えるための応答文を作成し、出力して本フローを終了する。

    【0042】また、待機状態の場合か稼動状態かによっても処理の手順が異なってくる。 このために稼動状況を格納したデータベースが必要である。 ステップS13で制御可能機器であると判定したときは、ステップS15
    で入力しようとしているコマンドがすでに入力されている情報と競合するか否かを判定する。 この場合、すでに予約状態にあるなどの競合状況を確認の上、制御を行うこととする。 競合を解決する手段の1つとして、別に定めたデータベースに従った優先順位による制御を行ってもよい。 以下、このデータベースによる例について説明する。

    【0043】図11は、接続機器の使用に関する優先度を記載したデータベースの一例を示す図、図12は、接続機器の使用に関する優先度を自動的に変更するルールを記載したデータベースの一例を示す図である。 図11
    に示すデータベースの例では、ユーザごとに時間情報、
    使用可能な機器の名称、制御コマンドリスト及び優先度を格納しておき、状況に応じて優先順位を選択する。 例えば、ユーザ名「A」については、時間20:00−2
    2:00では、機器名「32C-PD1」を制御名「Play」、
    優先度「1.0」が与えられており、ユーザ名「B」については、時間18:00−19:00では、機器名「32C-PD1」を制御名「Play」、優先度「1.0」が与えられている。 この例では、該当ユーザは該当する時間の該当機器については他のユーザよりも優先的に使用することができる。

    【0044】また、図12に示すデータベースの例では、プライオリティを自動的に変動させるよう過去の履歴を用いて優先順位を自動的に変えることができる。 例えば、ユーザ名「A」については、条件「使用頻度X>
    閾値Y」の条件では、優先度Zは0.1減算され(Z-=
    0.1)た変更値となり、前記条件を満たす毎に優先度は変更され、優先順位は自動的に変更されることになる。

    【0045】図11に示すプライオリティデータベースや図12に示すプライオリティ変更ルールデータベースは、ユーザの意向により変動するものであるため、簡単に書き換えられる必要がある。 このためには優先度及び変更ルールを簡単に書き換えられるようデータベースとして管理する必要がある。 先順位の高い制御が予約されていている場合には、凝人化エージェントとの対話の段階で拒絶してもよい。 システムを使用しているユーザ間だけで競合を解消できる場合にはユーザに支援を求める手段を用いてそのユーザ(予約されている制御を指示したユーザ)を呼び出し、支援を求めてもよい。 優先度の高い制御予約を行ったユーザが屋外にいるような場合には、ユーザを呼び出す手段を用いてユーザを呼び出し、
    支援を求めればよい。 呼び出す手段としては明らかに屋外にいるならば携帯電話等を用いるのが一般的である。
    E−Mailを使って支援を求めてもよい。 優先順位が低い場合にも単純に上書きするのではなく、擬人化エージェントが先の予約をしたユーザを呼び出し、上書きされる旨を伝える必要がある。

    【0046】図9に戻って、ステップS15で競合状況あるときは、ステップS17でこれらの競合情報を提示し、ステップS12に戻る。 競合しない場合にはステップS16で制御完了応答を実行し、その結果を出力して本フローを終了する。 この制御完了応答を制御を実行するためには、操作コマンドや送信手順を格納したデータベースを参照し、適切な手順でコマンドを送信する必要がある。 以下、図13及び図14により説明する。

    【0047】図13は、接続機器に送信するコマンドを格納したデータベースの一例を示す図、図14は、接続機器にコマンドを送信する手順を記載したデータベースの一例を示す図である。 例えば、図13に示すように機器ごとに異なる制御コマンドに変換して送出する必要がある。 例えば、機器名(型番)「32C-PD1」については、固有のIPアドレス「1.233.251.10」、制御名「再生」、制御コマンド「Send“Play”)」が格納されている。 送出の方法は有線でもよいし、赤外線での送信でもよい。

    【0048】また、図14のデータベースに示すように複数のコマンドを同時に送信する必要がある場合も存在する。 例えば、電源が入っていない、又は待機状態であるテレビに対して特定チャンネルを表示させるためには“電源を入れ”て、“チャンネルを合わせる”という手順が必要である。 このような処理手順を記録したデータベースも必要である。 この例として、図14では、機器名(型番)「32C-PD1」については、固有のIPアドレス「1.233.251.10」、制御手順「Play:-Power(ON),Chan
    ge(Channel).」が格納されている。

    【0049】また、最近では家庭内においても個人所有の機器が増えているため、ユーザことに機器の使用制限に関する情報を格納したデータベースを設けてもよい。
    操作権限のない機器の操作を排除する手段を設けることにより、例えば火気関連機器については保護者監督のもと以外での使用を制限することができるという利点もある。 さらに、同様の機能をもつ機器が複数ある場合にどちらを使うかの判断にもこの使用制限を使うことができる。 「使っていい」か、「だめ」かだけでなく、条件によっては使ってもよいなどの使用制限を設けてもよい。
    この条件には時間的な要素により場合わけをしてもよい。

    【0050】ネットワーク機器のデバイスドライバーなどのソフトウェアは、頻繁にそのバージョンが変わっているため、ソフトウェアのバージョンを管理する手段、
    現在のソフトウェアよりも新しいバージョンのソフトウェアを見つけた場合に自動的にダウンロードして、インストールする手段を設けることで製品寿命を延ばすことができる。 ソフトウェアをダウンロードするタイミングは、定期的にメーカーのインターネットサイトを検索しに行く、あるいはメーカー側から各家庭に対して擬人化エージェントによる配信を行い、音声対話により自動的にドライバー等のソフトウェアを更新してもよい。

    【0051】さらに、接続しているネットワーク機器が故障した場合の対処方法を記録したデータベースも必要である。 稼動状況を記録したデータベースをユーザが見れば故障かどうかは判断ができるが、常に監視することはできない。 そこで故障診断を行う手段によりシステムが故障と判断した時点で故障発生時対応ルールに従ってユーザ及びメーカーに対して情報を通知する手段により通知することで損害を最小限で防ぐことができる。

    【0052】図15は、故障発生時の対応ルールを格納したデータベースの一例を示す図である。 図15に示す例では、故障検出の時間と機器名に従って対処方法を変えている。 昼間(ここでは10:00〜17:00)に故障が発生した場合には、製造メーカーに故障発生を通知(Call Maker)し、その対処を待てばよい。 通知の方法はE−Mailでもよいし、合成音による音声対話形式でもよい。 夜間(ここでは17:00〜24:00)
    であれば製造メーカーの対応も遅れることが予想されるため、E−Mail等で製造メーカーに連絡をとる(Ma
    il to Maker)とともに、ユーザに対しても故障発生を通知する必要がある。 故障診断の結果を蓄積する手段を設けることにより、故障機器を使うことなく、ユーザの制御命令を実行することができる。

    【0053】接続された機器の操作方法を格納したデータベースを設けることにより、機器を使うユーザを支援することができる。 例えば本実施の形態の制御方法を用いずに機器単独での操作をユーザが試みる場合に使用方法を教示することができる。 教示の方法としては、CG
    映像やビデオ映像、合成音声などを用いることができる。 どのボタンを押したらいいか、わからない場合には合成音声とCG映像を使うとわかりやすい。 操作方法は、インターネットを使ってダウンロードするか、あるいは製品を購入した時点で、CD−ROM等のメディアを使って登録してもよい。 こうして、擬人化エージェントとの音声対話によるホームゲートウェイ1を使うことで、どのような入力方法を用いた場合でも同様の効果を得ることができると同時にインターネットを利用したさまざまなサービスを受けることができる。

    【0054】以上のように、本実施の形態のホームゲートウェイ1は、電話網、インターネット網等の各種ネットワーク、カメラ、マイクロフォン等の複数の入力のうち1系統を対話形式により選択するマルチモーダルインターフェース2と、ネットワークに接続されているネットワーク機器の情報、該機器それぞれのコマンド情報、
    所有者情報などを格納する機器制御用データベース20
    と、前記マルチモーダルインターフェースの出力により前記複数のネットワーク機器のうち少なくとも1つを制御する接続機器制御手段19とからなる制御部3を備え、マルチモーダルインターフェース2は、さらに音情報と意味理解手段14からの意味理解情報に基づいて相槌を打つ、応答タイミングを決定する等の対話を促す情報を生成する対話促進手段16を備えて構成したので、
    ユーザは擬人化エージェントとの対話によりネットワークに接続された機器を統一的に制御することができる。

    【0055】また、対話機能による、認識できない部分のみを聞き返すことによりユーザに不快感を与えることなく認識精度を向上させ、対話を通じて同一ネットワーク上にある機器を操作することができる。 また、意味理解手段14に個人情報、時間情報を持たせることでいろいろな対話応答が実現できる。 接続機器制御手段19に個人情報に関する機器制御用データベース20を接続することで機器の選定、制御セキュリティ等を実現することができる。 また、インターネット等の回線を利用してネットワーク機器のメーカー及びメンテナンス会社より該当機器の保守を行うことができる。

    【0056】また、本実施の形態では、図9の処理において、制御情報に則った操作を行うことが可能かどうかを検証するように制御しているので、不可能な場合には実際に制御信号を発することなくその結果をユーザに提示することが可能であり、不要な通信コストを下げることができる。 また、図9の処理において、競合を解決するように制御したので、複数ユーザで同一システムを共有することが可能であり、共有によって生じる競合を最小限にとどめることができる。

    【0057】また、本実施の形態では、ユーザに支援を求める手段を備えているので、システム自体で解決できない競合の解決をユーザに求めることが可能であり、競合を最小限にとどめることができる。 さらに、ユーザを呼び出す手段を設けているので、競合解消のためにネットワークにログインしていないユーザを呼び出すことが可能であり、ユーザ間の競合をスムーズに解消することができる。

    【0058】また、本実施の形態では、図13及び図1
    4に示すデータベースを用いて、接続された機器に対して故障診断を行う手段とその結果を蓄積する手段とを設けるようにすれば、接続機器に故障が発生した場合でもユーザ及びメーカーに対し情報を通知することが可能であり、安定した運用を実現することができる。 さらに、
    図15に示すデータベースを用いて、接続された機器に搭載されたソフトウェアのバージョンを管理する手段と、最新のモジュールをダウンロードし、インストールする手段を設けるようにすれば、接続機器のソフトウェアのバグを自動的に補正することが可能であり、安定した運用を実現することができる。

    【0059】なお、本発明のマルチモーダルインタフェースを用いたネットワーク機器制御装置は、上述の実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。 例えば、上述したようなプロトコル変換等を行うホームゲートウェイに適用することもできるが、これには限定されず、全ての装置に適用可能である。

    【0060】また、上記実施の形態で説明したマルチモーダルインタフェースへ入力される複数の入力デバイスの種類やマルチモーダルインタフェースにおける認識手段や対話方法、さらには対話形式で制御されるネットワーク機器の数、種類は一例であり、対話促進手段を有するマルチモーダルインタフェースであればどのようなものでもよく、同様な効果を得ることができる。 さらに、
    上記ネットワーク機器制御装置を構成する各回路部等の種類、データベースなどは前述した実施形態に限られない。

    【0061】

    【発明の効果】以上、詳述したように、請求項1に記載の発明によれば、擬人化エージェントとの対話によりネットワークに接続された機器を統一的に制御することができる。 また、問い返し、相槌などの応答をすることが可能であり、その結果スムーズな対話により機器の制御ができる。

    【0062】また、音声の強弱、音の高低の特徴、ユーザの身振り、音声認識の結果のうち少なくとも2つ以上を入力とする対話促進手段を設けているので、人間と同じような応答を実現することが可能であり、その結果スムーズな対話を実現することができる。 また、ユーザ別のデータベース手段を設けているので、アクセス方法、
    時間情報、ユーザ名などをキーとして異なった応答を生成することが可能であり、人間と話すようにストレスを感じない対話を実現することができる。

    【0063】さらに、接続された機器の操作方法を格納したデータベースとCG映像、ビデオ映像、合成音声のうち2つ以上を使って教示する手段を設けているので、
    使用方法がわからないユーザにその方法を教示することが可能であり、新しい機器を接続してもすぐに使えるようになる。

    【0064】請求項2に記載の発明によれば、例えば同一のネットワーク上に接続された機器の操作コマンド及び送信手順を格納したデータベース手段を設けているので、処理手順を考えることなく接続機器を制御すること可能であり、音声対話によりネットワーク機器を制御することができる。 請求項3に記載の発明によれば、機器の使用制限に関する情報を格納したデータベース手段を設けているので、操作権限のない機器の操作を排除することが可能であり、安全性を確保することができる。

    【図面の簡単な説明】

    【図1】本発明の実施の形態のネットワーク機器制御装置の構成を示すブロック図である。

    【図2】本発明の実施の形態のネットワーク機器制御装置のホームゲートウェイを構成するマルチモーダルインタフェースの構成を示す図である。

    【図3】本実施の形態のネットワーク機器制御装置のホームゲートウェイの制御部の構成を示す図である。

    【図4】本実施の形態のネットワーク機器制御装置の対話の応答パターンを変える動作を示すフローチャートである。

    【図5】本実施の形態のネットワーク機器制御装置の対話応答パターンを記録したデータベースの一例を示す図である。

    【図6】本実施の形態のネットワーク機器制御装置の交信履歴を格納するデータベースの一例を示す図である。

    【図7】本実施の形態のネットワーク機器制御装置のユーザ認証に関するデータベースの一例を示す図である。

    【図8】本実施の形態のネットワーク機器制御装置の伝言内容を格納するデータベースの一例を示す図である。

    【図9】本実施の形態のネットワーク機器制御装置のネットワーク機器を制御するための動作を示すフローチャートである。

    【図10】本実施の形態のネットワーク機器制御装置の接続機器の稼動状況を格納したデータベースの一例を示す図である。

    【図11】本実施の形態のネットワーク機器制御装置の接続機器の使用に関する優先度を記載したデータベースの一例を示す図である。

    【図12】本実施の形態のネットワーク機器制御装置の接続機器の使用に関する優先度を自動的に変更するルールを記載したデータベースの一例を示す図である。

    【図13】本実施の形態のネットワーク機器制御装置の接続機器に送信するコマンドを格納したデータベースの一例を示す図である。

    【図14】本実施の形態のネットワーク機器制御装置の接続機器にコマンドを送信する手順を記載したデータベースの一例を示す図である。

    【図15】本実施の形態のネットワーク機器制御装置の故障発生時の対応ルールを格納したデータベースの一例を示す図である。

    【符号の説明】

    1 ホームゲートウェイ 2 マルチモーダルインタフェース 3 制御部 4 マイクロフォン 5 カメラ 6 インターネット網 7 アナログ電話網 8 ISDN網 9 接続機器 11 画像認識手段 12 音声認識手段 13 音情報獲得手段 14 意味理解手段 15 対話用データベース(意味理解用データベース手段) 16 対話促進手段 17 音声合成手段 18 画像生成手段 19 接続機器制御手段 20 機器制御用データベース(機器制御用データベース手段)

    ───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. 7識別記号 FI テーマコート゛(参考) G06F 3/16 330 G06F 3/16 330K 5K033 330C 5K048 13/00 357 13/00 357A 5K101 G10L 13/00 H04M 11/00 301 9A001 15/18 H04Q 9/00 301E 15/00 321E H04L 12/28 331A 12/24 G10L 3/00 Q 12/26 R H04M 11/00 301 537Z H04Q 9/00 301 551A 321 H04L 11/00 310Z 331 11/08 Fターム(参考) 5B089 GA31 GB08 JB03 JB05 KA01 KC44 KC53 KC54 KC58 KH15 KH16 5D015 AA05 KK02 LL06 5D045 AB26 5E501 AA13 AC15 AC25 AC42 BA05 CA08 CB15 CC11 EA21 FA14 FA32 FA43 5K030 GA15 GA17 HA08 HB01 HB02 HC01 HD03 JL09 KA07 KA20 LD20 LE11 MB09 5K033 AA05 BA08 BA14 DA06 DB18 5K048 AA04 BA02 BA12 BA13 CA08 DA02 DA05 DC04 DC07 EA11 EB14 EB15 FB10 FB12 FC01 HA01 HA02 HA05 HA07 5K101 KK11 LL01 LL03 LL05 NN06 NN08 NN16 NN21 NN34 NN37 PP03 TT06 UU19 9A001 BB04 CC07 DD11 HH17 HH18 HH22 HH28 JJ01 JJ12 JJ25 KK54 LL03

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈