首页 / 专利库 / 电脑图像 / 化身 / Three-dimensional virtual world system

Three-dimensional virtual world system

阅读:66发布:2021-12-30

专利汇可以提供Three-dimensional virtual world system专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a three-dimensional virtual world system capable of reducing the loads of a network, simultaneously controlling sound qualities for respective users and allowing many users to make voice conversations by converting voice data generated by the user to character information, adding the identification information of the user, transferring the data between computers and converting the character information to the voice data again.
SOLUTION: Voice recognition mechanisms 6-1 and 6-2 for converting voice data to character information by a voice recognition processing, identification information setting mechanisms 4-1 and 4-2 for setting the identification information of a speaking user, message generation mechanisms 7-1 and 7-2 for generating a message from the character information and the identification information, information sharing mechanisms 3-1 and 3-2 for sharing the message between the respective computers, voice synthesis mechanisms 9-1 and 9-2 for synthesizing voices from the character information included in the message generated by the other computer and sound quality control mechanisms 10-1 and 10-2 for controlling the sound quality based on the identification information included in the message, are provided so that the voice data are transferred as character information.
COPYRIGHT: (C)1999,JPO,下面是Three-dimensional virtual world system专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 ネットワークで接続された複数の計算機間で仮想世界の情報を共有し、各計算機の利用者が操作する化身の視点からの視覚情報を各利用者に提供する3
    次元仮想世界システムにおいて:利用者が発する音声を入力する音声入力手段と、 音声を認識し文字情報に変換する音声認識手段と、 発話した利用者の識別情報を設定する識別情報設定手段と、 上記文字情報と上記識別情報とからメッセージを生成するメッセージ生成手段と、 上記メッセージを各計算機間で共有する情報共有手段と、 他の計算機により生成されたメッセージに含まれる文字情報から音声を合成する音声合成手段と、 上記メッセージに含まれる識別情報に基づいて音質を制御する音質制御手段と、 上記音声合成手段により合成された音声を出力する音声出力手段とを備えることを特徴とする3次元仮想世界システム。
  • 【請求項2】 上記音声合成手段は、 上記メッセージに含まれる識別情報から特定される他の計算機上で操作される化身と、計算機の利用者自身が操作する化身との相対位置に基づいて、音声データの音質、音量を制御する3次元音声制御手段を備えることを特徴とする請求項1記載の3次元仮想世界システム。
  • 【請求項3】 計算機の利用者の音声が到達する範囲を設定する到達範囲設定手段と、 上記メッセージに含まれる到達範囲情報に基づいて、計算機の利用者自身が操作する化身が到達範囲に含まれるかどうかを判定する到達範囲判定手段と、をさらに備え、 上記到達範囲判定手段により到達範囲に含まれると判定される場合には、音声合成処理を行い、到達範囲に含まれないと判定される場合には、音声合成処理を中止することを特徴とする請求項1記載の3次元仮想世界システム。
  • 【請求項4】 上記音声認識手段は、計算機の利用者の音声の抑揚を認識する抑揚認識手段を備え、 上記音声合成手段は、上記メッセージに含まれる抑揚情報に基づいて音声データの音質、音量を制御する抑揚制御手段を備えることを特徴とする請求項1記載の3次元仮想世界システム。
  • 【請求項5】 システム全体で標準とする言語を設定する標準言語設定手段と、 計算機の利用者が使用する言語を設定する言語設定手段と、 上記音声認識機構により変換された文字情報を標準言語に翻訳する第1の翻訳手段と、 他の計算機により生成されたメッセージに含まれる文字情報を上記言語設定手段により設定された利用者の使用する言語に翻訳する第2の翻訳手段と、をさらに備えることを特徴とする請求項1記載の3次元仮想世界システム。
  • 【請求項6】 計算機の利用者の発話に応じて、利用者の操作する化身の3次元画像を制御する化身画像制御手段をさらに備えることを特徴とする請求項1記載の3次元仮想世界システム。
  • 【請求項7】 他の計算機により生成されたメッセージをログとして保存するログ書込手段と、 上記ログ書込手段により保存されたログを読み出し、上記音声合成手段にメッセージを送ることによりログを再生するログ読出機構と、をさらに備えることを特徴とする請求項1記載の3次元仮想世界システム。
  • 【請求項8】 音声の再生を開始する時刻を設定する再生時刻設定手段と、 他の計算機により生成されたメッセージに含まれる時刻情報に基づいて音声合成処理を開始するタイマを設定するタイマ設定手段とをさらに備えることを特徴とする請求項1記載の3次元仮想世界システム。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】本発明は、ネットワークに接続された複数の計算機間で3次元仮想世界の情報を共有することにより実現される3次元仮想世界システムに関する。

    【0002】

    【従来の技術】本発明に関する従来技術としては、例えば、特開平7−56497号公報の音声仮想定位システムが提案されている。 図16は、特開平7−56497
    号公報に記載されている音声仮想定位システムを示すもので、図において、11は操作者が仮想する仮想空間を形成するための仮想空間シミュレータ、12は仮想空間シミュレータ11が複数設けられたシミュレータ群、1
    3は操作者の発する音声が入されるマイク(音声入力手段)、14は仮想空間シミュレータ11同士のデータ伝送を行う通信手段、15はデータ伝送における所定単位送信時間毎に、仮想空間の位置データ及び状態データと共に音声に基づく所定単位送信時間毎の音声データを送信する音声送出手段、16はホストコンピュータである。

    【0003】次に、上記の従来例の動作について説明する。 音声仮想定位システムは、シミュレータ群12を構成する各仮想空間シミュレータ11毎に共通の仮想空間を形成しており、各仮想空間シミュレータ11を操作するそれぞれの操作者が同一の仮想空間を共有することができる。 マイク13は、仮想空間シミュレータ11を操作する操作者の発する音声を採取する。 採取された音声は、所定単位送信時間毎の音声データとして分割される。 音声送出手段15は、所定単位送信時間毎に仮想空間の位置データ及び状態データと共に、分割された音声データを送信する。 これにより、音声データを実時間で採取して、実時間で再現することができる。 このようにして、操作者の発した音声は、仮想空間上のしかるべき位置に定位させた上で出力される。

    【0004】

    【発明が解決しようとする課題】しかしながら、このシステムでは音声データをそのままの形で計算機間でデータ転送しているため、ネットワークを流れるデータ量が多く、多数の利用者が参加する場合に、ネットワークの過負荷を引き起こしてしまうという問題があった。

    【0005】また、音声データは計算機が言語処理を行うには適していないため、他の言語へ翻訳することが困難であるという問題があった。

    【0006】加えて、音声データはデータ量が多いため、音声データを処理の経時的な記録を行うためのログとして保存するためには、大容量の記憶装置が必要であるという問題があった。

    【0007】本発明は上記課題を解決するためになされたもので、音声データを音声認識処理により文字情報に変換した後、計算機間でデータ転送を行い、音声合成処理により再び文字情報から音声データに変換することにより、ネットワークの負荷を低減し、多数の利用者が音声対話を行う3次元仮想世界システムを提供することにある。

    【0008】

    【課題を解決するための手段】第1の発明の次元仮想世界システムは、ネットワークで接続された複数の計算機間で仮想世界の情報を共有し、各計算機の利用者が操作する化身の視点からの視覚情報を各利用者に提供する3
    次元仮想世界システムにおいて、利用者の発する音声を入力する音声入力手段と、音声を認識し文字情報に変換する音声認識手段と、発話した利用者の識別情報を設定する識別情報設定手段と、上記文字情報と上記識別情報とからメッセージを生成するメッセージ生成手段と、上記メッセージを各計算機間で共有する情報共有手段と、
    他の計算機により生成されたメッセージに含まれる文字情報から音声を合成する音声合成手段と、上記メッセージに含まれる識別情報に基づいて音質を制御する音質制御手段と、上記音声合成手段により合成された音声を出力する音声出力手段を備えるようにしたものである。

    【0009】第2の発明は第1の発明の3次元仮想世界システムにおいて、上記音声合成手段は上記メッセージに含まれる識別情報から特定される他の計算機上で操作される化身と、計算機の利用者自身が操作する化身との相対位置に基づいて、音声データの音質、音量を制御する3次元音声制御手段を備えるようにしたものである。

    【0010】第3の発明は第1の発明の3次元仮想世界システムにおいて、計算機の利用者の音声が到達する範囲を設定する到達範囲設定手段と、上記メッセージに含まれる到達範囲情報に基づいて、計算機の利用者自身が操作する化身が到達範囲に含まれるかどうかを判定する到達範囲判定手段とを備え、上記到達範囲判定手段により到達範囲に含まれると判定される場合には、音声合成処理を行い、到達範囲に含まれないと判定される場合には、音声合成処理を中止するようにしたものである。

    【0011】第4の発明は第1の発明の3次元仮想世界システムにおいて、上記音声認識手段は計算機の利用者の音声の抑揚を認識する抑揚認識手段を備え、上記音声合成手段は上記メッセージに含まれる抑揚情報に基づいて音声データの音質、音量を制御する抑揚制御手段を備えるようにしたものである。

    【0012】第5の発明は第1の発明の3次元仮想世界システムにおいて、システム全体で標準とする言語を設定する標準言語設定手段と、計算機の利用者が使用する言語を設定する言語設定手段と、上記音声認識機構により変換された文字情報を標準言語に翻訳する第1の翻訳手段と、他の計算機により生成されたメッセージに含まれる文字情報を上記言語設定手段により設定された利用者の使用する言語に翻訳する第2の翻訳手段を備えるようにしたものである。

    【0013】第6の発明は第1の発明の3次元仮想世界システムにおいて、計算機の利用者の発話に応じて、利用者の操作する化身の3次元画像を制御する化身画像制御手段を備えるようにしたものである。

    【0014】第7の発明は第1の発明の3次元仮想世界システムにおいて、他の計算機により生成されたメッセージをログとして保存するログ書込手段と、上記ログ書込手段により保存されたログを読み出し、上記音声合成手段にメッセージを送ることによりログを再生するログ読出機構を備えるようにしたものである。

    【0015】第8の発明は第1の発明の3次元仮想世界システムにおいて、音声の再生を開始する時刻を設定する再生時刻設定手段と、他の計算機により生成されたメッセージに含まれる時刻情報に基づいて音声合成処理を開始するタイマを設定するタイマ設定手段を備えるようにしたものである。

    【0016】

    【発明の実施の形態】実施の形態1. 本発明の実施の形態1の3次元仮想世界システムについて、図1乃至図4
    に基づいて説明する。 図1は本発明の実施の形態1の3
    次元仮想世界システムのシステム構成を示すブロック図である。 図2は、図1のメッセージ生成機構7−1が生成するメッセージの例を示す図である。 図2のメッセージは、利用者Aの識別情報および利用者Aの発声した音声が上記音声認識機構6−1により変換された文字情報、たとえば、「Bさん、こんにちは。」を含み、このメッセージはネットワーク12を介して計算機1−2へ送信される。 図3は、図1の計算機1−1の利用者Aが操作する自己の化身2−1の視点からみた仮想世界の視覚情報の例を示す図である。 図4は、図1の利用者Aが操作する自己の化身2−1の周辺の仮想世界の例を示す俯瞰図であり、たとえば、利用者Bがその周辺に見える。

    【0017】図1において、1−1は利用者Aが利用する計算機、1−2は他の利用者Bが利用する計算機、2
    −1は計算機1−1の利用者Aが操作する仮想世界内の化身、2−2は計算機1−2の利用者Bが操作する仮想世界内の化身、3−1は複数の計算機間で共有される仮想世界内に化身2−1を生成し、計算機1−1の利用者Aの入力を受けて化身2−1を移動させ、化身2−1の視点からの視覚情報を利用者Bに提供するアプリケーションプログラムである。

    【0018】3−2は複数の計算機間で共有される仮想世界内に化身2−2を生成し、計算機1−2の利用者B
    の入力を受けて化身2−2を移動させ、化身2−2の視点からの視覚情報を利用者Aに提供するアプリケーションプログラムである。

    【0019】4−1は計算機1−1の利用者Aの入力を受けて利用者Aの識別情報を設定する識別情報設定機構、4−2は計算機1−2の利用者Bの入力を受けて利用者Bの識別情報を設定する識別情報設定機構、5−1
    は計算機1−1の利用者Aの音声を計算機1−1に入力する音声入力装置、5−2は計算機1−2の利用者Bの音声を計算機1−2に入力する音声入力装置、6−1は計算機1−1に入力された音声に対して音声認識処理を行い、文字情報に変換する音声認識機構、6−2は計算機1−2に入力された音声に対して音声認識処理を行い、文字情報に変換する音声認識機構である。

    【0020】7−1は音声認識機構6−1により変換された文字情報と、識別情報設定機4−1により設定された識別情報とからメッセージを生成するメッセージ生成機構である。 7−2は音声認識機構6−2により変換された文字情報と、識別情報設定機4−2により設定された識別情報とからメッセージを生成するメッセージ生成機構である。

    【0021】8−1は他の計算機1−2により生成されたメッセージを検知するメッセージ検知機構、8−2は他の計算機1−1により生成されたメッセージを検知するメッセージ検知機構、9−1はメッセージに含まれる文字情報から音声を合成する音声合成機構、9−2はメッセージに含まれる文字情報から音声を合成する音声合成機構、10−1はメッセージに含まれる識別情報に基づいて音質を制御する音質制御機構、10−2はメッセージに含まれる識別情報に基づいて音質を制御する音質制御機構、11−1は音声を出力する音声出力装置、1
    1−2は音声を出力する音声出力装置、12は複数の計算機1(1−1および1−2等)が接続されるネットワーク、13−1および13−2はネットワーク12に接続された複数の計算機間で情報を交換することにより3
    次元仮想世界を共有する情報共有機構である。

    【0022】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図1に基づいてその動作を説明する。

    【0023】まず、計算機1−1の利用者Aが操作する化身2−1を選択すると、識別情報設定機構4−1は利用者Aの識別情報を識別情報設定機構4−1に設定する。 計算機1−1の利用者Aが音声を発すると、利用者Aの音声は音声入力装置5−1によって音声データとして計算機1−1に入力される。 音声認識機構6−1は、
    音声入力装置5−1から入力された音声データに対して音声認識処理を行い、音声データを文字情報に変換する。 メッセージ生成機構7−1は、上記音声認識機構6
    −1により変換された文字情報と上記識別情報設定機構4−1に設定された利用者の識別情報とからメッセージを生成する。 上記メッセージ生成機構7−1により生成されたメッセージは、情報共有機構13−1およびネットワーク12を介して接続された他の計算機に送信される。

    【0024】一方、計算機1−2においては、計算機1
    −1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 音声合成機構9−2は、メッセージ検知機構8−2から受けたメッセージに含まれる文字情報から音声の合成処理を行い、メッセージを音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者Aの識別情報に基づいて上記音声合成機構9−2により変換された音声データの音質を変更する。 音声出力装置11−2は上記音声合成機構9−2により変換された音声データを音声として出力し、計算機1−2の利用者Bは計算機1
    −1の利用者Aの音声を聞くことができる。

    【0025】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0026】実施の形態2. 次に、本発明の実施の形態2の3次元仮想世界システムについて、図5および図6
    に基づいて説明する。 図5は本発明の実施の形態2の3
    次元仮想世界システムのシステム構成を示すブロック図である。 図6は、図5のメッセージ生成機構7−1が生成するメッセージの例を示す図である。 図6のメッセージは、利用者Aの識別情報、利用者Aの発声した音声が上記音声認識機構6−1により変換された文字情報、たとえば、「Bさん、こんにちは。」、および化身識別情報、たとえば、利用者Aの化身番号「化身001」を含み、このメッセージはネットワーク12を介して計算機1−2へ送信される。

    【0027】図5において、14−1は他の計算機1−
    2により生成されたメッセージに含まれる識別情報から特定される化身2の位置情報と、計算機1−1の利用者Aの化身2−1の位置情報から、両化身の相対位置を算出し、相対位置に基づいて、音声データの音質、音量を制御する3次元音声制御機構である。 14−2は他の計算機1−1により生成されたメッセージに含まれる識別情報から特定される化身2の位置情報と、計算機1−2
    の利用者Bの化身2−2の位置情報から、両化身の相対位置を算出し、相対位置に基づいて、音声データの音質、音量を制御する3次元音声制御機構である。 実施の形態2においては、実施の形態1のシステム構成に加え、上記の3次元音声制御機構14(14−1および1
    4−2)を追加したことに特徴がある。 なお、図1と図5中で用いられる同一の番号は同一の構成要素を表わすので説明を省略する。

    【0028】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図5に基づいてその動作を説明する。

    【0029】まず、計算機1−1の利用者Aが操作する化身2−1を選択すると、識別情報設定機構4−1は利用者Aの識別情報を識別情報設定機構4−1に設定する。 計算機1−1の利用者Aが音声を発すると、利用者Aの音声は音声入力装置5−1によって音声データとして計算機1−1に入力される。 音声認識機構6−1は、
    音声入力装置5−1から入力された音声データに対して音声認識処理を行い、音声データを文字情報に変換する。 メッセージ生成機構7−1は上記音声認識機構6−
    1により変換された文字情報と、上記識別情報設定機構4−1により設定された利用者Aの識別情報と化身2−
    1の識別情報とからメッセージを生成する。 上記メッセージ生成機構により生成されたメッセージは情報共有機構13−1およびネットワーク12を介して接続された他の計算機に送信される。

    【0030】一方、計算機1−2においては、計算機1
    −1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 音声合成機構9−2は、メッセージ検知機構8−2から受けたメッセージに含まれる文字情報から音声の合成処理を行い、メッセージを音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者の識別情報に基づいて上記音声合成機構により変換された音声データの音質を変更する。

    【0031】さらに、3次元音声制御機構14−2はメッセージに含まれる化身2−1の識別情報から特定される化身2−1の位置情報と、計算機1−2の利用者の化身2−2の位置情報から、両化身の相対位置を算出し、
    相対位置に基づいて、音声データの音質、音量を制御する。 音声出力装置11−2は上記音声合成機構9−2により変換された音声データを音声として出力し、計算機1−2の利用者Bは計算機1−1の利用者Aの音声を聞くことができる。

    【0032】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0033】実施の形態3. 次に、本発明の実施の形態3の3次元仮想世界システムについて、図7および図8
    に基づいて説明する。 図7は本発明の実施の形態3の3
    次元仮想世界システムのシステム構成を示すブロック図である。 図8は、図7のメッセージ生成機構7−1が生成するメッセージの例を示す図である。 図8のメッセージは、利用者Aの識別情報、利用者Aの発声した音声が上記音声認識機構6−1により変換された文字情報、たとえば、「Bさん、こんにちは。」、および到達範囲情報、たとえば、「位置(5,5,0)から距離10の範囲」を含み、このメッセージはネットワーク12を介して計算機1−2へ送信される。

    【0034】図7において、15−1は仮想世界において計算機1−1の利用者Aの音声が到達する範囲を設定する到達範囲設定機構、15−2は仮想世界において計算機1−2の利用者Bの音声が到達する範囲を設定する到達範囲設定機構、16−1は他の計算機1−2により生成されたメッセージに含まれる到達範囲情報に基づいて計算機1−1の利用者Aの化身2−1が到達範囲に含まれるかどうかを判定する到達範囲判定機構、16−2
    は他の計算機1−1により生成されたメッセージに含まれる到達範囲情報に基づいて計算機1−2の利用者Bの化身2−2が到達範囲に含まれるかどうかを判定する到達範囲判定機構である。 実施の形態3においては、実施の形態1のシステム構成に加え、上記の到達範囲設定機構15(15−1および15−2)および到達範囲判定機構16(16−1および16−2)を追加したことに特徴がある。 なお、図1と図7中で用いられる同一の番号は同一の構成要素を表わすので説明を省略する。

    【0035】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図7に基づいてその動作を説明する。

    【0036】まず、計算機1−1の利用者Aが操作する化身2−1を選択すると、識別情報設定機構4−1は利用者Aの識別情報を識別情報設定機構4−1に設定する。 また、計算機1−1の利用者Aは到達範囲設定手段15−1に仮想世界において計算機1−1の利用者A自身の音声が到達する範囲を設定する。 計算機1−1の利用者Aが音声を発すると、音声入力装置5−1により音声データが計算機1−1に入力される。 音声認識機構6
    −1は入力された音声データに対して音声認識処理を行い、音声データを文字情報に変換する。 メッセージ生成機構7−1は上記音声認識機構6−1により変換された文字情報と、上記識別情報設定機構4−1により設定された利用者Aの識別情報と、上記到達範囲設定機構15
    −1により設定された到達範囲情報とからメッセージを生成する。 上記メッセージ生成機構7−1により生成されたメッセージは情報共有機構13−1およびネットワーク12を介して接続された他の計算機に送信される。

    【0037】一方、計算機1−2においては、計算機1
    −1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 メッセージ検知機構8−2がメッセージを検知すると、到達範囲判定機構16−2は、メッセージに含まれる到達範囲情報に基づいて、計算機1−2の利用者Bの化身2
    −2が到達範囲に含まれるかどうかの判定を行い、到達範囲に含まれないと判定した場合には、メッセージの音声合成処理は中止し、音声の出力は行わない。 到達範囲に含まれると判定した場合には、音声合成機構9−2にメッセージを出力する。 音声合成機構9−2は受けたメッセージに含まれる文字情報から音声の合成処理を行い、音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者Aの識別情報に基づいて上記音声合成機構9−2により変換された音声データの音質を変更する。 音声出力装置11−2は上記音声合成機構9−2により変換された音声データを出力し、計算機1
    −2の利用者Bは計算機1−1の利用者Aの音声を聞くことができる。

    【0038】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0039】実施の形態4. 次に、本発明の実施の形態4の3次元仮想世界システムについて、図9および図1
    0に基づいて説明する。 図9は本発明の実施の形態4の3次元仮想世界システムのシステム構成を示すブロック図である。 図10は、図9のメッセージ生成機構7−1
    が生成するメッセージの例を示す図である。 図10のメッセージは、利用者Aの識別情報、利用者Aの発声した音声が上記音声認識機構6−1により変換された文字情報、たとえば、「Bさん、元気ですか?」、および抑揚情報、たとえば、「1(0:平調,1:上昇調,3:下降調)」を含み、このメッセージはネットワーク12を介して計算機1−2へ送信される。

    【0040】図9において、17−1は計算機1−1の利用者Aの音声の抑揚を認識する抑揚認識機構、17−
    2は計算機1−2の利用者Bの音声の抑揚を認識する抑揚認識機構、18−1は他の計算機1−2により生成されたメッセージに含まれる抑揚情報に基づいて音声データの音質、音量を制御する抑揚制御機構である。 18−
    2は他の計算機1−1により生成されたメッセージに含まれる抑揚情報に基づいて音声データの音質、音量を制御する抑揚制御機構である。 実施の形態1のシステム構成に加え、上記の抑揚認識機構17(17−1および1
    7−2)および抑揚制御機構18(18−1および18
    −2)を追加したことに特徴がある。 なお、図1と図9
    中で用いられる同一の番号は同一の構成要素を表わすので説明を省略する。

    【0041】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図9に基づいてその動作を説明する。

    【0042】まず、計算機1−1の利用者Aが操作する化身2−1を選択すると、識別情報設定機構4−1は利用者Aの識別情報を識別情報設定機構4−1に設定する。 計算機1−1の利用者Aが音声を発すると、音声入力装置5−1により音声データが計算機1−1に入力される。 音声認識機構6−1は入力された音声データに対して音声認識処理を行い、音声データを文字情報に変換する。 また、抑揚認識機構17−1は入力された音声データに対して抑揚認識処理を行い、抑揚情報に変換する。 メッセージ生成機構7−1は上記音声認識機構6−
    1により変換された文字情報と、上記識別情報設定機構4−1により設定された利用者Aの識別情報と、上記抑揚認識機構17−1により変換された抑揚情報とからメッセージを生成する。 上記メッセージ生成機構により生成されたメッセージは情報共有機構13−1およびネットワーク12を介して接続された他の計算機に送信される。

    【0043】一方、計算機1−2においては、計算機1
    −1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 メッセージ検知機構8−2がメッセージを検知すると、音声合成機構9−2はメッセージに含まれる文字情報から音声の合成処理を行い、音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者Aの識別情報に基づいて上記音声合成機構9−2により変換された音声データの音質を変更する。 さらに、抑揚制御機構18−2はメッセージに含まれる抑揚情報に基づいて音声データの音質、音量を制御する。 音声出力装置11−
    2は上記音声合成機構により変換された音声データを出力し、計算機1−2の利用者Bは計算機1−1の利用者Aの音声を聞くことができる。

    【0044】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0045】実施の形態5. 次に、本発明の実施の形態5の3次元仮想世界システムについて、図11に基づいて説明する。 図11は本発明の実施の形態5の3次元仮想世界システムのシステム構成を示すブロック図である。

    【0046】図11において、19(19−1および1
    9−2)はシステム全体で標準とする言語を設定する標準言語設定機構、20−1は計算機1−1の利用者Aが使用する言語を設定する言語設定機構、20−2は計算機1−2の利用者Bが使用する言語を設定する言語設定機構、21−1は音声認識機構6−1により変換された文字情報を標準言語に翻訳する翻訳機構、21−2は音声認識機構6−2により変換された文字情報を標準言語に翻訳する翻訳機構、27−1は他の計算機1−2により生成されたメッセージに含まれる文字情報を言語設定機構20−1により設定された利用者Aの使用する言語に翻訳する翻訳機構である。 27−2は他の計算機1−
    1により生成されたメッセージに含まれる文字情報を言語設定機構20−2により設定された利用者Bの使用する言語に翻訳する翻訳機構である。 実施の形態5においては、実施の形態1のシステム構成に加え、上記の標準言語設定機構19(19−1および19−2)および言語設定機構20(20−1および20−2)、第1の翻訳機構21(21−1および21−2)、および第2の翻訳機構27(27−1および27−2)を追加したことに特徴がある。 なお、図1と図11中で用いられる同一の番号は同一の構成要素を表わすので説明を省略する。

    【0047】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図11に基づいてその動作を説明する。

    【0048】まず、システムの起動時に標準言語設定機構19−1によりシステム全体で標準とする言語を設定する。 次に、計算機1−1の利用者Aが操作する化身2
    −1を選択すると、識別情報設定機構4−1は利用者A
    の識別情報を識別情報設定機構4−1に設定する。 また、計算機1−1の利用者Aは言語設定機構20−1により利用者Aの使用する言語を設定する。 同様に、計算機1−2の利用者Bは言語設定機構20−2により利用者Bが使用する言語を設定する。 計算機1−1の利用者Aが音声を発すると、音声入力装置5−1により音声データが計算機1−1に入力される。 音声認識機構6−1
    は入力された音声データに対して音声認識処理を行い、
    音声データを文字情報に変換する。 さらに、翻訳機構2
    1−1は上記標準言語設定機構19−1により設定された標準言語と、上記言語設定機構20−1により設定された計算機1−1の利用者Aの使用言語とが異なる場合、上記音声認識機構6−1により変換された文字情報を標準言語に翻訳する。 メッセージ生成機構7−1は上記翻訳機構21−1により翻訳された文字情報と、上記識別情報設定機構4−1により設定された利用者Aの識別情報とからメッセージを生成する。 上記メッセージ生成機構により生成されたメッセージは情報共有機構13
    −1およびネットワーク12を介して接続された他の計算機に送信される。

    【0049】一方、計算機1−2において、計算機1−
    1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 メッセージ検知機構8−2がメッセージを検知すると、翻訳機構27−2は上記標準言語設定機構19−2により設定された標準言語と、上記言語設定機構20−2により設定された計算機1−2の利用者Bの使用言語とが異なる場合、メッセージに含まれる文字情報を計算機1−
    2の利用者Bの使用言語に翻訳する。 音声合成機構9−
    2は上記翻訳機構27−2により翻訳された文字情報から音声の合成処理を行い、音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者Aの識別情報に基づいて上記音声合成機構9−2により変換された音声データの音質を変更する。 音声出力装置11−
    2は上記音声合成機構により変換された音声データを出力し、計算機1−2の利用者Bは計算機1−1の利用者Aの音声を聞くことができる。

    【0050】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0051】実施の形態6. 次に、本発明の実施の形態6の3次元仮想世界システムについて、図12に基づいて説明する。 図12は本発明の実施の形態6の3次元仮想世界システムのシステム構成を示すブロック図である。

    【0052】図12において、22−1は計算機1−1
    の利用者Aの発話に応じて化身2−1の3次元画像を制御する化身画像制御機構である。 22−2は計算機1−
    2の利用者Bの発話に応じて化身2−2の3次元画像を制御する化身画像制御機構である。 実施の形態6においては、実施の形態1のシステム構成に加え、上記の化身画像制御機構22(22−1および22−2)を追加したことに特徴がある。 なお、図1と図12中で用いられる同一の番号は同一の構成要素を表わすので説明を省略する。

    【0053】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図12に基づいてその動作を説明する。

    【0054】まず、計算機1−1の利用者Aが操作する化身2−1を選択すると、識別情報設定機構4−1は利用者Aの識別情報を識別情報設定機構4−1に設定する。 計算機1−1の利用者Aが音声を発すると、音声入力装置5−1により音声データが計算機1−1に入力される。 音声認識機構6−1は入力された音声データに対して音声認識処理を行い、音声データを文字情報に変換する。 メッセージ生成機構7−1は、上記音声認識機構6−1により変換された文字情報と、上記識別情報設定機構4−1により設定された利用者Aの識別情報とからメッセージを生成する。 上記メッセージ生成機構7−1
    により生成されたメッセージは情報共有機構13によりネットワーク12に接続された各計算機間で共有される。 さらに、化身画像制御機構22−1は上記音声認識機構6−1により変換された文字情報の長さに基づいて発話の長さを算出し、算出された発話時間中、計算機1
    −1の利用者Aの化身2−1の画像を制御し、化身2−
    1の口元を動かす。

    【0055】一方、計算機1−2において、計算機1−
    1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 メッセージ検知機構8−2がメッセージを検知すると、音声合成機構9−2はメッセージに含まれる文字情報から音声の合成処理を行い、音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者Aの識別情報に基づいて上記音声合成機構により変換された音声データの音質を変更する。 音声出力装置11−2は上記音声合成機構9−2により変換された音声データを出力し、計算機1−2の利用者Bは計算機1−1の利用者A
    の音声を聞くことができる。

    【0056】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0057】実施の形態7. 次に、本発明の実施の形態7の3次元仮想世界システムについて、図13に基づいて説明する。 図13は本発明の実施の形態7の3次元仮想世界システムのシステム構成を示すブロック図である。

    【0058】図13において、23−1は他の計算機1
    −2により生成されたメッセージをログとして保存するログ書込機構、23−2は他の計算機1−1により生成されたメッセージをログとして保存するログ書込機構、
    24−1はログ書込機構23−1により保存されたログを読み出し、音声合成機構9−1にメッセージを送るログ読出機構24、24−2はログ書込機構23−2により保存されたログを読み出し、音声合成機構9−2にメッセージを送るログ読出機構である。 実施の形態7においては、実施の形態1のシステム構成に加え、上記のログ書込機構23(23−1および23−2)およびログ読出機構24(24−1および24−2)を追加したことに特徴がある。 なお、図1と図13中で用いられる同一の番号は同一の構成要素を表わすので説明を省略する。

    【0059】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図13に基づいてその動作を説明する。

    【0060】まず、計算機1−1の利用者Aが操作する化身2−1を選択すると、識別情報設定機構4−1は利用者Aの識別情報を識別情報設定機構4−1に設定する。 計算機1−1の利用者Aが音声を発すると、音声入力装置5−1により音声データが計算機1−1に入力される。 音声認識機構6−1は入力された音声データに対して音声認識処理を行い、音声データを文字情報に変換する。 メッセージ生成機構7−1は上記音声認識機構6
    −1により変換された文字情報と、上記識別情報設定機構4−1により設定された利用者Aの識別情報とからメッセージを生成する。 上記メッセージ生成機構7−1により生成されたメッセージは情報共有機構13−1およびネットワーク12を介して接続された他の計算機に送信される。

    【0061】一方、計算機1−2においては、計算機1
    −1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 メッセージ検知機構8−2がメッセージを検知すると、ログ書込機構23−2はメッセージをログとして保存する。 また、音声合成機構9−2はメッセージに含まれる文字情報から音声の合成処理を行い、音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者Aの識別情報に基づいて上記音声合成機構により変換された音声データの音質を変更する。 音声出力装置1
    1−2は上記音声合成機構9−2により変換された音声データを出力し、計算機1−2の利用者Bは計算機1−
    1の利用者Aの音声を聞くことができる。

    【0062】また、計算機1−2の利用者Bがログ再生の要求を行うと、ログ読出機構24−2はログ書込機構23−2により保存されたログを読み出し、音声合成機構9−2にメッセージを送る。 音声合成機構9−2はメッセージを受け取り、メッセージに含まれる文字情報から音声の合成処理を行い、音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者Aの識別情報に基づいて上記音声合成機構により変換された音声データの音質を変更する。 音声出力装置11−2は上記音声合成機構により変換された音声データを出力し、
    計算機1−2の利用者Bは計算機1−1の利用者Aの音声を聞くことができる。

    【0063】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0064】実施の形態8. 次に、本発明の実施の形態8の3次元仮想世界システムについて、図14および図15に基づいて説明する。 図14は本発明の実施の形態8の3次元仮想世界システムのシステム構成を示すブロック図である。 図15は、図14のメッセージ生成機構7−1が生成するメッセージの例を示す図である。 図1
    5のメッセージは、利用者Aの識別情報、利用者Aの発声した音声が上記音声認識機構6−1により変換された文字情報、たとえば、「おはようございます。」、および再生時刻情報「6:30」を含み、このメッセージはネットワーク12を介して計算機1−2へ送信される。

    【0065】図14において、25−1は音声の再生を開始する時刻を設定する再生時刻設定機構、25−2は音声の再生を開始する時刻を設定する再生時刻設定機構、26−1は他の計算機1−2により生成されたメッセージに含まれる時刻情報に基づいて音声合成処理を開始するタイマを設定するタイマ設定機構である。 26−
    2は他の計算機1−1により生成されたメッセージに含まれる時刻情報に基づいて音声合成処理を開始するタイマを設定するタイマ設定機構である。 実施の形態8においては、実施の形態1のシステム構成に加え、上記の再生時刻設定機構2514(25−1および25−2)およびタイマ設定機構26(26−1および26−2)を追加したことに特徴がある。 なお、図1と図14中で用いられる同一の番号は同一の構成要素を表わすので説明を省略する。

    【0066】次に、計算機1−1の利用者Aが音声を発し、計算機1−2の利用者Bが計算機1−1の利用者A
    の音声を聞く場合を例にとり、図14に基づいてその動作を説明する。

    【0067】まず、計算機1−1の利用者Aが操作する化身2−1を選択すると、識別情報設定機構4−1は利用者Aの識別情報を識別情報設定機構4−1に設定する。 計算機1−1の利用者Aが音声を発すると、音声入力装置5−1により音声データが計算機1−1に入力される。 音声認識機構6−1は、入力された音声データに対して音声認識処理を行い、音声データを文字情報に変換する。 また、計算機1−1の利用者Aは再生時刻設定機構25−1により音声の再生を開始する時刻を設定する。 メッセージ生成機構7−1は上記音声認識機構6−
    1により変換された文字情報と、上記識別情報設定機構4−1により設定された利用者Aの識別情報と、上記再生時刻設定機構25−1により設定された時刻情報とからメッセージを生成する。 上記メッセージ生成機構7−
    1により生成されたメッセージは情報共有機構13−1
    およびネットワーク12を介して接続された他の計算機に送信される。

    【0068】一方、計算機1−2においては、計算機1
    −1の情報共有機構13−1から送出されたメッセージはネットワーク12および情報共有機構13−2を介して、メッセージ検知機構8−2によって検知される。 メッセージ検知機構8−2がメッセージを検知すると、タイマ設定機構26−2はメッセージに含まれる時刻情報に基づいて、音声合成処理を開始するタイマを設定する。 上記タイマ設定機構26−2により設定された時刻になると、音声合成機構9−2はメッセージに含まれる文字情報から音声合成処理を行い、音声データに変換する。 音質制御機構10−2はメッセージに含まれる利用者の識別情報に基づいて上記音声合成機構9−2により変換された音声データの音質を変更する。 音声出力装置11−2は上記音声合成機構により変換された音声データを出力し、計算機1−2の利用者Bは計算機1−1の利用者Aが再生時刻設定機構により設定した時刻に計算機1−1の利用者Aの音声を聞くことができる。

    【0069】音声入力装置5−2からの音声も同様に、
    音声認識機構6−2によって音声認識処理が行われ、音声データが文字情報に変換され、メッセージ生成機構7
    −2によってメッセージが生成され、情報共有機構13
    −2およびネットワーク12を介して各計算機に送信される。 その動作は、計算機1−1における動作と計算機1−2における動作とを入れ替えるだけで同様に実行できるので詳細な説明は省略する。

    【0070】

    【発明の効果】本発明は以上説明したようにして構成されているので、以下に示すような効果を奏する。

    【0071】本発明の第1の発明によれば、音声データを音声認識処理により文字情報に変換した後、利用者の識別情報を付加して計算機間でデータ転送を行い、音声合成処理により再び文字情報から音声データに変換し、
    利用者の識別情報により音質を制御するようにしたので、ネットワークの負荷を低減すると同時に、利用者毎に音質を変化させることができるため、多数の利用者が音声対話を行うことが可能となる。

    【0072】本発明の第2の発明によれば、転送データに化身の識別情報を付加し、音声を発した化身と、利用者自身が操作する化身との相対位置に基づいて、音声データの音質、音量を制御するようにしたので、音声の距離、方向を再現することが可能となる。

    【0073】本発明の第3の発明によれば、転送データに音声の到達範囲を付加し、利用者自身が操作する化身が音声の到達範囲に含まれる場合にのみ、音声合成処理を行うようにしたので、到達範囲に含まれない場合の音声合成処理に伴う計算機の負荷を削減することが可能となる。

    【0074】本発明の第4の発明によれば、転送データに音声の抑揚情報を付加し、抑揚情報により音質、音量を制御するようにしたので、文字情報だけでは伝わらない音声の抑揚を再現することが可能となる。

    【0075】本発明の第5の発明によれば、システム全体で標準とする言語を設定し、音声認識処理により変換された文字情報を標準言語に翻訳し、計算機間のデータ転送を行い、標準言語から、利用者の使用する言語に翻訳するようにしたので、利用者がお互いの使用言語を意識することなく対話することが可能となる。

    【0076】本発明の第6の発明によれば、利用者の発話に応じて、音声を発した利用者の操作する化身の3次元画像を制御するようにしたので、視覚情報により発話者を認識することが可能となる。

    【0077】本発明の第7の発明によれば、他の利用者の発話を文字情報のログとして保存し、再生する手段を備えるようにしたので、過去の対話を小容量の記憶装置で保存し、音声として聞くことが可能となる。

    【0078】本発明の第8の発明によれば、転送データに音声の再生を開始する時刻情報を付加し、時刻情報により音声合成処理を開始する手段を備えるようにしたので、利用者が予め音声データを用意し、希望する時刻に再生することが可能となる。

    【図面の簡単な説明】

    【図1】 本発明の実施の形態1の3次元仮想世界システムのシステム構成例を示す図である。

    【図2】 図1のメッセージ生成機構7−1が生成するメッセージの例を示す図である。

    【図3】 図1の計算機1−1の利用者が操作する化身2−1の視点からの仮想世界の視覚情報の例を示す図である。

    【図4】 図1の化身2−1の周辺の仮想世界の例を示す俯瞰図である。

    【図5】 本発明の実施の形態2の3次元仮想世界システムのシステム構成例を示す図である。

    【図6】 図5のメッセージ生成機構7−1が生成するメッセージの例を示す図である。

    【図7】 本発明の実施の形態3の3次元仮想世界システムのシステム構成例を示す図である。

    【図8】 図7のメッセージ生成機構7−1が生成するメッセージの例を示す図である。

    【図9】 本発明の実施の形態4の3次元仮想世界システムのシステム構成例を示す図である。

    【図10】 図9のメッセージ生成機構7−1が生成するメッセージの例を示す図である。

    【図11】 本発明の実施の形態5の3次元仮想世界システムのシステム構成例を示す図である。

    【図12】 本発明の実施の形態6の3次元仮想世界システムのシステム構成例を示す図である。

    【図13】 本発明の実施の形態7の3次元仮想世界システムのシステム構成例を示す図である。

    【図14】 本発明の実施の形態8の3次元仮想世界システムのシステム構成例を示す図である。

    【図15】 図14のメッセージ生成機構7−1が生成するメッセージの例を示す図である。

    【図16】 従来の音声仮想定位システムのシステム構成を示す図である。

    【符号の説明】

    1−1、1−2 計算機、2−1、2−2 化身、3−
    1、3−2 アプリケーションプログラム、4−1、4
    −2 識別情報設定機構、 5−1、5−2音声入力装置、6−1、6−2 音声認識機構、7−1、7−2
    メッセージ生成機構、8−1、8−2 メッセージ検知機構、9−1、9−2 音声合成機構、10−1、10
    −2 音質制御機構、11−1、11−2 音声出力装置、12 ネットワーク、13(13−1、13−2)
    情報共有機構、14−1、14−2 3次元音声制御機構、15−1、15−2 到達範囲設定機構、16−
    1、16−2 到達範囲判定機構、17−1、17−2
    抑揚認識機構、18−1、18−2 抑揚制御機構、
    19(19−1、19−2) 標準言語設定機構、20
    −1、20−2 言語設定機構、21−1、21−2
    翻訳機構、22−1、22−2 化身画像制御機構、2
    3−1、23−2 ログ書込機構、24−1、24−2
    ログ読出機構、25−1、25−2 再生時刻設定機構、26−1、26−2 タイマ設定機構、27−1、
    27−2 翻訳機構

    ───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. 6識別記号 FI G10L 9/00 G10L 9/00 M

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈