首页 / 专利库 / 人工智能 / 情感分析 / Speech synthesizing device

Speech synthesizing device

阅读:499发布:2021-12-29

专利汇可以提供Speech synthesizing device专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To assist an audience in understanding the contents of reading by adding a reading speed, a rhythm and an emotional tone to the sound of a synthesizing speech to be read out.
SOLUTION: Regarding a speech synthesizing device where a text is linguistically analyzed as a word, a rhythm is generated in the reading of the word, and a speech waveform is generated for the text for synthesizing a speech, an important part specifying part 11 for specifying an important part in the linguistically analyzed text and an important part rhythm part 12 for generating a rhythm for keeping the important part speed by the important part specifying part 11, different from parts other than the important part in the text are provided, together with an important part generation part 13 for generating a speech waveform for the important part.
COPYRIGHT: (C)1999,JPO,下面是Speech synthesizing device专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 テキストが単語として言語解析され、単語の読みに韻律が生成され且つテキストに対して音声波形が生成されて音声を合成する音声合成装置において、 言語解析されたテキスト中の重要部分を指定する重要部分指定部と、 前記重要部分指定部により指定された重要部分に対して、テキスト中の前記重要部分以外の他の部分と異ならせる韻律を形成する重要部分韻律部と、 前記重要部分に対して音声波形を生成する重要部分生成部とを備えることを特徴とする音声合成装置。
  • 【請求項2】 前記重要部分指定部は、テキスト中の主語・述語を重要部分として指定することを特徴とする、
    請求項1に記載の音声合成装置。
  • 【請求項3】 前記重要部分指定部は、テキスト中の数字を重要部分として指定することを特徴とする、請求項1に記載の音声合成装置。
  • 【請求項4】 前記重要部分指定部は、テキスト中の固有名詞を重要部分として指定することを特徴とする、請求項1に記載の音声合成装置。
  • 【請求項5】 前記重要部分韻律部は、前記重要部分指定部により指定された重要部分がゆっくりとした音声で読み上げられる韻律を形成することを特徴とする、請求項1に記載の音声合成装置。
  • 【請求項6】 前記重要部分韻律部は、前記重要部分指定部により指定された重要部分が大きい音声で読み上げられる韻律を形成することを特徴とする、請求項1に記載の音声合成装置。
  • 【請求項7】 サービス局から送信されるテキストに、
    重要部分と、これを識別するラベルと、重要部分に韻律を付加すべきラベルとが含まれるとき、前記重要部分指定部はテキストから重要部分を検索して重要部分を指定し、前記重要部分韻律部は前記重要部分に対する韻律を検索して検索された韻律を形成することを特徴とする、
    請求項1に記載の音声合成装置。
  • 【請求項8】 さらに、テキストの言語解析に使用する通常の単語辞書部に対して感情表現に富む単語を格納する感情用単語辞書部と、前記通常の単語辞書部の格納される単語の音声波形に対してピッチを変更した音声波形を格納する感情用波形辞書部とを備え、 前記重要部分指定部は前記感情用単語辞書部を用いてテキスト中の重要部分を指定し、 前記重要部分韻律部は前記重要部分指定部により指定された重要部分にピッチを変更して感情表現の韻律を形成し、 前記重要部分音声生成部は前記感情用波形辞書部を用いて重要部分の音声波形を生成することを特徴とする、請求項1に記載の音声合成装置。
  • 【請求項9】 前記感情用単語辞書部はこれに格納される単語に、明るい感情表現と暗い感情表現とが識別されるラベルを付けることを特徴とする、請求項8に記載の音声合成装置。
  • 【請求項10】 前記重要部分韻律部は、明るい感情表現の韻律に対してはピッチを高くし、暗い感情表現の韻律に対してピッチを高くすることを特徴とする、請求項8に記載の音声合成装置。
  • 【請求項11】 前記感情用単語辞書部は前記通常の辞書部と合体し前記通常の辞書部に使用される単語のうち感情表現に富む単語にラベルを付けることを特徴とする、請求項8に記載の音声合成装置。
  • 【請求項12】 サービス局から送信されるテキストに、感情表現に富む重要部分とこれを識別するラベルと、感情表現に富む重要部分に韻律を付加すべきラベルとが含まれるとき、前記重要部分指定部はテキストから感情表現に富む重要部分を検索して感情表現に富む重要部分を指定し、前記重要部分韻律部は前記感情に富む重要部分に対する韻律を検索して検索された韻律を形成することを特徴とする、請求項8に記載の音声合成装置。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】本発明はテキスト文を音声に合成して読み上げる音声合成装置に関し、特に読み上げる音声合成音に読み上げの速度、強弱、感情的な調子を付加することによって受聴者に読み上げ内容の理解の補助を行うことができる装置に関する。

    【0002】

    【従来の技術】従来の音声合成装置では、テキスト文は言語解釈されてテキスト文の「べた文」が各種の品詞の単語に解釈され、音素記号と韻律記号とからなる発音記号列に変換される。 次に、この発音記号列に対して、各音素の継続時間長、ピッチパターン、ポーズ長、イントネーションなどの韻律処理が行われる。 例えば、音素を合成単位として音声波形素片を接続して合成音声が合成される。

    【0003】このような音声合成装置が機器全般の分野に利用され、例えば、データ送信を行うサービス局との通信に利用される。

    【0004】

    【発明が解決しようとする課題】ところで、近年、多種多様なデータを送信するサービス局が増大している。 一方、この情報を受け手として、例えば自動車では、運転中であればその情報を画面表示としているが常に見ることはできないことから、主に音声合成に頼って聞くことになる。

    【0005】従来の音声合成装置では、読み上げる音声には、聞きづらくならないように、前述の如く、アクセント、イントネーション等が付いているが、特に雑音が多い自動車内でこの情報が重要なものかどうかは受聴者が良く注意して聞かなければ分からないという問題がある。 また、テキスト文中に、特に、感嘆符「!」、疑問符「?」がある場合には、感情表現が行われるが、他にはこのような感情表現が無く、読み上げられる音声は全般的に感情表現に乏しいという問題がある。

    【0006】したがって、本発明は、上記問題点に鑑み、受聴者に注意を促し且つ感情表現に富む読み上げを行うことができる音声合成装置を提供することを目的とする。

    【0007】

    【課題を解決するための手段】本発明は、前記問題点を解決するために、テキストが単語として言語解析され、
    単語の読みに韻律が生成され且つテキストに対して音声波形が生成されて音声を合成する音声合成装置において、言語解析されたテキスト中の重要部分を指定する重要部分指定部と、前記重要部分指定部により指定された重要部分に対して、テキスト中の前記重要部分以外の他の部分と異ならせる韻律を形成する重要部分韻律部と、
    前記重要部分に対して音声波形を生成する重要部分生成部とを備えることを特徴とする音声合成装置を提供する。 この手段により、重要部分として、主語・述語、数字、固有名詞が他のテキストの部分に対してゆっくりとした音声、又は大きな音声で読み上げられるので、受聴者が聞き取りやすい音声を合成することが可能になる。

    【0008】さらに、テキストの言語解析に使用する通常の単語辞書部に対して感情表現に富む単語を格納する感情用単語辞書部と、前記通常の単語辞書部の格納される単語の音声波形に対してピッチを変更した音声波形を格納する感情用波形辞書部とを備え、前記重要部分指定部は前記感情用単語辞書部を用いてテキスト中の重要部分を指定し、前記重要部分韻律部は前記重要部分指定部により指定された重要部分にピッチを変更して感情表現の韻律を形成し、前記重要部分音声生成部は前記感情用波形辞書部を用いて重要部分の音声波形を生成することを特徴とする。 この手段により、明るい感情表現に対してピッチが高い音声、暗い感情表現に対してはピッチが低い音声で合成されるので、受聴者は感情に富んだ読み上げを聞くことが可能になる。

    【0009】

    【発明の実施の形態】以下本発明の実施の形態について図面を参照して説明する。 図1は本発明に係る音声合成装置を有しサービス局から音声合成の入テキストを受信する受信機を示す図である。 本図に示す如く、受信機は、音声信号を受信するアンテナ200と、受信信号を音声に処理する受信部201と、音声信号を音声に変換するスピーカ203とが設けられる。 さらに、この受信機は、音声信号以外に、サービス局から多種多様のデータを受信し、受信部201でデータを抽出してこれをテキスト文として入力する音声合成装置100を具備し、
    音声合成装置100の合成音声は加算部202を経由してスピーカ203から出力される。

    【0010】図2は図1の音声合成装置100を説明する図である。 本図に示す音声合成装置100は、テキスト文を入力するテキスト解析処理部1を具備し、テキスト解析処理部1は単語辞書部2を有する。 単語辞書部2
    は、名詞、動詞、助詞、数詞等の品詞を区別した多数の単語と、この単語の読みとアクセント等とを格納している。 名詞には固有名詞も多数含まれる。 ここに単語の読みは、例えば、カタカナ(平仮名でもよい)の一文字に相当するモーラで表され、1つのモーラは音素である子音と母音とからなる。

    【0011】テキスト解析処理部1は、単語辞書部2を用いて、入力される「べた文」のテキスト文を、単語に区分して各単語に読みとアクセントを付けた発音記号列に変換する。 音声合成装置100はさらにテキスト解析処理部1から発音記号列を入力する韻律制御処理部3を具備し、韻律制御処理部3は発音記号列を音韻系列とし、且つ音韻系列に対して各音素の継続時間長、ピッチパターン、ポーズ長、アクセント、イントネーション、
    振幅などの韻律系列を形成する。

    【0012】音声合成装置100はさらに音声生成処理部4を具備し、音声生成処理部4は波形辞書部5を具備する。 波形辞書部5は音素長程度の音声波形を大量に用意し音素のピッチ、振幅、継続時間長などの情報と共に音声波形素片として格納される。 音声生成処理部4は音韻系列及び韻律系列から音声波形素片を波形辞書部5から選択して、接続して合成音声を形成する。 なお、波形辞書部5には通常の波形辞書部5A、重要部分用波形辞書部5B、5Cが設けられる。 重要部分用波形辞書部5
    Bは通常の波形辞書部5Aに対して音声波形素片の継続時間長が大きいものが格納される。 重要部分用波形辞書部5Cは通常の波形辞書部5Aに対して音声波形素片の振幅が大きいものが格納される。

    【0013】さらに、テキスト解析処理部1は入力されるテキスト中の重要部分を指定する重要部分指定部11
    を具備する。 重要部分指定部11は重要部分としてテキスト中の、例えば、『主語・述語』、『数字』、『固有名詞』を指定する。 韻律制御処理部3は重要部分指定部11により指定された重要部分について特有の韻律を付加する重要部分韻律部12を具備する。 重要部分韻律部12は、韻律の指定として、例えば、重要部分のみを『ゆっくり』又は『大きく』読み上げる韻律を指定する。

    【0014】音声合成装置100は重要部分指定部11
    及び重要部分韻律部12の操作を外部から行う表示操作部14を具備する。 図3は図1の表示操作部14の表示操作を説明する図である。 表示操作部14には本図に示す如く、重要部分の指定の操作ボタンとして『主語・述語』、『数字』、『固有名詞』を選択操作するボタンが表示され、韻律の指定の操作ボタンとして『ゆっくり』、『大きく』のボタンが表示される。 これらのボタンに加えて『サービス局の指定』のボタンが設けられる。

    【0015】先ず、重要部分指定部11及び韻律制御処理部12の具体例を説明する。 図3の表示操作14の表示で、重要部分の指定として『主語・述語』のボタンが押された場合の重要部分指定部11の動作を、以下に、
    説明する。 図4は図2の重要部分指定部11の動作を説明する例を示す図である。 図4(a)の左側に示す如く、テキスト解析処理部1に、例えば、『なんだかんだであれ、要点は重要です。 』との漢字仮名混じりのテキストが入力される。 この入力テキストに対してテキスト処理部1ではこれがカタカナのモーラである発音記号列に変換される。

    【0016】テキスト解析処理部1ではこの発音記号列のうち主語・述語とが検索されて、重要部分指定部11
    では、図4(a)の右側に示す『ナンダカンダデアレ、
    ヨウテンジュウヨウデス。 』の下線部分の如く、主語の助詞を除いた名詞部分と述語の語幹部分とが指定される。 同様に、図3の表示操作14の表示で、重要部分の指定として『数字』のボタンが押されているとする。 図4(b)の左側に示す如く、テキスト解析処理部1に、
    例えば、『時速100km/hです。 』との漢字仮名混じりのテキストが入力される。 この入力テキストに対してテキスト処理部1ではこれが発音記号列に変換され、
    この発音記号列のうち数字が検索されて、重要部分指定部11では、図4(b)の右側に示す『ジソクヒャクキ<br>ロメートルパーアワーデス。 』の下線部分の如く、数字が指定される。

    【0017】同様に、図3の表示操作14の表示で、重要部分の指定として『固有名詞』のボタンが押されているとする。 図4(c)の左側に示す如く、テキスト解析処理部1に、例えば、『まもなく神戸する。 』との漢字仮名混じりのテキストが入力される。 この入力テキストに対してテキスト処理部1ではこれが発音記号列に変換され、この発音記号列のうち固有名詞が検索されて、重要部分指定部11では、図4(c)の右側に示す『マモナクコウベデス。 』の下線部分の如く、固有名詞が指定される。

    【0018】なお、本図(a)、(b)、(c)に示す重要部分の任意の2つを組み合わせて、又は全部が同時に指定されてもよい。 韻律制御処理部12では、上記の指定された重要部分に対して、『ゆっくり』又は『大きく』の韻律の指定が行われる。 この場合、『ゆっくり』、『大きく』の韻律の指定が同時に行われてもよい。

    【0019】次に、受信機100に対するサービス局から重要部分の指定ラベル、これに付加する韻律の指定ラベルが入力テキストに付けられて送られる場合には図3
    の表示操作14の表示で、『サービス局の指定』のボタンが押される。 図5は『サービス局の指定』のボタンが押された場合の図2の重要部分指定部11の動作を説明する例を示す図である。 図5(a)の左側に示す如く、
    テキスト解析処理部1に、例えば、『なんだかんだであれ、「<Big or Slow >要点」は「<Big or Slow >重要」です。 』とのテキストが入力される。 このように、
    重要部分がラベル「 」により指定され、指定された重要部分の韻律がラベル<>内のBig (『大きく』の意味)or Slow (『ゆっくり』の意味)より指定される。
    重要部分指定部11ではこのラベルを解釈して、図5
    (a)右側に示す『ナンダカンダデアレ、 ヨウテン
    ュウヨウデス。 』の下線部分の如く、主語の助詞を除いた名詞部分と述語の語幹部分とが抽出され重要部分と指定される。 重要部分韻律部12ではラベルを解釈してこのように指定された重要部分に対して『ゆっくり』又は『大きく』の韻律が抽出され指定される。

    【0020】図6は図2の音声生成処理部4における重要部分音声生成部13を説明する図である。 音声生成処理部4では、韻律制御処理部3から音韻系列、韻律系列を入力して音素のピッチ、振幅、継続時間長などの韻律系列に対して音韻系列を構成する音素の波形が通常時の波形辞書部5から読み出されて接続が行われる。 例えば、指定された重要部分である『ヨウテン(要点)』のモーラを子音と母音との音素分解したモーラ『YOUT
    EN』に対して音声生成処理部4では通常の波形辞書部5Aを用いて図6(a)に示す音声波形が生成される。

    【0021】重要部分音声生成部13では、重要部分韻律部12から『ゆっくり』の韻律指定が入力されると、
    音声生成処理部4では重要部分用波形辞書部5Bを用いて図6(b)に示すモーラ『YOUTEN』のように時間的に伸長した音声波形が形成される。 このようにして、重要部分は他の部分と比較してゆっくりとした音声で読み上げられるので、受聴者に注意を促すことが可能になる。 特に高齢者にとっても聞きやすくなる。

    【0022】重要部分音声生成部13は、重要部分韻律部12から『大きく』の韻律指定が入力されると、音声生成処理部4では重要部分用波形辞書部5Cを用いて図6(c)に示すモーラ『YOUTEN』のように大きな振幅の音声波形が形成される。 このようにして、重要部分は他の部分と比較して大きい音声で読み上げられるので、受聴者に注意を促すことが可能になる。 特に高齢者にとっても聞きやすくなる。

    【0023】また、情報を提供するサービス局が意図するニュアンスでユーザに音声合成を聞かせることが可能になる。 図7は図2の変形例を説明する図である。 本図において図1と異なるのは単語辞書2、波形辞書部5である。 単語辞書2として、通常の単語辞書2Aと感情用単語辞書2Bが設けられる。 さらに、波形辞書部5として、通常の波形辞書部5Aと、感情用波形辞書部5D、
    5Eとが設けられる。

    【0024】図8は図7の音声合成装置100に設けられる通常の単語辞書2Aと感情用単語辞書2Bとを説明する図である。 図7に示す如く、単語辞書2として、通常の単語辞書2Aと感情用単語辞書2Bが設けられる。
    図8(a)に示す如く、通常の単語辞書2Aには、感動、東京、慰留、結婚、退職、鎮魂等の通常の単語が登録されている。 感情用単語辞書2Bには、(1)明るく読むモード、(2)暗く読むモードとを指定した単語を識別して登録してある。 例えば、明るく読むモード(1)として嬉しい、楽しい、結婚等の単語が登録され、暗く読むモード(2)として悲しい、退職等の単語が登録されている。 このように、通常の単語辞書2Aを変更することなく、感情読み上げのキーワードになる単語に拡張情報を持たせる感情用単語辞書2Bを追加することで実現することができる。

    【0025】感情用波形辞書部5Dは(1)明るく読むモードに対応する単語に対してピッチを高くした単語の音声波形を格納する。 感情用波形辞書部5Eは(2)暗く読むモードに対応する単語に対してピッチを低くした単語の音声波形を格納する。 なお、図8(b)に示す如く、通常の単語辞書2を拡張して、例えば、結婚という単語に明るく読むモードである記号(1)を付け、鎮魂という単語に暗く読むモードである記号(2)を付けてもよい。 前者と比較すると、単語辞書のサイズの増大を抑制することが可能になる。

    【0026】図9は表示操作14の感情的な読み上げを行う場合の表示操作例を説明する図である。 本図に示す表示操作で感情の表現を行うか否かの選択が行われる。
    表示操作14で『はい』のボタンが押されると、重要部分指定部11では、感情用単語辞書2Bにより、テキスト解析処理部1に入力したテキストの文に、明るく読むモード(1)に属する単語、又は暗く読むモード(2)
    に属する単語が含まれるかが判断される。

    【0027】図10は明るく読むモード(1)を含む場合、読み上げるピッチを説明する図である。 本図に示す如く、『鈴木さんが結婚しました。 』という入力テキストに結婚という明るく読み上げるモード(1)に該当する結婚という単語が含まれているので、重要部分指定部11ではこの発音記号列『スズキサンガケッコンシマシ<br>タ。 』の下線部分を重要部分として指定する。 重要部分韻律部12では重要部分を他のテキストの部分に対して、本図に示す如く、ピッチを上げる韻律系列を形成する。 重要部分音声生成部13では、感情用波形辞書部5
    Dを用いて重要部分に対してピッチを上げて音声を生成する。 このようにピッチを上げると、明るい読み上げになる。

    【0028】図11は暗く読むモード(2)を含む場合の文を読み上げるピッチを説明する図である。 本図に示す如く、『鈴木さんが退職しました。 』という入力テキストに結婚という暗く読み上げるモード(2)に該当する退職という単語が含まれているので、重要部指定部1
    1ではこの発音記号列『スズキサンガタイショクシマシ<br>タ。 』の下線部分を重要部分として指定する。 重要部分韻律部12では重要部分を他のテキストに対して、本図に示す如く、ピッチを下げる韻律系列を形成する。 重要部分音声生成部13では、感情用波形辞書部5Eを用いて重要部分に対してピッチを下げて音声を生成する。 このようにピッチを下げると、暗い読み上げになる。

    【0029】したがって、受聴者に対して感情表現に富む音声の合成を行うことが可能になる。 次に、受信機1
    00に対するサービス局から感情に関する重要部分の指定ラベル、これに付加する韻律の指定ラベルが入力テキストに付けられて送られる場合には図9の表示操作14
    の表示で、『サービス局の指定』のボタンが押される。

    【0030】図12は図9の表示操作で『サービス局の指定』のボタンが押された場合の図2の重要部分指定部11の動作を説明する例を示す図である。 図12(a)
    の左側に示す如く、テキスト解析処理部1に、例えば、
    『鈴木さんが「<High>結婚」しました。 』とのテキストが入力される。 このように、重要部分がラベル「 」により指定され、指定された重要部分の感情の韻律がラベル< >内のHigh(ピッチ高の意味) より指定される。
    重要部分指定部11ではこのラベルを解釈して、図12
    (a)右側に示す『スズキサンガケッコンシマシタ。 』
    の下線部分の如く、重要部分が指定される。 重要部分韻律部12ではラベルを解釈してこのように指定された重要部分に対してピッチが高い韻律が抽出され指定される。

    【0031】また、図12(b)の左側に示す如く、テキスト解析処理部1に、例えば、『鈴木さんが「<Low>
    退職」しました。 』とのテキストが入力される。 前述と同様に、重要部分がラベル「 」により指定され、指定された重要部分の感情の韻律がラベル< >内のLow
    (ピッチ低の意味) より指定される。 重要部分指定部1
    1ではこのラベルを解釈して、図12(b)右側に示す『スズキサンガタイショクシマシタ。 』の下線部分の如く、重要部分が指定される。 重要部分韻律部12ではラベルを解釈してこのように指定された重要部分に対してピッチが低い韻律が抽出され指定される。

    【0032】このように、情報を提供するサービス局が意図するニュアンスでユーザに音声合成を聞かせることが可能になる。

    【0033】

    【発明の効果】以上の説明により本発明によれば、重要部分として、主語・述語、数字、固有名詞が他のテキストの部分に対してゆっくりとした音声、又は大きな音声で読み上げられるので、受聴者が聞き取りやすい音声を合成することが可能になる。 さらに、明るい感情表現に対してピッチが高い音声、暗い感情表現に対してはピッチが低い音声で合成されるので、受聴者は感情に富んだ読み上げを聞くことが可能になる。

    【図面の簡単な説明】

    【図1】本発明に係る音声合成装置を有しサービス局から音声合成の入力テキストを受信する受信機を示す図である。

    【図2】図1の音声合成装置100を説明する図である。

    【図3】図1の表示操作部14の表示操作を説明する図である。

    【図4】図2の重要部分指定部11の動作を説明する例を示す図である。

    【図5】『サービス局の指定』のボタンが押された場合の図2の重要部分指定部11の動作を説明する例を示す図である。

    【図6】図2の音声生成処理部4における重要部分音声生成部13を説明する図である。

    【図7】図2の変形例を説明する図である。

    【図8】図7の音声合成装置100に設けられる通常の単語辞書2Aと感情用単語辞書2Bとを説明する図である。

    【図9】表示操作14の感情的な読み上げを行う場合の表示操作例を説明する図である。

    【図10】明るく読むモード(1)を含む場合、読み上げるピッチを説明する図である。

    【図11】暗く読むモード(2)を含む場合の文を読み上げるピッチを説明する図である。

    【図12】図9の表示操作で『サービス局の指定』のボタンが押された場合の図2の重要部分指定部11の動作を説明する例を示す図である。

    【符号の説明】

    1…テキスト解析処理部 2、2A、2B…単語辞書部 3…韻律制御処理部 4…音声生成処理部 5、5A、5B、5C、5D、5E…波形辞書部 11…重要部分指定部 12…重要部分韻律部 13…重要部分音声生成部 100…音声合成部 200…アンテナ 201…受信部 202…加算部 203…スピーカ

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈