首页 / 专利库 / 人工智能 / 语音用户界面 / Phonetic symbol producing device and text voice synthesized system therewith

Phonetic symbol producing device and text voice synthesized system therewith

阅读:122发布:2022-05-13

专利汇可以提供Phonetic symbol producing device and text voice synthesized system therewith专利检索,专利查询,专利分析的服务。并且PURPOSE:To be easy even for users who are unfamiliar with the definition of phonetic symbol strings to organize the phonetic symbol strings and produce the adequate phonetic symbol strings for natural rhythm. CONSTITUTION:A phonetic symbol string producing section 2 produces phonetic symbol strings for synthesized voice including readings and rhythm information by using word strings which is given information such as readings, parts of speech and accent types and speech partitioned information which represents the partitioned positions of accent phrases, speakable phrases, inhale paragraphs for the word strings as input elements. A speech partition organizing section 3 to organize speech partitions has a user interface for organizing the partitioned position of accent phrases, speakable phrases and suction paragraphs. In case that speech partitions are organized in the speech partition organizing section 3, the phonetic symbol string producing section 2 produces the phonetic symbol strings again in accordance with organized speech partitions.,下面是Phonetic symbol producing device and text voice synthesized system therewith专利的具体信息内容。

  • 【特許請求の範囲】 【請求項1】 単語列と発話区分情報とが内部データとして入力するときに、該内部データに基づき読みと韻律情報を含んだ発音記号列を生成する発音記号列生成手段と、発話区分を編集するための発話区分編集手段とを有し、前記発話区分編集手段によって発話区分の編集がなされた場合に、前記発音記号列生成手段は、編集のなされた発話区分に基づいて発音記号列を再度生成するようになっていることを特徴とする発音記号生成装置。 【請求項2】 前記発話区分編集手段は、発話区分を編集するための編集ウインドウをユーザインタフェースとして有し、該編集ウインドウ上にはユーザに解読可能な文字列と発話区分の識別子が表示され、発話区分の識別子に修正が加えられることによって発話区分の編集がなされるようになっていることを特徴とする請求項1記載の発音記号生成装置。 【請求項3】 請求項1記載の発音記号生成装置において、さらに、発音記号列生成手段によって生成された発音記号列を確認するための発音記号列確認手段が設けられていることを特徴する発音記号生成装置。 【請求項4】 請求項1記載の発音記号生成装置と、該発音記号生成装置に単語列と発話区分情報とを与える言語処理手段と、前記発音記号生成装置から出力された発音記号列に基づき合成音声を生成し出力する音声合成手段とを有していることを特徴とするテキスト音声合成システム。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【産業上の利用分野】本発明は、音声合成器が解読することの可能な発音記号列を生成する発音記号生成装置及びこれを用いたテキスト音声合成システムに関する。

    【0002】

    【従来の技術】従来、合成音声を出させるために、合成音声用の発音記号列を生成し音声合成器に与えるテキスト音声合成システムが知られている。 この種のテキスト音声合成システムでは、生成された発音記号列自体をテキストエディタにより編集する機能が付加されており、ユーザは、生成された発音記号列を訂正しようとする場合には、テキストエディタ等を用いて発音記号列を直接編集していた。

    【0003】

    【発明が解決しようとする課題】しかしながら、生成される発音記号列は、一般に、読みを表わす記号とアクセントの位置,声立て,ポーズの位置を表わす記号などの入り交じった記号列であり、発音記号列を直接修正するためには、その記号列の定義をユーザが熟知していなければならず、発音記号列の編集を一般のユーザに行なわせるのは非常に難かしいという問題があった。 また、従来のテキスト音声合成システムでは、上記のようなテキストエディタによる編集がなされる場合であっても、自然性の高い韻律を与える適切な発音記号列を容易に生成することができないという欠点があった。

    【0004】本発明は、発音記号列の定義を知らないユーザでも発音記号列の編集を容易に行なうことができ、
    また、自然性の高い韻律を与える適切な発音記号列を容易に生成することの可能な発音記号生成装置及びそれを用いたテキスト音声合成システムを提供することを目的としている。

    【0005】

    【課題を解決するための手段】上記目的を達成するために本発明は、単語列と発話区分情報とが内部データとして入力するときに、該内部データに基づき読みと韻律情報を含んだ発音記号列を生成する発音記号列生成手段と、発話区分を編集するための発話区分編集手段とを有し、前記発話区分編集手段によって発話区分の編集がなされた場合に、前記発音記号列生成手段は、編集のなされた発話区分に基づいて発音記号列を再度生成するようになっていることを特徴としている。

    【0006】上記発話区分編集手段は、発話区分を編集するための編集ウインドウをユーザインタフェースとして有し、該編集ウインドウ上にはユーザに解読可能な文字列と発話区分の識別子が表示され、発話区分の識別子が修正(無修正の場合も含む)されることによって発話区分の編集がなされるようになっていることを特徴としている。

    【0007】また、上記発音記号生成装置には、発音記号列生成手段によって生成された発音記号列を確認するための発音記号列確認手段が設けられていることを特徴としている。

    【0008】また、本発明のテキスト音声合成システムは、上記の発音記号生成装置と、該発音記号生成装置に単語列と発話区分情報とを与える言語処理手段と、前記発音記号生成装置から出力された発音記号列に基づき合成音声を生成し出力する音声合成手段とを有していることを特徴としている。

    【0009】

    【作用】上記のような構成の発音記号生成装置では、一般のユーザにとって容易に理解可能な発話区分を編集することが可能となっており、発話区分を編集することにより、間接的に発音記号列を編集することができる。

    【0010】また、発話区分の編集において、ユーザインタフェースとして編集ウインドウが用いられる場合、
    ユーザは、編集ウインドウ上にユーザに解読可能な文字列とともに表示された発話区分の識別子を修正(無修正の場合も含む)することで、発話区分の編集を行なうことができる。

    【0011】また、生成された発音記号列を確認するための発音記号列確認手段がさらに設けられているときには、ユーザは、生成された発音記号列が正しいものか否かを確認することができる。

    【0012】このような発音記号生成装置を用いてテキスト音声合成システムを構成すれば、自然性の高い韻律の合成音声を容易に得ることができる。

    【0013】

    【実施例】以下、本発明の実施例を図面に基づいて説明する。 図1は本発明に係る発音記号生成装置の一実施例のブロック図、図2は図1の発音記号生成装置を用いたテキスト音声合成システムの構成例を示す図である。 図1を参照すると、本実施例の発音記号生成装置1は、発音記号列生成部2と、発話区分編集部3と、発音記号列確認部4とを有している。 発音記号列生成部2は、読み,品詞,アクセント型などの情報が与えられている単語列と、その単語列のアクセント句,声立て句,呼気段落の区切り位置を表わす発話区分情報とを入力として、
    読みと韻律情報を含んだ合成音声用の発音記号列を生成するようになっている。 また、発話区分編集部3は、発話区分を編集するためのものであって、アクセント句,
    声立て句,呼気段落の区切り位置を編集するためのユーザインタフェースを備えている。 また、発音記号列確認部4は、発音記号列を確認するために設けられている。

    【0014】また、図2を参照すると、テキスト音声合成システム10は、発音記号生成装置1の入力部分に言語処理部11が接続され、発音記号生成装置1の出力部分に音声合成器12が接続されて構築されている。 なお、この場合、言語処理部11は、文字コード列を解析して、読み,品詞,アクセント型などの情報が付加された単語列と、その単語列のアクセント句,声立て句,呼気段落の区切り位置を表わす発話区分情報とを発音記号生成装置1に出力するようになっており、音声合成器1
    2は、発音記号生成装置1から出力された発音記号列を合成音声に変換するようになっている。

    【0015】図3はアクセント句,声立て句,呼気段落を説明するための図である。 図3を参照すると、アクセント句とは、1つのアクセント成分によって発話される単位のことであり、声立て句とは、1つの声立て成分(息継ぎはしないが、ピッチの立て直しがある成分)によって発話される単位のことであり、呼気段落とは一息で発話される単位のことである。

    【0016】アクセント句は、言語処理部11のレベルでは、個々の単語と1対1に定められるが、複数の単語を結合した複合語を合成音声として出力させたいような場合には、一般に、複合語のアクセントは、複合語を構成する個々の単語のアクセントを単に寄せ集めたものではなく、個々の単語に1対1に対応していないので、複合語全体に対してアクセント句を定める必要がある。

    【0017】テキスト音声合成システム10において、
    発音記号生成装置1の発音記号列生成部2は、このような目的のために設けられており、発音記号列生成部2では、言語処理部11から複合語を構成する個々の単語についての情報が与えられたとき、個の構成単語のアクセント句を1つにまとめ上げて複合語のアクセント句を生成する所謂アクセント結合処理がなされるようになっている。

    【0018】アクセント結合処理の多くは、個々の構成単語の性質から規則的に行なうことができて、例えば、
    “音声({お}んせー)”と“合成(ご{ーせい)”という2つの単語を結合して“音声合成”の複合語を作る場合には、“(お{んせーご}ーせー)”のように、各単語のアクセントを1つのアクセント句にまとめアクセント核(アクセントの落ちる拍の位置)を移動させて発話区分を設定し、アクセント結合を行なうことができる。 なお、“{”は、アクセントの上昇位置,“}”はアクセントの下降位置を表わすための符号である。

    【0019】ところで、言語処理部11から与えられる個々の単語に関する情報が正しいものであっても、発音記号列生成部2において、例えば複合語の発音記号列を生成する際に上記のようなアクセント結合処理が正しく行なわれず、発話区分に誤まりがあると、適切な発音記号列を生成することはできない。 本願の発明者は、合成音声の韻律の不自然さは、発話区分の誤まりに起因することが多いことに着目し、発音記号列のレベルでの編集を行なわずとも、発話区分の編集を行なうことによって、間接的に発音記号列を編集することができるということを見出した。 図1の発音記号生成装置1において、
    発話区分編集部3,発音記号列確認部4は、上記の着想の下で、発話区分の編集を行なわせるために設けられている。

    【0020】発話区分編集部3は、具体的には、発話区分を編集するための編集ウインドウをユーザインタフェースとして提供し、アクセント句をそれ以上分けることができない最小単位(通常は文節)の単語列と発話区分位置とを表示するよう構成され、ユーザは、編集ウインドウにおいて、特定の位置を指定することにより発話区分を追加,削除,変更,すなわち修正(無修正も含む)
    することができるようになっている。

    【0021】また、発話区分編集部3において発話区分の追加,削除,変更等の編集がなされた場合には、発音記号列生成部2は、編集のなされた発話区分を入力として、再度、発音記号列を生成し直し、その結果を発音記号列確認部4に提示するようになっている。 この場合、
    発音記号列確認部4は、発音記号列生成部2から送られた発音記号列に基づいて、例えば合成音声を出力するものとして構成されている。

    【0022】図4はテキスト音声合成システム10のハードウェア構成例を示す図であり、図4の構成例では、
    発音記号生成装置1,言語処理部11は、汎用のワークステーション20上で動作するソフトウェアとして実現されており、発音記号生成装置1において発話区分を編集するための編集ウインドウはディスプレイ21に表示され、また、編集ウインドウ上で発話区分の編集を行なうためのキー,データは、キーボード,マウスなどの入力デバイス22から入力されるようになっている。 また、発音記号生成装置1の発音記号列確認部4は、これが合成音声を出力するものとして構成されているときには、テキスト音声合成システム10の音声合成器12によりこれを実現することができる。

    【0023】次にこのような構成において、発音記号列の編集処理動作を具体的に説明する。 なお、以下では、
    文節を1つの自立語と複数の付属語から構成される単語列と定義し、アクセント句をそれ以上分けることのできない最小の単語が文節であるとする。

    【0024】いま、言語処理部11から図5(a)のような文節データの列,すなわち文節列D1,D2,…D
    n,…が発音記号生成装置1に入力するとする。 なお、
    各文節データは、図5(b)のようなフォーマットのものであるとし、また、文節データ中の各単語データE
    1,E2,…は図5(c)のようなフォーマットであるとする。 図5(b),(c)からわかるように、各文節データは、単語表記,読み,品詞,アクセント型の情報をもつ単語データと、発話区分フラグN,A,V,Pとから構成されている。

    【0025】発音記号生成装置1に図5(a),
    (b),(c)のフォーマットをもつ文節データが順次に文節列として入力すると、発音記号生成装置1では、
    これらのデータを内部データとして保持し、発音記号列生成部2では、これらの内部データに基づき発音記号列を生成するとともに、発話区分編集部3では、これらの内部データを、ユーザに分かり易い表現形式に変換した上で、編集ウインドウに表示する。

    【0026】図6(a)乃至(e),図7は発話区分の編集処理の具体例を示す図であり、内部データが図6
    (a)のようなものであって、このうち、“音声”,
    “合成を”,“行います。”,“さて、”の各文節データがそれぞれ図6(b),(c),(d),(e)のようになっている場合、発話区分編集部3は、これらの内部データを、図7のような表現形式に変換して編集ウインドウに表示する。 図7において、“ ”は文節の切れ目、“/”はアクセント句の切れ目、“//”は声立て句の切れ目、“///”は呼気段落の切れ目を表わす発話区分マークである。 これからわかるように、声立て句の切れ目,呼気段落の切れ目は、明らかにアクセント句の切れ目になっている。 なお、ここでは、発話区分マーク以外の単語の読み,品詞,アクセント型などの情報は全て正しいと仮定し、編集ウインドウには図7のように、ユーザが見て分かり易い漢字仮名混じり文字列と発話区分マークのみを表示し、読み仮名列等は表示しない。

    【0027】ユーザは、図7のように編集ウインドウに表示された結果を見ながら、特定の位置にある発話区分マークを削除したり、追加したり、変更したりして、発話区分の修正,すなわち編集を行なうことができる。 ユーザによる一連の編集が終了すると、発話区分編集部3
    は、編集ウインドウの発話区分位置を用いて、内部データを更新し、しかる後、発音記号列生成部2は、更新後の内部データを用いて新たな発音記号列を生成する。

    【0028】そして、発音記号列確認部4は、新たな発音記号列に基づき、例えば合成音声を出力する。 これにより、ユーザは、発音記号列がユーザの意図するようなものとなったか否かを確認することができる。

    【0029】このように本実施例では、発音記号列の定義を知らなくても、その言語を話す能力のある者であれば容易に理解可能な発話区分を編集しうるよう構成されており、発話区分を編集することによって、間接的に発音記号列が編集されるので、自然性の高い韻律を与える適切な発音記号列を容易に得ることができる。

    【0030】また、編集ウインドウ上に、ユーザが見て分かり易い漢字仮名混じり文字列と発話区分の識別子(例えばマーク)のみが表示される場合には、ユーザは発話区分を簡単に修正することができて、適切な発音記号列を極めて容易に得ることができる。

    【0031】さらに、発音記号列確認部4において、編集後の新たな発音記号列に基づき、合成音声が出力される場合には、ユーザは、編集の結果、正しい発音記号列が生成されたか否かを直ちに確認することができる。

    【0032】

    【発明の効果】以上に説明したように本発明の発音記号生成装置によれば、一般のユーザにとって容易に理解可能な発話区分を編集することが可能となっており、発話区分を編集することにより間接的に発音記号列を編集することができるので、発音記号列の定義を知らないユーザでも発音記号列の編集を容易に行なうことができ、また自然性の高い韻律を与える適切な発音記号列を容易に生成することができる。

    【0033】また、発話区分の編集において、ユーザインタフェースとしての編集ウインドウ上にユーザに解読可能な文字列と発話区分の識別子が表示され、発話区分の識別子に修正(無修正も含む)を加えることにより編集がなされるよう構成されている場合には、発話区分の編集を極めて容易に行なうことができ、これにより適切な発音記号列を極めて容易に得ることができる。

    【0034】また、生成された発音記号列を確認するための発音記号列確認手段がさらに設けられているときには、ユーザは、生成された発音記号列が正しいものか否かを確認することができる。

    【0035】また、本発明では、上記のような発音記号生成装置を用いてテキスト音声合成システムが構成されているので、テキスト音声合成システムにおいて自然性の高い韻律の合成音声を容易に得ることができる。

    【図面の簡単な説明】

    【図1】本発明に係る発音記号生成装置の一実施例のブロックである。

    【図2】図1の発音記号生成装置を用いたテキスト音声合成システムの構成例を示す図である。

    【図3】アクセント句,声立て句,呼気段落を説明するための図である。

    【図4】図2に示すテキスト音声合成システムのハードウェア構成例を示す図である。

    【図5】(a)乃至(c)は発音記号生成装置に入力する文節列の一例を示す図である。

    【図6】(a)乃至(e)は発話区分の編集処理の具体例を説明するための図である。

    【図7】発話区分の編集処理の具体例を説明するための図である。

    【符号の説明】

    1 発音記号生成装置 2 発音記号列生成部 3 発話区分編集部 4 発音記号列確認部 10 テキスト音声合成システム 11 言語処理部 12 音声合成器 20 ワークステーション 21 ディスプレイ 22 入力デバイス

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈