首页 / 专利库 / 图形技术 / 递归噪声 / Audio encoding device and audio decoding device

Audio encoding device and audio decoding device

阅读:247发布:2021-06-14

专利汇可以提供Audio encoding device and audio decoding device专利检索,专利查询,专利分析的服务。并且PURPOSE:To provide an audio encoding device in which past driving signals do not affect a noise code search adversely, the driving signals do not become a repetition of a monotonous waveform and high quality audio signals are reproduced even though the bit rate is low. CONSTITUTION:The device is provided with a zero state recursive pitch synthesis section 2200 which obtains the zero response of a recursive pitch synthesis filter when a code vector from a noise code book 2180 is inputted and a zero input recursive pitch synthesis section 2000 which obtains the zero input response when the internal state of the recursive pitch synthesis filter is made to be a past driving signal. These responses are linearly combined to generate a driving signal of an audio synthesis filter 2270. Moreover, in order to reduce the distortion of the synthesized audio, a distortion evaluation section 2310 is provided with a noise code search loop 2340 and a pitch period search loop 2330 which searches a noise code and a pitch period employing the zero state response and the zero input response of the recursive pitch synthesis filter.,下面是Audio encoding device and audio decoding device专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】雑音コードに対応したコードベクトルを格納し、外部から与えられる雑音コードで指定されたコードベクトルを出力する雑音コードブックと、 ピッチ周期およびピッチゲインのうち少なくともピッチ周期をパラメータとした再帰形ピッチ合成フィルタに前記雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答を少なくとも用いて駆動信号を生成する駆動信号生成手段と、 この駆動信号生成手段により生成される駆動信号を入力として合成音声を得る音声合成フィルタと、 前記再帰形ピッチ合成フィルタの零状態応答を用いて前記合成音声の歪みが小さくなるように前記雑音コードを探索する雑音コード探索手段とを有することを特徴とする音声符号化装置。
  • 【請求項2】雑音コードに対応したコードベクトルを格納し、外部から与えられる雑音コードで指定されたコードベクトルを出力する雑音コードブックと、 ピッチ周期およびピッチゲインのうち少なくともピッチ周期をパラメータとした再帰形ピッチ合成フィルタに前記雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答と、前記再帰形ピッチ合成フィルタの内部状態を過去の駆動信号としたときの零入力応答とを線形結合することにより駆動信号を生成する駆動信号生成手段と、 この駆動信号生成手段により生成される駆動信号を入力として合成音声を得る音声合成フィルタと、 前記再帰形ピッチ合成フィルタの零状態応答を用いて前記合成音声の歪みが小さくなるように前記雑音コードを探索する雑音コード探索手段と、 前記再帰形ピッチ合成フィルタの零入力応答を用いて前記合成音声の歪みが小さくなるように前記ピッチ周期を探索するピッチ周期探索手段とを有することを特徴とする音声符号化装置。
  • 【請求項3】雑音コードに対応したコードベクトルを格納し、外部から与えられる雑音コードで指定されたコードベクトルを出力する雑音コードブックと、 ピッチ周期をパラメータとしピッチゲインを固定値とした再帰形ピッチ合成フィルタに前記雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答を少なくとも用いて駆動信号を生成する駆動信号生成手段と、 この駆動信号生成手段により生成される駆動信号を入力として合成音声を得る音声合成フィルタとを有することを特徴とする音声復号化装置。
  • 【請求項4】雑音コードに対応したコードベクトルを格納し、外部から与えられる雑音コードで指定されたコードベクトルを出力する雑音コードブックと、 ピッチ周期をパラメータとしピッチゲインを固定値とした再帰形ピッチ合成フィルタに前記雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答と、ピッチ周期をパラメータとしピッチゲインを固定値とし過去の駆動信号を内部状態とした再帰形ピッチ合成フィルタの零入力応答とを線形結合することにより駆動信号を生成する駆動信号生成手段と、 この駆動信号生成手段により生成される駆動信号を入力として合成音声を得る音声合成フィルタとを有することを特徴とする音声復号化装置。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【産業上の利用分野】本発明は、音声を少ない情報量で高能率に符号化する低ビットレート音声符号化装置および音声復号化装置に関する。

    【0002】

    【従来の技術】音声を低ビットレートで高能率に符号化する音声符号化技術として、CELP(Code Excited L
    inear Prediction)方式が知られている。 初期のCEL
    P方式の詳細は、例えば「MRSchroeder and BSAta
    l,"Code-Excited Linear Prediction (CELP):high qual
    ity speech at very low bit rates",in Proc. ICASSP'
    85,pp.937-939,1985 」に示されている。 この方式は、
    駆動信号と再帰形ピッチ合成フィルタおよび音声合成フィルタを用い、音声合成フィルタにより合成された合成音声の歪みを最小化するように雑音コードブックから雑音コードを探索する方法を世界で最初に導入し、低ビットレートでも高品質な合成音声を提供できる符号化の可能性を示したことで知られている。

    【0003】ここで、ブロックLの長さ単位で雑音コードブックから特定のコードベクトル(次元L)を指定する雑音コードを探索する方法について、2つの従来例をもって説明する。 なお、以降の説明では簡単化のため、
    再帰形ピッチ合成フィルタの次数はすべて1次とする。

    【0004】まず、図8を用いて従来例1のCELP方式の雑音コード探索の方法を説明する。 雑音コードブック300に格納されているM本のコードベクトルの中から、雑音コード候補を基にセレクタ310によって引き出されるコードベクトルをピッチ合成フィルタ320と音声合成フィルタ370を通過させて合成ベクトル候補を生成し、この合成ベクトル候補の歪み(原音声から生成される目標ベクトルに対する合成ベクトル候補の誤差)を最小化するように最適なコードベクトルを引き出すことのできる雑音コードを選択する。

    【0005】再帰形ピッチ合成フィルタ320は、ピッチ予測器360と加算器330から構成され、ピッチ予測器360はゲイン回路340とピッチ周期に相当する遅延時間を持つ遅延回路350からなる。 このピッチ合成フィルタ320のパラメータとしては、ブロック毎に更新されるピッチ周期Tとピッチゲインβがあり、これらを用いてコードベクトルのピッチ合成を再帰的に行う。 従来例1の雑音コード探索では、ピッチ合成フィルタ320の内部の初期状態として、過去の駆動信号が遅延回路350を構成するメモリに格納されている。

    【0006】上述した従来例1のような構成では、過去の駆動信号成分がピッチ合成フィルタ320から出されたときの信号波形が雑音コードの探索に悪影響を及ぼす場合があるという問題がある。 また、過去の駆動信号を用いない自己相関法などの開ループ法で求めたピッチ周期を用いて雑音コード探索を行う構成なので、開ループで求めたピッチ周期と過去の駆動信号のピッチ周期成分の不整合が生じる悪影響のため、低ビットレートでは、雑音コードブックを用いても音質の改善が少ないという問題点があった。

    【0007】次に、特開平4−344699に示される従来例2の雑音コード探索の方法について説明する。 この方法は、ピッチ合成フィルタを用いずに、駆動信号に強いピッチ周期性を与えて合成音声の品質改善を図るために、雑音コードブックから出力されるコードベクトルをピッチ周期分だけ切り出し、切り出された長さTの波形パターンをブロック長Lに達するまで単純に繰り返す処理を行う。 そして、この繰り返し波形を音声合成フィルタに通過させて得られる合成ベクトル候補の歪み((目標ベクトルに対する合成ベクトル候補の誤差)を最小化するように雑音コードを探索する。

    【0008】図9(a)に、従来例2を用いて作成されるピッチ周期で単純に繰り返される波形の例を示す。 この図ではピッチ周期Tがブロック長Lの1/4の長さとなっている。 この図から分かるように、従来例2ではピッチ周期毎の雑音成分の間には時間が経過しているにも関わらず、全く波形的な変化がないことが分かる。 この方法で得られる雑音ベクトルと、過去の駆動信号をピッチ周期で単純に繰り返す適応コードブックからの適応ベクトルとを用いて駆動信号を生成する方法が従来例2では述べられているが、同じピッチ周期の単純繰り返し波形を結合しても、得られる駆動信号波形は図9(a)で示した波形と同様に、ピッチ周期毎に全く同じ波形パターンが繰り返すものとなることは明白である。 一方、実際の自然な音声で駆動信号のピッチ周期の繰り返し波形を観測すると、全く同じ波形パターンが繰り返すような場合は全く無いといってもよく、ほとんどの場合、微妙に複雑な変化をしながら繰り返す波形となっている。

    【0009】したがって従来例2では、ブロック長またはベクトルの次元が大きくなると、単純な波形パターンの繰り返しによる単調さが引き起こす合成音声特有の劣化、すなわち自然性の欠如が露呈してくるため、符号化ブロック長を大きくしてビットレートを大幅に低化させる音声符号化には適用が困難となってくる。

    【0010】

    【発明が解決しようとする課題】上述したように、従来の技術では過去の駆動信号が雑音コード探索に悪影響を及ぼす場合があるという問題点や、ブロック長またはベクトルの次元が大きくなると、単純な駆動信号の波形パターンの繰り返しによる単調さが引き起こす合成音声特有の劣化が露呈してくるという問題点があった。

    【0011】本発明は、過去の駆動信号が雑音コード探索に悪影響を及ぼすことがなく、しかもブロック長が大きい場合でも、音源となる駆動信号が単調な波形の繰り返しになることがないようにして合成音声の音質を改善することができる音声符号化装置および音声復号化装置を目的とする。

    【0012】

    【課題を解決するための手段】上述した目的を達成するため、本発明に係る音声符号化装置は、雑音コードに対応したコードベクトルを格納し、外部から与えられる雑音コードで指定されたコードベクトルを出力する雑音コードブックと、ピッチ周期およびピッチゲインのうち少なくともピッチ周期をパラメータとした再帰形ピッチ合成フィルタに雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答を少なくとも用いて駆動信号を生成する駆動信号生成手段と、この駆動信号生成手段により生成される駆動信号を入力として合成音声を得る音声合成フィルタと、再帰形ピッチ合成フィルタの零状態応答を用いて前記合成音声の歪みが小さくなるように雑音コードを探索する雑音コード探索手段とを有することを基本的な特徴とする。

    【0013】この場合、再帰形ピッチ合成フィルタのピッチゲインβは固定値であってもよいし、0<β≦1の範囲でピッチ周期Tの増加に対してその絶対値が単調増加するように設定してもよい。

    【0014】また、本発明に係る音声符号化装置においては、再帰形ピッチ合成フィルタに雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答と、再帰形ピッチ合成フィルタの内部状態を過去の駆動信号としたときの零入力応答とを線形結合することにより駆動信号を生成するように駆動信号生成手段を構成し、かつ再帰形ピッチ合成フィルタの零入力応答を用いて合成音声の歪みが小さくなるようにピッチ周期を探索するピッチ周期探索手段をさらに有する構成としてもよい。

    【0015】この場合、再帰形ピッチ合成フィルタのピッチゲインβは固定値であってもよいし、0<β≦1の範囲でピッチ周期Tの増加に対してその絶対値が増加するように設定してもよいし、再帰形ピッチ合成フィルタの零状態応答を求めるときと零入力応答を求めるときとで異なる固定値に設定してもよい。

    【0016】本発明に係る音声復号化装置は、雑音コードに対応したコードベクトルを格納し、外部から与えられる雑音コードで指定されたコードベクトルを出力する雑音コードブックと、ピッチ周期をパラメータとしピッチゲインを固定値とした再帰形ピッチ合成フィルタに雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答を少なくとも用いて駆動信号を生成する駆動信号生成手段と、この駆動信号生成手段により生成される駆動信号を入力として合成音声を得る音声合成フィルタとを有することを基本的な特徴とする。

    【0017】また、本発明に係る音声復号化装置においては、ピッチ周期をパラメータとしピッチゲインを固定値とした再帰形ピッチ合成フィルタに前記雑音コードブックから出力されるコードベクトルを入力としたときの零状態応答と、ピッチ周期をパラメータとしピッチゲインを固定値とし過去の駆動信号を内部状態とした再帰形ピッチ合成フィルタの零入力応答とを線形結合することにより駆動信号を生成するように駆動信号生成手段を構成してもよい。 この場合、再帰形ピッチ合成フィルタの零入力応答を求めるときのピッチゲインβは、好ましくは0<β≦1の範囲に設定する。

    【0018】

    【作用】本発明においては、内部状態が零の再帰形ピッチ合成フィルタに雑音コードブックからのコードベクトルを入力して得られる零状態応答の形状ベクトル成分から駆動信号を求め、この駆動信号を音声合成フィルタに通して得られる合成ベクトル候補を用いて、合成音声の歪みが小さくなるような雑音コードを探索する。 このようにすることにより、再帰形ピッチ合成フィルタからの過去の駆動信号の影響を零入力応答として分離できるので、合成音声に含まれる歪みが非常に少ない雑音コードを探索することができる。

    【0019】また、本発明においては、再帰形ピッチ合成フィルタのピッチ周期化作用により、ピッチゲインをどのような値にしても最終的に生成される駆動信号は単調な繰り返し波形になることはなく、合成音声特有の劣化が防止される。

    【0020】

    【実施例】以下、図面を参照して本発明の実施例を説明するが、その前に図1を用いて再帰形ピッチ合成フィルタの零入力応答と零状態応答の関係についてより詳細に説明する。 図1(a)は加算器11とピッチ予測器30
    (ゲイン回路12とピッチ周期の遅延時間を持つ遅延回路13により構成される)からなる従来の再帰形ピッチ合成フィルタ13の構成を表したブロック図であり、図1(b)はこの再帰形ピッチ合成フィルタ13を零入力応答と零状態応答に分離した場合の等価回路をブロック図として表したものである。

    【0021】図1(b)において、第1の処理部14では加算器15とピッチ予測器31(ゲイン回路16と遅延回路17により構成される)からなる再帰形ピッチ合成フィルタの入力を零とし、過去の駆動信号を内部状態として零入力応答が生成される。 したがって、この第1
    の処理部14から出力される零入力応答は、再帰形ピッチ合成フィルタの入力信号に無関係な過去の駆動信号だけの純粋な影響を表している。

    【0022】一方、第2の処理部19では加算器21とピッチ予測器32(ゲイン回路20と遅延回路22により構成される)からなる再帰形ピッチ合成フィルタの内部状態(遅延回路22を構成するメモリの状態)を零にクリアした状態で、純粋に入力信号だけで生成されるピッチ合成の影響を表す零状態応答が生成される。 そして、これら第1および第2の処理部14,19によって生成される二つの応答を加算器24で加算することにより、図1(a)の再帰形ピッチ合成フィルタ13の出力と等価な出力が得られる。

    【0023】なお、図1(b)において破線矢印25で示した出力信号の帰還はブロック毎に行われ、各時点の処理ブロックにおいて適切に零入力応答を得ることができるようにするために必要なフィルタの内部状態の設定を示している。

    【0024】ここで、再帰形ピッチ合成フィルタの出力を零入力応答と零状態応答の2つに分離する方法の他の例として、図2に示すように加算器45とピッチ予測器60(ゲイン回路46と遅延回路47により構成される)からなる再帰形ピッチ合成フィルタによって生成される零入力応答と、加算器51とピッチ予測器61(ゲイン回路50と遅延回路52により構成される)からなる再帰形ピッチ合成フィルタによって生成される零状態応答の各応答毎に、ゲイン回路56,57によって異なるゲイン量を個別に設定でき、ゲイン設定後に2つの応答を加算器54で加算したものを出力とする再帰形ピッチ合成フィルタを提案する。

    【0025】この図2のような構成の再帰形ピッチ合成フィルタによると、過去の駆動信号からの影響量とコードベクトルの雑音成分の影響量をそれぞれ制御できるので、さらに正確に周期信号を表現できる再帰形ピッチ合成フィルタを提供できる。 また、2つの応答を求める際に用いるゲイン回路46,50で付与されるピッチゲインβを固定化することで、符号化においてピッチゲインβの情報を伝送するのに必要な符号量を節約することが出来る。 さらに、固定のピッチゲインβを零入力応答用と零状態応答用とでそれぞれの応答に対し適切な異なる値に設定することで、ピッチゲインβを固定化させたことによる表現力の若干の低下をある程度回復することができるようになる。

    【0026】本発明による音声符号化装置のもう一つの効果として、用いる再帰形ピッチ合成フィルタは零入力応答と零状態応答を求めるために変形されてはいるが、
    前述した従来例1の再帰形ピッチ合成フィルタのピッチ周期化の方法を受け継いでいるので、ピッチゲインβをどのような値に設定しても、最終的に生成される駆動信号波形は、単調な繰り返し波形とはならないことが挙げられる。 これは、ピッチ合成フィルタ内部の加算器において、1ピッチ周期前の区間で生成された出力信号の繰り返しと入力されるコードベクトルの和を次のピッチ周期区間の出力としていることにその本質がある。 図9
    (b)に再帰形ピッチ合成フィルタを用いて得られる駆動信号波形の一例を示す。 この図からもわかるように、
    本発明によると駆動信号が単調な繰り返し波形とはならず、徐々に変化した波形パターンの繰り返しを表現できる。

    【0027】従って、本発明によると過去の駆動信号が雑音コード探索に悪影響を及ぼすことがないようにでき、しかもブロック長が大きい場合でも、音源となる駆動信号が単調な波形の繰り返しになることがないようにできるので、低ビットレートにおける合成音声の品質が改善される。

    【0028】図3は、本発明の一実施例に係る音声符号化装置のブロック図である。 本実施例は、入力される音声信号(以下、入力音声という)から合成フィルタ情報、ピッチ周期情報、雑音コード情報、ゲイン情報の4
    種類の情報を抽出/符号化する構成で、かつ合成音声の歪みが小さくなるようにピッチ周期情報、雑音コード情報、ゲイン情報の符号化を行うCELP方式に代表される音声符号化法による音声符号化装置に本発明を適用した例を示している。

    【0029】この音声符号化装置は、雑音コードに対応したコードベクトルを格納した雑音コードブック218
    0、雑音コードブック2180から雑音コードで指定されるコードベクトルを引き出すためのセレクタ219
    0、再帰形ピッチ合成フィルタの零入力応答を求めるための零入力再帰形ピッチ合成部2000、再帰形ピッチ合成フィルタの零状態応答を求めるための零状態再帰形ピッチ合成部2200、これらピッチ合成部2000,
    2200から得られる零入力応答および零状態応答を線形結合して駆動信号を生成するゲイン回路2160,2
    250および加算器2260、駆動信号を入力として合成音声を得る音声合成フィルタ2270、入力音声から音声合成フィルタ2270のフィルタ情報を分析する合成フィルタ情報分析部2290、入力音声と合成フィルタ情報から目標ベクトルを生成する目標ベクトル生成部2300、目標ベクトルと合成フィルタ情報を用いて音声合成フィルタ2270で得られた合成音声の歪みを評価する歪み評価部2310、および符号選択部2320
    からなる。

    【0030】次に、この実施例の動作を説明する。 合成フィルタ情報分析部2290は入力音声を分析して音声のスペクトラムの外形を表す音声合成フィルタの情報を抽出/符号化し、これを合成フィルタ情報として出力するとともに、音声合成フィルタ2270にパラメータを与える。 合成フィルタ情報の分析法としては、例えばL
    PC(Linear Prediction Coding)分析法を用いることができる。

    【0031】零入力再帰形ピッチ合成部2000および零状態再帰形ピッチ合成部2200で必要なピッチ周期情報の抽出は、次のようにして行われる。 まず、符号選択部2320から探索ループ2330を用いて零入力再帰形ピッチ合成部2000にピッチ周期の候補を与えることにより、零入力応答を求める。 この零入力応答をゲイン回路2160および加算器2260を介して音声合成フィルタ2270に入力し、合成ベクトル候補を得る。 この合成ベクトル候補と、入力音声から目標ベクトル生成部2300で生成される目標ベクトルを歪み評価部2310に入力し、両者間の誤差、つまり合成ベクトル候補の歪みを求め、これに基づき符号選択部2320
    を制御して歪みが小さくなるようなピッチ周期Tを探索する。 このとき、ゲイン回路2160によって零入力応答に与えられるゲイン2160は、例えば通常のCEL
    P方式で用いられるような、最適ゲインを用いるのと等価なコードブック探索法を用いることが出来る。

    【0032】また、このとき零状態応答の影響は零であるとしてピッチ周期の探索が行われるが、もし雑音コードの候補数が非常に少ない数に限定できるときは、零状態応答の影響を考慮してピッチ周期探索を行うとさらに歪みの少ない合成音声を生成できるピッチ周期と雑音コードを探索することが出来るという効果がある。

    【0033】このピッチ周期の探索中は、零入力再帰形ピッチ合成部2000および零状態再帰形ピッチ合成部2200におけるピッチゲインβは、全てのピッチ周期候補に対し固定化されているか、またはβの絶対値が1
    より小さい範囲で、Tの増加に対しβの絶対値が増加する対応関係を持つように、βが設定されている必要がある。 常にβ=1に固定化されている場合は、本実施例における零入力応答を用いたピッチ周期探索の部分が公知の適応コードブック探索と同一の構造となる。 一方、β
    の絶対値が1より小さな値に設定される場合は、過去の駆動信号の繰り返しの利用効果が若干低下するが、符号の伝送誤りによる音質の劣化の影響をリークさせる効果が生じるため、伝送路誤りがあっても比較的早く音質を回復できるような音声符号化/復号化を実現することができる。 また、βをTと関係付けてβを変化させる方法では、ピッチ周期候補毎の零入力応答のエネルギーをT
    によらずに比較的安定な値にできるので、上述のリーク量を一定化できる効果が得られる。

    【0034】次に、零状態再帰形ピッチ合成部2200
    を用いた雑音コード探索の方法について説明する。 雑音コード探索は、少なくともピッチ周期に関して零入力再帰形ピッチ合成部2000と同じ条件で使用される零状態再帰形ピッチ合成部2200を用いて、探索ループ2
    340に関して行われる。 まず、符号選択部2320から探索ループ2340を用いて雑音コードの候補をセレクタ2190に与え、雑音コードブック2180から該雑音コードに対応するコードベクトルを取り出して零状態再帰形ピッチ合成部2200に入力し、零状態応答を求める。 この零状態応答をゲイン回路2250および加算器2260を介して音声合成フィルタ2270に入力し、合成ベクトル候補を得る。 この合成ベクトル候補と、入力音声から目標ベクトル生成部2300で生成される目標ベクトルを歪み評価部2310に入力し、両者間の誤差、つまり合成ベクトル候補の歪みを求め、これに基づき符号選択部2320を制御して歪みが小さくなるような雑音コードを探索する。 このとき、ゲイン回路2250によって零状態応答に与えられるゲインは、例えば公知のCELP方式で用いられるような、最適ゲインを用いるのと等価なコードブック探索法を用いることが出来る。

    【0035】上述した雑音コードの探索に当たっては、
    零入力態応答からの影響を考慮し、トータル的に歪みの少ない雑音コードを探索するようにする。 もし、零状態応答側から見て、零入力応答側が雑音コード探索に与える影響が無視できるような構成で探索が行えるような歪み尺度またはコードブックまたはベクトルの直交化等の方法を用いる場合は、雑音コードの探索をピッチ周期の探索と独立に行うことができる。

    【0036】図4に、本実施例における雑音コードの探索動作を示す。 同図において、雑音コード探索はピッチ周期Tが与えられた零状態再帰形ピッチ合成部620を用いて、探索ループ690に関して行われる。 まず、符号選択部695から雑音コードの候補をセレクタ610
    に与えて、雑音コードブック600から該雑音コードに対応するコードベクトルを取り出して零状態再帰形ピッチ合成部620に入力する。 そして、零状態再帰形ピッチ合成部620で再帰計算処理により零状態応答を求め、これを音声合成フィルタ670で合成して得られる合成ベクトル候補とし、この合成ベクトル候補と入力音声から生成される目標ベクトルとの誤差、つまり合成音声の歪みを歪み評価部680で評価し、これに基づき符号選択部695を制御して歪みが小さくなるような雑音コードを探索する。 雑音コードを探索する。 このとき、
    再帰形ピッチ合成フィルタの零入力応答からの影響が無視できない場合には、評価部680に図示しない零入力応答成分を入力して、歪み量を評価することで、零入力応答の影響をも考慮した雑音コード探索を行うことができる。

    【0037】ゲイン情報は、この実施例ではゲイン情報によってゲインコードブックから特定のゲインを指定することのできるゲインコードブックを用いて符号化される。 ゲイン情報の探索に当たっては、合成音声の歪みが少なくなるようにゲイン情報を探索するようにする。

    【0038】上記実施例では、図5(a)に示すようにコードベクトルを再帰形ピッチ合成フィルタ70に通してから音声合成フィルタ71に入力したが、両フィルタの接続順序を入れ換えて図5(b)に示ようにコードベクトルを音声合成フィルタ72に通してから再帰形ピッチ合成フィルタ73に入力しても構わない。 フィルタリングに要する計算量的観点から見ると、オーバラッピング構造を持つ構造化されたコードブックを雑音コードブックとして使用する場合は、図5(b)のように先に音声合成フィルタ、後でピッチ合成フィルタの処理を行う順序の方が特願平1−329228に示される、音声合成フィルタのインパルス応答を用いた再帰的畳み込みの方法を用いて計算量を大幅に削減できるので、図5
    (b)は図5(a)の接続順序に比べてより少ない計算量で雑音コードを探索することができる効果がある。

    【0039】次に、音声復号化装置について説明する。
    図6は、本発明に係る音声復号化装置の一実施例を示すブロック図である。 同図では、上述の音声符号化装置で符号化されたパラメータであるところの合成フィルタ情報、ピッチ周期情報、雑音コード情報およびゲイン情報を入力し、これらの情報から合成音声を再生する構成を示している。

    【0040】まず、駆動信号の再生方法について説明する。 零入力再帰形ピッチ合成部1000において、音声符号化装置から伝送されたピッチ周期情報を基に過去の駆動信号から零入力応答ベクトル1150を生成する。
    この零入力応答ベクトル1150に対して、音声符号化装置から伝送されたゲイン情報を基にゲインコードブック1290から得られる零入力応答用のゲインをゲイン回路1160で乗じて第1のベクトルを作成する。

    【0041】一方、音声符号化装置から伝送された雑音コードを基に雑音コードブック1180からセレクタ1
    190を介してコードベクトルを取り出し、これを零状態再帰形ピッチ合成部1200に音声符号化装置から伝送されたピッチ周期情報を基に構成される再帰形ピッチ合成フィルタの内部状態を零クリアした状態で入力しして零状態応答1240を求め、この零状態応答1240
    にゲインコードブック1290から得られる零状態応答用のゲインをゲイン回路1250で乗じて第2のベクトルを作成する。

    【0042】そして、加算器1260で第1のベクトルと第2のベクトルを加算したものを駆動信号として再生し、この駆動信号を音声符号化装置から伝送された合成フィルタ情報を基に構成される音声合成フィルタ127
    0に入力して合成を行い、再生音声を出力端子1280
    より得る。

    【0043】図7は、本発明に係る音声復号化装置の他の実施例を示すブロック図である。 ここでは、再帰形ピッチ合成フィルタとして、図2を用いて説明したピッチゲインが異なる構成のものを用いている。 すなわち、まず駆動信号の再生方法について説明すると、零入力再帰形ピッチ合成部120において、音声符号化装置から伝送されたピッチ周期情報を基に過去の駆動信号から零入力応答ベクトル150を生成する。 この零入力応答ベクトル150に対して、音声符号化装置から伝送されたゲイン情報を基にゲインコードブック290から得られる零入力応答用のゲインをゲイン回路160で乗じて第1
    のベクトルを作成する。

    【0044】一方、音声符号化装置から伝送された雑音コードを基に雑音コードブック180からセレクタ19
    0を介してコードベクトルを取り出し、これを零状態再帰形ピッチ合成部210に音声符号化装置から伝送されたピッチ周期情報を基に構成される再帰形ピッチ合成フィルタの内部状態を零クリアした状態で入力しして零状態応答240を求め、この零状態応答240にゲインコードブック290から得られる零状態応答用のゲインをゲイン回路250で乗じて第2のベクトルを作成する。

    【0045】そして、加算器260で第1のベクトルと第2のベクトルを加算したものを駆動信号として再生し、この駆動信号を音声符号化装置から伝送された合成フィルタ情報を基に構成される音声合成フィルタ270
    に入力して合成を行い、再生音声を出力端子280より得る。

    【0046】ここで、零入力再帰形ピッチ合成部120
    内でゲイン回路130により与えられるピッチゲインβ
    1と、零応答再帰形ピッチ合成部210内でゲイン回路220により与えられるピッチゲインβ2とは異なっている。 これにより固定のピッチゲインβ1,β2を零入力応答用と零状態応答用とでそれぞれの応答に対し適切な異なる値に設定することで、ピッチゲインを固定化させたことによる表現力の若干の低下をある程度回復することができるという利点がある。 なお、上述した本発明による音声復号化装置は、音声合成装置としても使用できることはいうまでもない。

    【0047】上述した実施例では、ピッチ合成フィルタの零状態応答を求める際に使用するピッチ周期Tは、もともと1つのピッチ合成フィルタを2つに分離したものであるため、零入力応答の生成に使用したピッチ周期と同一のものを用いている。 しかし、実際の符号化装置の実現に当たり計算量が問題となるような場合は、例えば非整数ピッチ周期を整数化してピッチ合成を簡単化するなどの方法で雑音コードをより少ない計算量で探索し、
    同じ方法で音声を再生するような実施形態も可能である。 このように、零状態応答を求める際のピッチ周期の精度をある程度簡略化しても、合成音声の歪が少なくなるように雑音コードを探索することによって、探索で選ばれたコードベクトルがピッチ周期の精度の僅かなずれを補う働きをし、結果的には音質がほとんど劣化しない。

    【0048】

    【発明の効果】以上説明したように、本発明によれば過去の駆動信号が雑音コード探索に悪影響を及ぼさないようにし、ブロック長が大きい場合でも、音源となる駆動信号が単調な波形の繰り返しになることがないようにして、非常に低いビットレートでも合成音声の音質を改善することができる。

    【図面の簡単な説明】

    【図1】再帰形ピッチ合成フィルタの基本構成と再帰形ピッチ合成フィルタを零入力応答と零状態応答をそれぞれ求める処理部に分割した構成を示すブロック図

    【図2】本発明に基づく再帰形ピッチ合成フィルタの構成を示すブロック図

    【図3】本発明に係る音声符号化装置の一実施例を示すブロック図

    【図4】同実施例における雑音コード探索動作を説明するための図

    【図5】再帰形ピッチ合成フィルタと音声合成フィルタの接続方法を示すブロック図

    【図6】本発明に係る音声復号化装置の一実施例を示すブロック図

    【図7】本発明に係る音声復号化装置の他の実施例を示すブロック図

    【図8】従来例1による雑音コード探索法を示すブロック図

    【図9】従来例2と本発明との駆動信号波形を比較して示す図

    【符号の説明】

    2000…零入力再帰形ピッチ合成部 2200…零状態再帰形ピッチ合成部 2180…雑音コードブック 2160,2250…ゲイン回路 2270…音声合成フィルタ 2280…ゲインコードブック 2290…合成フィルタ情報分析部 2300…目標ベクトル生成部 2310…歪み評価部 2320…符号選択部 2330…ピッチ周期探索ループ 2340…雑音コード探索ループ 2350…ゲインコード探索ループ

    ───────────────────────────────────────────────────── フロントページの続き (72)発明者 押切 正浩 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 天田 皇 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈