METHOD FOR QUANTIZING INPUT SIGNAL OF N SAMPLES INTO STRING OF k SYMBOLS DRAWN FROM q-ARY ALPHABET

申请号 JP2004277703 申请日 2004-09-24 公开(公告)号 JP2005110251A 公开(公告)日 2005-04-21
申请人 Mitsubishi Electric Research Laboratories Inc; ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド; 发明人 YEDIDIA JONATHAN S; MARTINIAN EMIN;
摘要 PROBLEM TO BE SOLVED: To provide a method for quantizing an input signal of N samples into a string of (k) symbols drawn from a q-ary alphabet. SOLUTION: A complementary method reproduces a minimally distorted version of the input signal from the quantized string, given some distortion measure. First, an [N, k] q linear error-correcting code that has a sparse generator factor graph representation is selected. A fixed mapping from q-ary symbols to samples is selected. A soft-input decoder and an encoder for the SGFG codes are selected. A cost function is determined from the input signal and a distortion measure, using the fixed mapping. The decoder determines an information block corresponding to a code word of the SGFG code with a low cost for the input signal. The input signal can be reproduced using the encoder for the SGFG code, in combination with the fixed mapping. COPYRIGHT: (C)2005,JPO&NCIPI
权利要求
  • N個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法であって、
    スパーズ生成素ファクターグラフ表現を有する[N,k] 線形ブロック誤り訂正符号を選択すること、
    前記シンボルから前記サンプルへの選択されたマッピング関数と所定の歪み測度とを使用して前記入力信号に対するコスト関数を求めること、
    および 前記コスト関数を、前記線形ブロック誤り訂正符号の符号語であって低歪みコストを有する符号語に対応する、前記k個のシンボルのストリングを含む情報ブロックに復号すること を含む、N個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 前記線形ブロック誤り訂正符号は、[N,k] スパーズ生成素ファクターグラフ符号である 請求項1記載のN個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 前記線形ブロック誤り訂正符号は、低密度生成素行列符号である 請求項1記載のN個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 前記復号は、軟入力復号方法である 請求項1記載のN個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 前記復号は、確率伝播復号方法である 請求項1記載のN個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 前記復号は、ビット反転復号方法である 請求項1記載のN個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 前記k個のシンボルのストリングを前記線形ブロック誤り訂正符号の再生符号語に符号化すること、
    および 前記再生符号語のシンボルを前記選択されたマッピング関数に従ってサンプルに置き換えること から成る、前記k個のシンボルのストリングから前記入力信号の歪みが最小のバージョンを再生する方法、をさらに含む 請求項1記載のN個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 前記符号化の方法は、前記線形ブロック誤り訂正符号を表すスパーズ生成素ファクターグラフに対するハードメッセージを用いる確率伝播方法である 請求項7記載のN個のサンプルを含む入力信号を、q元アルファベットから選択されたk個のシンボルのストリングに量子化する方法。
  • 说明书全文

    本発明は、包括的には、信号を量子化し量子化信号を再生する分野に関する。

    データ記憶および通信の分野における基本的な問題は、入信号を量子化する、およびその後最小の歪み量で量子化信号を再生する、実際的な方法の開発である。 R. GrayおよびD. Neuhoff著、「Quantization」、IEEE Transactions on Information Theory、vol. 44、pp.2325-2383、October 1998を参照のこと。

    信号を量子化し再生する方法は、大規模な物理的現象から取得される信号と同様に、一般に音声、画像またはビデオファイルとともに発生する非常に大量のデータを記憶または転送するシステムの重要な部分である。 これらの方法は、特に、大量のデータを比較的低速な通信ネットワークで転送するかまたは量が限られたメモリに大きいデータセットを記憶する場合に重要である。 量子化は、非可逆圧縮の一形態である。

    量子化および再生問題 信号を量子化し再生する問題を、以下のように定式化することができる。 入力信号は、N個のサンプルのデータを含む。 信号は、画像、ビデオ、音声ストリーム、もしくは数のセットによって表すことができる他の任意の信号を表してもよい。 サンプルは、実数であっても、精度が制限された数であってもよい。 たとえば、サンプルは、16ビット数であってもよく、それはサンプルが2 16のあり得る値のうちの1つをとることができることを意味する。

    かかる信号を、q元(q-ary)アルファベットから選択されるk個のシンボルのストリングに量子化することが望ましい。 実際の適用では、qは、通常、サンプルがとることができるレベルの数よりはるかに小さい。 すなわち、シンボルを表すために必要なビットの数は、通常、サンプルを表すために必要なビットの数より少ない。 さらに、k個のシンボルのストリングを後に、平均して入力信号と実質的に同様のN個のサンプルの出力信号に再生することができるように、量子化方法を使用することが望ましい。 すなわち、量子化および再生により、最小量の歪みがもたらされる。

    図1は、量子化および再生問題の一般的な形態100を要約したものを示す。 ソースは、量子化すべきN個のサンプル102の入力信号101を生成する。 入力信号x[n](指数nはN個のサンプルに及ぶ)を、量子化器110に渡す。 量子化器は、サンプル102をk個のシンボルのストリングs[a]115に変換する。 再生器120は、後に、シンボル115をN個のサンプル103の出力信号z[n]104に変換することができ、これは入力信号101と実質的に同様である。

    例示的な量子化および再生方法 例示的な例として、入力信号がN=4個のサンプルを含み、信号の各サンプルが、0.0と1.0との間の一様な確率分布とは無関係に選択される3つの有効数字の実数である、という場合を考える。 典型的な信号は、{. 723,. 238,. 129,. 678}である。 かかる信号を、q=4個のシンボルのアルファベット、たとえば4つの文字A、B、CおよびDから選択されるk=2個のシンボルのストリングに量子化したいと仮定する。

    この問題のための例示的な量子化方法は、以下ように作用する。 まず、信号における最初の2つのサンプル、この場合は. 723および. 238を考える。 これらがともに. 5以上である場合、量子化ストリングの第1の文字をAであるように割り当てる。 第1のサンプルが. 5以上であるが第2のサンプルが. 5未満である場合、第1の文字をBであるように割り当てる。 第1のサンプルが. 5未満であり第2のサンプルが. 5以上である場合、第1の文字をCであるように割り当てる。 最後に、第1および第2のサンプルがともに. 5未満である場合、第1の文字をDであるように割り当てる。 同一の規則を使用して、信号の第3および第4のサンプルの値に基づいて量子化ストリングの第2の文字を割り当てる。 この方法を使用して、信号{. 723,. 238,. 129,. 678}をストリング{B,C}に量子化する。

    量子化方法110とともに、入力信号を再構築するための適合する再生方法120が必要である。 例示的な量子化方法と適合する妥当な再生方法は、以下のように作用する。 量子化ストリングの最初の文字がAである場合、再生信号の最初の2つのサンプルを{. 75,. 75}であるように割り当てる。 ストリングの第1の文字がBである場合、再生信号の最初の2つのサンプルを{. 72,. 25}であるように割り当てる。 第1の文字がCである場合、最初の2つのサンプルを{. 25,. 75}であるように割り当て、第1の文字がDである場合、最初の2つのサンプルを{. 25,. 25}であるように割り当てる。 同一の規則を利用して、第2の文字に基づいて第3および第4のサンプルを割り当てる。 たとえば、これらの規則を使用してストリング{B,C}を再生信号{. 75,. 25,. 25,. 75}に変換する。

    レートおよび歪み 任意の量子化/再生方法に対する2つの非常に重要な測度は、方法のレートおよびその方法によってもたらされる歪みである。

    量子化器のレートRは、入力信号のサンプル毎に使用されるビットの数である。 単一q元シンボルの情報内容はlog (q)ビットであるため、量子化器の全体のレートは、R=klog (q)/Nである。 上の一例としての量子化器のレートは、2log (4)/4=1ビット/サンプルである。 明らかに、入力信号を表すために最小数のビットを使用するように、量子化器のレートは可能な限り低いことが望まれる。

    歪みDは、入力信号と再生出力信号との差の測度である。 歪みを、入力信号のいずれの特徴が重要であるとみなされるかに応じて、多くの異なる方法で定義することができる。 入力信号のサンプルが実数である場合、歪みを測定する1つの自然な方法は、入力信号と出力信号との差の二乗の合計を平均する、すなわち歪みを

    であると定義することである。 この歪み測度を、平均二乗誤差(MSE)歪みと呼ぶ。

    ほとんどの場合に妥当である、歪み測度に対するより一般的な形態は、

    である。 ここで、d(a,b)は、2つの個々のサンプルaとbとの間の距離を測る。

    通常、d(a,b)≧0であり、a=bである場合はd(a,b)=0であるような距離測度を使用する。 これにより、歪みが非負であり、出力信号z[n]が入力信号x[n]と同一である場合に0に等しいことが保証される。

    優れた量子化および再生方法では、歪みとレートとをともに最小化する。 しかしながら、レートと歪みとの間のトレードオフがあることが必然的である。 一般に、レートが高いほど歪みを少なくすることが可能になる。

    最適なレート・歪み関数 量子化問題を、入力信号の確率分布と歪み測度とによって定義することができる。 量子化問題によっては、レートの関数として最適な歪みを与える式を明示的に求めることが可能である。 この概念は、情報理論を紹介するシャノン(Shannon)の最初の論文にまでさかのぼる。 CE Shannon著、「A Mathematical Theory of Communication」、Bell Syst. Tech. Journal、vol 27、pp.379-423、623-656、1948およびCE Shannon著、「Coding Theorems for a Discrete Source with a Fidelity Criterion」、IRE Nat. Conv. Rec.、Pt. 4、pp.142-163、1959を参照のこと。

    シャノンは、最適なレート・歪み関数、すなわち特定のレートが与えられた場合の最適な歪みまたはその逆が、入力確率分布と歪み測度とのみに依存する式によって与えられることを証明した。 この理論の詳細な論考について、T. CoverおよびJ. Thomas著、「Elements of Information Theory」、John Wiley & Sons、New York、1991を参照のこと。 シャノンの式の詳細な理解は必要でない。 重要な点は、単に、任意の量子化問題に対し最適なレート・歪み限界がある、ということである。

    最適なレート・歪み関数をより明示的に計算することができる場合の1つの量子化問題は、信号のサンプルがガウス分布とは無関係に選択され、歪み測度がMSE歪みである場合である。

    従来技術による量子化および再生方法における主な問題は、それらのいずれも、この問題に対し最適なレート・歪み限界での性能に達しない、ということである。 たとえば、MSE歪みに対してガウス源から生成される入力信号を量子化する場合、エントロピー符号化スカラー量子化(ECSQ)方法は、レートに応じてシャノンレート・歪み限界から1.5〜3.4dB離れる。 R. GrayおよびD. Neuhoff著、「Quantization」、IEEE Transactions on Information Theory、vol. 44、pp.2325-2383、October 1998を参照のこと。

    この問題に対し、最適な量子化とともに256状態符号を使用するトレリス符号量子化(TCQ)は、最適なレート・歪み限界から0.5〜1.4dBである。 M. MarcellinおよびT. Fischer著、「Trellis Coded Quantization of Memoryless and Gauss-Markov Sources」、IEEE Transactions on Communications、vol. 38、pp.82-93、1990を参照のこと。

    従来技術による量子化および再生方法は、同様に、いかなる他の非自明な量子化問題に対しても最適なレート・歪み限界を達成することができない。

    二元消失量子化問題 最適なレート・歪み関数を明示的に計算することができる別の量子化問題は、二元消失量子化(binary erasure quantization)(BEQ)問題と呼ばれる。 BEQ問題では、入力信号x[n]は、N個のサンプルのシーケンスであり、そこでは各サンプルは、「0」、「1」および「*」で示される3つのあり得る値をとることができる。 「*」の値を、「消失」または「ドントケア」シンボルとみなすことができる。

    x[n]の各サンプルを、無関係に、確率p で消失「*」であると選択し、確率(1−p )/2で「1」または「0」であると選択する。

    信号x[n]を、k個のビットs[a]のストリングに量子化する。 この問題に対してq=2であるため、したがって量子化器のレートはR=k/Nである。

    ストリングs[a]を、最終的に、再生出力信号z[n]に変換する。 出力信号z[n]は、「0」および「1」のサンプルのシーケンスである。 BEQ問題における歪み測度は、

    である。 ここで、a=*またはa=bの場合はd(a,b)であり、それ以外の場合はd(a,b)=1である。 この問題に対し、最適なレート・歪み関数をシャノンのレート・歪み式を使用して求めることができる。 特に、ゼロ歪み(D=0)を要求する場合、最適レートはR=1−p であることが分かる。

    以下は、BEQ問題のより直観的な説明である。 サンプルのうちのいくつか、たとえば「0」および「1」のサンプルを正確に再生する一方で、他のサンプル、たとえば「*」サンプルを「0」または「1」に置き換えることができることを確実にしたい場合、N個のサンプルのランダムな入力信号が与えられる。

    当然ながら、信号を受け取る前は、いずれのサンプルが重要であるか、およびいずれのサンプルが消失であるかを知らず、さらに、量子化器はいかなる入力信号に対しても作用しなければならない。

    「0」または「1」のサンプルのうちのいくつが不正確に再生されるかに関して歪みの量を測定する。 最適なレート・歪み関数に従って、通常は、いかなる歪みもなしに、入力信号をk個のシンボル(kは単に、元の信号の「0」および「1」のサンプルの平均数である)のストリングに量子化することができる。

    二元対称量子化問題 例示の目的で有用な別の量子化問題は、二元対称量子化(binary symmetric quantization)(BSQ)問題である。 BSQ問題では、入力信号x[n]はN個のサンプルのシーケンスであり、各サンプルは、「0」「1」によって示される2つのあり得る値のみをとることができる。 x[n]の各サンプルを、無関係に、確率1/2で「1」であると選択し、確率1/2で「0」であると選択する。

    信号x[n]を、kビットのストリングs[a]に量子化する。 ストリングs[a]を、再生出力信号z[n]に変換する。 出力信号z[n]は、「0」および「1」のサンプルのシーケンスである。 BEQ問題における歪み測度は、

    である。 ここで、a=bの場合はd(a,b)=0であり、それ以外の場合はd(a,b)=1である。

    BSQ問題に対しても、最適なレート・歪み関数をシャノンのレート・歪み理論に従って求める。 たとえば、レート1/2の量子化器の場合、あり得る最小歪みはおよそ0.11であることが分かる。

    BEQ問題とBSQ問題とはともに、あり得るサンプル値の数が非常に少ないという意味で、実際的な適用では幾分か非現実的である。 しかしながら、これらは、量子化および再生問題を例示するためにはまだ有用である。

    線形ブロック誤り訂正符号 本発明は、線形ブロック誤り訂正符号を従来とは異なる方法で使用する。 したがって、以下は、かかる線形ブロック誤り訂正符号に関する必要な背景情報を提供することを意図する。 Blahut著、「Algebraic Codes for Data Transmission」、Cambridge University Press: Cambridge、2003およびMacWilliams他著、「The Theory of Error-Correcting Codes」、North-Holland: New York、NY、1997は、誤り訂正符号に関する優れた教科書である。

    本明細書において「符号」という場合はいつも、特に線形ブロック誤り訂正符号を意味する。 これらの符号の背景にある基本的な概念は、N個のシンボルのストリングを使用してk個のシンボルのストリングを符号化することであり、N>kである。 従来の誤り訂正符号の適用では、破損したメッセージを復号し訂正するために追加のN−kビットを使用する。

    N個のシンボルの任意のストリングを、時に「ブロック」または「語」とも呼ぶ。 符号のすべての制約を満足するN個のシンボルのブロックを、「符号語」と呼ぶ。 シンボルを、q元アルファベットから引き出す。 非常に重要な特別な場合は、q=2の場合である。 この場合、符号は「2進」符号である。

    図2は、線形ブロック誤り訂正符号を使用する従来の通信路符号化方法200を示す。 ソース201は、k個のシンボル202を含むストリングs[a]を生成し、シンボルはq元アルファベットから引き出される。 このストリングを、誤り訂正符号の符号器210に渡し、N個のシンボル203を含む符号語x[n]に変換する。

    そして、符号語203を、通信路215を通して送信し、そこでそれらは、破損して信号y[n]204になる。 そして、破損した信号y[n]204を、復号器220に渡し、復号器220は、符号語x[n]の再構築205か、もしくは等化に、通信路における付加的雑音がそれほど大きくない場合は、入力信号と同様のk個のシンボルストリングs[a]の形態の出力信号206を出力する。

    符号のパラメータ 符号Cを、ブロック長Nを有するq 個のあり得る符号語のセットによって定義する。 パラメータkを、時に符号の「次元(dimension)」と呼ぶ。 符号は、通常、Nおよびkが大きい場合はるかに有効である。 しかしながら、パラメータNおよびkのサイズが増大するに従い、破損したメッセージを復号することが困難になる。

    符号の「レート」Rを、R=klog (q)/Nによって定義する。

    2つの符号語間のハミング距離を、2つの語における異なるシンボルの数として定義する。 符号の距離dを、符号における符号語のすべての対の間の最小ハミング距離として定義する。 dの値が大きい符号ほど、より大きい誤り訂正能力を有する。 パラメータN、kおよびqを有する符号を、[N,k] 符号と呼ぶ。 距離dもまた既知である場合、それらを[N,k,d] 符号と呼ぶ。

    ガロア体 線形符号を、通常、生成素およびパリティ検査行列に関して表現する。 これらの行列を定義するためには、まずq元シンボルを加算し乗算する方法が必要である。 ガロア体とも呼ぶ有限体の理論は、q元シンボルに対する加法および乗法を定義する方法を提供する。 ガロア体の詳細な説明について、すでに引用したものまたはS. LinおよびD. Costello著、「Error Control Coding: Fundamentals and Applications」、Prentice Hall: Englewood Cliffs、NJ、1983を含む、誤り訂正符号に関する任意の教科書を参照のこと。

    ガロア体では、q元アルファベットからの任意の2つのシンボルを合せて加算または乗算する場合、回答は同じアルファベットからの要素である。 乗法および加法単位元要素があり、各要素は、乗法および加法逆元を有するが、加法単位元要素は乗法逆元を有していない。

    ガロア体を、GF(q)と示す。 qは、アルファベットの要素の数である。 ガロア体を、その加法および乗法テーブルに関して定義することができる。 もっとも単純なガロア体は、GF(2)であり、それは2つの要素0および1を有し、0は加法単位元であり1は乗法単位元である。 GF(2)に対する加法規則は、0+0=1+1=0および0+1=1+0=1であり、GF(2)に対する乗法規則は、0*0=0*1=1*0=0および1*1=1である。

    GF(3)は、3つの要素0、1および2を有し、0は加法単位元であり、1は乗法単位元であり、加法規則は、0+0=1+2=2+1=0、0+1=1+0=2+2=1、0+2=1+1=2+0=2であり、乗法規則は、0*0=0*1=0*2=1*0=2*0=0、1*1=2*2=1、1*2=2*1=2である。

    ガロア体を、素数かまたは素数の整数乗である任意のqに対して定義することができる。 任意のガロア体に対する加法および乗法規則を、先に引用した誤り訂正符号に関する教科書に記載されている理論から導出することができる。

    本明細書で述べるq元シンボルの加法および乗法はすべて、GF(q)の規則を使用する加法および乗法であると想定しなければならない。

    符号の生成素行列表現 任意の2つの符号語の加法もまた符号語である場合、ブロック符号は「線形」である。 各々N個のシンボルの2つの符号語の合計を、1つずつ個々のシンボルを合計することによって得られるN個のシンボルの符号語であるとして定義する。 たとえば、GF(2)を使用する2つの符号語1110100および0111010の合計は、1001110である。

    線形符号を、生成素行列によってコンパクトに表すことができる。 実際には、多くの異なる生成素行列が同じ線形符号を表すことができる。

    [N,k] 符号を表す生成素行列は、L行およびN列の行列であり、行列の各要素はq元シンボルである。 行列のN列は、符号語におけるN個のシンボルに対応する。 生成素行列は、k個の線形独立行を含む。 L>kである場合、生成素行列の行のうちのいくつかは冗長である。 符号におけるすべての符号語を、生成素行列の行の線形組合せをとることによって取得することができる。

    生成素行列の例示的な例は、「テトラ符号(tetra-code)」として既知の[N=4,k=2,d=3] q=3符号に対する以下の行列である。

    テトラ符号は、ブロック長N=4を有し、符号語の数は、q =9である。

    別の例として、以下は[N=7,k=4,d=3] q=2バイナリハミング符号の生成素行列である。

    誤り訂正符号のための符号器 線形[N,k] 符号に対する符号器210は、k個のシンボルのストリング202をN個のシンボルの符号語203に変換する。 このようにq 個の異なる符号語に変換されるk個のシンボルのストリングを、「情報ブロック」と呼び、情報ブロックのシンボルを「情報シンボル」と呼ぶ。 符号器は、符号に対し生成素行列を使用して構成することができる。

    より詳細には、情報ブロックs[a]を有し、生成素行列Gによって生成される符号に対しN個のシンボル符号語y[n]を構成したいと想定する。 符号化を式

    を使用して行うことができる。 ここで、G[a,n]は、行列Gにおける第a行および第n列のシンボルの値である。 たとえば、式(3)で与えられた生成素行列によって表されるようなテトラ符号を考慮する。 情報ブロックが{1,2}である場合、対応する符号語は、GF(3)の加法および乗法の規則を使用して、1011+2*0112=1011+0221=1202である。 全部で、テトラ符号の9個の符号語は、0000、1011、2022、0112、1120、2101、0221、1202および2210である。

    なお、すべて0の語は、常に、情報ブロックのすべてのシンボルが0に等しい場合に得られる、線形符号の符号語である。

    符号のパリティ検査行列表現 また、線形符号を、パリティ検査行列によって表すことも可能である。 [N,k] 符号を表すパリティ検査行列を、M行およびN列を有するq元シンボルの行列によって定義する。 パリティ検査行列のN列は、符号のNシンボルに対応する。 行列の線形独立行の数は、kでなければならない。

    パリティ検査行列の各行は、制約を表す。 特定の行によって表される制約に含まれるシンボルは、その行に非ゼロシンボルを有する列に対応する。 パリティ検査制約により、それらのシンボルのGF(q)に亙る重み付き合計が、強制的にゼロに等しくなる。 たとえば、バイナリ符号の場合、パリティ検査行列

    は、3つの制約

    を表す。 ここで、y[n]は、第nビットの値である。 このパリティ検査行列は、式(4)で与えられた生成素行列によって表される[N=7,k=4,d=3] q=2ハミング符号を表す別の方法である。

    符号を生成素行列Gおよびパリティ行列Hによって表す場合、その二重(dual)符号は、Hが生成素行列である符号である。

    誤り訂正符号に対する復号器 線形[N,k] 符号に対する復号器220は、送信された符号語203の歪んだバージョンx[n]を符号語y[n]205に変換する。 符号語y[n]とy[n]に符号化される情報ブロックs[a]との間に1対1マッピングがあるため、復号器を、x[n]を情報ブロックs[a]に変換することとみなすことも可能である。

    送信された符号語の歪んだバージョンは、時に、サンプルが誤り訂正符号と同じq元アルファベットからの値をとる、語x[n]である。 かかる入力信号を受け入れる復号器を、しばしば「硬入力(hard-input)」復号器と呼ぶ。 かかる復号器は、通信路により幾分か低い確率で符号語のq元シンボルが破損して他のq元シンボルになる場合に有用である。 かかる通信路に対する最適な硬入力復号器は、x[n]から最短距離を有する符号語y[n]を出力する。

    代替的に、信号x[n]を、まず「コスト関数」に変換することができ、その後そのコスト関数を復号器に入力する。 コスト関数は、各シンボルのあり得る状態各々に対するコストを指定するベクトルである。

    かかる入力コスト関数を受け入れる復号器を、しばしば「軟入力(soft-input)」復号器と呼ぶ。 ブロック長3のバイナリ符号の場合、軟入力復号器に対するコスト関数例は、[(.1,.3)、(.2,.4),(.25,.15)]である。 このコスト関数は、第1のビットに値「0」を割り当てるコストが. 1であり、第1のビットに値「1」を割り当てるコストが. 3であり、第2のビットに値「0」を割り当てるコストが. 2である等を意味する。

    最適な軟入力復号器は、コスト関数が与えられると、あり得る最低の合計コストを有する符号語y[n]を返す。 たとえば、先の段落の例の3ビット符号が2つの符号語000および111を有する場合、符号語000が返される。 それは、符号語111が. 3+. 4+. 15=. 85のコストを有する一方で、それが. 1+. 2+. 25=. 55のコストを有するためである。

    軟入力復号器のコストを、しばしば、受信信号と通信路モデルとが与えられた場合に、各ビットに対する対数尤度の負数に等しいように取る。 このため、最適な復号器を、しばしば「最大尤度」復号器と呼ぶ。 それは、コストを最小化することは尤度を最大化することに対応するためである。

    誤り訂正符号に対し最適な硬入力または軟入力復号器を構成することは、一般に、誤り訂正符号に対して符号器を構成することより、はるかに複雑な問題である。 この問題は、大きいNおよびkを有する符号に対して、特に複雑になる。 この理由で、実際に使用される多くの復号器は最適ではない。 非最適な硬入力復号器は、受け取った語に最も近い符号語を求めようと試みるが、そうすることは保証されておらず、一方、非最適な軟入力復号器は、最低コストの符号語を求めようと試みるが、そうすることは保証されていない。

    符号の最適性能に対する限界 情報理論は、最適な復号器のあり得る性能に対して重要な限界を与える。 これらの結果のいくつかは、最初に、CE Shannonにより、「A Mathematical Theory of Communication」、Bell Syst. Tech. Journal、vol 27、pp.379-423、623-656、1948において証明された。 R. Gallager著、「Information Theory and Reliable Communication」、John Wiley & Sons、New York 1968は、この問題に関するさらなる参考教科書である。

    直観的な用語で表現すると、シャノンは、いかなる雑音のある通信路も、その雑音性に関連する容量Cを有し、その容量が符号のレートより大きい場合にのみ、最適な符号の最適な復号器がすべての誤りを訂正することができることを示した。

    雑音のある通信路の例は、二元消失通信路(BEC)である。 この通信路は、2入力および3出力通信路であり、入力は値「0」または「1」をとるビットであり、出力は値「0」、「1」または「?」をとり、「?」は消失を示す。 各「0」または「1」入力ビットは、確率1−p で変化せずに通信路を通過し、確率でp で「?」に変換され、すなわち消失される。 シャノンの理論を使用してBECの容量は1−p であると示すことが可能である。

    これは、平均してビットの半分が消失される二元消失通信路を使用している場合、0.5未満のレートを有する誤り訂正符号を使用することによりすべての消失を訂正することができる、ということを意味する。

    実際の誤り訂正符号化方法は最適な性能から非常に遠かったため、何年もの間、シャノンの限界は、単に理論的に重要であるようにしかみられなかった。 しかしながら、非常に最近、確率伝播(belief propagation)復号器と不規則な低密度パリティ検査符号とを使用した誤り訂正方法が、シャノン限界のまたはそれにきわめて近い結果を達成することができることが示された。 確率伝播復号器と低密度パリティ検査符号とについては、後により詳細に説明する。

    BECに対し、Oswald等は、確率伝播復号器を使用して復号された不規則な低密度パリティ検査符号がシャノン限界に達することができることを示した。 P. OswaldおよびA. Shokrollahi著、「Capacity-achieving Sequences for the Erasure Channel」、IEEE Transactions on Information Theory、vol. 48、pp.3017-3028、December 2002を参照のこと。 加法性白色ガウス雑音(AWGN)に対し、Chung等は、シミュレーションにより、同様の符号と復号器とを使用してシャノン限界の. 0045dB内で10 −5のビット誤り率を取得することができることを示した。 S.-Y. Chung、G. Forney、T. RichardsonおよびR. Urbanke著、「On the Design of Low-Density Parity-Check Codes Within .0045 dB of the Shannon Limit」、IEEE Communications Letters、vol. 5、pp. 58-60、February 2001を参照のこと。

    反直感的に、非最適な復号器を使用することが、通信路符号化問題に対しシャノン限界に非常に近づくための重要な要素であることを理解することが重要である。 この明白な逆説の説明は、シャノン限界に近づくためには、非常に大きいブロック長および次元の符号を使用しなければならない、ということである。 かかる長い符号は、通常、最適な復号器を使用して事実上復号することができない。

    最適に復号することができる例外的に長い符号があるが、かかる符号は、常に、それらの符号語間の非常に不十分な最短距離等、他の深刻な欠陥を有する。

    確率伝播復号器のわずかな非最適性は、非常に長い低密度パリティ検査符号を使用することができることによって得られる利点に比較して、比較的重要でないことが分かる。

    低密度パリティ検査符号 非常に重要な種類の符号、すなわち低密度パリティ検査(LDPC)符号は、R. Gallagerにより「Low Density Parity Check Codes」、MIT Press、Cambridge、1963において説明された。 かかる符号の定義する特性は、それらのパリティ検査行列が低密度の非ゼロ要素を有する、ということである。

    Gallagerによって述べられた元のLDPC符号では、符号を定義するパリティ検査行列の各行は、同じ数の非ゼロ要素を有する。 これらの符号を、時に、「レギュラー」LDPC符号と呼ぶ。 イレギュラーLDPC符号では、パリティ検査行列の行が異なると、異なる数の非ゼロ要素を有する可能性がある。

    Gallagerはまた、大きいブロック長のLDPC符号に対し2つの種類の復号方法を紹介した。 彼が「確率的復号(probabilistic decoding)」と呼ぶ一方の方法は、しばしば「sum−product復号」または「確率伝播復号」とも呼ばれる。 他方の方法は、いわゆる「ビット反転(bit-flipping)」方法である。 これらの復号方法はいずれも最適ではないが、上述したように、確率伝播復号方法は、シャノン限界に非常に近接して大きいイレギュラーLDPC符号を復号するように用いることができるため十分に最適に近い。

    最近では、適切なLDPC符号を作成するために多くの方法が探求されてきた。 文献の導入的概説として、T. RichardsonおよびR. Urbanke著、「The Renaissance of Gallager's Low-Density Parity Check Codes」、IEEE Communications Magazine、pp. 126-131、August 2003を参照のこと。

    ファクターグラフ 図3に示すように、符号を、「ファクターグラフ(factor graph)」と呼ばれる2部グラフ300によって表すことができる。 FR Kschischang、BJ FreyおよびH.-A. Loeliger著、「Factor Graphs and the Sum-Product Algorithm」、IEEE Transactions on Information Theory、vol. 47、pp. 498-519、February 2001と、GD Forney, Jr.著、「Codes on Graphs: Normal Realizations」、IEEE Transactions on Information Theory、vol. 47、pp. 520-549、February 2001と、RM Tanner著、「A Recursive Approach to Low-Complexity Codes」、IEEE Transactions on Information Theory、vol. 27、pp. 533-547、September 1981と、を参照のこと。

    ファクターグラフは、「変数ノード(variable nodes)」と「ファクターノード(factor nodes)」と呼ばれる2つのタイプのノードを含む2部グラフである。 変数ノード302は、ファクターノード301のみに接続され、その逆でもある。 ファクターノードは、慣用的に正方形301を使用して描かれ、変数ノードは、慣用的に円302を使用して描かれ、変数ノードとファクターノードとの間の接続は、対応する円と正方形とを接続する線303によって示される。 時に、ファクターノード内に、それが強制する制約の種類を表すために、シンボル、すなわち「+」が描かれる。

    変数ノードは、符号で使用されるシンボルを表し、ファクターノードは、符号に対する制約を表す。 変数ノードは、対応する制約を受ける場合にのみファクターノードに接続される。

    もっとも単純な符号のファクターグラフ表現は、パリティ検査行列表現に対応するものである。 かかるファクターグラフでは、パリティ検査行列のN列に対応するN個の変数ノードがあり、パリティ検査行列のM行に対応するM個のファクターノードがある。 たとえば、パリティ検査行列

    を有するバイナリ符号は、図3に示す対応するファクターグラフ表現を有する。 このファクターグラフ表現において、変数ノードは、符号語のN個のシンボルに対応するもののみであり、ファクターノードはすべてパリティ検査制約に対応する。

    符号のより一般的なファクターグラフ表現が可能である。 特に、変数ノードのセットは、時に、符号の定義に役立つが符号語のN個のシンボルのうちの1つではない「状態変数ノード(state variable node)」と呼ばれるノードも含む。

    時に、ファクターノードはまた、パリティ検査制約より一般的な制約を表す。 たとえば、ファクターノードは、それに接続する変数ノードの許容可能な構成が何らかの小さい符号の符号語に対応するもののみであるように、制約を表すことができる。 このように、大きい符号を小さい符号から再帰的に構築することができる。 RM Tanner著、「A Recursive Approach to Low-Complexity Codes」、IEEE Transactions on Information Theory、vol. 27、pp. 533-547、September 1981を参照のこと。

    符号のスパーズ生成素ファクターグラフ表現 各ファクターノードが比較的少ない数の変数ノードにのみ接続されおよびその逆である場合、符号のファクターグラフ表現を「スパーズ(sparse):まばら」と呼ぶ。

    LDPC符号のパリティ検査行列に対応するファクターグラフは、LDPC符号のパリティ検査行列の低密度特性のために本質的にスパーズである。

    また、時に、スパーズ生成素ファクターグラフ(sparse generator factor graph)表現により他の線形符号を表すことも可能である。 たとえば、スパーズなファクターグラフにより、有限幾何学に基づくリード・マラー(Reed-Muller)符号および他の符号を表すことができる。 GD Forney, Jr.著、「Codes on Graphs: Normal Realizations」、IEEE Transactions on Information Theory、vol. 47、pp.520-549、February 2001およびJS Yedidia、J. ChenおよびM. Fossorier著、「Representing Codes for Belief Propagation Decoding」、Proceedings of the International Symposium on Information Theory、p. 176、2003を参照のこと。

    確率伝播復号 しばしば、スパーズファクターグラフによって表すことができる符号に対し、確率伝播復号方法を有効に適用することができる。 確率伝播復号方法は、非最適な軟入力復号方法であるが、非最適性の程度は、符号のスパーズファクターグラフ表現に適用する場合は概して極めて小さい。

    確率伝播復号器には多くの異なるバージョンがある。 FR Kschischang、BJ FreyおよびH.-A. Loeliger著、「Factor Graphs and the Sum-Product Algorithm」、IEEE Transactions on Information Theory、vol. 47、pp.498-519、February 2001、およびSpecial Issue on Codes and Graphs and Iterative Algorithms、IEEE Transactions on Information Theory、vol. 47、February 2001における他の論文を参照のこと。 「一般化された確率伝播(generalized belief propagation)」に基づく復号器もある。 JS Yedidia、WT FreemanおよびY. Weiss著、「Constructing Free Energy Approximations and Generalized Belief Propagation Algorithms」、Mitsubishi Electric Research Laboratories、TR2002-35、August 2002を参照のこと。

    それら復号器はすべて、「メッセージ(message)」が変数ノードとファクターノードとの間を通るという概念に基づく。 時に「証拠(evidence)」とも呼ばれる、符号のコスト関数に対応する特別な種類のメッセージもまた、各変数ノードに送出される。 変数ノードは、指定されかつ事前に求められた更新規則に基づき、ノードがファクターノードに送出するメッセージを連続的に更新し、またその逆もまた同様である。 更新規則は、ノードまたはノード群における出力メッセージを同じノードまたはノード群における入力メッセージに関連付ける。

    そして、変数ノードがそのあり得る状態のうちの1つにあるという「ビリーフ(belief)」を、その変数ノードに到達したメッセージと証拠とから求めることができる。 「ビリーフ」は、通常、q元ベクトルとして表される。 ベクトルは、変数ノードのq個のあり得る値の各々が正しいものであるという推定された確率を含む。 復号器は、最終的に、ビリーフが最高確率を有するシンボル値を選び取ることにより、各シンボルの状態を選択する。

    通信路符号化と量子化問題との二重関係 意外なことに、通信路符号化問題と量子化および再生問題とは、互いに非常に密接に関連する。 たとえば、BEQ問題とBECモデルとが非常に類似していることは特筆すべきことであり、量子化問題に対する量子化器の最適レートは、通信路符号化問題に対する符号の最適レートと同一である。

    しかしながら、今まで、LDPC符号を使用して通信路符号化問題に対し最適な限界に近づくように、量子化および再生問題に対する最適限界に近づくことができる既知の方法はない。

    本発明は、N個のサンプルの入力信号をq元アルファベットから引き出されるk個のシンボルのストリングに量子化する方法を提供する。 さらに、本発明は、量子化ストリングから入力信号を再生し、その再生の出力信号の入力信号に対する歪みが最小であるようにする、対応する方法を提供する。

    初期化中、以下の要素を選択する。

    量子化および再生方法に対する[N,k] 符号を選択する。 符号は、スパーズ生成素ファクターグラフ(SGFG)表現を有する。 したがって、選択された符号を、スパーズ生成素ファクターグラフ(SGFG)符号と呼ぶ。

    q元シンボルをサンプル値にマッピングする固定関数を選択する。

    SGFG符号に対する軟入力復号方法を選択する。 好ましい復号器は、確率伝播を使用する。 しかしながら、他の復号器も可能である。

    SGFG符号に対する符号化方法を選択する。

    そして、量子化器は、入力信号を以下のように処理する。

    入力信号と、所定の歪み測度と、q元シンボルをサンプル値にマッピングする関数と、から、コスト関数を求める。

    コスト関数を、低コストの符号語に復号する。 そして、k個のシンボルの対応する情報ブロックを生成するように、符号語の情報ブロックを選択する。

    再生方法は、SGFG符号に対する選択された符号器に基づく。 量子化信号の再生が望まれる場合、まず量子化ストリングを、符号器を使用して対応する符号語に変換する。 そして、q元シンボルをサンプル値にマッピングする関数を使用して、符号語をN個のシンボルの出力信号に変換する。

    再生出力信号は、入力信号と実質的に同様である。

    図4は、本発明による初期化手続き400のステップを示す。 図5は、本発明による量子化および再生方法のステップを示す。 新規な特徴として、本方法は、スパーズ生成素ファクターグラフ符号を使用する。

    パラメータ 入力信号501は、N個のサンプルを含む。 入力信号を、q元アルファベットから選択されるk個のシンボルのストリングに量子化したいものとする。 再生出力信号もまたN個のサンプルを有する。 入力信号と再生出力信号との間の歪み測度は既知であり、式(1)の形態を有する。

    本発明の好ましい実施の形態では、Nは大きい数であり、およそ1000以上である。 この実施の形態を処理しやすくするために、より小さいNでの実施の形態を用いる。 Nに対する大きい値が望ましい理由は、ブロック長の大きい量子化器が、上述した最適なシャノンレート・歪み限界に近づくことができるからである。 重要な点は、通信路符号化問題に対し最適な限界に近づくために、大きいブロック長の符号を使用し、同様に、量子化および再生問題の最適な限界に達するために、長い信号を量子化する量子化器を使用する、ということである。

    スパーズ生成素ファクターグラフ表現を用いる符号の選択 スパーズ生成素ファクターグラフ(SGFG)表現により[N,k] 符号411を選択する410ことにより、初期化を開始する。

    意味することを明らかにするために、まず、符号に対する「生成素ファクターグラフ(generator factor graph)」を定義する。 [N,k] 符号に対する生成素ファクターグラフは、以下の条件を満足するファクターグラフである。 第1に、生成素ファクターグラフは、少なくともN個の変数ノードを含み、それにより変数ノードのうちのN個が、符号語を定義するために使用されるシンボルに対応する。 第2に、k個の変数ノードは、符号に対する情報ブロックに対応する。 第3に、情報ブロックに対応するk個の変数ノードの値が指定されると、符号語に対応するN個の変数ノードの値を一意に求めることができる。 スパーズ生成素ファクターグラフは、同じくスパーズな生成素ファクターグラフである。 スパーズ生成素ファクターグラフによって表される符号をスパーズ生成素ファクターグラフ(SGFG)符号411と呼ぶ。

    SGFG表現を有する符号の一実施例は、低密度パリティ検査(LDPC)符号に対して二重の符号である。 かかる符号は低密度生成素行列を有するため、低密度生成素行列(LDGM)符号と呼ぶ。

    [N,k] LDGM符号は、生成素行列表現を有し、生成素行列はN列およびM行を有し、そのうちのk行は線形独立である。 q元アルファベットから生成素行列のシンボルを選択し、それを、上述したようにガロア体GF(q)の規則に従って操作する。

    LDGM符号の生成素行列の各行は、少数、典型的にはおよそ10以下の非ゼロシンボルを有する。 生成素行列を、LDPC符号に対しパリティ検査行列を形成するために文献において既知である多くの方法のうちのいずれかを使用して形成する。

    図6は、LDGM符号に対応する一例としてのスパーズ生成素ファクターグラフ600を示す。 以下の生成素行列を有する[N=3,k=2] q=2符号を考慮する。

    式(5)に従って情報ブロックs[a]から符号語x[n]が求められる、ということを想起する。 結果としての制約を明示的に書き出すことにより、

    となる。 GF(2)を使用する場合、これらの制約を次のように書くことができる。

    これらの制約を、図6のファクターグラフに表す。 なお、情報ブロックに対応する変数ノードs[1]およびs[2]が指定された後に、符号語に対応する変数ノードx[1]、x[2]およびx[3]が一意に求められるため、これは生成素ファクターグラフである。

    概して、[N,k]LDGM符号に対し、N+k変数、すなわちN個の符号語変数とk個の情報シンボル変数とに対するN個の制約式を求める。

    LDGM符号は、常に、生成素ファクターグラフ表現を有し、生成素ファクターグラフは、LDGM符号の生成素行列の低密度特性のために常にスパーズである。 したがって、LDGM符号は、常にSGFG符号である。

    LDGM符号のスパーズ生成素ファクターグラフ表現は、いかなる状態変数も含まないが、状態変数を含むスパーズ生成素ファクターグラフにより、リード・マラー符号等の他の符号を表すことができる。 量子化問題によっては、状態変数を含むSGFG表現を有するSGFG符号がより使用に適当である場合がある。

    シンボルをサンプル値にマッピングする固定関数の選択 次に、シンボルをサンプルにマッピングする固定関数421を選択する420。 この関数をy=Y(a)として書く。 ここで、aはシンボルであり、yは対応するサンプルであり、Y(a)は選択された固定マッピング関数421である。

    たとえば、q=4であり入力信号501のサンプルが0.0と1.0との間に分散する実数である場合、1つのあり得る関数は、Y('0')=. 125、Y('1')=. 375、Y('2')=. 625、Y('3')=. 875である。

    最良の関数は、歪み測度419と入力信号の確率分布418とによって決まる。 多くの場合、適切な選択は、いかなるサンプルもそのサンプルがマッピングされるシンボルの値から遠すぎない値を有するように、サンプルのあり得る値の範囲を比較的均一に分割することである。 信号に対する入力確率分布または歪み測度が非対称である場合、他の関数がより適当である場合がある。

    マッピング関数の別の例として、BEQ問題に対し、サンプルが3つの値「0」、「1」および「*」をとりシンボルが値「0」および「1」をとる場合、単純に、シンボル「0」をサンプル値「0」にマッピングし、シンボル「1」をサンプル値「1」にマッピングする。 このマッピングを、BEQに対する「標準(standard)」マッピング関数と呼ぶ。

    SGFG符号に対する復号方法の選択 次に、選択されたSGFG符号411に対し軟入力復号方法431を選択する430。

    最適な軟入力復号方法が実際的である場合、それを使用することができる。 1つの最適な軟入力復号方法は、すべてのあり得る符号語をチェックし最低コストを有するものを選択する。

    多くの実際的な適用では、SGFG符号Nは非常に大きく、符号語の数は最適な復号器には大きすぎる。 したがって、非最適な軟入力復号器を使用する。

    復号器の複雑性とそれが生成する符号語のコストとのトレードオフに応じて、いくつかの異なる非最適な軟入力復号器が可能である。 たとえば、ビット反転復号器は通常それほど複雑ではない。 しかしながら、確率伝播復号器が、通常、より低いコストを有する符号語を出力する。

    SGFG符号に対する符号化方法の選択 次に、入力信号を再生することが望まれる場合、SGFG符号411に対して符号器441を選択する440。 これを行う1つの方法は、符号に対して生成素行列を求め、その後式(5)を使用して情報ブロックを符号語に変換する、というものである。

    生成素ファクターグラフの定義のために、常に、スパーズ生成素ファクターグラフ自体をあるバージョンの既知の確率伝播方法と結合して使用することにより、SGFG符号411に対して符号器441を生成することが可能である。 これを、ノードが完全に確実である時にのみメッセージを送出する確率伝播方法のバージョンを使用して行うことができる。 かかる確率伝播方法を、「ハード(hard)」メッセージを使用する確率伝播方法と呼ぶ。

    スパーズ生成素ファクターグラフとハードメッセージを使用する確率伝播方法とを使用して符号器を生成するために、情報ブロックシンボルのシンボルに対応する変数ノードをそれらの所望の状態に設定することにより開始する。 そして、これらのノードは、メッセージをそれらの状態に関する接続されたファクターノードに送出し、それらのメッセージはファクターノードによって処理される。 そして、ファクターノードは、状態がまだ求められていない他の変数ノードにメッセージを送出する。 それらの状態を、状態がすでに既知であるノードから求めることができる。 確率伝播を、所望の符号語に対応する変数を含むファクターグラフのすべての変数ノードが求められるまで繰り返す。

    量子化および再生方法の一般的な機能 上記選択を実行した後、図5に示すように信号を量子化し再生することができる。

    本発明の基本的な概念は、量子化に対しSGFG符号411のための復号器431を使用し、再生に対しSGFG符号411のための符号器441を使用する、ということである。

    入力信号のための歪みコスト関数を求める 入力信号x[n]501を量子化する第1のステップにおいて、入力信号501と、シンボルをサンプル値にマッピングする固定マッピング関数421と、既知の歪み測度419と、を使用して、軟入力コスト関数511を求める510。

    コスト関数511を、入力信号x[n]501のN個のサンプルすべてに対しサンプル毎に求める。 入力信号x[n]の各サンプルに対し、あり得るシンボル値a各々に対して、aから取得されるマッピングされたサンプル値y=Y(a)のx[n]に関する歪みコストを測定することにより、歪みコストを求める。

    例として、ここでは二元消失量子化適用を扱っており、信号{1,*,1,0}を量子化したいとする。 式(2)で与えられるBEQ問題に対する歪み関数を、上述したBEQに対するシンボルとサンプル値との間の標準固定マッピング421とともに使用する。 入力信号から、シンボル「0」を第1のビットに割り当てるコストは1/4であり、シンボル「1」を第1のビットに割り当てるコストは0であると求められる。 同様にいずれのシンボルを第2のビットに割り当てるコストも0である。 この実施例での全歪みコスト関数は、この入力信号が与えられると、[(1/4,0),(0,0),(1/4,0),(0,1/4)]である。

    軟入力復号器の適用 [N,k] SGFG符号411に対し歪みコスト関数511と軟入力復号器431とが与えられると、ここで、コスト関数511を、符号411の低コスト符号語に対応する情報ブロック531に復号する520。 復号器431が最適である場合、最低コストの符号語に対応する情報ブロックを復号する。 情報ブロックは、必要に応じてq元アルファベットから選択されるk個のシンボルを含む。 この情報ブロックは、量子化器500の出力である。

    実施例として、本量子化問題は、BEQ量子化問題であり、N=4、k=2およびq=2であるものとする。 生成素行列

    を有する[N=4,k=2] q=2 SGFG符号411を使用し、使用される復号方法は最適な復号である。

    入力信号{1,*,1,0}が[(1/4,0),(0,0),(1/4,0),(0,1/4)]の歪みコスト関数に変換される場合、選択される符号は、4つの符号語、すなわち0000、0101、1010および1111を有する。 符号語は、それぞれ4つの情報ブロック00、01、10および11に対応する。

    歪みコスト関数を使用することにより、4つの符号語のコストは、それぞれ2/4、3/4、0および1/4である。 このため、最適な復号器は、0の歪みコストを有する、符号語1010に対応する情報ブロック10に復号する。 したがって、この誤り訂正符号と最適な復号器とを使用する量子化器は、入力信号{1,*,1,0}を情報ブロック10に量子化する。

    非最適軟入力復号器 Nが、最適な復号器を使用することができないほど大きい場合、代わりに非最適な復号器を使用する。 任意の非最適復号器の1つの重要な要件は、復号器が、何らかの符号語に対応する情報ブロックを、その符号語が最低コスト符号語でない場合であっても常に出力する、ということである。 障害状態は許容可能ではない。

    非最適な復号器は、低コスト符号語を、それが最低コスト符号語でない場合であっても確実に出力することが好ましい。 ここで、この特性を有するビット反転復号器と確率伝播復号器とを論考する。

    ビット反転復号器 低コスト符号語を確実に出力する、比較的単純な種類の復号器は、ビット反転復号器である。 使用することができる多くのあり得るビット反転復号器がある。 一例として、「ゼロ温度ビット反転復号器(zero-temperature bit-flipping decoder)」と呼ぶ以下のビット反転復号器を考慮する。

    復号器を、「仮(provisional)」情報ブロックt[a]で初期化する。 情報ブロックに対応する符号語y[n]を、SGFG符号に対する符号器を使用することによって取得することができる。 各符号語は、歪みコスト関数を使用して求めることができるコストを有する。 初期符号語のコストを、変数cに記憶する。

    各繰り返しにおいて、ゼロ温度ビット反転復号器は、仮情報ブロックにおける情報シンボルをランダムに選択し、そのシンボルを、同様にランダムに選択される別の情報シンボルに「反転させる(flip)」ように試みる。 新たに取得された情報ブロックに対応する符号語のコストがcより低い場合、反転を受け入れ、仮情報ブロックt[a]を更新し、コストcを、t[a]の新たな状態に対応する符号語のコストに更新する。 一方、新たに取得された符号語のコストがcより大きい場合、反転を拒否する。

    そして、復号器は繰り返し、別の情報シンボルを選択してランダムに反転させるように試みる。 復号器は、いかなる情報シンボルも反転させることに成功せずに所定数繰り返した後に終了し、情報ブロックt[a]を出力する。

    確率伝播復号器 SGFG符号はスパーズファクターグラフ表現を有するため、軟入力復号器として確率伝播復号器を有効に使用することも可能である。

    符号の他のファクターグラフ表現とは対照的に生成素ファクターグラフの1つの重要な利点は、それらによって情報ブロックの状態として確率伝播復号器のいかなる所与の状態も迅速に解釈することができる、ということである。 特に、情報ブロックの状態を求めるために情報ブロックに対応する変数ノードにおけるビリーフを見るだけでよい。

    再生方法 入力信号を再生するために、k個のシンボル531のストリングs[a]をN個のサンプルの出力信号z[n]509に変換する必要があることを想起する。

    [N,k] SGFG誤り訂正符号411に対する符号器441を使用することにより、ストリングs[a]531を符号語y[n]541に変換することができる。 そして、上述したように、あり得るq元シンボルの各々を固定関数421に従って異なるサンプル値に割り当てることにより、符号語y[n]541を所望の出力信号z[n]509に変換することができ、それは、入力信号501と実質的に同様である。

    たとえば、入力信号は、0.0から1.0の範囲の実数の形態の4つのサンプルを有する。 入力信号を、各々が2ビットであるシンボルのストリングに量子化する。 例示の目的で、生成素行列

    を有する[N=4,k=2] q=2 SGFG符号を使用し、量子化ストリング{1,0}で開始するものとする。 符号器は、入力ストリングを符号語{1,0,1,0}に変換する。 そして、「0」シンボルを値. 25を有するサンプルに変換し「1」シンボルを値. 75を有するサンプルに変換するという規則を適用する場合、再生出力信号は{. 75,. 25,. 75,. 25}である。

    発明の効果 BEQ問題に対し、推奨される手法は、BEC通信路符号化に対して有効なLDPC符号に対し二重のLDGM符号を使用することである。 LDPC符号に対する確率伝播復号器がBEC通信路符号化問題に対し大きいN限界におけるシャノン限界に達する場合、量子化器として使用される二重符号に対する確率伝播復号器もまた、BEQ問題に対しシャノン限界に達する。

    経験的シミュレーションがこの結果を裏づけする。 すなわち、レート1/2で長い符号を使用するほど、ゼロ歪みで50%消失の限界により近づくように量子化することができる。

    ビット反転復号器もまた有効である。 たとえば、BSQ問題に対し、ビット反転復号器とともに長さ1000のレート1/2のレギュラーLDGM符号を使用することにより、. 11という理論的限界に比較して. 14という歪みレベルで量子化することができる。

    本発明を好ましい実施形態の実施例として説明したが、発明の精神および範囲内でさまざまな他の適応および変更を行ってもよい、ということを理解しなければならない。 したがって、本発明の真の精神および範囲内にあるかかる変形および変更のすべてを包含することが、添付の特許請求項の目的である。

    従来技術による量子化および再生方法のブロック図である。

    従来技術による通信路符号化方法のブロック図である。

    パリティ検査行列に対応する従来技術によるファクターグラフである。

    本発明による初期化手続きのフローチャートである。

    本発明による量子化手続きのフローチャートである。

    本発明によって使用されるスパーズ生成素ファクターグラフである。

    QQ群二维码
    意见反馈