首页 / 专利库 / 视听技术与设备 / 视频编码层 / Method and system for dynamically displaying residue coefficient

Method and system for dynamically displaying residue coefficient

阅读:469发布:2022-01-21

专利汇可以提供Method and system for dynamically displaying residue coefficient专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a method and system that can enhance a video coding efficiency through a dynamic display technology for residue coefficients.
SOLUTION: The method for enhancing a video coding efficiency through the dynamic display technology of a residue coefficient includes a step where a base layer of a video sequence introducing a loss of video quality is coded, a step where the residue number of the video sequence is calculated from the coded base layer, a step where use of the dynamic indication technology expresses the residue number, a step where a corrected size and the code value of the residue coefficient are coded, and a step where the coded information is represented by coding indication.
COPYRIGHT: (C)2001,JPO,下面是Method and system for dynamically displaying residue coefficient专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法であって、 映像品質の損失を導入するビデオシーケンスのベースレイヤを符号化するステップと、 前記符号化したベースレイヤから前記ビデオシーケンスの剰余数を計算するステップと、 動的表示技術を用いて剰余数値を表すステップと、 ビットプレーンエントロピ符号化方法によって、修正された大きさと剰余数係数の符号値とを符号化するステップと、 前記符号化情報を符号化表示で表すステップと、 からなる方法。
  • 【請求項2】 請求項1に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、ベースレイヤの符号化器が、 2次元配列の画素を有するブロック内に入力画像をサンプリングするステップと、 予めメモリ内に再構築された映像から予測ブロックを構築するステップと、 サンプリングした画素の前記ブロックに使用される予測モードについて決定するステップと、 前記決定に基づき、サンプリングした画素の前記ブロックから予測ブロックを減算して予測誤差を獲得するステップと、 予測誤差の前記ブロックに離散コサイン変換を実行するステップと、 DCT係数の前記ブロックを量子化するステップと、 前記ブロックをジグザグスキャン順序でスキャンするステップと、 ハフマン符号化によって前記ブロックを符号化し、また前記符号化情報を符号化表示で表すステップと、 からなる方法。
  • 【請求項3】 請求項1に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、周波数領域の剰余数値を計算するステップが、 ベースレイヤ内の符号化器からDCT係数のブロックを獲得するステップと、 将来の減算のためにDCT係数の前記ブロックをブロックメモリに記憶するステップと、 ベースレイヤ内の前記符号化器から量子化DCT係数のブロックを獲得するステップと、 量子化DCT係数の前記ブロックを逆量子化するステップと、 ブロックメモリ内のDCT係数の前記ブロックから、再構築されたDCT係数の前記ブロックを減算して剰余数係数を獲得するステップと、 剰余数係数の前記ブロックをジグザグスキャン順序で並べ替えるステップと、 剰余数係数の前記ブロックをフレームメモリに記憶するステップと、 からなる方法。
  • 【請求項4】 請求項1に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、空間領域の剰余数値を計算するステップが、 ベースレイヤ内の符号化器から量子化DCT係数のブロックを獲得するステップと、 量子化DCT係数の前記ブロックを逆量子化するステップと、 逆離散コサイン変換によって前記ブロックを空間領域に変換するステップと、 ベースレイヤからの動き補償した予測値のブロックに、
    再構築された予測差の前記ブロックを加算して復号化映像を再構築するステップと、 再構築された映像の画素値をフィルタ処理するステップと、 前記フィルタ処理された画素値を元の映像の画素値から減算して剰余数係数を獲得するステップと、 2次元配列の画素を有するブロック内に前記剰余数係数をサンプリングするステップと、 離散コサイン変換によって剰余数係数の前記ブロックを周波数領域に変換するステップと、 剰余数係数の前記ブロックをジグザグスキャン順序で並べ替えるステップと、 剰余数係数の前記ブロックをフレームメモリに記憶するステップと、 からなる方法。
  • 【請求項5】 請求項1に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、動的剰余数表示が、 フレームメモリから剰余数係数を検索するステップと、 前記剰余数係数の符号値と大きさとを獲得するステップと、 前記大きさの最大値を発見するステップと、 前記大きさのカットオフ値を規定するステップと、 前記最大値情報と前記カットオフ値情報とを符号化し、
    また前記情報を符号化表示で表すステップと、 剰余数変換に必要なパラメータを計算するステップと、 前記最大値と前記カットオフ値と前記計算されたパラメータとに基づき、バイナリ変換を前記大きさに実行するステップと、 からなる方法。
  • 【請求項6】 請求項1に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、周波数領域で計算された剰余数の復号化器が、 ベースレイヤビットストリームを復号化するステップと、 拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出するステップと、前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得するステップと、 剰余数変換に必要なパラメータを計算するステップと、 剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得するステップと、 前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築するステップと、 2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングするステップと、 剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替えるステップと、 ベースレイヤから逆量子化DCT係数のブロックを獲得するステップと、 逆量子化DCT係数の前記ブロックに、再構築された剰余数値の前記ブロックを加算するステップと、 拡張されたDCT係数の前記ブロックに逆離散コサイン変換を行い空間領域における前記係数の値を獲得するステップと、 ベースレイヤのために使用された予測モードを決定するステップと、 前記予測モードに基づき、動き補償された予測ブロックをベースレイヤから獲得するステップと、 拡張された予測誤差の前記ブロックに前記動き補償された予測ブロックを加算して拡張された映像を形成するステップと、 からなる方法。
  • 【請求項7】 請求項1に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、空間領域で計算された剰余数の復号化器が、 ベースレイヤビットストリームを復号化するステップと、 拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出するステップと、 前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得するステップと、 剰余数変換に必要なパラメータを計算するステップと、 剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得するステップと、 前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築するステップと、 2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングするステップと、 剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替えるステップと、 剰余数係数の前記ブロックに逆離散コサイン変換を行い剰余数ブロックの画素値を獲得するステップと、 ベースレイヤからの復号化映像をフィルタ処理してノイズを最小にするステップと、 剰余数係数の前記ブロックの値に、ベースレイヤからの前記フィルタ処理された映像の画素値を加算して拡張された映像を形成するステップと、 からなる方法。
  • 【請求項8】 請求項1、6、7に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、ベースレイヤビットストリームを復号化するステップが、 前記ベースレイヤビットストリームを逆エントロピ符号化して量子化DCT係数のブロックを獲得するステップと、 ベースレイヤビットストリームからスキャン方法と予測方法とを抽出するステップと、 前記スキャン方法によって量子化DCT係数の前記ブロックをスキャンするステップと、 将来の予測のために係数の前記ブロックをブロックメモリに記憶するステップと、 DCT係数の前記ブロックを逆量子化するステップと、 逆離散コサイン変換によって、再構築されたDCT係数の前記ブロックを空間領域に変換するステップと、 前記予測方法と、ベースレイヤの予め復号化された映像からの情報とに基づき動き補償された予測ブロックを形成するステップと、 前記再構築されたブロックを前記予測ブロックに加算して復号化映像の画素値を再構築するステップと、 将来の予測のために復号化映像をフレームメモリに記憶するステップと、 からなる方法。
  • 【請求項9】 請求項1および5に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、カットオフ値を規定するステップが、 VOP内の剰余数係数の大きさの値について発生数を獲得するステップと、 必要な最小拡張ビットレートと、フレームレートと、エントロピ符号化の符号化効率とに基づき発生のしきい値の和を計算するステップと、 発生の前記しきい値の和に基づきカットオフ値を決定するステップと、 からなる方法。
  • 【請求項10】 請求項1、5、6、7に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、剰余数変換のパラメータを計算するステップが、 第2のビットプレーンの最大ダイナミックレンジを発見するステップと、 ビット数を計算して前記最大ダイナミックレンジを表すステップと、 前記ビット数に基づきビットプレーンの総数を計算するステップと、 前記ビット数に基づき第2のビットプレーンと下方の最大バイナリレンジを決定するステップと、 しきい値を計算するステップと、 からなる方法。
  • 【請求項11】 請求項1、6、7に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、剰余数再構築と、受信した非ゼロ剰余数係数の修正された大きさに関する予測とを実行するステップが、 前記受信した剰余数係数の修正された大きさについて予測を実行するステップと、 受信された剰余数の大きさを予測された大きさから再構築するステップと、 からなる方法。
  • 【請求項12】 請求項1、5、9に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、発生のしきい値の和が、最小拡張ビットレートを第1のビットプレーンのエントロピ符号化のフレームレートと符号化効率とで除算することによって計算される方法。
  • 【請求項13】 請求項1、5、9に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、カットオフ値が、前記カットオフ値よりも大きい剰余数係数の総数が発生のしきい値の和よりも小さいという基準に基づいて決定される方法。
  • 【請求項14】 請求項1および5に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、前記カットオフ値よりも小さく、また前記しきい値よりも大きな大きさの2進法表示が、前記剰余数係数の大きさに2を乗算し、また前記乗法の前記結果から前記しきい値を減算することによって動的剰余数表示に変換される方法。
  • 【請求項15】 請求項1および5に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、前記カットオフ値よりも大きいかまたは等しい大きさの2進法表示を動的剰余数表示に変換するステップが、 前記大きさから前記カットオフ値を減算することによってオフセット値を計算するステップと、 前記剰余数係数の前記オフセット値に2を乗算し、また前記オフセット値が前記しきい値よりも大きい場合には、前記乗算の前記結果から前記しきい値を減算するステップと、 最大ダイナミックレンジを表すために所定のビット数だけ値を左に移動し、また前記移動した値を前記計算されたオフセット値に加算するステップと、からなる方法。
  • 【請求項16】 請求項1、6、7、11に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、受信した非ゼロ剰余数係数の修正された大きさについて予測を実行するステップが、 受信されたビットプレーンの数を決定するステップと、 受信されたビットプレーンの数が1に等しい場合には、
    最後に受信されたビットプレーンの下の2つのビットプレーンのビットを1に設定するステップと、 受信されたビットプレーンの数が1に等しい場合以外の場合には、前記受信されたビットプレーンの数がビットプレーンの総数よりも1を越えて小さければ、前記最後に受信されたビットプレーンの下の次のビットプレーンのビットを1に設定するステップと、 からなる方法。
  • 【請求項17】 請求項1、6、7、11に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、予測された剰余数係数から大きさを再構築するステップが、 前記予測された剰余数係数から第1のビット情報を抽出するステップと、 前記予測された剰余数係数の第1のビットをゼロに設定するステップと、 前記抽出されたビットが1であるかどうかを決定するステップと、 前記しきい値を前記予測された剰余数係数に加算し、また予測された値が前記しきい値よりも大きければ前記結果を2で除算するステップと、 前記抽出されたビットが1である場合には、前記予測された値と前記カットオフ値とを合計するステップと、 からなる方法。
  • 【請求項18】 請求項1、5、6、7、10に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、第2のビットプレーンの最大ダイナミックレンジを発見するステップが、 前記第2のビットプレーンの上限ダイナミックレンジを計算するステップと、 前記第2のビットプレーンの下限ダイナミックレンジを計算するステップと、 前記2つのダイナミックレンジから最大値を発見するステップと、 からなる方法。
  • 【請求項19】 請求項1、5、6、7、10に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、前記ビットプレーンの総数が、最大ダイナミックレンジ+1を表すビット数である方法。
  • 【請求項20】 請求項1、5、6、7、10、11、
    15、17に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、前記しきい値が、最大ダイナミックレンジに2を乗算すると共に前記結果から最大バイナリレンジを減算することによって計算される方法。
  • 【請求項21】 請求項1、5、6、7、10、18に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、前記上限ダイナミックレンジが、最大値からカットオフ値を減算することによって計算される方法。
  • 【請求項22】 請求項1、5、6、7、10、18に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法において、前記下限ダイナミックレンジが、カットオフ値から1を減算することによって計算される方法。
  • 【請求項23】 剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置であって、 映像品質の損失を導入するビデオシーケンスのベースレイヤを符号化する手段と、 前記符号化したベースレイヤから前記ビデオシーケンスの剰余数を計算する手段と、 動的表示技術を用いて剰余数値を表す手段と、 ビットプレーンエントロピ符号化方法によって、修正された大きさと剰余数係数の符号値とを符号化する手段と、 前記符号化情報を符号化表示で表す手段と、 からなる装置。
  • 【請求項24】 請求項23に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、ベースレイヤの符号化手段が、 2次元配列の画素を有するブロック内に入力画像をサンプリングする手段と、 予めメモリ内に再構築された映像から予測ブロックを構築する手段と、 サンプリングした画素の前記ブロックに使用される予測モードについて決定する手段と、 前記決定に基づき、サンプリングした画素の前記ブロックから予測ブロックを減算して予測誤差を獲得する手段と、 予測誤差の前記ブロックに離散コサイン変換を実行する手段と、 DCT係数の前記ブロックを量子化する手段と、 前記ブロックをジグザグスキャン順序でスキャンする手段と、 ハフマン符号化によって前記ブロックを符号化し、また前記符号化情報を符号化表示で表す手段と、 からなる装置。
  • 【請求項25】 請求項23に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、周波数領域の剰余数値を計算する手段が、 ベースレイヤ内の符号化器からDCT係数のブロックを獲得する手段と、 将来の減算のためにDCT係数の前記ブロックをブロックメモリに記憶する手段と、 ベースレイヤ内の前記符号化器から量子化DCT係数のブロックを獲得する手段と、 量子化DCT係数の前記ブロックを逆量子化する手段と、 ブロックメモリ内のDCT係数の前記ブロックから、再構築されたDCT係数の前記ブロックを減算して剰余数係数を獲得する手段と、 剰余数係数の前記ブロックをジグザグスキャン順序で並べ替える手段と、 剰余数係数の前記ブロックをフレームメモリに記憶する手段と、 からなる装置。
  • 【請求項26】 請求項23に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、空間領域の剰余数値を計算する手段が、 ベースレイヤ内の符号化器から量子化DCT係数のブロックを獲得する手段と、 量子化DCT係数の前記ブロックを逆量子化する手段と、 逆離散コサイン変換によって前記ブロックを空間領域に変換する手段と、 ベースレイヤからの動き補償した予測値のブロックに、
    再構築された予測差の前記ブロックを加算して復号化映像を再構築する手段と、 再構築された映像の画素値をフィルタ処理する手段と、 前記フィルタ処理された画素値を元の映像の画素値から減算して剰余数係数を獲得する手段と、 2次元配列の画素を有するブロック内に前記剰余数係数をサンプリングする手段と、 離散コサイン変換によって剰余数係数の前記ブロックを周波数領域に変換する手段と、 剰余数係数の前記ブロックをジグザグスキャン順序で並べ替える手段と、 剰余数係数の前記ブロックをフレームメモリに記憶する手段と、 からなる装置。
  • 【請求項27】 請求項23に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、動的剰余数表示が:フレームメモリから剰余数係数を検索する手段と、 前記剰余数係数の符号値と大きさとを獲得する手段と、 前記大きさの最大値を発見する手段と、 前記大きさのカットオフ値を規定する手段と、 前記最大値情報と前記カットオフ値情報とを符号化し、
    また符号化情報を復号化器に挿入する手段と、 剰余数変換に必要なパラメータを計算する手段と、 前記最大値と前記カットオフ値と前記計算されたパラメータとに基づき、バイナリ変換を前記大きさに対して実行する手段と、 からなる装置。
  • 【請求項28】 請求項23に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、周波数領域で計算された剰余数の復号化手段が、 ベースレイヤビットストリームを復号化する手段と、 拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出する手段と、 前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得する手段と、 剰余数変換に必要なパラメータを計算する手段と、 剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得する手段と、 前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築する手段と、 2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングする手段と、 剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替える手段と、 ベースレイヤから逆量子化DCT係数のブロックを獲得する手段と、 逆量子化DCT係数の前記ブロックに、再構築された剰余数値の前記ブロックを加算する手段と、 拡張されたDCT係数の前記ブロックに逆離散コサイン変換を行い空間領域における前記係数の値を獲得する手段と、 ベースレイヤのために使用された予測モードを決定する手段と、 前記予測モードに基づき、動き補償された予測ブロックをベースレイヤから獲得する手段と、 拡張された予測誤差の前記ブロックに前記動き補償された予測ブロックを加算して拡張された映像を形成する手段と、 からなる装置。
  • 【請求項29】 請求項23に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、空間領域で計算された剰余数の復号化手段が、 ベースレイヤビットストリームを復号化する手段と、 拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出する手段と、 前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得する手段と、 剰余数変換に必要なパラメータを計算する手段と、 剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得する手段と、 前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築する手段と、 2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングする手段と、 剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替える手段と、 剰余数係数の前記ブロックに逆離散コサイン変換を行い剰余数ブロックの画素領域を獲得する手段と、 ベースレイヤからの復号化映像をフィルタ処理してノイズを最小にする手段と、 剰余数係数の前記ブロックの値に、ベースレイヤの前記フィルタ処理された映像の画素値を加算して拡張された映像を形成する手段と、からなる装置。
  • 【請求項30】 請求項23、28、29に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、ベースレイヤビットストリームを復号化する手段が、 前記ベースレイヤビットストリームを逆エントロピ符号化して量子化DCT係数のブロックを獲得する手段と、 ベースレイヤビットストリームからスキャン方法と予測方法とを抽出する手段と、 前記スキャン方法によって量子化DCT係数の前記ブロックをスキャンする手段と、 将来の予測のために係数の前記ブロックをブロックメモリに記憶する手段と、 DCT係数の前記ブロックを逆量子化する手段と、 逆離散コサイン変換によって、再構築されたDCT係数の前記ブロックを空間領域に変換する手段と、 前記予測方法と、ベースレイヤの予め復号化された映像からの情報とに基づき動き補償された予測ブロックを形成する手段と、 前記再構築されたブロックを前記予測ブロックに加算して復号化映像の画素値を再構築する手段と、 将来の予測のために復号化映像をフレームメモリに記憶する手段と、からなる装置。
  • 【請求項31】 請求項23および27に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、カットオフ値を規定する手段が、 VOP内の剰余数係数の大きさの値について発生数を獲得する手段と、 必要な最小拡張ビットレートと、フレームレートと、エントロピ符号化の符号化効率とに基づき発生のしきい値の和を計算する手段と、 発生の前記しきい値の和に基づきカットオフ値を決定する手段と、 からなる装置。
  • 【請求項32】 請求項23、27、28、29に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、剰余数変換のパラメータを計算する手段が、 第2のビットプレーンの最大ダイナミックレンジを発見する手段と、 ビット数を計算して前記最大ダイナミックレンジを表す手段と、 前記ビット数に基づきビットプレーンの総数を計算する手段と、 前記ビット数に基づき第2のビットプレーンと下方の最大バイナリレンジを決定する手段と、 しきい値を計算する手段と、 からなる装置。
  • 【請求項33】 請求項23、28、29に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、剰余数再構築と、受信した非ゼロ剰余数係数の修正された大きさに関する予測とを実行する手段が、 前記受信した剰余数係数の修正された大きさについて予測を実行する手段と、 受信された剰余数の大きさを予測された大きさから再構築する手段と、 からなる装置。
  • 【請求項34】 請求項23、27、31に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、発生のしきい値の和が、最小拡張ビットレートを第1のビットプレーンのエントロピ符号化のフレームレートと符号化効率とで除算する手段によって計算される装置。
  • 【請求項35】 請求項23および27に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、前記カットオフ値よりも大きいかまたは等しい大きさの2進法表示を動的剰余数表示に変換する手段が、 前記大きさから前記カットオフ値を減算することによってオフセット値を計算する手段と、 前記剰余数係数の前記オフセット値に2を乗算し、また前記オフセット値が前記しきい値よりも大きい場合には、前記乗算の前記結果から前記しきい値を減算する手段と、 最大ダイナミックレンジを表すためにビット数だけ値を左に移動し、また前記移動した値を前記計算されたオフセット値に加算する手段と、 からなる装置。
  • 【請求項36】 請求項23、28、29、33に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、受信した非ゼロ剰余数係数の修正された大きさについて予測を実行する手段が、 受信されたビットプレーンの数を決定する手段と、 受信されたビットプレーンの数が1に等しい場合には、
    最後に受信されたビットプレーンの下の2つのビットプレーンのビットを1に設定する手段と、 受信されたビットプレーンの数がビットプレーンの総数よりも1を越えて小さければ、最後に受信されたビットプレーンの下の次のビットプレーンのビットを1に設定する手段と、 からなる装置。
  • 【請求項37】 請求項23、28、29、33に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、予測された剰余数係数から大きさを再構築する手段が、 前記予測された剰余数係数から第1のビット情報を抽出する手段と、 前記予測された剰余数係数の第1のビットをゼロに設定する手段と、 前記抽出されたビットが1であるかどうかを決定する手段と、 前記しきい値を前記予測された剰余数係数に加算し、また予測された値が前記しきい値よりも大きければ前記結果を2で除算する手段と、 前記抽出されたビットが1である場合には、前記予測された値と前記カットオフ値とを合計する手段と、 からなる装置。
  • 【請求項38】 請求項23、27、28、29、32
    に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、第2のビットプレーンの最大ダイナミックレンジを発見する手段が、 前記第2のビットプレーンの最大ダイナミックレンジを計算する手段と、 前記第2のビットプレーンの下限ダイナミックレンジを計算する手段と、 前記2つのダイナミックレンジから最大値を発見する手段と、 からなる装置。
  • 【請求項39】 請求項23、27、28、29、32
    に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、前記ビットプレーンの総数が、ビット数を加算して最大ダイナミックレンジを1で表す手段によって計算される装置。
  • 【請求項40】 請求項23、27、28、29、3
    2、33、36、38に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、前記しきい値が、最大ダイナミックレンジに2を乗算すると共に前記結果から最大バイナリレンジを減算する手段によって計算される装置。
  • 【請求項41】 請求項23、27、28、29、3
    2、39に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、前記上限ダイナミックレンジが、最大値からカットオフ値を減算する手段によって計算される装置。
  • 【請求項42】 請求項23、27、28、29、3
    2、39に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、前記下限ダイナミックレンジが、カットオフ値から1を減算する手段によって計算される装置。
  • 【請求項43】 請求項23および27に記載の剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置において、前記カットオフ値よりも小さく、また前記しきい値よりも大きな大きさの2進法表示が、前記剰余数係数の大きさに2を乗算し、また前記乗法の前記結果から前記しきい値を減算することによって動的剰余数表示に変換される装置。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】本発明は、MPEG4規格における細粒度ビデオスケーラビリティスキームで利用できる技術に関する。

    【0002】

    【従来の技術】MPEG4規格のビットレートスケーラビリティのために、ビデオ品質の細粒度スケーラビリティを提供できるビデオ符号化技術の必要性が増している。 細粒度スケーラビリティ(FGS: Fine Granular
    ity Scalability)スキームは、ネットワークビデオ配信用途を目的として開発されたものである(例えばインターネットビデオ伝送)。

    【0003】FGSスキームでは、基本的に2つの異なったビットストリームのレイヤがある。 1つのレイヤはベースレイヤであり、また他のレイヤは拡張レイヤである。 図1は、FGS符号化器のブロック図を示す。

    【0004】ベースレイヤ符号化については、ビデオ符号化の手順はMPEG4バージョン1のシンプルプロフィルと同じである。 従来技術は、それぞれブロックサンプリング、離散コサイン変換、量子化、DCとAC予測、ジグザグスキャンおよび可変長符号化モジュール1
    01、103、104、105、106、107から構成される。

    【0005】ベースレイヤのフレーム内符号化については、ブロックサンプリング後のブロックにはDCTが行われ、次に量子化、DCとAC予測、ジグザグスキャン、最後に可変長符号化またはエントロピ符号化が行われる。 これに対し、ベースレイヤにおけるフレーム間符号化については、ブロックサンプリング後に逆量子化、
    逆DCT、動き予測と動き補償がそれぞれモジュール1
    08、109、112で実行される。 予測差はモジュール102で計算され、またフレーム内符号化におけるのと同一の符号化手順を経る。

    【0006】拡張レイヤ符号化については、ベースレイヤの量子化DCT係数はモジュール113で逆量子化され、また剰余数(residue)の値は、モジュール114
    で、再構築されたDCT値を元のDCT係数から減算することによって計算される。 次に、計算された剰余数はジグザグスキャンとビットプレーン可変長符号化モジュール115と116それぞれに送られる。

    【0007】現在の最新技術では、拡張レイヤの剰余数の絶対値は2進数で表され、また2進表示に応じて異なったビットプレーンに符号化される。 各剰余数の符号ビットは 2進数の最上位ビットと共に符号化される。 拡張レイヤの符号化効率を改良するために、剰余数値の表示を変更する試みはこれまで行われていなかった。

    【0008】ビットプレーンVLCモジュールから出される拡張レイヤビットストリームは、FGSサーバに伝送される。 FGSサーバは、クライアントとFGSサーバとの間のチャネルの帯域幅に基づき、チャネル容量に合せるため、拡張レイヤビットストリームのより下位のビットプレーンを切り捨てる。 ベースレイヤビットストリームは、ビットストリームの成分を修正することなく、FGSサーバを通して直接クライアントに伝送される。

    【0009】図2は、FGS復号化器のブロック図を示す。 クライアント側では、ベースレイヤ復号化のため、
    従来技術ではそれぞれVLD、逆ジグザグスキャン、逆DC&AC予測、逆量子化、逆DCTおよび動き補償モジュール201、202、203、204、205、2
    07から構成される。 フレーム内復号化については、ベースレイヤビットストリームは可変長復号化、逆ジグザグスキャン、逆DCとAC予測、逆量子化、次に逆離散コサイン変換のプロセスを受ける。 これに対しフレーム間復号化については、ビットストリームは逆DCTプロセスの後に動き補償の追加手順を経て、また動き補償プロセスの出力はモジュールで逆DCTの出力に加算され、映像を再構築する。

    【0010】拡張レイヤ復号化については、復号化器の従来技術は、ビットプレーンVLD、逆ジグザグスキャンおよび逆DCTモジュール209、210、212からそれぞれ構成される。 拡張ビットストリームがビットプレーンVLDプロセスを経た後、復号化されたビットプレーンは組み合わされて剰余数値を与える。 FGSサーバによって伝送されないそれらのビットプレーンは、
    最後に受信したビットプレーンの下の第2のビットプレーンを除き復号化器側でゼロであると想定される。 前記剰余数の最上位ビットが送られた場合には、このビットプレーンのビットは1に設定される。

    【0011】再構築された剰余数は逆ジグザグスキャンされる。 次に、これらの剰余数値は、ベースレイヤの逆量子化DCT係数に加算され、モジュール211に示すように拡張されたDCT係数を与える。 拡張されたDC
    T係数は逆DCTプロセスを受け拡張された画素値を与える。 ベースレイヤにおけるフレーム間復号化については、拡張レイヤの逆DCTモードの出力は拡張された予測誤差である。 これらの拡張された予測誤差は、モジュール213で、ベースレイヤの動き補償の出力値に加算され、拡張された映像値を与える。

    【0012】

    【発明が解決しようとする課題】既存のFGSビデオ符号化技術に基づき、剰余数は2進数で提示される。 2進数表示では、数は2の累乗を用いて表される。 33の剰余数値の実例を挙げると、33の剰余数値は2進(2 5
    +2 0 )の100001として表すことができる。 この剰余数のすべてのビットを復号化器側で受信できるならば、この種の表現は可逆である。 しかし、これは実際のネットワークの条件では可能ではない。 ある低いビットレートの場合、FGSサーバは最上位ビットのみを伝送できるだけであり、またクライアント側で復号化されるビットは100000である。

    【0013】従来技術の剰余数予測技術を用いて、受信したビットよりも2つ下方のビットを1に設定することによって、復号化器は剰余数値を予測する。 この結果、
    2進表示でで101000という予測された剰余数値が得られ、またその数値は40であり、これによって元の剰余数値に比較して7の予測誤差が与えられる。

    【0014】全体のVOPの最大剰余数値が33である場合には、VOP内の剰余数の最大ダイナミックレンジは2進数表示を用いて63に増加され、この結果復号化された剰余数の予測効率は悪くなる。 これは、従来技術の剰余数表示と予測技術が、拡張ビットレートが低い場合にとって非常に効率的でないことを示している。

    【0015】したがって、本開示の目的は従来技術の符号化技術の効率の悪さを解決することである。 解決すべき第1の問題は、ビットプレーン符号化の符号化効率を最大にするにはどのように剰余数を表せばよいかである。 解決すべき第2の問題は、どのように復号化された剰余数係数に関する予測を行えば、VOPのPSNRを最適化できるかである。

    【0016】

    【課題を解決するための手段】VOP内の剰余数の確率密度分布は均一に分布していないことが知られている。
    図3は、VOP内の剰余数の大きさの典型的な確率密度分布図を示す。 図示されるように、剰余数はダイナミックレンジの低い方で高く分布し、またダイナミックレンジの高い方での分布はより低い。 剰余数係数はこの特性をベースレイヤDCT係数から受け継ぐので、これは正しい。

    【0017】2進法表示技術の効率の悪さは、実際のダイナミックレンジと比較してより大きな指定ダイナミックレンジに起因する。 最大ダイナミックレンジ情報を拡張ビットストリームに仕様として定め、またVOPの確率密度分布を利用する動的表示技術を用いることによって、この非効率の問題を解決し、拡張ビットプレーンのビットの役割を規定できる。

    【0018】同様に、剰余数の確率密度分布の形状から判断すると、復号化された剰余数係数に関する予測は、
    拡張レイヤのVOPの異なったビットプレーンレベルについて異なった予測割合を指定することによって改良できる。 確率密度分布曲線の形状はほとんどの場合直線でないので、これは正しい。

    【0019】現在の2進法表示技術は、現在のFGSスキームの剰余数係数を表すのに使用される唯一の技術である。 本発明で新規なことは、新しい剰余数表示と予測技術が拡張ビットプレーンのビットの役割を固定しないことである。 ビットの役割は、VOP内の剰余数の確率密度分布と、ビットプレーンの剰余数の最上位ビットの位置とに関係して動的に仕様として定められる。

    【0020】本発明による剰余数係数の動的表示技術によってビデオ符号化効率を改良するための方法は、映像品質の損失を導入するビデオシーケンスのベースレイヤを符号化するステップと、前記符号化したベースレイヤから前記ビデオシーケンスの剰余数を計算するステップと、動的表示技術を用いて剰余数値を表すステップと、
    ビットプレーンエントロピ符号化方法によって、修正された大きさと剰余数係数の符号値とを符号化するステップと、前記符号化情報を符号化表示で表すステップとからなる方法であって、これにより上記目的が達成される。

    【0021】ベースレイヤの符号器が、2次元配列の画素を有するブロック内に入力画像をサンプリングするステップと、予めメモリ内に再構築された映像から予測ブロックを構築するステップと、サンプリングした画素の前記ブロックに使用される予測モードについて決定するステップと、前記決定に基づき、サンプリングした画素の前記ブロックから予測ブロックを減算して予測誤差を獲得するステップと、予測誤差の前記ブロックに離散コサイン変換を実行するステップと、DCT係数の前記ブロックを量子化するステップと、前記ブロックをジグザグスキャン順序でスキャンするステップと、ハフマン符号化によって前記ブロックを符号化し、また前記符号化情報を符号化表示で表すステップとを含んでいてもよい。

    【0022】周波数領域の剰余数値を計算するステップが、ベースレイヤ内の符号器からDCT係数のブロックを獲得するステップと、将来の減算のためにDCT係数の前記ブロックをブロックメモリに記憶するステップと、ベースレイヤ内の前記符号器から量子化DCT係数のブロックを獲得するステップと、量子化DCT係数の前記ブロックを逆量子化するステップと、ブロックメモリ内のDCT係数の前記ブロックから、再構築されたD
    CT係数の前記ブロックを減算して剰余数係数を獲得するステップと、剰余数係数の前記ブロックをジグザグスキャン順序で並べ替えるステップと、剰余数係数の前記ブロックをフレームメモリに記憶するステップとを含んでいてもよい。

    【0023】空間領域の剰余数値を計算するステップが、ベースレイヤ内の符号器から量子化DCT係数のブロックを獲得するステップと、量子化DCT係数の前記ブロックを逆量子化するステップと、逆離散コサイン変換によって前記ブロックを空間領域に変換するステップと、ベースレイヤからの動き補償した予測値のブロックに、再構築された予測差の前記ブロックを加算して復号化映像を再構築するステップと、再構築された映像の画素値をフィルタ処理するステップと、前記フィルタ処理された画素値を元の映像の画素値から減算して剰余数係数を獲得するステップと、2次元配列の画素を有するブロック内に前記剰余数係数をサンプリングするステップと、離散コサイン変換によって剰余数係数の前記ブロックを周波数領域に変換するステップと、剰余数係数の前記ブロックをジグザグスキャン順序で並べ替えるステップと、剰余数係数の前記ブロックをフレームメモリに記憶するステップとを含んでいてもよい。

    【0024】動的剰余数表示が、フレームメモリから剰余数係数を検索するステップと、前記剰余数係数の符号値と大きさとを獲得するステップと、前記大きさの最大値を発見するステップと、前記大きさのカットオフ値を規定するステップと、前記最大値情報と前記カットオフ値情報とを符号化し、また前記情報を符号化表示で表すステップと、剰余数変換に必要なパラメータを計算するステップと、前記最大値と前記カットオフ値と前記計算されたパラメータとに基づき、バイナリ変換を前記大きさに実行するステップとを含んでいてもよい。

    【0025】周波数領域で計算された剰余数の復号器が、ベースレイヤビットストリームを復号化するステップと、拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出するステップと、前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得するステップと、剰余数変換に必要なパラメータを計算するステップと、剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得するステップと、前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築するステップと、2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングするステップと、剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替えるステップと、
    ベースレイヤから逆量子化DCT係数のブロックを獲得するステップと、逆量子化DCT係数の前記ブロックに、再構築された剰余数値の前記ブロックを加算するステップと、拡張されたDCT係数の前記ブロックに逆離散コサイン変換を行い空間領域における前記係数の値を獲得するステップと、ベースレイヤのために使用された予測モードを決定するステップと、前記予測モードに基づき、動き補償された予測ブロックをベースレイヤから獲得するステップと、拡張された予測誤差の前記ブロックに前記動き補償された予測ブロックを加算して拡張された映像を形成するステップとを含んでいてもよい。

    【0026】空間領域で計算された剰余数の復号器が、
    ベースレイヤビットストリームを復号化するステップと、拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出するステップと、前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得するステップと、剰余数変換に必要なパラメータを計算するステップと、剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得するステップと、前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築するステップと、2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングするステップと、剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替えるステップと、剰余数係数の前記ブロックに逆離散コサイン変換を行い剰余数ブロックの画素値を獲得するステップと、ベースレイヤからの復号化映像をフィルタ処理してノイズを最小にするステップと、剰余数係数の前記ブロックの値に、
    ベースレイヤからの前記フィルタ処理された映像の画素値を加算して拡張された映像を形成するステップとを含んでいてもよい。

    【0027】ベースレイヤビットストリームを復号化するステップが、前記ベースレイヤビットストリームを逆エントロピ符号化して量子化DCT係数のブロックを獲得するステップと、ベースレイヤビットストリームからスキャン方法と予測方法とを抽出するステップと、前記スキャン方法によって量子化DCT係数の前記ブロックをスキャンするステップと、将来の予測のために係数の前記ブロックをブロックメモリに記憶するステップと、
    DCT係数の前記ブロックを逆量子化するステップと、
    逆離散コサイン変換によって、再構築されたDCT係数の前記ブロックを空間領域に変換するステップと、前記予測方法と、ベースレイヤの予め復号化された映像からの情報とに基づき動き補償された予測ブロックを形成するステップと、前記再構築されたブロックを前記予測ブロックに加算して復号化映像の画素値を再構築するステップと、将来の予測のために復号化映像をフレームメモリに記憶するステップとを含んでいてもよい。

    【0028】カットオフ値を規定するステップが、VO
    P内の剰余数係数の大きさの値について発生数を獲得するステップと、必要な最小拡張ビットレートと、フレームレートと、エントロピ符号化の符号化効率とに基づき発生のしきい値の和を計算するステップと、発生の前記しきい値の和に基づきカットオフ値を決定するステップとを含んでいてもよい。

    【0029】剰余数変換のパラメータを計算するステップが、第2のビットプレーンの最大ダイナミックレンジを発見するステップと、ビット数を計算して前記最大ダイナミックレンジを表すステップと、前記ビット数に基づきビットプレーンの総数を計算するステップと、前記ビット数に基づき第2のビットプレーンと下方の最大バイナリレンジを決定するステップと、しきい値を計算するステップとを含んでいてもよい。

    【0030】剰余数再構築と、受信した非ゼロ剰余数係数の修正された大きさに関する予測とを実行するステップが、前記受信した剰余数係数の修正された大きさについて予測を実行するステップと、受信された剰余数の大きさを予測された大きさから再構築するステップとを含んでいてもよい。

    【0031】発生のしきい値の和が、最小拡張ビットレートを第1のビットプレーンのエントロピ符号化のフレームレートと符号化効率とで除算することによって計算されてもよい。

    【0032】カットオフ値が、前記カットオフ値よりも大きい剰余数係数の総数が発生のしきい値の和よりも小さいという基準に基づいて決定されてもよい。

    【0033】前記カットオフ値よりも小さく、また前記しきい値よりも大きな大きさの2進法表示が、前記剰余数係数の大きさに2を乗算し、また前記乗法の前記結果から前記しきい値を減算することによって動的剰余数表示に変換してもよい。

    【0034】前記カットオフ値よりも大きいかまたは等しい大きさの2進法表示を動的剰余数表示に変換するステップが、前記大きさから前記カットオフ値を減算することによってオフセット値を計算するステップと、前記剰余数係数の前記オフセット値に2を乗算し、また前記オフセット値が前記しきい値よりも大きい場合には、前記乗算の前記結果から前記しきい値を減算するステップと、最大ダイナミックレンジを表すために所定のビット数だけ値を左に移動し、また前記移動した値を前記計算されたオフセット値に加算するステップとを含んでいてもよい。

    【0035】受信した非ゼロ剰余数係数の修正された大きさについて予測を実行するステップが、受信されたビットプレーンの数を決定するステップと、受信されたビットプレーンの数が1に等しい場合には、最後に受信されたビットプレーンの下の2つのビットプレーンのビットを1に設定するステップと、受信されたビットプレーンの数が1に等しい場合以外の場合には、前記受信されたビットプレーンの数がビットプレーンの総数よりも1
    を越えて小さければ、前記最後に受信されたビットプレーンの下の次のビットプレーンのビットを1に設定するステップとを含んでいてもよい。

    【0036】予測された剰余数係数から大きさを再構築するステップが、前記予測された剰余数係数から第1のビット情報を抽出するステップと、前記予測された剰余数係数の第1のビットをゼロに設定するステップと、前記抽出されたビットが1であるかどうかを決定するステップと、前記しきい値を前記予測された剰余数係数に加算し、また予測された値が前記しきい値よりも大きければ前記結果を2で除算するステップと、前記抽出されたビットが1である場合には、前記予測された値と前記カットオフ値とを合計するステップとを含んでいてもよい。

    【0037】第2のビットプレーンの最大ダイナミックレンジを発見するステップが、前記第2のビットプレーンの上限ダイナミックレンジを計算するステップと、前記第2のビットプレーンの下限ダイナミックレンジを計算するステップと、前記2つのダイナミックレンジから最大値を発見するステップとを含んでいてもよい。

    【0038】前記ビットプレーンの総数が、最大ダイナミックレンジ+1を表すビット数であってもよい。

    【0039】前記しきい値が、最大ダイナミックレンジに2を乗算すると共に前記結果から最大バイナリレンジを減算することによって計算されてもよい。

    【0040】前記上限ダイナミックレンジが、最大値からカットオフ値を減算することによって計算されてもよい。

    【0041】前記下限ダイナミックレンジが、カットオフ値から1を減算することによって計算されてもよい。

    【0042】本発明による剰余数係数の動的表示技術によってビデオ符号化効率を改良するための装置は、映像品質の損失を導入するビデオシーケンスのベースレイヤを符号化する手段と、前記符号化したベースレイヤから前記ビデオシーケンスの剰余数を計算する手段と、動的表示技術を用いて剰余数値を表す手段と、ビットプレーンエントロピ符号化方法によって、修正された大きさと剰余数係数の符号値とを符号化する手段と、前記符号化情報を符号化表示で表す手段とからなり、これにより上記目的が達成される。

    【0043】ベースレイヤの符号化手段が、2次元配列の画素を有するブロック内に入力画像をサンプリングする手段と、予めメモリ内に再構築された映像から予測ブロックを構築する手段と、サンプリングした画素の前記ブロックに使用される予測モードについて決定する手段と、前記決定に基づき、サンプリングした画素の前記ブロックから予測ブロックを減算して予測誤差を獲得する手段と、予測誤差の前記ブロックに離散コサイン変換を実行する手段と、DCT係数の前記ブロックを量子化する手段と、前記ブロックをジグザグスキャン順序でスキャンする手段と、ハフマン符号化によって前記ブロックを符号化し、また前記符号化情報を符号化表示で表す手段とを含んでいてもよい。

    【0044】周波数領域の剰余数値を計算する手段が、
    ベースレイヤ内の符号器からDCT係数のブロックを獲得する手段と、将来の減算のためにDCT係数の前記ブロックをブロックメモリに記憶する手段と、ベースレイヤ内の前記符号器から量子化DCT係数のブロックを獲得する手段と、量子化DCT係数の前記ブロックを逆量子化する手段と、ブロックメモリ内のDCT係数の前記ブロックから、再構築されたDCT係数の前記ブロックを減算して剰余数係数を獲得する手段と、剰余数係数の前記ブロックをジグザグスキャン順序で並べ替える手段と、剰余数係数の前記ブロックをフレームメモリに記憶する手段とを含んでいてもよい。

    【0045】空間領域の剰余数値を計算する手段が、ベースレイヤ内の符号器から量子化DCT係数のブロックを獲得する手段と、量子化DCT係数の前記ブロックを逆量子化する手段と、逆離散コサイン変換によって前記ブロックを空間領域に変換する手段と、ベースレイヤからの動き補償した予測値のブロックに、再構築された予測差の前記ブロックを加算して復号化映像を再構築する手段と、再構築された映像の画素値をフィルタ処理する手段と、前記フィルタ処理された画素値を元の映像の画素値から減算して剰余数係数を獲得する手段と、2次元配列の画素を有するブロック内に前記剰余数係数をサンプリングする手段と、離散コサイン変換によって剰余数係数の前記ブロックを周波数領域に変換する手段と、剰余数係数の前記ブロックをジグザグスキャン順序で並べ替える手段と、剰余数係数の前記ブロックをフレームメモリに記憶する手段とを含んでいてもよい。

    【0046】動的剰余数表示が、フレームメモリから剰余数係数を検索する手段と、前記剰余数係数の符号値と大きさとを獲得する手段と、前記大きさの最大値を発見する手段と、前記大きさのカットオフ値を規定する手段と、前記最大値情報と前記カットオフ値情報とを符号化し、また符号化情報を復号器に挿入する手段と、剰余数変換に必要なパラメータを計算する手段と、前記最大値と前記カットオフ値と前記計算されたパラメータとに基づき、バイナリ変換を前記大きさに対して実行する手段とを含んでいてもよい。

    【0047】周波数領域で計算された剰余数の復号化手段が、ベースレイヤビットストリームを復号化する手段と、拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出する手段と、前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得する手段と、剰余数変換に必要なパラメータを計算する手段と、剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得する手段と、前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築する手段と、2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングする手段と、剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替える手段と、ベースレイヤから逆量子化DC
    T係数のブロックを獲得する手段と、逆量子化DCT係数の前記ブロックに、再構築された剰余数値の前記ブロックを加算する手段と、拡張されたDCT係数の前記ブロックに逆離散コサイン変換を行い空間領域における前記係数の値を獲得する手段と、ベースレイヤのために使用された予測モードを決定する手段と、前記予測モードに基づき、動き補償された予測ブロックをベースレイヤから獲得する手段と、拡張された予測誤差の前記ブロックに前記動き補償された予測ブロックを加算して拡張された映像を形成する手段とを含んでいてもよい。

    【0048】空間領域で計算された剰余数の復号化手段が、ベースレイヤビットストリームを復号化する手段と、拡張レイヤビットストリームから最大値とカットオフ値とに関する情報を抽出する手段と、前記拡張レイヤビットストリームを逆ビットプレーンエントロピ符号化して剰余数係数の符号値と修正された大きさとを獲得する手段と、剰余数変換に必要なパラメータを計算する手段と、剰余数再構築と、非ゼロ剰余数係数の前記修正された大きさに関する予測とを実行して剰余数係数の予測される大きさを獲得する手段と、前記符号値と前記予測された大きさとを組み合わせることによって剰余数係数を再構築する手段と、2次元配列の画素を有する複数のブロック内に前記剰余数係数をサンプリングする手段と、剰余数係数の前記ブロックを逆ジグザグスキャン順序で並べ替える手段と、剰余数係数の前記ブロックに逆離散コサイン変換を行い剰余数ブロックの画素領域を獲得する手段と、ベースレイヤからの復号化映像をフィルタ処理してノイズを最小にする手段と、剰余数係数の前記ブロックの値に、ベースレイヤの前記フィルタ処理された映像の画素値を加算して拡張された映像を形成する手段とを含んでいてもよい。

    【0049】ベースレイヤビットストリームを復号化する手段が、前記ベースレイヤビットストリームを逆エントロピ符号化して量子化DCT係数のブロックを獲得する手段と、ベースレイヤビットストリームからスキャン方法と予測方法とを抽出する手段と、前記スキャン方法によって量子化DCT係数の前記ブロックをスキャンする手段と、将来の予測のために係数の前記ブロックをブロックメモリに記憶する手段と、DCT係数の前記ブロックを逆量子化する手段と、逆離散コサイン変換によって、再構築されたDCT係数の前記ブロックを空間領域に変換する手段と、前記予測方法と、ベースレイヤの予め復号化された映像からの情報とに基づき動き補償された予測ブロックを形成する手段と、前記再構築されたブロックを前記予測ブロックに加算して復号化映像の画素値を再構築する手段と、将来の予測のために復号化映像をフレームメモリに記憶する手段とを含んでいてもよい。

    【0050】カットオフ値を規定する手段が、VOP内の剰余数係数の大きさの値について発生数を獲得する手段と、必要な最小拡張ビットレートと、フレームレートと、エントロピ符号化の符号化効率とに基づき発生のしきい値の和を計算する手段と、発生の前記しきい値の和に基づきカットオフ値を決定する手段とを含んでいてもよい。

    【0051】剰余数変換のパラメータを計算する手段が、第2のビットプレーンの最大ダイナミックレンジを発見する手段と、ビット数を計算して前記最大ダイナミックレンジを表す手段と、前記ビット数に基づきビットプレーンの総数を計算する手段と、前記ビット数に基づき第2のビットプレーンと下方の最大バイナリレンジを決定する手段と、しきい値を計算する手段とを含んでいてもよい。

    【0052】剰余数再構築と、受信した非ゼロ剰余数係数の修正された大きさに関する予測とを実行する手段が、前記受信した剰余数係数の修正された大きさについて予測を実行する手段と、受信された剰余数の大きさを予測された大きさから再構築する手段とを含んでいてもよい。

    【0053】発生のしきい値の和が、最小拡張ビットレートを第1のビットプレーンのエントロピ符号化のフレームレートと符号化効率とで除算する手段によって計算されてもよい。

    【0054】前記カットオフ値よりも大きいかまたは等しい大きさの2進法表示を動的剰余数表示に変換する手段が、前記大きさから前記カットオフ値を減算することによってオフセット値を計算する手段と、前記剰余数係数の前記オフセット値に2を乗算し、また前記オフセット値が前記しきい値よりも大きい場合には、前記乗算の前記結果から前記しきい値を減算する手段と、最大ダイナミックレンジを表すためにビット数だけ値を左に移動し、また前記移動した値を前記計算されたオフセット値に加算する手段とを含んでいてもよい。

    【0055】受信した非ゼロ剰余数係数の修正された大きさについて予測を実行する手段が、受信されたビットプレーンの数を決定する手段と、受信されたビットプレーンの数が1に等しい場合には、最後に受信されたビットプレーンの下の2つのビットプレーンのビットを1に設定する手段と、受信されたビットプレーンの数がビットプレーンの総数よりも1を越えて小さければ、最後に受信されたビットプレーンの下の次のビットプレーンのビットを1に設定する手段とを含んでいてもよい。

    【0056】予測された剰余数係数から大きさを再構築する手段が、前記予測された剰余数係数から第1のビット情報を抽出する手段と、前記予測された剰余数係数の第1のビットをゼロに設定する手段と、前記抽出されたビットが1であるかどうかを決定する手段と、前記しきい値を前記予測された剰余数係数に加算し、また予測された値が前記しきい値よりも大きければ前記結果を2で除算する手段と、前記抽出されたビットが1である場合には、前記予測された値と前記カットオフ値とを合計する手段とを含んでいてもよい。

    【0057】第2のビットプレーンの最大ダイナミックレンジを発見する手段が、前記第2のビットプレーンの最大ダイナミックレンジを計算する手段と、前記第2のビットプレーンの下限ダイナミックレンジを計算する手段と、前記2つのダイナミックレンジから最大値を発見する手段とを含んでいてもよい。

    【0058】前記ビットプレーンの総数が、ビット数を加算して最大ダイナミックレンジを1で表す手段によって計算されてもよい。

    【0059】前記しきい値が、最大ダイナミックレンジに2を乗算すると共に前記結果から最大バイナリレンジを減算する手段によって計算されてもよい。

    【0060】前記上限ダイナミックレンジが、最大値からカットオフ値を減算する手段によって計算されてもよい。

    【0061】前記下限ダイナミックレンジが、カットオフ値から1を減算する手段によって計算されてもよい。

    【0062】前記カットオフ値よりも小さく、また前記しきい値よりも大きな大きさの2進法表示が、前記剰余数係数の大きさに2を乗算し、また前記乗法の前記結果から前記しきい値を減算することによって動的剰余数表示に変換されてもよい。

    【0063】本発明を簡潔に説明する。 MPEG4規格における細粒度スケーラビリティスキームはストリーミングビデオ用途を対象としている。 このスキームでは、
    ビットプレーン可変長符号化は圧縮のための符号化技術として使用され、また符号化が実行される前に剰余数の大きさが2進数として表される。 しかし、このスキームは、顧客側の復号化器が剰余数用に大部分のビットを受信することができない場合、非常に非効率であることが分かる。 剰余数の大きさを動的表示するための方法を実施形態に提示している。 本発明は、低いビットレートにおける拡張レイヤの符号化効率を改良するのに非常に効率的であり、また符号化器が異なったVOPについて異なったダイナミックレンジを動的に指定するのを可能にする。 本発明は、MPEG4規格の細粒度スケーラビリティスキームで利用することが期待される。

    【0064】

    【発明の実施の形態】 動的剰余数表示動的剰余数表示は、ビットプレーン可変長符号化の符号化効率を改良するために、FGS拡張レイヤの剰余数係数を表示するための方法を提供する。 図4および図5
    は、本発明の1つのとり得る実施形態を示す。

    【0065】図4は第1の実施形態の符号化器のブロック図を示す。 モジュール416は、本発明を形成する既存の従来技術に新しく追加したものである。 ベースレイヤ符号化について、その手順は既存の従来技術と同じである。 拡張レイヤ符号化については、ベースレイヤの量子化DCT係数はモジュール413で逆量子化を受け、
    また剰余数係数はモジュール414で計算される。 計算された剰余数係数はモジュール415でジグザグスキャンを受け、次にモジュール416で動的剰余数表示が行われる。 次に、動的剰余数表示の結果はモジュール41
    7でビットプレーン可変長符号化を受け、また拡張レイヤビットストリームがFGSサーバに伝送される。

    【0066】FGSサーバにおける再転送プロセスは既存の従来技術と同じである。 FGSサーバからの切り捨てられた拡張レイヤビットストリームは、復号化器に伝送される。 図5は第1の実施形態の復号化器のブロック図を示す。 モジュール510は、本発明を形成する既存の従来技術に新しく追加したものである。 ベースレイヤ復号化の全体プロセスは既存の従来技術と同じである。
    拡張レイヤ復号化のために、受信した拡張レイヤビットストリームはビットプレーン可変長復号化され、次にモジュール509と510でそれぞれ剰余数再構築と予測とが行われる。 次に、逆ジグザグスキャンがモジュール511で予測された剰余数係数に実行される。 次に、ベースレイヤからの逆量子化DCT係数が、予測された剰余数係数にモジュール512で加算され、次に拡張されたDCT係数がモジュール513でIDCTを受ける。
    イントラ符号化については、IDCTの出力は復号化フレームの拡張された画素値である。 これに対し、非イントラ符号化については、IDCTモジュールの出力は拡張された予測差であり、またそれらはベースレイヤの動き補償モジュールからの予測値に加えられ、モジュール514で出力フレームの拡張された画素値を形成する。

    【0067】上記の実施形態では、剰余数が計算され、
    また周波数領域で再構築される。 本発明の他のとり得る実施形態は、図6と図7に示したように、剰余数が空間領域で計算かつ再構築される実施形態である。

    【0068】図6は第1の実施形態の符号化器のブロック図を示す。 ベースレイヤ符号化について、その手順は既存の従来技術と同じである。 拡張レイヤ符号化については、ベースレイヤの量子化DCT係数はモジュール6
    13と614でそれぞれ逆量子化とIDCTとを受ける。 非イントラ符号化ブロックについては、動き補償モジュールからの予測値はモジュール615でIDCTの出力に加えられ、復号化フレームの画素値を形成する。
    復号化フレームはモジュール616でフィルタ処理を受け、映像のブロッキーノイズとリンギングノイズとを取り除く。 剰余数係数は、元の映像の画素値から復号化映像の画素値を減算することによって計算される。 次に剰余数係数は、モジュール618と619でそれぞれDC
    Tとジグザグスキャンを受ける。 ジグザグスキャンの出力は、本発明を用いてモジュール620で表示される。
    次に、動的剰余数表示の結果はモジュール621でビットプレーン可変長符号化を受け、次に拡張レイヤビットストリームがFGSサーバに伝送される。

    【0069】図7は第2の実施形態の復号化器のブロック図を示す。 モジュール710は、本発明を形成する既存の従来技術に新しく追加したものである。 ベースレイヤ復号化の全体プロセスは既存の従来技術と同じである。 拡張レイヤ復号化のために、受信した拡張レイヤビットストリームはビットプレーン可変長復号化を受け、
    次にモジュール709と710でそれぞれ剰余数再構築と予測とが行われる。 次にモジュール711と712
    で、逆ジグザグスキャンと逆DCTが、予測された剰余数係数に実行される。 ベースレイヤからの復号化出力フレームはモジュール714でフィルタ処理を受け、またフィルタ処理の結果に拡張レイヤのIDCTモジュールの出力が加算され、モジュール713に示したように拡張された映像の画素値を与える。

    【0070】本発明では、VOP内の剰余数係数の大きさの確率密度分布は、最初に獲得される。 この分布を用いて、最大剰余数値と第1のビットプレーンのカットオフ値が計算され、また拡張レイヤビットストリームのV
    OPヘッダ内に記憶される。 剰余数係数はこれらの2つの値に基づき表される。 以下の項では本発明の実施形態をさらに詳細に説明している。

    【0071】 VOP内の剰余数値の大きさの確率密度分
    剰余数の大きさの取り得る最大値は2048である。 これは、剰余数係数が、[−2048、2047]の範囲で飽和した値を有するDCT係数に基づき計算されるからである。 したがって、剰余数係数の絶対値をとり、またVOP内の[0,2048]からの範囲のこれらの絶対剰余数値の発生数を累積することによって、VOPの絶対剰余数値の確率密度分布を決定することができる。
    発生数は次のように計算される。 v=|R(x,y,m)| S(v)+=1 x=0. . . 7. ,y
    =0. . . 7. ,m=0. . . . k R(x,y,m)はVOP内の剰余数値を表し、S
    (v)は発生数を表し、またkはVOP内の最大ブロック数を表す。

    【0072】 VOP内の第1のビットプレーンの最大値
    とカットオフ値最大値は次のようにVOP内の剰余数値から計算することができる。 最大値=max(|R(x,y,m)|) x=
    0. . . 7. ,y=0. . . 7. ,m=0. . . . k 第1のビットプレーンのカットオフ値を決定するためには、しきい値を最初に計算しなければならない。 このしきい値は次のように計算される。 T 1 =BR E /(FR * CE) BR Eが最小目標拡張ビットレートを表す場合、FRはフレームレートを表し、またCEは、シンボル当たりのビットに関するMSBビットプレーン内のビットプレーンVLCの符号化効率を表す。 T 1は、カットオフ値よりも大きな絶対剰余数値を有するVOP内の剰余数係数の最大数を表す。 かくして、計算されたしきい値に基づいて、カットオフ値は次のようにS(v)から獲得される。

    【0073】

    【数1】

    カットオフ値=最小x値、ここでC(x)<T

    1

    【0074】最大値とカットオフ値とを獲得した後に、
    これらの2つの値は拡張レイヤビットストリームのVO
    Pヘッダ内に記憶され、復号化器で復号化するために使用される。

    【0075】 ビットプレーンの総数本発明では、第1のビットプレーンについて、「1」ビットは「より大きいか等しい」ことを示し、一方「0」
    ビットは「より小さい」ことを示している。 したがって、第1のビットプレーンのカットオフ値に基づき、カットオフ値よりも大きいか等しい値を有する剰余数係数は、第1のビットプレーンで「1」ビットとして、またカットオフ値よりも小さい値を有するそれらの係数について「0」ビットとして表される。

    【0076】表1は、第1のビットプレーンの剰余数のビットを示す。

    【0077】

    【表1】

    ビットプレーンの総数を決定するには、最初に第2のビットプレーンの最大ダイナミックレンジを計算しなければならない。 最大ダイナミックレンジは次のように計算される、 ・R

    lower =カットオフ値−1 ・R

    upper =最大値−カットオフ値・B

    M =max(R


    lower ,R

    upper ) 次に、B

    Mを表す2進ビットの数N

    Mが決定される。 例えば、上記の実例のB

    Mは26であり2進数で11010


    と表すことができる。 かくしてこの場合のN

    Mは5である。 計算されたN

    Mの値に基づき、ビットプレーンの総数はN

    M +1によって決定される。

    【0078】 バイナリ変換Mの最大バイナリレンジは次の式を用いて決定することができる。 R B =1<<N M −1 計算したR B値に基づいて、上限と下限両方のしきい値が計算される。 T しきい値 =2×B M −R B剰余数係数の大きさは次のように符号化される。

    【0079】

    【数2】 if(剰余数値<カットオフ値) if(剰余数値>T しきい値 ) 符号化値=剰余数値<<1−T しきい値 else 符号化値=剰余数値 else オフセット値=剰余数値−カットオフ値 if(オフセット値>T しきい値 ) 符号化値=1<<N M +オフセット値<<1−T
    しきい値 else 符号化値=1<<N M +オフセット値 符号化された値はN M +1ビットの2進数を用いて表される。

    【0080】 剰余数再構築と予測剰余数再構築と予測技術は、再構築された映像の全体的な品質を改良すべく、またその予測された剰余数値に基づいて剰余数値を再構築すべく、受信された剰余数係数について予測を実行するための方法を提供する。

    【0081】復号化器側で、最大値とカットオフ値とを拡張レイヤビットストリームのVOPヘッダから獲得することができる。 これらの2つの値に基づき、
    upper 、R l ower 、B M 、N M 、T upperおよびT lowerの値を計算できる。

    【0082】FGSサーバにおける拡張レイヤビットストリームの切り捨てにより、N M +1のビットプレーンのすべてが復号化器側で受信されるのではない。 したがって、再構成の前に、受信した値について予測を行う必要がある。 予測値は次のように計算される。

    【0083】

    【数3】N Dを復号化器側で受信されるビットプレーンの数であるとする。

    【0084】

    【数4】剰余数値を再構築して戻すために、次のアルゴリズムが使用される。 if(予測値<(1<<N M )) if(予測値>T しきい値 ) 剰余数値=(予測値+T しきい値 )>>1 else 剰余数値=予測値 else オフセット値=予測値−1<<N M if(オフセット値>T しきい値 ) 剰余数値=カットオフ値+(オフセット値+T しきい値 )>>1 else 剰余数値=カットオフ値+オフセット値

    【0085】

    【発明の効果】本発明は、剰余数値を表すために使用されるビットの有意性を改良し、かくしてビットプレーン可変長符号化の符号化効率を向上するのに非常に効率的である。

    【図面の簡単な説明】

    【図1】 従来技術の基本的なFGS符号化器のブロック図である。

    【図2】 従来技術の基本的なFGS復号化器のブロック図である。

    【図3】 VOP内の剰余数の大きさの典型的な確率密度分布図である。

    【図4】 本発明の第1の実施形態の符号化器のブロック図である。

    【図5】 本発明の第1の実施形態の本発明の復号化器のブロック図である。

    【図6】 本発明の第2の実施形態の本発明の符号化器のブロック図である。

    【図7】 本発明の第2の実施形態の本発明の復号化器のブロック図である。

    【図8】 128kbpsにおけるベースレイヤビットレートについての本発明と従来技術との間の性能を比較した図である。

    【図9】 256kbpsにおけるベースレイヤビットレートについての本発明と従来技術との間の性能を比較した図である。

    【符号の説明】

    401 ブロックサンプリング 403 DCT 404 量子化 405 DC&AC予測 406 ジグザグスキャン 407 VLC 408 逆量子化 409 逆DCT 411 フレームメモリ 412 動き推定および動き補償 413 逆量子化 415 ジグザグスキャン 416 動的剰余数表示 417 ビットプレーンVLC 402、410、414 加算部

    ───────────────────────────────────────────────────── フロントページの続き (72)発明者 ティオ ケン・タン シンガポール534415シンガポール、タイ・ セン・アベニュー、ブロック1022、04− 3530番、タイ・セン・インダストリアル・ エステイト、パナソニック・シンガポール 研究所株式会社内 Fターム(参考) 5C059 KK11 MA00 MA04 MA05 MA23 MC01 MC04 MC33 ME01 PP04 RA01 RA04 RB01 SS06 TA43 TB07 TC08 TD02 TD12 TD14 UA02 UA11 UA31 5J064 AA02 BA09 BA16 BB03 BC01 BC08 BD02

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈