首页 / 专利库 / 广播 / 帧内预测 / Moving image coding apparatus, moving image decoding apparatus, control method therefor, computer program, and computer-readable storage medium

Moving image coding apparatus, moving image decoding apparatus, control method therefor, computer program, and computer-readable storage medium

阅读:796发布:2023-12-14

专利汇可以提供Moving image coding apparatus, moving image decoding apparatus, control method therefor, computer program, and computer-readable storage medium专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a moving image coding apparatus in which a deterioration in image quality is prevented by suppressing errors due to bitplane rounding off operation from being gradually accumulated in a predicted frame image, such as P- and B-pictures, by selectively discarding code data for each bitplane. SOLUTION: There are provided a block segmentation unit 31 for segmenting an inputted frame into a plurality of blocks; a difference computing unit 32 for outputting the blocks to a DWT unit 33 without any change when the intra-frame coding mode is set, or for computing a difference from predicted data from a motion compensation unit 42 when the inter-frame coding mode is set; a DWT computing unit 33 for coding a bitplane; a quantization unit 34; an entropy coding unit 35; and a bit round-off unit 36 for rounding off code data of bitplanes from the least significant position to an upper bit position such that the resultant code amount becomes equal to or less than a target code amount. Only when the intra-frame coding mode is set, a dequantization unit 39 and an inverse DWT unit 40 are executed to update a frame memory 41. COPYRIGHT: (C)2006,JPO&NCIPI,下面是Moving image coding apparatus, moving image decoding apparatus, control method therefor, computer program, and computer-readable storage medium专利的具体信息内容。

  • 動画像を構成するフレームの画像データを順次入力し、符号化する動画像符号化装置であって、
    フレーム間の相関を利用した第1の符号化モード、フレーム単独で符号化する第2の符号化モードをフレーム単位に適応的に選択するモード選択手段と、
    入力したフレームの画像データを複数のブロックに分割する分割手段と、
    前記モード選択手段の出力に応じて符号化された画像データをローカルデコードする復号手段と、
    前記第1の符号化モードでは、前記分割手段で分割して得られたブロック画像に基づき従前のローカルデコードされたフレームから予測データを抽出し、前記分割したブロック画像と前記予測データとを差分したブロックを出力し、第2の符号化モードでは前記分割手段で分割したブロックを出力する演算手段と、
    前記演算手段で得られたブロックを空間周波数成分データに変換する変換手段と、
    変換して得られた各周波数成分値を表わす各ビット位置のビット情報で構成されるビットプレーン単位に中間的な符号化データを生成する符号化データ生成手段と、
    生成された符号化データ中の最下位ビット位置から上位ビット位置に向かう所望とするビットプレーンの符号化データまでを切り捨てることで、符号化データ量を調整する調整手段と、
    前記調整手段により調整された符号化データを出力する出力手段と を備えることを特徴とする動画像符号化装置。
  • 前記復号手段は、前記第2の符号化モードにより符号化された画像データに対してのみローカルデコードすることを特徴とする請求項1に記載の動画像符号化装置。
  • 前記演算手段で参照するローカルデコードされたフレームとは、前記第2の符号化モードで演算された画像データのローカルデコード画像であることを特徴とする請求項1または2に記載の動画像符号化装置。
  • 前記変換手段は、離散ウェーブレット変換であることを特徴とする請求項1乃至3のいずれか1項に記載の動画像符号化装置。
  • 更に、前記調整手段によるビットプレーンの符号化データの切り捨てを行う/行わないを指示する指示手段を備えることを特徴とする請求項1乃至4のいずれか1項に記載の動画像符号化装置。
  • 前記モード選択手段は、入力するフレーム数が所定数になった後の最初に入力するフレームについて前記第2の符号化モードを選択することを特徴とする請求項1乃至5のいずれか1項に記載の動画像符号化装置。
  • 前記復号手段は、前記調整手段により調整された符号化データをローカルデコードすることを特徴とする請求項1乃至6のいずれか1項に記載の動画像符号化装置。
  • 動画像を構成するフレームの画像データを順次入力し、符号化する動画像符号化装置の制御方法であって、
    フレーム間の相関を利用した第1の符号化モード、フレーム単独で符号化する第2の符号化モードをフレーム単位に適応的に選択するモード選択工程と、
    入力したフレームの画像データを複数のブロックに分割する分割工程と、
    前記モード選択手段の出力に応じて符号化された画像データをローカルデコードする復号工程と、
    前記第1の符号化モードでは、前記分割工程で分割して得られたブロック画像に基づき従前のローカルデコードされたフレームから予測データを抽出し、前記分割したブロック画像と前記予測データとを差分したブロックを出力し、前記第2の符号化モードでは前記分割工程で分割したブロックを出力する演算工程と、
    前記演算工程で得られたブロックを空間周波数成分データに変換する変換工程と、
    前記変換して得られた各周波数成分値を表わす各ビット位置のビット情報で構成されるビットプレーン単位に中間的な符号化データを生成する符号化データ生成工程と、
    前記生成された符号化データ中の最下位ビット位置から上位ビット位置に向かう所望とするビットプレーンの符号化データまでを切り捨てることで、符号化データ量を調整する調整工程と、
    前記調整工程で調整された符号化データを出力する出力工程と を備えることを特徴とする動画像符号化装置の制御方法。
  • コンピュータが読み込み実行することで、動画像を構成するフレームを順次入力し、符号化する動画像符号化装置として機能するコンピュータプログラムであって、
    フレーム間の相関を利用した第1の符号化モード、フレーム単独で符号化する第2の符号化モードをフレーム単位に適応的に選択するモード選択手段と、
    入力したフレームの画像データを複数のブロックに分割する分割手段と、
    前記モード選択手段の出力に応じて符号化された画像データをローカルデコードする復号手段と、
    前記第1の符号化モードでは、前記分割手段で分割して得られたブロック画像に基づき従前のローカルデコードされたフレームから予測データを抽出し、前記分割したブロック画像と前記予測データとを差分したブロックを出力し、前記第2の符号化モードでは前記分割手段で分割したブロックを出力する演算手段と、
    前記演算手段で得られたブロックを空間周波数成分データに変換する変換手段と、
    前記変換して得られた各周波数成分値を表わす各ビット位置のビット情報で構成されるビットプレーン単位に中間的な符号化データを生成する符号化データ生成手段と、
    前記生成された符号化データ中の最下位ビット位置から上位ビット位置に向かう所望とするビットプレーンの符号化データまでを切り捨てることで、符号化データ量を調整する調整手段と、
    前記調整手段により調整された符号化データを出力する出力手段 として機能することを特徴とするコンピュータプログラム。
  • 請求項9に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
  • 動画像を構成するフレームの画像データを順次入力し、符号化する動画像符号化装置であって、
    フレーム間の相関を利用した第1の符号化モード、フレーム単独で符号化する第2の符号化モードをフレーム単位に適応的に選択するモード選択手段と、
    入力したフレームの画像データを複数のブロックに分割する分割手段と、
    少なくとも1フレーム分の画像データを記憶する記憶手段と、
    前記モード選択手段で前記第1の符号化モードが選択された場合には、前記分割手段で分割して得られたブロック画像に基づき、前記記憶手段に記憶された画像データから予測データを抽出し、抽出した予測データと前記ブロック画像との差分を出力し、前記記モード選択手段で前記第2の符号化モードが選択された場合には、前記分割手段で分割されたブロック画像を出力する演算手段と、
    該演算手段より出力されたブロックを空間周波数成分データに変換する変換手段と、
    該変換手段で得られた各周波数成分値を表わす各ビット位置のビット情報で構成されるビットプレーン単位に符号化する符号化手段と、
    前記モード選択手段によって前記第2の符号化モードを選択した場合、前記符号化手段で生成された符号化データをローカルデコードし、デコードして得られた画像データで前記記憶手段を更新する更新手段と を備えることを特徴とする動画像符号化装置。
  • 前記符号化手段は、
    最上位のビットプレーンのビット位置をNmax、n(0≦n≦Nmax)目のビットプレーンの符号化データをC(i)、その符号化データ量をL(C(i))、1フレームの許容符号量を示す閾値をTとしたとき、
    ΣL(C(Nmax−k))≦T
    を満たす最大kまでの符号化データC(Nmax),C(Nmax−1)、…、C(Nmax−k)を有効な符号化データとして出力し、符号化データC(0)、…、C(Nmax−k−1)まで破棄することを特徴とする請求項11に記載の動画像符号化装置。
  • 前記閾値Tは、前記第1、第2の符号化モードで異なることを特徴とする請求項12に記載の動画像符号化装置。
  • 少なくとも1フレーム分の画像データを記憶する記憶手段を備え、動画像を構成するフレームの画像データを順次入力し、符号化する動画像符号化装置の制御方法であって、
    フレーム間の相関を利用した第1の符号化モード、フレーム単独で符号化する第2の符号化モードをフレーム単位に適応的に選択するモード選択工程と、
    入力したフレームの画像データを複数のブロックに分割する分割工程と、
    前記モード選択工程で前記第1の符号化モードが選択された場合には、前記分割工程で分割して得られたブロック画像に基づき、前記記憶手段に記憶された画像データから予測データを抽出し、抽出した予測データと前記ブロック画像との差分を出力すると共に、前記記モード選択工程で前記第2の符号化モードが選択された場合には、前記分割工程で分割されたブロック画像を出力する演算工程と、
    該演算工程より出力されたブロックを空間周波数成分データに変換する変換工程と、
    該変換工程で得られた各周波数成分値を表わす各ビット位置のビット情報で構成されるビットプレーン単位に符号化する符号化工程と、
    前記モード選択工程によって前記第2の符号化モードを選択した場合、前記符号化工程で生成された符号化データをローカルデコードし、デコードして得られた画像データで前記記憶手段を更新する更新工程と を備えることを特徴とする動画像符号化装置の制御方法。
  • 少なくとも1フレーム分の画像データを記憶する記憶手段を備え、動画像を構成するフレームの画像データを順次入力し、符号化する動画像符号化装置用のコンピュータプログラムであって、
    フレーム間の相関を利用した第1の符号化モード、フレーム単独で符号化する第2の符号化モードをフレーム単位に適応的に選択するモード選択手段と、
    入力したフレームの画像データを複数のブロックに分割する分割手段と、
    前記モード選択手段で前記第1の符号化モードが選択された場合には、前記分割手段で分割して得られたブロック画像に基づき、前記記憶手段に記憶された画像データから予測データを抽出し、抽出した予測データと前記ブロック画像との差分を出力すると共に、前記記モード選択手段で前記第2の符号化モードが選択された場合には、前記分割手段で分割されたブロック画像を出力する演算手段と、
    該演算手段より出力されたブロックを空間周波数成分データに変換する変換手段と、
    該変換手段で得られた各周波数成分値を表わす各ビット位置のビット情報で構成されるビットプレーン単位に符号化する符号化手段と、
    前記モード選択手段によって前記第2の符号化モードを選択した場合、前記符号化手段で生成された符号化データをローカルデコードし、デコードして得られた画像データで前記記憶手段を更新する更新手段 として機能することを特徴とするコンピュータプログラム。
  • 請求項15に記載のコンピュータプログラムを格納したことを特徴とするコピー可読記憶媒体。
  • 符号化された動画像データを復号する動画像復号装置であって、
    少なくとも1フレーム分の画像データを記憶する記憶手段と、
    入力した符号化データに基づき、注目フレームがフレーム間の相関を利用した第1の符号化モードによる符号化データであるか、フレーム単独で符号化する第2の符号化モードによる符号化データであるのかを判定する判定手段と、
    注目フレームの符号化データを復号する復号手段と、
    前記判定手段で注目フレームが前記第1の符号化モードによる符号化データであると判定された場合、前記復号手段による復号結果は差分画像データであるものとし、前記記憶手段に記憶された画像データと前記差分画像データとを加算することでフレーム画像を生成すると共に、前記判定手段で注目フレームが前記第2の符号化モードによる符号化データであると判定された場合には、復号結果をフレーム画像として出力する加算手段と、
    前記判定手段で注目フレームが前記第2の符号化モードによる符号化データであると判定された場合、前記加算手段より出力されたフレーム画像で前記記憶手段を更新する更新手段と を備えることを特徴とする動画像復号装置。
  • 少なくとも1フレーム分の画像データを記憶する記憶手段を有し、符号化された動画像データを復号する動画像復号装置の制御方法であって、
    入力した符号化データに基づき、注目フレームがフレーム間の相関を利用した第1の符号化モードによる符号化データであるか、フレーム単独で符号化する第2の符号化モードによる符号化データであるのかを判定する判定工程と、
    注目フレームの符号化データを復号する復号工程と、
    前記判定工程で注目フレームが前記第1の符号化モードによる符号化データであると判定された場合、前記復号工程による復号結果は差分画像データであるものとし、前記記憶手段に記憶された画像データと前記差分画像データとを加算することでフレーム画像を生成すると共に、前記判定工程で注目フレームが前記第2の符号化モードによる符号化データであると判定された場合には、復号結果をフレーム画像として出力する加算工程と、
    前記判定工程で注目フレームが前記第2の符号化モードによる符号化データであると判定された場合、前記加算工程より出力されたフレーム画像で前記記憶手段を更新する更新工程と を備えることを特徴とする動画像復号装置の制御方法。
  • 少なくとも1フレーム分の画像データを記憶する記憶手段を有し、符号化された動画像データを復号する動画像復号装置を制御するためのコンピュータプログラムであって、
    入力した符号化データに基づき、注目フレームがフレーム間の相関を利用した第1の符号化モードによる符号化データであるか、フレーム単独で符号化する第2の符号化モードによる符号化データであるのかを判定する判定手段と、
    注目フレームの符号化データを復号する復号手段と、
    前記判定手段で注目フレームが前記第1の符号化モードによる符号化データであると判定された場合、前記復号手段による復号結果は差分画像データであるものとし、前記記憶手段に記憶された画像データと前記差分画像データとを加算することでフレーム画像を生成すると共に、前記判定手段で注目フレームが前記第2の符号化モードによる符号化データであると判定された場合には、復号結果をフレーム画像として出力する加算手段と、
    前記判定手段で注目フレームが前記第2の符号化モードによる符号化データであると判定された場合、前記加算手段より出力されたフレーム画像で前記記憶手段を更新する更新手段 として機能することを特徴とするコンピュータプログラム。
  • 請求項19に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
  • 说明书全文

    本発明は動画像データの符号化技術に関するものである。

    近年、ネットワーク、とりわけインターネット上に流れるコンテンツは文字情報から静止画像情報、さらには動画像情報へと大容量化、多様化している。 これに合わせて、情報量を圧縮する符号化技術の開発も進み、開発された符号化技術は国際標準化によって広く普及するようになった。

    一方で、ネットワーク自体も大容量化、多様化が進んでおり、1つのコンテンツが送信側から受信側に届くまでに様々な環境を通過することになった。 また、送信/受信側機器の処理性能も多様化している。 送受信機器の主として用いられるパーソナルコンピュータ等の汎用情報処理装置(以下、PCという)はCPU性能、グラフィクス性能など、大幅な性能向上が進む一方、PDA、携帯電話機、TV,ハードディスクレコーダなど、処理性能の異なる様々な機器がネットワーク接続機能を持つようになってきている。 このため、1つのデータで、変化する通信回線容量や受信側機器の処理性能に対応できるスケーラビリティという機能が注目されている。

    このスケーラビリティ機能を持つ静止画像符号化方式としてJPEG2000符号化方式が広く知られている。 この方式は国際標準化され、ISO/IEC15444−1(Information technology -- JPEG 2000 image coding system -- Part 1: Core coding system)に詳細が記述されている。 その特徴は入された画像データに対して離散ウェーブレット変換(DWT:Discreate Wavelet Transformation)を施し、複数周波数帯に分離する。 それらの係数を量子化し、その値をビットプレーン毎に算術符号化するというものである。 ビットプレーンを必要な数だけ符号化したり、復号したりすることで、きめの細かい階層の制御を可能にしている。

    また、JPEG2000符号化方式では、従来の符号化技術には無い、画像の中で興味がある領域の画質を相対的に向上させるROI(Region Of Interest)といった技術も実現している。

    図8にJPEG2000符号化方式の符号化手順を示す。 タイル分割部9001は入力画像を複数の領域(タイル)に分割する。 この機能はオプションである。 DWT部9002は離散ウェーブレット変換を行い、周波数帯に分離する。 量子化部9003で、各係数を量子化する。 ただし、この機能はオプションである。 ROI部9007はオプションであり、興味のある領域を設定し、量子化部9003でシフトアップを行う。 エントロピー符号化部9004でEBCOT(Embeded Block Coding with Optimized Truncation)方式でエントロピー符号化を行い、符号化されたデータはビットプレーン切り捨て部9005で必要に応じて下位ビットプレーンを切り捨ててレート制御を行う。 符号形成部9006でヘッダ情報を付加し、種々のスケーラビリティの機能を選択して符号化データを出力する。

    図9にJPEG2000符号化方式の復号手順を示す。 符号解析部9020はヘッダを解析し、階層を構成するための情報を得る。 ビットプレーン切り捨て部9021は入力される符号化データを内部バッファの容量、復号処理能力に対応して、下位のビットプレーンを切り捨てる。 エントロピー復号部9022はEBCOT符号化方式の符号化データを復号し、量子化されたウェーブレット変換係数を得る。 逆量子化部9023はこれに逆量子化を施し、逆DWT部9024は逆離散ウェーブレット変換を施して画像データを再生する。 タイル合成部9025は複数のタイルを合成して画像データ再生する。

    このJPEG2000符号化方式を動画像の各フレームに対応させることで動画像符号化を行うMotion JPEG2000方式(ISO/IEC15444−3(Information technology -- JPEG 2000 image coding system Part 3: Motion JPEG 2000))も勧告されている。 この方式ではフレーム単位に独立に符号化処理が行われており、時間相関を用いて符号化を行わないため、フレーム間に冗長性が残る。 このため、時間相関を用いた動画像符号化方式に比べて符号量を効果的に削減することは難しいという問題がある。

    一方で、MPEG符号化方式では動き補償を行い、符号化効率の改善を図っている(非特許文献1)。 図10にその符号化の手順を示す。 ブロック分割部9031で8×8の画素ブロックに分割し、差分部9032で動き補償による予測データを引き、DCT部9033で離散コサイン変換を行い、量子化部9034で量子化を行う。 その結果はエントロピー符号化部9035で符号化され、符号形成部9036でヘッダ情報を付加して、符号化データを出力する。

    同時に、逆量子化部9037で逆量子化し、逆DCT部9038で離散コサイン変換の逆変換を施し、加算部9039で予測データを加算してフレームメモリ9040に格納する。 動き補償部9041は入力画像とフレームメモリ9040に格納されている参照フレームを参照して動きベクトルを求め、予測データを生成する。

    「最新MPEG教科書」76ページ他 アスキー出版局1994年

    前述のMPEG符号化方式において、JPEG2000のようなスケーラビリティを実現するようにビットプレーン符号化を行う方式に適用するためには、ビットプレーン符号化の打ち切りによって動き補償での誤差が累積し、画像の劣化を招くといった問題が生じる。 すなわち、図10のDCT部9033と逆DCT部9038を離散ウェーブレット変換と逆離散ウェーブレット変換に置き換え、エントロピー符号化部9035でビットプレーン符号化を行い、符号形成9036でビットプレーン切り捨て部9005を付加してビットプレーン切捨てを行なうと、図9のビットプレーン切り捨て部9021で行われたビットプレーンの切捨てによって各フレームで再生されるビットプレーン数が異なる。 また、切り捨てられた下位ビットプレーンを0で補填すると本来の誤差と異なる値になるため、MPEGで言うPピクチャから、更なるPピクチャやBピクチャを生成すると、誤差が累積されることになってしまい、動画像として画質が悪くなってしまう。

    本発明は、前記課題に鑑みなされたものであり、ビットプレーン符号化の打ち切りによって発生する誤差が、PピクチャやBピクチャのような予測フレーム画像に、徐々に累積されていくことを抑制し、画像の劣化を防ぐことを可能ならしめる技術を提供しようとするものである。

    この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。 すなわち、
    動画像を構成するフレームの画像データを順次入力し、符号化する動画像符号化装置であって、
    フレーム間の相関を利用した第1の符号化モード、フレーム単独で符号化する第2の符号化モードをフレーム単位に適応的に選択するモード選択手段と、
    入力したフレームの画像データを複数のブロックに分割する分割手段と、
    前記モード選択手段の出力に応じて符号化された画像データをローカルデコードする復号手段と、
    前記第1の符号化モードでは、前記分割手段で分割して得られたブロック画像に基づき従前のローカルデコードされたフレームから予測データを抽出し、前記分割したブロック画像と前記予測データとを差分したブロックを出力し、第2の符号化モードでは前記分割手段で分割したブロックを出力する演算手段と、
    前記演算手段で得られたブロックを空間周波数成分データに変換する変換手段と、
    変換して得られた各周波数成分値を表わす各ビット位置のビット情報で構成されるビットプレーン単位に中間的な符号化データを生成する符号化データ生成手段と、
    生成された符号化データ中の最下位ビット位置から上位ビット位置に向かう所望とするビットプレーンの符号化データまでを切り捨てることで、符号化データ量を調整する調整手段と、
    前記調整手段により調整された符号化データを出力する出力手段とを備える。

    本発明によれば、ビットプレーン毎の符号化データの取捨選択により最終的な符号化データを生成する場合にあっても、PピクチャやBピクチャのような予測フレーム画像に、徐々にビットプレーンの切り捨てによる誤差が累積されていくことを抑制し、画像の劣化を防ぐことが可能になる。

    以下、添付図面に従って本発明に係る実施形態を詳細に説明する。

    <第1実施形態>
    図1は第1の実施形態における動画像符号化装置のブロック構成図である。 本第1実施形態においては、動画像符号化装置が使用する画像の符号化方式として、MotionJPEG2000符号化方式を例にとって説明するが、これに限定されない。

    図1において、31は入力された画像データをブロック単位に分割するブロック分割部であり、32は画像データの後述する動き補償によって得られる予測データとの差分を求める差分演算部である。 33は分割されたブロックに対して離散ウェーブレット変換を施すDWT部である。 34は離散ウェーブレット変換で得られた変換係数を量子化する量子化部であり、35はJPEG2000符号化方式のEBCOT符号化をビットプレーン毎に行なうエントロピー符号化部であり、36は符号化データから有効な上位ビットプレーンの符号化データを選択し、下位ビットプレーンの符号化データを切り捨てるビットプレーン切り捨て部であり、37は必要なヘッダを生成し、ビットプレーン切捨て部36の出力から符号化データを形成する符号形成部である。

    43はフレーム単位で符号化モードを決定するモード判定部であり、フレーム内符号化(イントラフレーム符号化)モードと、フレーム間符号化(インターフレーム符号化)モードのいずれかを使用するかを判定する。 39は量子化部34の逆量子化を行う逆量子化部であり、40はDWT部33の逆変換を行う逆DWT部である。 逆量子化部39及び逆DWT部40は、モード判定部43でフレーム内符号化モードで符号化することを決定した場合にのみ実行する。 それ故、モード判定部43による判定結果を受けて、これら逆量子化部39、逆DWT部40を実行許可を与えるためのスイッチ38を設けた。

    41は動き補償の参照のために復号画像(逆量子化部39、逆DWT部04によりローカルデコードされた画像)を格納しておくフレームメモリである。 先に説明したように、逆量子化部39及び逆DWT部40は、フレーム内符号化モード時のみ実行されるので、フレームメモリ41には、フレーム内符号化した画像の、復号画像結果のみが格納されることになる。 42はフレームメモリ41と入力画像から動き予測を行い、動きベクトルと予測データを算出する動き補償である。

    上記のように構成された動画像符号化装置における動作を以下で説明する。 本実施形態においてはフレーム内符号化を行うIピクチャと、前方予測によるフレーム間符号化を行うPピクチャだけでGOP(Group Of Pictures)を構成する場合を説明する。 1GOPは15フレームで構成されるものとする。 通常、再生時には30フレーム/秒のフレームレートで再生するから、1GOPは約0.5秒分の動画像データとなる。 また、実施形態では、1GOPには、Iピクチャ(フレーム内符号化データ)は1つ、残りの14フレームはPピクチャ(フレーム間符号化データ)とし、Iピクチャを生成するタイミングは固定とする。 なお、Iピクチャの数は2以上でも良い。 1GOP内のIピクチャの数が増えると、動画像としての画質が良くなるが、代わりに符号化データ量が増えることになる。 30フレーム/秒で再生し、1GOPが15フレームで構成されるとした場合、1GOP内のIピクチャは2つ程度で十分であろう。

    ブロック分割部31では入力された動画像の1フレームをN×N(Nは自然数)のブロックに分割し(各ブロックは32×32画素サイズとする)、各ブロック画像を差分演算部32と、動き補償部42へ送る。 動き補償部42は入力されたブロック画像に対するフレームメモリ41から動きベクトルを算出してその予測データであるブロック画像データを得る。 差分演算部32は、モード判定部43がフレーム間符号化モード(インターフレーム符号化モード)を選択した場合には、現フレームから予測データを減算する。 また、モード判定部43がフレーム内符号化(イントラフレーム符号化)モードを選択した場合には、差分を取らず(予測データの係数をすべて0にしても良い)、入力フレームの情報をそのままDWT部33へ出力する。

    DWT部33では、離散ウェーブレット変換を行い、量子化部34へ出力する。 量子化部34では、離散ウェーブレット変換後の係数を量子化し、エントロピー符号化部35と逆量子化部39へ出力する。 エントロピー符号化部35は、量子化された係数をビットプレーン毎に符号化し、ビットプレーン切り捨て部36へ出力する。 ビットプレーン切り捨て部36では、1GOPの符号量が所定の符号量に収まるようビットプレーンの切り捨てを行い、符号形成部37へ出力する。

    Iピクチャ(フレーム内符号化データ)の符号化データ量の閾値をTi、Pピクチャ(フレーム間符号化データ)の符号量の閾値をTpと定義したとき、1GOPのデータ量の許容量はTi×n+Tp×mで表現できる(実施形態では、n=1、m=14)。 ビットプレーン切り捨て部36がエントロピー符号化部35より受信する1フレームのデータ量Dと定義する。

    今、フレーム内符号化モードが選択されている場合において、D≦Tiなる関係にある場合には、ビットプレーン切り捨て部36は切り捨てを行わない。 D>Tiの関係にある場合、ビットプレーン切り捨て部36は、D≦Tiなる関係になるまで、エントロピー符号化部35より入力した最下位ビットプレーンから上位に向かうビットプレーンの符号化データを切り捨てていく。

    例えば、nビット目のビットプレーンの符号化データをC(n)、その符号化データ量をL((Cn))とし、最上位ビットをNmaxとした場合、
    L(C(Nmax))+L(C(Nmax−1))+…+L(C(Nmax−k))≦Ti
    を満足するkの最大値を見つけ出し、C(Nmax)、C(Nmax−1)、…、C(Nmax−k)を有効な符号化データとして出力し、符号化データC(Nmax−k−1)、C(Nmax−k−2)、…、C(0)を破棄する。

    上記はPピクチャの場合にも同様である。 ただし、Pピクチャの場合の閾値はTpとなる点で異なる。 IピクチャはPピクチャを生成する際の基準となるものであり、その画質が高いことが望まれる。 また、Iピクチャはフレーム内符号化するピクチャであるので、閾値TiとTpの関係はTi>Tpである。 以上の結果、1GOPのデータ量は、許容データ量以下に維持することが可能となる。 なお、閾値Ti、Tpは適宜決定すればよい。

    符号化部37は符号形成部37では符号にヘッダ情報を付加して、符号化データを出力する。

    逆量子化部39及び逆DCT部40は、先に説明したように、モード判定部43からフレーム内符号化モードを示す情報に基づいてスイッチ38がONになった場合にのみ機能する。 それ故、逆量子化部39、逆DWT部40を経たデータは復元された画像データとなる(差分データではないという意味)。 この復元画像データは、フレームメモリに41に格納されることになる。 実施形態の場合、1GOPにIピクチャが1つとしているので、フレームメモリ41が更新されるのは15フレーム間隔となる。 勿論、1GOP内にIピクチャが2つとか、3つにする場合には、それぞれのインターバルでフレームメモリ41が更新されることになる。

    動き補償部42は、現在符号化対象のフレームをフレーム間符号化する場合にのみ、入力画像とフレームメモリ41に格納されている参照フレームを参照して動きベクトルを求め、予測データを生成する。

    以上の動画像符号化処理の簡単な流れを、図2のフローチャートに従って説明する。 同図は、第1実施形態に係る動画像符号化装置における処理手順を示すフローチャートである。

    先ず、ステップS100にて、符号化が開始すると符号化モードを表すピクチャタイプフラグPicTypeを0、カウンタcntを0初期化する。 このピクチャタイプフラグPicTypeが0である場合には、フレーム間符号化モード、1である場合にはフレーム内符号化モードを示す。 カウンタcntは、フレームを入力するたびにカウントアップするものであり、値14を越えた場合に再び“0”にリセットされるものである。 つまり、0〜14の範囲を繰り返しカウントする。 これは、実施形態では、1GOP=15フレーム、1GOPにIピクチャは1つの例を説明していることに起因する。

    次に、ステップS116にて、フレーム入力が終了したか否かを判定し、否の場合には、ステップS101以降の処理を繰り返す。 なお、フレームの入力終了の判定は、例えば、実施形態の装置がビデオカメラであれば、不図示の録画ボタンがOFFになったか否かで判定する。 また、設定されたフレーム数(もしくは時間)になったか否かで判定してもよい。

    ステップS101に進むと、1フレーム分の画像を入力し、ウェーブレット変換するために、ブロックに分割する。 このとき、カウンタcntを“1”だけ増加させる。 次いで、ステップS102にて、入力するフレームをIピクチャとして符号化するタイミングか否かを判定する。 この判定は、カウンタcnt=1であるか否かで判断する。

    カウンタcnt=1であると判断した場合には、ステップS104に進んで、フラグPicTypeを“1”に設定して、入力したフレームについてはフレーム内符号化モードの符号化処理を設定する。 また、カウンタcntが“1”以外であれば、入力したフレームはフレーム間符号化モードを行うため、ステップS103にて、フラグPicTypeを“0”に設定する。

    ステップS103、S104のいずれかの処理を行うと、フラグPicTypeが“0”、“1”のいずてかに設定されるが、この判定を行うのが図1のモード判定部43である。 モード判定部43は、フラグPicTypeに設定された値を信号として、図1の差分演算部32、逆量子化部39、逆DWT部40、ビットプレーン切り捨て部36それぞれに供給されることになる。 差分演算部32は、供給された信号が“1”の場合には、動き補償部42からの信号を使用せず、入力した各画素ブロックをそのままDWT部32に供給し、“0”の場合には動き補償部42からの画素ブロックと入力ブロックとの差分を演算し、その結果をDWT部33に供給する。

    ビットプレーン切り捨て部36では、モード判定部43からの信号に応じて、閾値Ti,Tpのいずれかを選択し、選択閾値以下の符号量になるよう、最下位から上位に向かうビットプレーンの符号データの切り捨て処理を行うことになる。

    次に、ステップS105に進み、差分演算部32からの各ブロックについてDWT部32にてDWT変換を行い、ステップS106にて、量子化部34での量子化処理を行わせる。

    次のステップS107では、フラグPicTypeが“1”であるか否か、すなわち、フレーム内符号化モードか否かを判定する。 フラグPicTypeが“1”であると判定した場合には、ステップS108にてスイッチ38をONにし、逆量子化部39、逆DWT部40を機能させるように設定する。 また、フラグPicTypeが“0”の場合には、スイッチ38をOFFにし、ステップS109乃至S111の処理は行わない。

    ステップS109に処理が進むと、逆量子化部39にて逆量子化処理を行わせ、ステップS110にて逆DWT変換を行い、ステップS111にて変換結果の画像データをフレームメモリ41に格納することで、フレームメモリ41を更新する。

    ステップS113では、エントロピー符号化部35にてエントロピー符号化を行わせる。 このエントロピー符号化はビットプレーン毎の符号化データを生成する処理でもある。

    次いで、ステップS114にて、ビットプレーン切り捨て部36にて、設定された閾値以内に符号化データが収まるよう、最下位ビットプレーンから上位に向かうビットプレーンの符号化データの切り捨て処理を行わせる。 そして、ステップS115にて1フレーム分の符号化データに所定のヘッダ(この中には、I、Pピクチャのいずれであるのかを示す情報も含まれる)を附加して符号化データを生成し、出力する。 このあと、処理はステップS116に戻り、上記処理を繰り返すことになる。

    以上説明したように本実施形態によれば、ビットプレーン符号化を行い、ビットプレーン切り捨てで符号量制御を行う動画像符号化において、フレーム間符号化を行うフレームはフレーム内符号化を行ったフレーム画像のみを参照して動き補償を行うことで、復号側で動き補償による累積誤差、すなわち、PピクチャからPピクチャを生成する場合のような誤差累積されることがないので、画像劣化を抑制させた動画像符号化データを生成することが可能となる。

    なお、実施形態では1GOPを15フレームで構成し、1GOPにIピクチャを1つ、残りの14フレームをPピクチャで生成するものとして説明したが、その終わりに近いPピクチャは、Iピクチャから時間的に離れており、動き補償の精度が悪くなる可能性が高い。 そのような場合には、Iピクチャの個数を2個、乃至3個程度にし、それらの間に挿入するPピクチャ数を平均的に割り当てることで、比較的動き大きなオブジェクトがある場合にも対処できよう。

    また、実施形態では、Iピクチャを生成するか否かを、フレーム数をカウントして、そのカウント値に応じて判定するものとしたが、所定時間単位(もしくは所定GOP数)の符号化データ量のサイズに応じてIピクチャを生成するか否かを判定するようにしてもよい。 この場合には、Iピクチャは固まって生成することは避けるべきであるので、Iピクチャを生成した後は、少なくとも1つはPピクチャを生成するという条件で符号化データを生成することが望ましい。

    なお、本実施形態ではIピクチャとPピクチャについてのみ説明を行ったが、これに限定されず、双方向予測のBピクチャを導入しても良い。 Bピクチャの場合には、2フレームを参照することになるので、フレームメモリの容量を増やし、参照する2フレームの画像をフレームメモリに格納することで実現が可能である。

    また、実施形態における図1における各処理は、パーソナルコンピュータ等で実行されるソフトウェアによって実現しても構わない。 この場合、動画像データの入力は、ビデオキャプチャカード等を搭載する等で対処できよう。 また、通常、コンピュータプログラムは、それを格納したCD−ROM等のコンピュータ可読記憶媒体をコンピュータにセットし、システムにコピーもしくはインストールすることで実行可能となるので、当然、そのようなコンピュータ可読記憶媒体も本発明の範疇に含まれる。

    また、符号化方式もJPEG2000符号化方式に限定されず、MPEG―4符号化方式のFGS符号化における拡張レイヤの符号化方式を採用しても構わない。

    さらに、双方向予測を行うBピクチャを導入してもかまわない。 この場合、前後のIピクチャを参照して動き補償を行う事で実現できる。

    また、本実施形態では、量子化後の係数に対して逆量子化を行い、復号画像を得たが、これに限定されない。 図11はビット切捨て後の係数に逆量子化をおこない、復号画像を得る場合の構成図である。 同図において、エントロピー復号部61で復号した結果を受けた逆量子化部60は、切り捨てられたビットの分のシフトを行って、逆量子化を行う機能を有する。 これにより、ビット切捨てを考慮した動画像符号化装置を実現できる。

    <第2の実施形態>
    図3は、本発明の第2の実施に係る動画像符号化装置の構成を示すブロック図である。 図3において第1実施形態の図1と同様の機能を果たす部分に関しては同じ番号を付与し、その説明については省略する。

    図中、1414は、入力画像データを格納するフレームメモリであり、142はフレームメモリ1414と入力画像から動き予測を行い、動きベクトルと予測データを算出する動き補償部である。 143はモード判定部43の出力で出力を制御するスイッチであり、フレーム内符号化モードを示す信号を受けた場合には、入力した各ブロックをフレームメモリ1414に上書きしていく。 そして、フレーム間符号化モードの場合には、スイッチがOFFとなり、フレームメモリ1414には書き込まない。 このようにすることで、フレームメモリ1414には、入力した現フレームより前の、フレーム内符号化を行ったフレームの画像が記憶保持されることになり、第1の実施形態と同様となる。

    135はDWT部33で生成された変換係数をビットプレーン毎に符号化するエントロピー符号化部である。 144、145は外部の指示部150から与えられるロスレス選択信号で入出力を選択するセレクタである。

    上記のように構成された動画像符号化装置におけるロスレス符号化動作を以下で説明する。 第1実施形態と同様にIピクチャとPピクチャだけでGOPを構成している例を説明する。 また、実施形態では、JPEG2000を例に説明をするものとするが、これに限定されない。

    第1の実施形態と同様に、ブロック分割部31では入力フレームをブロックに分割し、差分演算部32と、動き補償部142、スイッチ143へ送る。 モード選択43は、入力フレームの符号化モードとしてフレーム内符号化モードとフレーム間符号化モードのいずれかを示す信号を生成し、差分演算部32、動き補償部142、スイッチ143に出力する。

    差分演算部32は、モード判定部43が現在のフレームをフレーム間符号化モードを示す信号を受信した場合には、ブロック分割部31で分割された各ブロックから動き補償による予測データを減算する。 フレーム内符号化モードを示す信号を受けた場合には、差分演算は行わず、入力フレームの情報をそのままDWT部33へ出力する。 DWT部33で離散ウェーブレット変換を行い、エントロピー符号化部135へ出力する離散ウェーブレット変換後の係数をビットプレーン単位で符号化し、符号形成部37へ出力する。 エントロピー符号化部135は、量子化された係数を符号化し、セレクタ144に出力する。 セレクタ144は外部からロスレス符号化を行うように指示された場合は、ビットプレーン切り捨て部36を介在させないで、エントロピー符号化部135で符号化されたデータを符号形成部37にダイレクトに出力する。 また、ロッシー符号化を行うよう指示された場合には、エントロピー符号化部135で生成された符号化データをビットプレーン切り捨て部36に供給し、その結果を符号形成部37に供給する。

    ビットプレーン切り捨て部36では、第1の実施形態と同様の処理を行うことになる。 すなわち、符号データ量が所定の符号量に収まるようビットプレーンの符号化データの切り捨てを行う。 符号形成部37では符号にヘッダ情報を付加して、符号化データを出力する。

    一方、スイッチ143は、モード判定部43からフレーム内符号化モードを示す信号を受信すると、ONになり、フレームメモリ1414へ入力フレームを送り書き込む。 このとき、動き補償部142は動作せず、予測データとして0を差分部32に出力する。 一方、フレーム間符号化モードを示す信号を受信した場合、スイッチ143はオフになり、入力フレームはフレームメモリ1414へは送らない(フレームメモリ1414を更新しない)。 動き補償142は、現在符号化対象のフレームを入力画像とフレームメモリ1414に格納されている参照フレームを参照して動きベクトルを求め、予測データを生成する。 すなわち、フレームメモリ141は、情報が上書きされるまで、その情報を保持する。

    以上、本第2の実施形態における動画像符号化処理の簡単な流れを、図4のフローチャートに従って説明する。

    先ず、ステップS200にて、各パラメータを初期化する。 そして、ステップS212にて、符号化処理が終了したと判断するまで、以下のステップS201以降の処理を繰り返す。 ステップS200、S212の処理は第1の実施形態のステップS100、S116と同様である。

    ステップS201に進むと、1フレーム分の画像を入力し、ウェーブレット変換するために、ブロックに分割する。 このとき、カウンタcntを“1”だけ増加させる。 次いで、ステップS202にて、入力するフレームをIピクチャとして符号化するタイミングか否かを判定する。 この判定は、カウンタcnt=1であるか否かで判断する。

    Iピクチャ用の符号化データを作成すると判断した場合には、ステップS203にて、スイッチ143をONにする。 そして、ステップS204にて入力したフレーム画像をフレームメモリ1414に格納させることで更新すると共に、フラグPicTypeを“1”に設定する。

    一方、入力したフレームをPピクチャとして符号化する場合には、ステップS205にて、スイッチ143をOFFにして、フレームメモリ1414の更新を行わないようにする。 次いで、ステップS206にて、フレームメモリ1414に蓄積されている画像と入力された画像データとの間で動き補償を行い、その結果を差分演算部32に出力させると共に、フラグPicTypeを“0”に設定する。

    ステップS207では、入力画像データあるいは、差分画像データをDWT部33にて離散ウェーブレット変換を行わせる。 そして、ステップS208にて、ビットプレーン毎にエントロピー符号化を行なわせる。

    次に、ステップS209にて、ロスレス符号化が指示されているか否かを判定し、ロッシー符号化が指示されていれば、ステップS210にてビットプレーン切り捨て処理を行わせ、ロスレス符号化が指示されていれば、ステップS210の処理は行わないようにする。

    ステップS211では、符号化データを入力し、それに必要なヘッダ等を付加して符号形成し、出力する。 このあと、処理はステップS212に戻り、最終フレームであると判断するまで、ステップS201以下の処理を繰り返す。

    以上説明したように本第2の実施形態によれば、ビットプレーン符号化を行なう動画像ロスレス符号化において、フレーム間符号化を行なう際には、過去にフレーム内符号化を行なう対象となったフレーム画像のみを参照して動き補償を行なうことで、第1の実施形態と同様の作用効果を得ることができる。 しかも、本第2の実施形態では、第1の実施形態で示した逆量子化部、逆DWT部が不要となり、ハードウェアで実現する場合には回路規模を小さなものにでき、ソフトウェアで実現する場合には、CPUのかかる負担を軽減させることが可能となる。 また、第2の実施形態によれば、ビットプレーン切り捨て処理を行うか否かを適宜選択できるので、非可逆な符号化にも対応できる。

    なお、本実施形態ではIピクチャとPピクチャについてのみ説明を行ったが、これに限定されず、双方向予測のBピクチャを導入してもフレームメモリを増やし、同様にIピクチャを参照することで実現が可能である。

    また、実施形態における図3における各処理は、パーソナルコンピュータ等で実行されるソフトウェアによって実現しても構わない。 この場合、動画像データの入力は、ビデオキャプチャカード等を搭載する等で対処できよう。 また、通常、コンピュータプログラムは、それを格納したCD−ROM等のコンピュータ可読記憶媒体をコンピュータにセットし、システムにコピーもしくはインストールすることで実行可能となるので、当然、そのようなコンピュータ可読記憶媒体も本発明の範疇に含まれる。

    また、符号化方式もJPEG2000符号化方式に限定されず、MPEG―4符号化方式のFGS符号化における拡張レイヤの符号化方式を採用しても構わない。

    <第3の実施形態>
    次に、第3の実施形態を説明する。 図5は、第3の実施形態における動画像符号化装置を示すブロック構成図である。

    同図において、300は装置全体の制御、及び種々の処理を行なう中央演算装置(CPU)、301は本装置の制御に必要なオペレーティングシステム(OS)、画像圧縮処理にかかるコンピュータプログラム、並びに、演算に必要な記憶領域を提供するメモリである。 302は種々の装置をつなぎ、データ、制御信号をやり取りするバスである。

    303は装置の起動、各種条件の設定、再生の指示を行なうためのスイッチやキーボード、マウス(登録商標)等のポインティングデバイスで構成される入力部である。 304は上記OSや各種ソフトウェアを蓄積する記憶装置(例えばハードディスク)である。 305はストリームを記憶媒体に蓄積する記憶装置であり、記憶媒体としては書き込み可能なCDディスク、DVDディスク、磁気テープ等である。 306は動画像を撮像するカメラである。 307は画像を表示するモニタであり、309は通信回路であり、LAN、公衆回線、無線回線、放送電波等で構成されている。 308は通信回路309を介してストリームを送受信する通信インターフェースである。

    メモリ301には装置全体を制御し、各種ソフトウェアを動作させるためのOSや動作させるソフトウェアを格納し、画像データを格納する画像エリア、生成した符号化データを格納する符号エリア、各種演算や符号化の際のパラメータ等や透かしに関するデータ等を格納しておくワーキングエリアが存在する。

    このような構成において動画像符号化処理について説明する。 カメラ306から入力された画像データを符号化し、通信回路309に出力する場合を例にとって説明する。

    メモリ301のメモリの使用、格納状況は図7に示す通りである。 メモリ301には装置全体を制御し、各種ソフトウェアを動作させるためのOS、動画像符号化する動画像符号化ソフトウェア、動画像からオブジェクトを抽出するオブジェクト抽出ソフトウェア、通信する通信ソフトウェア、カメラ305から動画像をフレーム単位で入力する画像入力ソフトウェアが格納されている。 動画像符号化ソフトウェアはMotion JPEG2000符号化方式をベースとしたものを例にとって説明するが、これに限定されない。

    処理に先立ち、入力部303から装置全体に対して起動が指示され、各部が初期化される。 入力部303からはMotion JPEG2000符号化方式との互換性を保つか否かの指示が入力され、記憶装置304に格納されているソフトウェアがバス302を介してメモリ301に展開され、ソフトウェアが起動される。

    このような構成において、処理に先立ち、メモリ301上の符号エリア、ワーキングエリアを0クリアする。 JPEG2000符号化と互換を保つ場合は、画像エリア2は使用しないため、開放されている。

    画像入力ソフトウェアはカメラ305で撮像された画像データを1フレームずつ、メモリ301上の画像エリアに格納する。 その後、オブジェクト抽出ソフトウェアは画像エリアの画像からオブジェクトを抽出し、その形状情報を画像エリアに格納する。

    次に、CPU300による動画像符号化ソフトウェアが符号化する動作について図6に示すフローチャートに従って説明する。

    まずステップS301にて、MotionJPEG2000符号化方式で必要なヘッダを生成して、メモリ301上に確保した符号エリアに格納する。 通信ソフトウェアは、符号エリアに符号化データが格納されたら、通信インターフェース308を介して通信回線309に送出し、送出後、符号エリアの該当する領域をクリアする。 以後、特に、符号エリアの符号化データの送信については言及しない。

    ステップS302にて、符号化処理の終了判定を行なう。 入力部303から符号化処理の終了が入力されれば全ての処理を終了する。 そうでなければステップS303に進む。

    ステップS303に処理が進むと、メモリ301上の画像エリアから画像データを読み込む。 ステップS304にて、符号化するフレームをフレーム内符号化するか、フレーム間相関符号化するかを決定する。 入力部303からMotion JPEG2000との互換性を保つことが指示された場合、符号化モードはフレーム内符号化を行なうように決定される。 決定された結果はメモリ301上のワーキングエリアに格納される。 また、Motion JPEG2000との互換を保つか否かの情報もワーキングエリアに格納される。

    ステップS305にて、全ブロックの処理が終了したか否かの判定を行なう。 全てのブロックの符号化処理を終了したらステップS302に戻り、次のフレームの符号化処理を行なう。 そうでなければステップS306に進む。

    ステップS306では、メモリ301上の画像エリアから符号化するブロックを抽出し、ワーキングエリアに格納する。 そして、ステップS307にて、メモリ301上のワーキングエリアの符号化モードを参照し、フレーム内符号化(Iピクチャ)であれば、ステップS308に進む。 そうでなければステップS314に進む。

    ステップS308では、ワーキングエリアに格納されたブロックデータに対して離散ウェーブレット変換を施し、得られた変換係数をワーキングエリアのブロックデータが格納されていた部分に再格納する。 そして、ステップS309にて、ワーキングエリアに格納された変換係数に対して量子化を行い、得られた量子化結果をワーキングエリアの従前の処理で変換係数が格納されていたエリアに格納する。

    ステップS310にて、メモリ301上のワーキングエリアのMotion JPEG2000との互換性の情報を参照し、互換性を保つ場合はステップS317に進み、そうでない場合はステップS311に進む。

    ステップS311では、メモリ301上のワーキングエリアに格納された量子化結果に対して逆量子化を行い、得られた変換係数をワーキングエリアの量子化結果が格納されていた部分に格納する。 そして、ステップS312にて、ワーキングエリアに格納された変換係数に対して逆離散ウェーブレット変換を施し、ステップS313にて、得られた画像データを画像エリア2に格納する。 この画像エリア2に格納された画像が、第1の実施形態におけるフレームメモリ41に相当するものとなる。

    一方、ステップS307にて、Iピクチャ以外であると判断した場合には、ステップS314にて、画像エリア2に格納された復号画像と、入力された画像データから抽出したブロックとの間で動き補償を行い、動きベクトルと予測誤差データを算出する。 そして、動きベクトルデータはMPEG−4符号化での動きベクトル符号化と同様に符号化され、メモリ301上の符号エリアに格納される。 予測誤差データはメモリ301上のワーキングエリアに格納される。

    次いで、ステップS315にて、メモリ301上のワーキングエリアに格納された予測誤差データに対して、離散ウェーブレット変換を施し、得られた変換係数をワーキングエリアのブロックデータが格納されていた部分に格納する。 ステップS316にて、ワーキングエリアに格納された変換係数に対して量子化を行い、得られた量子化結果をワーキングエリアの変換係数が格納されていた部分に格納する。

    ステップS317では、ステップS309またはステップS316で得られた量子化結果をビットプレーン単位で符号化し、メモリ301上のワーキングエリアに格納する。 そして、ステップS318にて、ワーキングエリアに格納された符号化データでレート制御で送信できる符号化データを選択して、フレームメモリ301上の符号エリアに格納する。 次いで、ステップS319にて、符号エリア上の符号化データを多重化し、送信する。 その後、ワーキングエリア、符号エリアをクリアする。 その後、処理はステップS305に戻る。

    このような一連の動作により従来の静止画符号化方式と互換性が高い符号化が可能な方式と、フレーム間符号化方式を選択可能になる。

    なお、第1実施形態、第2の実施形態の動画像符号化の処理をソフトウェアに実現するようにしても構わないし、第3実施形態の動画像符号化装置をハードウェアでもって実現さても構わない。

    <第4の実施形態>
    図12は第4の実施形態における動画像復号化装置のブロック構成図である。

    本第4実施形態においては、動画像復号化装置が使用する画像の符号化方式として、MotionJPEG2000符号化方式を例にとって説明するが、これに限定されない。

    図12において、71は符号列をヘッダ情報と画像符号データ列に分離する符号分離部であり、72は上記符号列をJPEG2000符号化方式のEBCOT復号処理をビットプレーン毎に行なうエントロピー復号部であり、73は復号された量子化後係数を逆量子化する逆量子化部であり、74はDWT係数に逆DWT変換を施す逆DWT部である。

    77はフレーム単位で符号化モードを判定するモード判定部であり、フレーム内符号化(イントラフレーム符号化)モードと、フレーム間符号化(インターフレーム符号化)モードのいずれかを判定する。 75は画像データの後述する動き補償によって得られる予測データとの加算を求める加算部である。 79は動き補償の参照のために復号画像を格納しておくフレームメモリである。 なお、このフレームメモリ79には、モード判定部77でフレーム内符号化モードで復号化することを決定した場合にのみ、復号した画像を格納する。 このため、加算演算部75の出力をフレームメモリ79に蓄積するための切り替え器80を設けた。

    78はフレームメモリ79と入力画像から動き予測を行い、動きベクトルと予測データを算出する動き補償である。

    符号分離部71では、GOP単位に符号化データを入力し、符号化データをヘッダ、DCT係数に関する符号、動きベクトルの符号などに分離する。 エントロピー復号化部72では分離した符号化をエントロピー復号化し、逆量子化部73へ出力する。 逆量子化部73ではDC係数に関する情報を逆量子化し、逆DWTへ出力する。 逆DWT74では、逆DWTを施し、加算部75へ出力する。

    モード判定部77は、符号分離部71より得られた情報中の入力符号化データ中のピクチャレイヤのヘッダに基づき、復号化している画像がIピクチャ、それ以外のいずれかを検出し、その判定結果の情報を加算部75、動き補償部78、切り替え器80へ送る。 切り替え器80はモード判定の結果がIピクチャの時、加算部75からの出力がフレーム79に書き込みを行なう。 つまり、フレームメモリ79は、Iピクチャをデコードする場合にのみ、その内容が更新されることになる。

    動き補償部78はエントロピー復号化部72から出力される動きベクトルの情報とフレームメモリ79の情報を利用して動き補償し、加算部75へ補償画像を送る。 加算部75はモード判定の結果がIピクチャの場合、逆DWT74の結果をそのままブロック結合76へ結果を送り、Iピクチャ以外の場合は動き補償78から出力された画像と逆DWT74の画像(差分画像となる)を対応するピクセル同士加算しブロック結合76へ送る。

    以上の動画像復号化処理の簡単な流れを、図13のフローチャートに従って説明する。 同図は、第4実施形態に係る動画像復号化装置における復号処理手順を示すフローチャートである。 概要を簡単に説明すると、ステップS500〜ステップS511までの処理は画像を小領域に分ける小領域単位で行われ、ステップS512で小領域が結合しビデオフレームを生成し出力するものである。

    先ず、復号化が開始されると(ステップS500)、入力符号の有無を検出し(ステップS501)、全フレームの復号が終了した場合、復号を終了する(ステップS502)。 全復号が終了していない場合、符号をヘッダ、画像信号符号、動きベクトル符号などに分離する(ステップS503)。

    次に、エントロピー復号処理を行なう(ステップS504)。 そして、ヘッダ情報から復号しようとしている画像のピクチャタイプを検出する(ステップS505)。 Iピクチャの場合、エントロピー復号された結果に対して逆量子化、逆DWTを施す(ステップS509〜S510)。 その後、復号画像をフレームメモリに格納し(ステップS511)、その結果をビデオフレームとして出力する(ステップS512)。

    ステップS505でピクチャタイプがIピクチャでない場合、逆量子化、逆DWTを施し(ステップS506〜S507)、ステップS511で格納した復号画像を用いて動き補償を行い(ステップS508)、その補償画像と逆DWT(ステップS507)の結果と加算して、ビデオフレームとして出力する(ステップS512)。

    以上説明したように本第4の実施形態によれば、ビットプレーン符号化を行い、ビットプレーン切り捨てで符号量制御が施された動画像符号化データを入力した場合であっても、PピクチャからPピクチャを生成するような誤差累積する復号処理がなくなり、良好な動画像を再生することが可能となる。

    なお、本第4の実施形態でもIピクチャとPピクチャについてのみ説明を行ったが、これに限定されず、双方向予測のBピクチャを導入した符号データでもフレームメモリを増やし、同様にIピクチャを参照することで実現が可能である。

    また、実施形態における図12における各処理は、パーソナルコンピュータ等で実行されるソフトウェアによって実現しても構わない。 この場合、動画像データの入力は、ビデオキャプチャカード等を搭載する等で対処できよう。 また、通常、コンピュータプログラムは、それを格納したCD−ROM等のコンピュータ可読記憶媒体をコンピュータにセットし、システムにコピーもしくはインストールすることで実行可能となるので、当然、そのようなコンピュータ可読記憶媒体も本発明の範疇に含まれる。

    また、符号化方式もJPEG2000符号化方式に限定されず、MPEG―4符号化方式のFGS符号化における拡張レイヤの符号化方式を採用しても構わない。

    以上第1乃至第4の実施形態を説明したが、各処理部に相当する機能はコンピュータプログラムでもって実現できるのは明らかであるから、本発明はコンピュータプログラムをもその範疇とする。 また、通常、コンピュータプログラムは、CD−ROM等のコンピュータ可読記憶媒体に記憶されていて、それをコンピュータにセットしてシステムにコピーもしくはインストールすることで実行可能となるわけであるから、当然、そのようなコンピュータ可読記憶媒体も本発明の範疇に入る。

    第1の実施形態における動画像符号化装置のブロック構成図である。

    第1の実施形態における動画像符号化処理手順を示すフローチャートである。

    第2の実施形態における動画像符号化装置のブロック構成図である。

    第2の実施形態における動画像符号化処理手順を示すフローチャートである。

    第3の実施形態における動画像符号化装置のブロック構成図である。

    第3の実施形態における動画像符号化処理手順を示すフローチャートである。

    第3の実施形態における処理中のメモリマップを示す図である。

    JPEG2000の画像符号化装置のブロック構成図である。

    JPEG2000の復号装置のブロック構成図である。

    従来の動画像符号化装置のブロック構成図である。

    第1の実施形態における動画像符号化装置の別なブロック構成図である。

    第4の実施形態における動画像復号装置のブロック構成図である。

    第4の実施形態における処理手順を示すフローチャートである。

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈