首页 / 专利库 / 视听技术与设备 / 运动补偿预测 / Moving image decoding device and moving image decoding method

Moving image decoding device and moving image decoding method

阅读:678发布:2020-10-25

专利汇可以提供Moving image decoding device and moving image decoding method专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a moving image decoding device which can adaptively switch the size of a rectangular region in accordance with the resolution of an image and content of an image, and suppress increase in rectangular size information to an encoded image.SOLUTION: A decoding device includes: an entropy decoding section 21 which decodes information on the size of a rectangular region by sequence, determines the size of the rectangular region on the basis of the information on the size and decodes an encoding mode determined by rectangular region; and a macro block decoding section 22 which decodes a pixel value in the rectangular region with the encoding mode. The decoded encoding mode includes motion compensation region shape information indicating the shape of a motion compensation region which is the same as the rectangular region or obtained by dividing the rectangular region. The macro block decoding section 22 includes: a motion compensation section 25 which performs motion compensation prediction by using motion vector information decoded by region indicated in the motion compensation region shape information; and an inverse quantization and inverse conversion section 27 which performs inverse quantization and inverse orthogonal conversion processing on the basis of block size instruction information.,下面是Moving image decoding device and moving image decoding method专利的具体信息内容。

  • 動画像を矩形領域に分割し前記矩形領域を単位として符号化されたビットストリームの復号を行う動画像復号装置において、
    複数の連続するフレームの集合であるシーケンス単位に前記矩形領域のサイズの情報を復号する矩形領域サイズ復号手段と、
    前記矩形領域サイズ復号手段によって復号された前記矩形領域のサイズの情報に基づいて前記矩形領域のサイズを決定する矩形領域サイズ決定手段と、
    前記矩形領域単位に定められる符号化モードを復号する符号化モード復号手段と、
    前記符号化モード復号手段によって復号された符号化モードにより前記矩形領域内の画素値を復号する矩形領域復号手段とを備え、
    前記符号化モード復号手段によって復号された符号化モードには、前記矩形領域と同じまたは前記矩形領域を分割した動き補償領域の領域の形状を示す動き補償領域形状情報を含み、
    前記矩形領域復号手段は、
    前記動き補償領域形状情報に示される領域の単位に復号される動きベクトル情報を用いて動き補償予測を行い、予測画像を得る動き補償手段と、
    逆量子化及び逆直交変換を行う単位を示すブロックサイズ指示情報を復号し、該ブロックサイズ指示情報に基づいて逆量子化及び逆直交変換処理を行う変換処理手段と、
    を備えることを特徴とする動画像復号装置。
  • 動画像を矩形領域に分割し前記矩形領域を単位として符号化されたビットストリームの復号を行う動画像復号方法において、
    複数の連続するフレームの集合であるシーケンス単位に前記矩形領域のサイズの情報を復号する矩形領域サイズ復号ステップと、
    前記矩形領域サイズ復号ステップによって復号された前記矩形領域のサイズの情報に基づいて前記矩形領域のサイズを決定する矩形領域サイズ決定ステップと、
    前記矩形領域単位に定められる符号化モードを復号する符号化モード復号ステップと、
    前記符号化モード復号ステップによって復号された符号化モードにより前記矩形領域内の画素値を復号する矩形領域復号ステップとを備え、
    前記符号化モード復号ステップによって復号された符号化モードには、前記矩形領域と同じまたは前記矩形領域を分割した動き補償領域の領域の形状を示す動き補償領域形状情報を含み、
    前記矩形領域復号ステップは、
    前記動き補償領域形状情報に示される領域の単位に復号される動きベクトル情報を用いて動き補償予測を行い、予測画像を得る動き補償ステップと、
    逆量子化及び逆直交変換を行う単位を示すブロックサイズ指示情報を復号し、該ブロックサイズ指示情報に基づいて逆量子化及び逆直交変換処理を行う変換処理ステップと、
    を有することを特徴とする動画像復号方法。
  • 说明书全文

    この発明は、動画像を矩形領域に分割して、矩形領域単位で符号化を行う動画像符号化装置と、符号化された動画像を矩形領域単位で復号する動画像復号装置に関するものである。

    従来の画像信号を符号化または復号する方式として、MPEG−4(Moving Picture Experts Group Phase−4)ビジュアル(ISO/IEC 14496−2)がある。 MPEG−4は、動画像シーケンスを時間/空間的に任意の形状をとる動画像オブジェクトの集合体としてとらえ、各動画像オブジェクトを単位として符号化・復号化を行う方式である。

    MPEG−4では時間軸を含めた動画像オブジェクトをVideo Objectと呼び、Video Objectの構成要素をVideo Object Layer(VOL)と呼び、VOLの構成要素をGroup of Video Object Plane(GOV)と呼び、GOVの各時刻の状態を表し符号化の単位となる画像データをVideo Object Plane(VOP)と呼ぶ。 矩形形状のオブジェクトを扱う場合には、VOPはフレームに相当する。 VOPは被符号化領域の単位であるマクロブロックごとに符号化される。 マクロブロックは16画素×16ライン固定の矩形ブロックである。 マクロブロックはさらに8画素×8ラインのブロックに分割され、マクロブロック単位または8画素×8ラインサイズのブロック単位での動き補償予測を行う。

    動き補償予測のブロックサイズの選択はマクロブロック単位に切り替えることができる。 また、対象とするマクロブロックの符号化を行うかどうかをマクロブロック単位に選択することができる。 対象とするマクロブロックの符号化を行わない場合(非符号化モード)には、1フレーム前の同位置(真裏)のマクロブロックの復号データが用いられる。 対象とするマクロブロックの符号化を行う場合には、動き補償予測を行うか(インター符号化モード)、あるいは動き補償予測によるフレーム間予測を行わずにフレーム内の情報のみで符号化を行うか(イントラ符号化モード)をマクロブロック単位に選択することができる。

    また、符号化処理におけるブロック分割において、複数のサイズのマクロブロックに分割できるようにし、画像の中の画質の重要度が高い部分ではそのサイズを小さくし、重要度が低い部分ではそのサイズを大きくするようにしたものがあった(例えば、特許文献1参照)。

    特開平11−146367号公報

    このような従来の画像符号化・復号化方式では、マクロブロックサイズが固定であるため、画像の解像度や画像の内容(絵柄の細かさ、動きの激しさ等)に応じてマクロブロックサイズを適応的に切り替えることができないという問題点があった。 特に画像の解像度が高くなった場合には、従来の画像符号化・復号化方式で採用されている固定のマクロブロックサイズでは、マクロブロックがカバーする領域が局所化し、周辺マクロブロックで同じ符号化モードになったり、同じ動きベクトルをもつケースが発生する。 このようなケースでは予測効率が上がらないにもかかわらず、マクロブロックごとに符号化される符号化モード情報や動きベクトル情報などのオーバーヘッドが増えるため、符号化効率全体としては低下する。

    解像度が低い画像であっても、動きの少ない画像やフレーム内で動きが一定の画像の場合には、周辺マクロブロックで同じ符号化モード(非符号化モードが)になったり、同じ動きベクトルをもつケースが発生する。 また、一般にマクロブロックのサイズが大きい場合には、符号化モード等のマクロブロック単位に必要なオーバーヘッドに関わる情報量を少なくすることができる。 しかしながら、マクロブロックサイズより小さなサイズの領域単位での符号化モードの切り替えができないため、動きが激しい領域、動きが異なる(人物と背景など)領域の境界付近での予測効率が低下し、符号化効率が低下する。 逆にマクロブロックのサイズが小さい場合には、マクロブロック数が増え、符号化モード等のオーバーヘッドの情報量は増えるが、動きが激しい領域、動きが異なる(人物と背景など)領域の境界付近では適応的に符号化モードの切り替えができるため、予測効率が向上し、符号化効率が向上する。

    また、上記の従来の特許文献1に記載された技術では、フレーム内で適応的にサイズを切り替えるため、矩形サイズ情報の符号量が多いという問題点があった。

    この発明は上記のような課題を解決するためになされたもので、画像の解像度や画像の内容によって、適応的に矩形領域サイズを切り替えて符号化することができ、かつ、これによる符号化画像へ矩形サイズ情報の増加を抑えることのできる動画像符号化装置及び動画像復号装置を得ることを目的とする。

    この発明に係る動画像復号装置は、複数の連続するフレームの集合であるシーケンス単位に矩形領域のサイズの情報を復号する矩形領域サイズ復号手段と、矩形領域サイズ復号手段によって復号された矩形領域のサイズの情報に基づいて矩形領域のサイズを決定する矩形領域サイズ決定手段と、矩形領域単位に定められる符号化モードを復号する符号化モード復号手段と、符号化モード復号手段によって復号された符号化モードにより矩形領域内の画素値を復号する矩形領域復号手段とを備え、符号化モード復号手段によって復号された符号化モードには、矩形領域と同じまたは矩形領域を分割した動き補償領域の領域の形状を示す動き補償領域形状情報を含み、矩形領域復号手段は、動き補償領域形状情報に示される領域の単位に復号される動きベクトル情報を用いて動き補償予測を行い、予測画像を得る動き補償手段と、逆量子化及び逆直交変換を行う単位を示すブロックサイズ指示情報を復号し、該ブロックサイズ指示情報に基づいて逆量子化及び逆直交変換処理を行う変換処理手段と、を備えるものである。

    この発明の動画像復号装置は、上記のように構成したので、矩形領域サイズ及びブロックサイズ指示情報を画像の特徴などによって容易かつ適応的に切り替えることができ、かつ、これによる符号化画像へ矩形サイズ情報の増加を抑えることができる。 その結果、シーケンス単位で矩形領域サイズ及びブロックサイズ指示情報を変更して効率よく符号化した動画像を復号することができる。

    この発明の実施の形態1による動画像符号化装置を示す構成図である。

    この発明の実施の形態1の動画像符号化装置における動き補償の単位となる領域分割例(その1)を示す説明図である。

    この発明の実施の形態1の動画像符号化装置における動き補償の単位となる領域分割例(その2)を示す説明図である。

    この発明の実施の形態1の動画像符号化装置における動きベクトル検出の説明図である。

    この発明の実施の形態1の動画像符号化装置におけるイントラ予測の説明図である。

    この発明の実施の形態1の動画像符号化装置におけるマクロブロックサイズ情報の変更をスライス単位とした場合の説明図である。

    この発明の実施の形態2による動画像復号装置を示す構成図である。

    以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
    実施の形態1.
    図1は、この発明の実施の形態1による動画像符号化装置を示す構成図である。
    図において、動画像符号化装置は、マクロブロックサイズ決定部(矩形領域サイズ決定手段)1、マクロブロック分割部(矩形領域分割手段)2、マクロブロック符号化部(矩形領域符号化手段)3、エントロピー符号化部(矩形領域サイズ情報多重化手段)4を備えている。 また、マクロブロック符号化部3は、符号化モード決定部(符号化モード決定手段)5、動き補償領域分割部(動き補償領域分割手段)6、動き検出部(動き検出手段)7、動き補償部(動き補償手段)8、減算器9、ブロック分割部(ブロック分割手段)10、変換量子化部(変換量子化手段)11、逆量子化逆変換部12、加算器13、参照画像メモリ14、イントラ予測ブロック分割部(画面内予測ブロック分割手段)15、イントラ予測部(画面内予測手段)16を備えている。

    マクロブロックサイズ決定部1は、フレーム単位にマクロブロックのサイズを決定し、これをマクロブロックサイズ指示情報(矩形領域サイズ情報)102として出する機能部である。 マクロブロック分割部2は、マクロブロックサイズ決定部1で決められたサイズのマクロブロックに入力画像101を分割する機能部である。 マクロブロック符号化部3は、マクロブロック毎に符号化モードを決定し、その決定した符号化モードにより、マクロブロック内の画素値を符号化する機能を有している。 エントロピー符号化部4は、マクロブロックサイズ決定部1で決定されたマクロブロックサイズ指示情報102と、ブロックサイズ指示情報108と、符号化モード決定部5から出力された符号化モード情報106と、変換量子化部11で求められた係数データ109と、動き検出部7で求められた動きベクトル情報107とをビットストリーム103に多重化する機能を有している。

    符号化モード決定部5は、マクロブロック毎に符号化モードを決定する機能部である。 動き補償領域分割部6は、マクロブロック内を、符号化モード決定部5が定める領域に分割する機能部である。 動き検出部7は、動き補償領域分割部6によって分割された領域単位に動き検出を行う機能部である。 動き補償部8は、動き検出部7によって得られる動きベクトル情報107を用いて動き補償予測を行い、予測画像を得る機能部である。 減算器9は、動き補償部8で得られた予測画像と入力画像との画素値の差分を得るための減算器である。 ブロック分割部10は、減算器9で得られた画素値の差分を、マクロブロック単位の予測誤差画像として取得すると共に、入力画像または予測誤差画像のマクロブロック内を、ブロックサイズ指示情報108に基づいて、予め決められたサイズの矩形ブロックに分割する機能部である。

    変換量子化部11は、ブロック分割部10で分割されたブロック単位に直交変換処理および量子化を行い、係数データ109を出力する機能部である。 逆量子化逆変換部12は、変換量子化部11から出力された係数データ109に基づいて、逆量子化逆変換を行い、復号予測誤差画像を得るための機能部である。 加算器13は、逆量子化逆変換部12で得られた復号予測誤差画像と動き補償部8で求めた予測画像とを加算し、復号画像を得るための加算器である。 参照画像メモリ14は、加算器13から出力された復号画像を参照画像として格納するメモリである。

    次に、実施の形態1の動作について説明する。
    先ず、入力画像101がマクロブロック分割部2へ入力され、フレーム単位で決定されるマクロブロックサイズ指示情報102に基づき、所定のマクロブロックサイズに分割される。 マクロブロックサイズ指示情報102は、例えば、16画素×16ライン、32画素×32ラインのいずれかのサイズを選択可能な情報であり、これについては後述する。 ここで指定されたマクロブロックサイズ指示情報102は、エントロピー符号化部4へ入力され、エントロピー符号化され、ビットストリーム103へ多重化される。

    マクロブロックサイズ指示情報102はマクロブロックサイズ決定部1から出力される。 マクロブロックサイズ決定部1では、フレーム間差分を算出してフレーム間差分が小さい場合には、32画素×32ラインのマクロブロックを採用し、フレーム間差分が大きい場合には16画素×16ラインのマクロブロックを採用する。 また、第2の方法としては、32画素×32ライン単位での動き検出と、16画素×16ライン単位での動き検出を行い、それぞれ予測誤差を算出し、予測誤差が小さいサイズをマクロブロックサイズとして採用する。 更に、第3の方法としては、32画素×32ライン単位および16画素×16ライン単位で画素値の分散を算出し、分散のフレーム内平均が小さいサイズをマクロブロックサイズとして採用する。 またこれら複数の方法を組み合わせて決定しても良い。

    また、第4の方法としては、所定の解像度よりも高い解像度の場合には32画素×32ラインを採用し、所定の解像度よりも低い解像度の場合には16画素×16ラインを採用するなど、画像の解像度に応じて自動的に決定しても良い。 この場合、解像度によって、マクロブロックサイズが決まるので、マクロブロックサイズ指示情報102をビットストリーム103に多重化する必要がない。

    また、利用形態によって利用可能な符号化パラメータの組み合わせを予め定めた情報(プロファイルと呼ぶ)によって、予めマクロブロックサイズを決めておき、選択したプロファイルによって自動的にマクロブロックサイズを決定してもよい。

    マクロブロックに分割された入力画像101は、マクロブロック毎に決定される符号化モードに応じて、マクロブロック符号化部3内の動き補償領域分割部6、イントラ予測ブロック分割部15、ブロック分割部10のいずれかへ入力される。

    マクロブロック毎に決定される符号化モードには、マクロブロックタイプ情報、動き補償領域形状情報104、イントラ予測ブロックサイズ情報105が含まれる。 マクロブロックタイプ情報とは、画面間予測符号化を行うモード(インターモード)、画面内符号化を行うモード(イントラモード)、画面内予測符号化を行うモード(イントラ予測モード)を選択可能な情報である。 これらのモードの選択は、符号化モード決定部5にて行われるが、これらのモードの選択方法については、本発明の特徴点とは直接関係がないため、ここでの説明は省略する。

    符号化モード決定部5では、上記符号化モードのそれぞれについて、更に詳細な符号化モードが決定される。 即ち、インターモードのときには、動き補償を行う単位を示す動き補償領域形状情報104、イントラ予測モードのときには、イントラ予測を行う単位を示すイントラ予測ブロックサイズ情報105が決定される。 尚、それぞれの情報の内容については後述する。 また、符号化モード決定部5で決定された各種符号化モードは、符号化モード情報106としてエントロピー符号化部4に与えられ、エントロピー符号化部4にて、マクロブロック毎に符号化されビットストリームに多重化される。

    先ず、インターモードが選択された場合について説明する。
    マクロブロック分割部2でマクロブロックに分割された入力画像は、動き補償領域分割部6に入力され、符号化モード決定部5にて選択された動き補償領域形状情報104に基づき、動き補償の単位となる領域形状に分割される。

    図2および図3に動き補償の単位となる領域分割例を示す。
    マクロブロックサイズが16画素×16ラインの場合には、図2に示す(a)から(d)の領域のいずれか(16画素×16ライン、8画素×16ライン、16画素×8ライン、8画素×8ライン)に分割され、(d)の領域に分割された場合には8画素×8ラインの各ブロックは、図2の(e)から(h)のいずれか(8画素×8ライン、4画素×8ライン、8画素×4ライン、4画素×4ライン)に分割することもできる。 マクロブロックサイズが32画素×32ラインの場合には、16画素×16ラインのマクロブロックサイズのときと同様に、図2に示す(a)から(d)の領域のいずれかに分割してもよいが、別の例として、図3に示す(j)から(k)のいずれか(32画素×32ライン、16画素×32ライン、32画素×16ライン、16画素×16ライン)に分割し、(k)の領域に分割された場合には、16画素×16ラインの各ブロックを図2の(a)から(d)のいずれかに分割することもできる。 これらの分割方法を指示する情報が動き補償領域形状情報104である。 上述したように、動き補償領域形状情報104は、マクロブロックサイズによって選択可能な領域形状を切り替えてもよい。

    動き補償の単位となる領域形状に分割された入力画像は、動き検出部7に入力され、参照画像メモリ14に格納されている1枚以上の参照画像を用いて動き検出が行われる。 動き検出部7では、動き補償領域分割部6にて決定された領域単位に参照画像の所定の範囲を探索し、最適な動きベクトルを検出する。 図4は、このような動きベクトル検出の説明図である。 尚、動きベクトル検出動作については、公知であるため、ここでの詳細な説明は省略する。

    動き検出部7から得られる動きベクトル情報107は、エントロピー符号化部4に入力され、エントロピー符号化されてビットストリーム103に多重化されると共に、動き補償部8へ入力される。 動き補償部8では、参照画像メモリ14に格納されている参照画像と、動き検出部7からの動きベクトル情報107を用いて予測画像の生成を行う。 動き補償部8から得られる予測画像は、減算器9によって、マクロブロックに分割された入力画像との差分が求められ、この差分が予測誤差画像として、ブロック分割部10へ入力される。 ブロック分割部10では、ブロックサイズ指示情報108に基づいて、変換(DCTのような直交変換)および量子化の単位となるブロックに分割する。

    ブロックサイズ指示情報108は、例えば、8画素×8ライン、4画素×4ラインのいずれかを選択可能な情報である。 また、他の例としては、選択可能なブロックサイズ指示情報108をマクロブロックサイズによって切り替えても良い。 例えば16画素×16ラインのマクロブロックの場合、ブロックサイズ指示情報108は、8画素×8ライン、4画素×4ラインを選択可能な情報とし、32画素×32ラインのマクロブロックの場合、ブロックサイズ指示情報108は、16画素×16ライン、8画素×8ラインを選択可能な情報とする。 選択したブロックサイズ指示情報108は、エントロピー符号化部4へ入力され、エントロピー符号化されてビットストリーム103に多重化される。

    更に他の例としては、ブロックサイズはマクロブロックサイズに応じて決めてもよい。 例えば16画素×16ラインのマクロブロックの場合には、ブロックサイズを4画素×4ラインとし、32画素×32ラインのマクロブロックの場合には、ブロックサイズを8画素×8ラインとする。 この場合、マクロブロックサイズに応じて、ブロックサイズが決まるので、ブロックサイズ指示情報をビットストリーム103に多重化する必要がない。

    ブロックに分割された予測誤差画像は変換量子化部11へ入力され、直交変換および量子化が行われる。 直交変換および量子化処理の結果得られる係数データ109は、エントロピー符号化部4にてエントロピー符号化され、ビットストリーム103に多重化される。 変換量子化部11から得られる係数データ109は、更に、逆量子化逆変換部12へ入力され、逆量子化・逆変換が行われ、復号予測誤差画像が得られる。 復号予測誤差画像は、動き補償部8から得られる予測画像と加算器13で加算され、復号画像として出力される。 復号画像は以降の入力画像の符号化において、参照画像として使用されるため、参照画像メモリ14に格納される。

    次に、イントラモードが選択された場合について説明する。
    マクロブロック分割部2にてマクロブロックに分割された入力画像は、ブロック分割部10へ入力される。 ブロック分割部10の動作は、インターモードのときと同様である。 ブロックに分割された入力画像は変換量子化部11にて直交変換および量子化が行われる。 直交変換および量子化処理の結果得られる係数データ109は、エントロピー符号化部4でエントロピー符号化され、ビットストリーム103に多重化される。 変換量子化部11から得られる係数データ109は、更に、逆量子化逆変換部12へ入力され、逆量子化・逆変換が行われ、復号画像が得られる。 復号画像は以降の入力画像の符号化において参照画像として使用されるため、参照画像メモリ14に格納される。

    次に、イントラ予測モードが選択された場合について説明する。
    マクロブロック分割部2にてマクロブロックに分割された入力画像は、イントラ予測ブロック分割部15へ入力される。 イントラ予測ブロック分割部15では、イントラ予測ブロックサイズ情報105に基づいて、イントラ予測の単位となるブロックに分割する。 イントラ予測ブロックサイズ情報105は、16画素×16ライン、4画素×4ラインのいずれかを選択可能な情報である。 他の例としては、選択可能なイントラ予測ブロックサイズ情報105をマクロブロックサイズによって切り替えても良い。 例えば16画素×16ラインのマクロブロックの場合、イントラ予測ブロックサイズ情報105は、16画素×16ライン、4画素×4ラインを選択可能な情報とし、32画素×32ラインのマクロブロックの場合、イントラ予測ブロックサイズ情報105は、32画素×32ライン、8画素×8ラインを選択可能な情報とする。

    イントラ予測ブロック分割部15にてブロックに分割された入力画像はイントラ予測部16へ入力され、イントラ予測が行われる。 イントラ予測については公知であるため、ここでは詳細な説明は省略するが、図5に示すように、符号化対象ブロック内の各画素値を符号化済みの周辺ブロック(図5のAからD)の画素値から予測した予測画像を生成する。 イントラ予測部16から得られた予測画像と、マクロブロックに分割された入力画像との差分を減算器9で求め、この差分が予測誤差画像として、ブロック分割部10へ入力される。 ブロック分割部10の動作はインターモードのときと同様である。

    ブロックに分割された予測誤差画像は変換量子化部11へ入力され、直交変換および量子化が行われる。 直交変換および量子化処理の結果得られる係数データ109は、エントロピー符号化部4にてエントロピー符号化され、ビットストリーム103に多重化される。 変換量子化部11から得られる係数データ109は、更に逆量子化逆変換部12へ入力され、逆量子化・逆変換が行われ、復号予測誤差画像が得られる。 復号予測誤差画像は、イントラ予測部16から得られる予測画像と加算器13で加算され、復号画像として出力される。 復号画像は以降の入力画像の符号化において、参照画像として使用されるため、参照画像メモリ14に格納される。

    以上の実施の形態では、フレーム単位でマクロブロックサイズ情報を変更できるようにしたが、図6に示す例のように1フレーム内を複数のマクロブロックの集合(スライスと呼ぶ)に分割した単位で変更できるようにしてもよい。 符号化処理については、1スライスを1フレームとみなし、以上の実施の形態で述べたように行えばよい。 このときにはマクロブロックサイズ指示情報102はスライス単位にビットストリーム103に多重化される。

    また、複数の連続するフレームの集合であるシーケンス単位にマクロブロックサイズ情報を変更できるようにしてもよい。 このときにはマクロブロックサイズ指示情報102はシーケンス単位にビットストリーム103に多重化される。

    更に、変形例としては、フレーム単位に変更するか、あるいはシーケンス単位に変更するかを選択してもよい。 このときにはフレーム単位に変更するかどうかの情報をシーケンス単位にビットストリーム103に多重化し、フレーム単位に変更することが選択された場合にフレーム単位にマクロブロックサイズ指示情報102をビットストリーム103に多重化し、シーケンス単位に変更することが選択された場合にはシーケンス単位にマクロブロックサイズ指示情報102をビットストリーム103に多重化する。

    以上のように、実施の形態1の動画像符号化装置によれば、動画像を矩形領域に分割して、矩形領域単位で符号化を行う動画像符号化装置において、フレーム単位または複数の連続するフレームの集合であるシーケンス単位に矩形領域のサイズを決定する矩形領域サイズ決定手段と、矩形領域サイズ決定手段によって決められたサイズの矩形領域に入力画像を分割する矩形領域分割手段と、矩形領域毎に符号化モードを決定し、決定した符号化モードにより矩形領域内の画素値を符号化する矩形領域符号化手段とを備えたので、画像の内容(動きの激しさや絵柄の細かさ等)や解像度、プロファイルに応じて適切な矩形領域サイズを選択することができ、符号化効率を向上させることができると共に、矩形サイズ情報の符号量として、例えば、1フレームまたは1シーケンスに対して数ビットの符号量しかかからない等、矩形サイズ情報の追加による符号量の増加を小さくすることができる。

    また、実施の形態1の動画像符号化装置によれば、矩形領域サイズ決定手段によって定められた矩形領域サイズ情報をビットストリームに多重化する矩形領域サイズ情報多重化手段を備えたので、矩形領域サイズを画像の特徴などによって適応的に切り替えることができる。

    また、実施の形態1の動画像符号化装置によれば、矩形領域サイズ決定手段は、入力画像の解像度に応じて矩形領域サイズを決定するようにしたので、矩形領域サイズ情報をビットストリームに多重化する必要がなく、処理のオーバーヘッドを減らすことができる。

    また、実施の形態1の動画像符号化装置によれば、矩形領域符号化手段は、矩形領域毎に符号化モードを決定する符号化モード決定手段と、矩形領域内を、符号化モード決定手段が定める領域に分割する動き補償領域分割手段と、動き補償領域分割手段によって分割された領域単位に動き検出を行う動き検出手段と、動き検出手段によって得られる動きベクトル情報を用いて動き補償予測を行い、予測画像を得る動き補償手段と、予測画像と、矩形領域内の画素値の差分を、矩形領域単位の予測誤差画像として取得すると共に、入力画像または予測誤差画像の矩形領域内を予め定められたサイズの矩形ブロックに分割するブロック分割手段と、ブロック分割手段で分割されたブロック単位に直交変換処理および量子化を行う変換量子化手段とを備えたので、矩形領域サイズ毎に決定される符号化モードとして画面間予測符号化を行うインターモードの場合も対応することができる。

    また、実施の形態1の動画像符号化装置によれば、矩形領域符号化手段は、矩形領域内を符号化モードが定める矩形ブロックに分割する画面内予測ブロック分割手段と、画面内予測ブロック分割手段によって分割された矩形ブロック単位に画面内予測を行い予測画像を得る画面内予測手段と、予測画像と矩形領域内の画素値の差分として、矩形領域単位の予測誤差画像を取得すると共に、入力画像または予測誤差画像の矩形領域内を予め定められたサイズの矩形ブロックに分割するブロック分割手段と、ブロック分割手段によって分割されたブロック単位に量子化および直交変換処理を行う変換量子化手段とを備えたので、矩形領域サイズ毎に決定される符号化モードとして画面内予測符号化を行うイントラ予測モードの場合も対応することができる。

    実施の形態2.
    実施の形態2は、フレーム単位で異なるマクロブロックサイズを選択して符号化されたビットストリームを復号する動画像復号装置である。

    図7は、実施の形態2による動画像復号装置の構成図である。
    図において、動画像復号装置は、エントロピー復号部21とマクロブロック復号部(矩形領域復号手段)22とを備えている。 ここで、エントロピー復号部21は、入力ビットストリーム201に対してエントロピー復号を行う処理部であり、フレーム単位または複数の連続するフレームの集合であるシーケンス単位に矩形領域のサイズを決定する矩形領域サイズ決定手段と、矩形領域単位に定められる符号化モードを復号する符号化モード復号手段と、動き補償領域単位に動きベクトル情報を復号する動きベクトル情報復号手段と、逆量子化・逆直交変換を行う単位となる矩形ブロックサイズを決定するブロックサイズ決定手段とを実現している。

    また、マクロブロック復号部22は、符号化モード切替部23、動き補償領域分割部(動き補償領域分割手段)24、動き補償部(動き補償手段)25、参照画像メモリ26、逆量子化逆変換部(逆量子化逆変換手段)27、加算器28、イントラ予測ブロック分割部29、イントラ予測部(画面内予測手段)30からなる。

    符号化モード切替部23は、マクロブロックタイプ情報204に基づいて、符号化モードを切り替えるための機能部である。 動き補償領域分割部24は、マクロブロック内を、動き補償領域形状情報206が定める領域に分割する機能部である。 動き補償部25は、動きベクトル情報207を用いて動き補償予測を行い、予測画像を得るための機能部である。 逆量子化逆変換部27は、ブロックサイズ指示情報203に基づいて、係数データ208をマクロブロック単位に、逆量子化および逆直交変換処理を行い、予測誤差画像を求めるための機能部である。 加算器28は、逆量子化逆変換部27から出力された予測誤差画像と動き補償部25から出力された予測画像とを加算し、復号画像209を得るための加算器である。 また、参照画像メモリ26は、復号画像209を参照画像として格納するためのメモリである。 なお、エントロピー復号部21と逆量子化逆変換部27により、逆量子化及び逆直交変換を行う単位を示すブロックサイズ指示情報を復号し、該ブロックサイズ指示情報に基づいて逆量子化及び逆直交変換処理を行う変換処理手段を実現している。

    次に、実施の形態2の動作について説明する。
    先ず、入力ビットストリーム201がエントロピー復号部21へ入力され、マクロブロックサイズ指示情報202、ブロックサイズ指示情報203、符号化モード(マクロブロックタイプ情報204、イントラ予測ブロックサイズ情報205、動き補償領域形状情報206)、動きベクトル情報207、係数データ208が復号される。 尚、マクロブロックサイズ指示情報202はフレーム単位に復号される情報であり、符号化モードはマクロブロックサイズ指示情報202で決定されるサイズのマクロブロック単位に復号される情報である。 また、動きベクトル情報207は復号した動き補償領域形状情報206単位に復号される情報である。

    次に、マクロブロックサイズ指示情報202によって、マクロブロックサイズが決定され、以降の復号は、決定されたサイズのマクロブロック単位にマクロブロック復号部22にて行われる。 マクロブロックタイプがインターモードのときには、動き補償予測が行われ、イントラ予測モードのときには、イントラ予測が行われる。

    先ず、マクロブロックタイプがインターモードのときについて説明する。
    動き補償領域分割部24では、エントロピー復号部21で復号された動き補償領域形状情報206に基づき、指定サイズのマクロブロック内を動き補償を行う単位の領域に分割する。 動き補償領域形状情報206の内容は、実施の形態1の動き補償領域形状情報104と同様である。 動き補償部25は、動き補償領域分割部24で決定された領域単位に、復号された動きベクトル情報207と参照画像メモリ26に含まれる参照画像を用いて予測画像を生成する。 また、動きベクトル情報207についても、実施の形態1の動きベクトル情報107と同様である。

    エントロピー復号部21にて復号された係数データ208は、逆量子化逆変換部27へ入力される。 逆量子化逆変換部27では、復号されたブロックサイズ指示情報203に基づき、逆量子化逆変換処理を行う。 即ち、ブロックサイズ指示情報203が、例えば4画素×4ラインならば、4画素×4ライン単位の逆量子化、逆変換を行い、その結果予測誤差画像が復号される。

    動き補償部25で生成された予測画像と、逆量子化逆変換部27で復号された予測誤差画像は加算器28で加算され、復号画像209が得られる。 復号画像209は以降の復号に用いられるため、参照画像メモリ26に格納される。

    次に、符号化モードがイントラモードのときについて説明する。
    復号した係数データ208は、逆量子化逆変換部27へ入力される。 逆量子化逆変換部27の動作は、インターモードのときと同様である。 逆量子化逆変換の結果は復号画像209として出力される。 復号画像209はインターモードのときと同様、参照画像メモリ26に格納される。

    次に、符号化モードがイントラ予測モードのときについて説明する。
    イントラ予測ブロック分割部29では、エントロピー復号部21で復号されたイントラ予測ブロックサイズ情報205に基づき、マクロブロック内をイントラ予測を行う単位のブロックに分割する。 イントラ予測ブロックサイズ情報205の内容は、実施の形態1のイントラ予測ブロックサイズ情報105と同様である。 イントラ予測部30は、イントラ予測ブロック分割部29で決定されたブロック単位に、イントラ予測を行う。 イントラ予測については公知であるため、ここでの詳細な説明は省略するが、実施の形態1のイントラ予測部16と同様、復号済みの周辺ブロックの画素値を用いて、符号化対象ブロックの予測値(予測画像)を生成する。

    一方、エントロピー復号部21で復号された係数データ208は、逆量子化逆変換部27へ入力される。 逆量子化逆変換部27の動作は、インターモードのときと同様である。 逆量子化逆変換の結果は予測誤差画像として出力される。 イントラ予測部30で生成された予測画像と逆量子化逆変換部27で復号された予測誤差画像は加算器28にて加算され、復号画像209が得られる。 復号画像209は以降の復号に用いられるため、参照画像メモリ26に格納される。

    尚、上記実施の形態2においては、フレーム単位にマクロブロックサイズ指示情報を復号し、フレーム単位にマクロブロックサイズを切り替えて復号するようにしたが、複数マクロブロックの集合であるスライス単位にマクロブロックサイズ指示情報を復号し、スライス単位にマクロブロックサイズを切り替えて復号するようにしてもよい。

    また、他の例では、複数フレームの集合であるシーケンス単位にマクロブロックサイズ指示情報を復号し、シーケンス単位にマクロブロックサイズを切り替えて復号するようにしてもよい。

    更に他の例では、フレーム単位でマクロブロックサイズを切り替えるか、またはシーケンス単位でマクロブロックサイズを切り替えるかを指示する情報をシーケンス単位に復号し、フレーム単位に切り替えることが選択された場合にはフレーム単位にマクロブロックサイズ指示情報を復号し、シーケンス単位に切り替えることが選択された場合にはシーケンス単位にマクロブロックサイズ指示情報を復号するようにしてもよい。

    また、エントロピー復号部21は、ビットストリームに多重化されたマクロブロックサイズ指示情報を復号するようにしたが、例えば、所定の解像度よりも高い解像度の場合には32画素×32ラインを採用し、所定の解像度よりも低い解像度の場合には16画素×16ラインを採用するなど、復号対象画像の解像度に応じて自動的に決定しても良い。

    以上のように、実施の形態2の動画像復号装置によれば、動画像を矩形領域に分割して、矩形領域単位で復号を行う動画像復号装置において、フレーム単位または複数の連続するフレームの集合であるシーケンス単位に矩形領域のサイズを決定する矩形領域サイズ決定手段と、矩形領域単位に定められる符号化モードを復号する符号化モード復号手段と、符号化モード復号手段によって復号された符号化モードにより矩形領域内の画素値を復号する矩形領域復号手段とを備えたので、フレームまたはシーケンス単位で矩形領域サイズを変更して効率よく符号化した動画像を復号することができる。 また、矩形領域サイズの変更は、フレームまたはシーケンス単位であるため、例えばフレーム内で矩形領域サイズを切り替える場合等に比べて、矩形領域サイズ切替のための処理量が小さくて済む効果がある。

    また、実施の形態2の動画像復号装置によれば、矩形領域サイズ決定手段は、ビットストリームにフレーム単位または複数の連続するフレームの集合であるシーケンス単位に多重化された矩形領域サイズ情報を復号し、復号結果に基づき、矩形領域サイズを決定するようにしたので、矩形領域サイズを、画像の特徴などによって容易かつ適応的に切り替えることができる。

    また、実施の形態2の動画像復号装置によれば、矩形領域サイズ決定手段は、復号対象画像の解像度に応じて矩形領域サイズを決定するようにしたので、別途に矩形領域サイズ情報を復号する必要がなく、処理のオーバーヘッドを減らすことができる。

    また、実施の形態2の動画像復号装置によれば、符号化モード復号手段によって復号された符号化モードには、動き補償領域の単位となる領域形状を示す動き補償領域形状情報を含み、矩形領域復号手段は、矩形領域内を動き補償領域形状情報が定める領域に分割する動き補償領域分割手段と、動き補償領域単位に動きベクトル情報を復号する動きベクトル情報復号手段と、動きベクトル復号手段によって得られる動きベクトル情報を用いて動き補償予測を行い、予測画像を得る動き補償手段と、逆量子化・逆直交変換を行う単位となる矩形ブロックサイズを決定するブロックサイズ決定手段と、矩形ブロック単位に逆量子化および逆直交変換処理を行う逆量子化逆変換手段とを備えたので、符号化モードとして画面間予測符号化を行うインターモードの場合も復号装置として対応することができる。

    また、実施の形態2の動画像復号装置によれば、符号化モード復号手段によって復号された符号化モードには、画面内予測の単位となる領域形状を示すイントラ予測ブロックサイズ情報を含み、矩形領域復号手段は、イントラ予測ブロックサイズ情報が定める矩形ブロック単位に画面内予測を行い予測画像を得る画面内予測手段を備えたので、符号化モードとして画面内予測符号化を行うイントラ予測モードの場合も復号装置として対応することができる。

    また、実施の形態2の動画像復号装置によれば、動き補償領域形状情報は、矩形領域サイズ毎に設定される動き補償領域形状を復号したものであるようにしたので、矩形領域サイズ毎に決定される符号化モードとして画面間予測符号化を行うインターモードの場合も対応することができる。

    また、実施の形態2の動画像復号装置によれば、イントラ予測ブロックサイズ情報は、矩形領域サイズ毎に設定されるイントラ予測ブロックサイズを復号したものであるようにしたので、矩形領域サイズ毎に決定される符号化モードとして画面内予測符号化を行うイントラ予測モードの場合も対応することができる。

    1 マクロブロックサイズ決定部(矩形領域サイズ決定手段)、2 マクロブロック分割部(矩形領域分割手段)、3 マクロブロック符号化部(矩形領域符号化手段)、4 エントロピー符号化部(矩形領域サイズ情報多重化手段)、5 符号化モード決定部(符号化モード決定手段)、6 動き補償領域分割部(動き補償領域分割手段)、7 動き検出部(動き検出手段)、8 動き補償部(動き補償手段)、9 減算器、10 ブロック分割部(ブロック分割手段)、11 変換量子化部(変換量子化手段)、12 逆量子化逆変換部、13 加算器、14 参照画像メモリ、15 イントラ予測ブロック分割部(画面内予測ブロック分割手段)、16 イントラ予測部(画面内予測手段)、21 エントロピー復号部(変換処理手段)、22 マクロブロック復号部(矩形領域復号手段)、23 符号化モード切替部、24 動き補償領域分割部(動き補償領域分割手段)、25 動き補償部(動き補償手段)、26 参照画像メモリ、27 逆量子化逆変換部(逆量子化逆変換手段/変換処理手段)、28 加算器、29 イントラ予測ブロック分割部、30 イントラ予測部(画面内予測手段)。

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈