首页 / 专利库 / 广播 / 帧内预测 / Image signal processing apparatus and method, recording medium, program, and video camera

Image signal processing apparatus and method, recording medium, program, and video camera

阅读:935发布:2023-12-19

专利汇可以提供Image signal processing apparatus and method, recording medium, program, and video camera专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To highly accurately determine a quantization scale enabling an objective generated code amount to be produced in the case of coding an image at a head of a sequence or just after a scene change or the like.
SOLUTION: An image processing method includes: a step S41 in which an intra prediction section generates an intra prediction image corresponding to an I picture, and an intra prediction residual arithmetic section calculates an intra prediction residual being a difference between the intra prediction image and the I picture being an original picture; a step S42 in which a rate control section normalizes a preset objective code amount BIT by using an intra prediction residual ERROR; and a step S43 of calculating the quantization scale QP on the basis of the logarithm of the normalized objective code amount. The image processing method or the like can be applied to digital video cameras.
COPYRIGHT: (C)2006,JPO&NCIPI,下面是Image signal processing apparatus and method, recording medium, program, and video camera专利的具体信息内容。

  • 動画像を表示するための画像信号を所定の符号化方式に従って圧縮符号化する画像信号処理装置において、
    動画像を構成する静止画像に対し、イントラ予測画像を生成して、前記静止画像と前記イントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出手段と、
    前記静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、前記静止画像に対応する前記イントラ予測残差を用いて正規化する正規化手段と、
    前記正規化手段によって正規化された前記目標発生符号量に基づき、前記静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定手段と、
    前記静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換手段と、
    前記直交変換手段によって生成された前記変換係数を、前記決定手段によって決定された前記量子化スケールを用いて量子化する量子化手段と を含むことを特徴とする画像信号処理装置。
  • 前記イントラ予測残差算出手段は、動画像を構成する前記静止画像に対し、擬似的または実際のイントラ予測画像を生成して、前記静止画像と前記イントラ予測画像との差分を示す前記イントラ予測残差を算出する ことを特徴とする請求項1に記載の画像信号処理装置。
  • 前記決定手段は、前記正規化手段によって正規化された前記目標発生符号量の対数に基づき、前記静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する ことを特徴とする請求項1に記載の画像信号処理装置。
  • 前記決定手段は、前記正規化手段によって正規化された前記目標発生符号量の対数を、所定の1次関数に代入して、前記静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する ことを特徴とする請求項1に記載の画像信号処理装置。
  • 前記所定の1次関数は、任意の静止画像に対応する画像信号を圧縮符号化したときの、量子化スケールと、発生符号量をイントラ予測残差で正規化した値の対数との対応関係に基づき、予め設定されている ことを特徴とする請求項4に記載の画像信号処理装置。
  • 前記静止画像は、I(Intra coded)ピクチャである ことを特徴とする請求項1に記載の画像信号処理装置。
  • 前記静止画像は、前記動画像のシーケンスの先頭のIピクチャ、または前記動画像のシーンチェンジ直後のIピクチャである ことを特徴とする請求項1に記載の画像信号処理装置。
  • 前記所定の符号化方式は、MPEG(Moving Picture Experts Group)方式である ことを特徴とする請求項1に記載の画像信号処理装置。
  • 前記所定の符号化方式は、MPEG4-AVC(Advanced Video Coding)方式である ことを特徴とする請求項1に記載の画像信号処理装置。
  • 動画像を表示するための画像信号を所定の符号化方式に従って圧縮符号化する画像信号処理方法において、
    動画像を構成する静止画像に対し、イントラ予測画像を生成して、前記静止画像と前記イントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出ステップと、
    前記静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、前記静止画像に対応する前記イントラ予測残差を用いて正規化する正規化ステップと、
    前記正規化ステップの処理で正規化された前記目標発生符号量に基づき、前記静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定ステップと、
    前記静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換ステップと、
    前記直交変換ステップの処理で生成された前記変換係数を、前記決定ステップの処理で決定された前記量子化スケールを用いて量子化する量子化ステップと を含むことを特徴とする画像信号処理方法。
  • 動画像を表示するための画像信号を所定の符号化方式に従って圧縮符号化するためのプログラムであって、
    動画像を構成する静止画像に対し、イントラ予測画像を生成して、前記静止画像と前記イントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出ステップと、
    前記静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、前記静止画像に対応する前記イントラ予測残差を用いて正規化する正規化ステップと、
    前記正規化ステップの処理で正規化された前記目標発生符号量に基づき、前記静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定ステップと、
    前記静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換ステップと、
    前記直交変換ステップの処理で生成された前記変換係数を、前記決定ステップの処理で決定された前記量子化スケールを用いて量子化する量子化ステップと を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。
  • 動画像を表示するための画像信号を所定の符号化方式に従って圧縮符号化するためのプログラムであって、
    動画像を構成する静止画像に対し、イントラ予測画像を生成して、前記静止画像と前記イントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出ステップと、
    前記静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、前記静止画像に対応する前記イントラ予測残差を用いて正規化する正規化ステップと、
    前記正規化ステップの処理で正規化された前記目標発生符号量に基づき、前記静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定ステップと、
    前記静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換ステップと、
    前記直交変換ステップの処理で生成された前記変換係数を、前記決定ステップの処理で決定された前記量子化スケールを用いて量子化する量子化ステップと を含む処理をコンピュータに実行させることを特徴とするプログラム。
  • 撮影した動画像に対応する画像信号を所定の符号化方式に従って圧縮符号化し、情報記録媒体に記録するビデオカメラにおいて、
    被写体の動画像を撮影し、前記画像信号を生成する撮影手段と、
    前記撮影手段によって撮影された動画像を構成する静止画像に対し、イントラ予測画像を生成して、前記静止画像と前記イントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出手段と、
    前記静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、前記静止画像に対応する前記イントラ予測残差を用いて正規化する正規化手段と、
    前記正規化手段によって正規化された前記目標発生符号量に基づき、前記静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定手段と、
    前記静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換手段と、
    前記直交変換手段によって生成された前記変換係数を、前記決定手段によって決定された前記量子化スケールを用いて量子化する量子化手段と、
    前記量子化手段によって量子化された前記変換係数を前記情報記録媒体に記録する記録手段と を含むことを特徴とするビデオカメラ。
  • 说明书全文

    本発明は、画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラに関し、特に、画像信号を圧縮符号化するときの圧縮率を制御する場合に用いて好適な画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラに関する。

    例えば、動画像データをディジタル化して情報記録媒体に記録したり、インタネット等に代表されるネットワークを介して伝送したりする場合、そのデータ量が膨大であることから、動画像データを圧縮符号化することが行われている。 動画像データの代表的な符号化方式としては、動き補償予測符号化方式を挙げることができる。

    動き補償予測符号化方式の具体的なものとしては、MPEG(Moving picture experts group)符号化方式がある。 MPEG方式では、1フレームまたは1フィールドが、16ライン×16画素で構成されるマクロブロックに分割され、このマクロブロック単位で、動き補償予測符号化が行われる。

    動き補償予測符号化方式は、画像の時間軸方向の相関を利用する符号化方法であり、参照する画像(参照画像)に対する、符号化対象の画像(符号化対象画像)の動きベクトルを検出し、その動きベクトルにしたがって、既に符号化されて復号化された参照画像を動き補償することにより、予測画像を生成する。 そして、この予測画像に対する、符号化対象画像の予測残差を求め、この予測残差と動きベクトルを符号化することにより、動画像の情報量が圧縮される。

    動き補償予測符号化方式には、大別して、イントラ符号化と、インター符号化の2種類の符号化方式がある。 イントラ符号化では、符号化対象のマクロブロックに関して、符号化対象画像の情報がそのまま符号化され、インター符号化では、符号化対象画像に時間的に前後する画像を参照画像として、その参照画像から生成される予測画像と、符号化対象画像との差分が符号化される。

    MPEG方式では、各画像が、Iピクチャ(Intra coded picture)、Pピクチャ(Predictive coded picture、またはBピクチャ(Bidirectionally predictive coded picture)のうちのいずれかとして符号化される。また、MPEG方式では、GOP(Group of picture)単位で処理が行われる。

    このGOP単位で符号化され、その結果得られた符号化データを情報記録媒体に記録したり、伝送したりするときには、符号化データを伸長復号したときの画質を高く保ちつつ、符号化データのデータ量が、情報記録媒体の記録容量以下、あるいは通信回線の伝送容量以下となるように、符号圧縮率を正確に制御する必要がある。

    符号圧縮率を正確に制御する方法としては、従来から、実際の符号化に先立ち、符号化しようとする画像の発生符号量を正確に見積もり、見積もり結果に基づいて圧縮率を制御することが行われている。

    例えば、発生符号量を正確に見積もるためには、実際の符号化に先立って、圧縮率に関わるパラメータを仮に設定して、符号化を行う方法がある。 しかしながら、このような方法を用いると、実際の符号化で必要とされる演算量の倍の演算を行う必要があるので効率が悪いという問題があった。

    そこで、実際の符号化で必要とされる演算量の倍の演算を行うことなく、画像の予測残差に基づいて発生符号量を見積もる方法も存在する(例えば、特許文献1参照)。

    ただし、符号化対象画像の予測残差は、実際に符号化対象画像を符号化しない限り得ることのできない指標であるので、発生符号量を見積もるために利用する予測残差は、符号化対象画像に対応するものではなく、例えば、符号化対象画像の1フレーム前の画像に対応する予測残差をフィードバックし、それを符号化対象画像に対応する予測残差と見なして利用している。

    WO98/26599(特願平10−526505号)

    上述したように、例えば、符号化対象画像の1フレーム前の画像に対応する予測残差をフィードバックして、符号化対象画像に対応する予測残差と見なして利用する場合、符号化対象画像がシーケンスの先頭であったり、1フレーム前の画像と符号化対象画像との間にシーンチェンジ等が存在していたりするときには、符号化対象画像に対して見積もられる発生符号量が適切なものとならないので、符号圧縮率を正確に制御することができない、具体的には例えば、量子化スケールを固定しない符号化の場合、最適な量子化スケールを定めることができないという課題があった。

    なお、目標とする発生符号量に対応する量子化スケールを実験によって求め、その量子化スケールを初期値に定める方法も考えられるが、実験結果により求めた量子化スケールの初期値は、必ずしも多くのシーケンスで有効なわけではないので、目標とする発生符号量が得られる保証はないという課題があった。

    本発明はこのような状況に鑑みてなされたものであり、シーケンスの先頭であったり、シーンチェンジ直後等の画像を符号化する場合において、目標とする発生符号量を生じ得る量子化スケールを、精度良く決定できるようにすることを目的とする。

    本発明の画像信号処理装置は、動画像を構成する静止画像に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出手段と、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化手段と、正規化手段によって正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定手段と、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換手段と、直交変換手段によって生成された変換係数を、決定手段によって決定された量子化スケールを用いて量子化する量子化手段とを含むことを特徴とする。

    前記イントラ予測残差算出手段は、動画像を構成する静止画像に対し、擬似的または実際のイントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するようにすることができる。

    前記決定手段は、正規化手段によって正規化された目標発生符号量の対数に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定するようにすることができる。

    前記決定手段は、正規化手段によって正規化された目標発生符号量の対数を、所定の1次関数に代入して、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定するようにすることができる。

    前記所定の1次関数は、任意の静止画像に対応する画像信号を圧縮符号化したときの、量子化スケールと、発生符号量をイントラ予測残差で正規化した値の対数との対応関係に基づき、予め設定されているようにすることができる。

    前記静止画像は、Iピクチャとすることができる。

    前記静止画像は、動画像のシーケンスの先頭のIピクチャ、または動画像のシーンチェンジ直後のIピクチャとすることができる。

    前記所定の符号化方式は、MPEG方式とすることができる。

    前記所定の符号化方式は、MPEG4-AVC方式とすることができる。

    本発明の画像信号処理方法は、動画像を構成する静止画像に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出ステップと、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化ステップと、正規化ステップの処理で正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定ステップと、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換ステップと、直交変換ステップの処理で生成された変換係数を、決定ステップの処理で決定された量子化スケールを用いて量子化する量子化ステップとを含むことを特徴とする。

    本発明の記録媒体のプログラムは、動画像を構成する静止画像に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出ステップと、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化ステップと、正規化ステップの処理で正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定ステップと、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換ステップと、直交変換ステップの処理で生成された変換係数を、決定ステップの処理で決定された量子化スケールを用いて量子化する量子化ステップとを含むことを特徴とする。

    本発明のプログラムは、動画像を構成する静止画像に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出ステップと、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化ステップと、正規化ステップの処理で正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定ステップと、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換ステップと、直交変換ステップの処理で生成された変換係数を、決定ステップの処理で決定された量子化スケールを用いて量子化する量子化ステップとを含む処理をコンピュータに実行させることを特徴とする。

    本発明のビデオカメラは、被写体の動画像を撮影し、画像信号を生成する撮影手段と、撮影手段によって撮影された動画像を構成する静止画像に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出手段と、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化手段と、正規化手段によって正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定手段と、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換手段と、直交変換手段によって生成された変換係数を、決定手段によって決定された量子化スケールを用いて量子化する量子化手段と、量子化手段によって量子化された変換係数を情報記録媒体に記録する記録手段とを含むことを特徴とする。

    本発明の画像信号処理装置および方法、プログラム、並びにビデオカメラにおいては、動画像を構成する静止画像に対してイントラ予測残差が算出され、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量が、静止画像に対応するイントラ予測残差を用いて正規化され、正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールが決定される。 また、静止画像に対応する画像信号が直交変換されて変換係数が生成され、生成された変換係数が、決定された量子化スケールを用いて量子化される。

    本発明によれば、シーケンスの先頭であったり、シーンチェンジ直後等の画像を符号化する場合において、目標とする発生符号量を生じ得る量子化スケールを、精度良く決定することが可能となる。

    以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。 この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。 従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。 逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

    さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。 換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加されたりする発明の存在を否定するものではない。

    請求項1に記載の画像信号処理装置(例えば、図1の画像信号処理装置1)は、動画像を構成する静止画像(フレーム画像またはフィールド画像)に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出手段(例えば、図13のイントラ予測部41およびイントラ予測残差演算部42)と、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化手段(例えば、図17のステップS42の処理を行う図13のレート制御部43)と、正規化手段によって正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定手段(例えば、図17のステップS43の処理を行う図13のレート制御部43)と、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換手段(例えば、図13の直交変換部44)と、直交変換手段によって生成された変換係数を、決定手段によって決定された量子化スケールを用いて量子化する量子化手段(例えば、図13の量子化部45)とを含むことを特徴とする。

    請求項10に記載の画像信号処理方法は、動画像を構成する静止画像に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出ステップ(例えば、図17のステップS41)と、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化ステップ(例えば、図17のステップS42)と、正規化ステップの処理で正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定ステップ(例えば、図17のステップS43)と、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換ステップ(例えば、図17のステップS44)と、直交変換ステップの処理で生成された変換係数を、決定ステップの処理で決定された量子化スケールを用いて量子化する量子化ステップ(例えば、図17のステップS44)とを含むことを特徴とする。

    請求項14に記載の本発明のビデオカメラ(例えば、図18のディジタルビデオカメラ200)は、被写体の動画像を撮影し、画像信号を生成する撮影手段(例えば、図18のカメラ部201)と、撮影手段によって撮影された動画像を構成する静止画像に対し、イントラ予測画像を生成して、静止画像とイントラ予測画像との差分を示すイントラ予測残差を算出するイントラ予測残差算出手段(例えば、図13のイントラ予測部41およびイントラ予測残差演算部42)と、静止画像に対応する画像信号が圧縮符号化されるときの符号量の目標値を示す目標発生符号量を、静止画像に対応するイントラ予測残差を用いて正規化する正規化手段(例えば、図17のステップS42の処理を行う図13のレート制御部43)と、正規化手段によって正規化された目標発生符号量に基づき、静止画像に対応する画像信号が圧縮符号化されるときに用いられる量子化スケールを決定する決定手段(例えば、図17のステップS43の処理を行う図13のレート制御部43)と、静止画像に対応する画像信号を直交変換して変換係数を生成する直交変換手段(例えば、図13の直交変換部44)と、直交変換手段によって生成された変換係数を、決定手段によって決定された量子化スケールを用いて量子化する量子化手段(例えば、図13の量子化部45)と、量子化手段によって量子化された変換係数を情報記録媒体(例えば、図18の記録媒体210)に記録する記録手段(例えば、図18の媒体I/F204)とを含むことを特徴とする。

    なお、本発明の記録媒体に記録されているプログラム、および本発明のプログラムの請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係は、上述した本発明の情報処理方法のものと同様であるので、その記載は省略する。

    以下、本発明の一実施の形態について説明する。 図1は、本発明を適用した画像信号処理装置の構成例を示している。 この画像信号処理装置1は、入される動画像信号(以下、被符号化画像信号と記述する)を圧縮符号化して、被符号化画像信号よりもデータ量やビットレートの小さな符号化画像信号を生成するものであり、疑似予測残差生成部2、予測残差予想部3、目標符号量決定部4、および符号化部5から構成される。

    疑似予測残差生成部2は、入力される被符号化画像信号に基づき、後段の符号化部5において被符号化画像信号が実際に符号化されるときに算出される予測残差SADの擬似的な値(以下、疑似予測残差BDと記述する)を算出して予測残差予想部3に出力する。 以下、n番目の画像(フレーム画像またはフィールド画像)の被符号化画像信号に対応する疑似予測残差をBD(n)と記述する。

    予測残差予想部3は、疑似予測残差生成部2から入力された、n番目の画像に対応する疑似予測残差BD(n)を、n−1番目の画像の被符号化画像信号に対応する疑似予測残差BD(n-1)と、符号化部5から入力されるn−1番目の画像の被符号化画像信号に対応する予測残差SAD(n-1)に基づいて補正し、その補正結果として得られた予想予測残差PRED(n)を目標符号量決定部4に出力する。

    目標符号量決定部4は、予測残差予想部3から入力された予想予測残差PRED(n)に基づき、n番目の画像を符号化するときにVBR(Variable Bit Rate)を適用した場合における目標符号量(以下、VBR目標符号量BIT_VBR(n)と記述する)と、CBR(Constant Bit Rate)を適用した場合における目標符号量(以下、CBR目標符号量BIT_CBR(n)と記述する)とを算出し、これらの一方を目標符号量BIT_TGT(n)として符号化部5に出力する。

    さらに、目標符号量決定部4に対して符号化部5から、VBVバッファ(またはCPBバッファ)を占めるデータ量を供給するようにして、目標符号量決定部4が、VBVバッファ(またはCPBバッファ)を占めるデータ量に基づいてVBV目標符号量BIT_VBV(n)を算出し、VBV目標符号量BIT_VBV(n)がVBR目標符号量BIT_VBR(n)およびCBR目標符号量BIT_CBR(n)よりも小さい場合、VBV目標符号量BIT_VBV(n)を目標符号量BIT_TGTに設定するようにすることもできる。 ここで、VBVバッファ(またはCPBバッファ)とは、符号化部5に設けられている仮想的なバッファであり、符号化画像信号の復号時にオーバーフローやアンダーフローが発生しないように、実際の発生符号量を監視するものである。 ここで、VBVバッファは、MPEG2における用語であり、CPBバッファは、MPEG4−AVC(Advanced Video Coding)における用語である。

    符号化部5は、動き補償予測符号化方式を適用した、例えば、MPEG2方式、MPEG4方式、MPEG4-AVC方式等の符号化装置であり、入力された被符号化画像信号を、目標符号量決定部4から入力される目標符号量BIT_TGTに従って圧縮符号化し、符号化画像信号を生成する。 また、符号化部5は、圧縮符号化の処理過程で算出した実際の予測残差SADを予測残差予想部3に出力する。

    図2は、疑似予測残差生成部2の構成例を示している。 図2の構成例において、イントラ予測部11は、入力された被符号化画像信号にフレーム内予測を適用してイントラ予測画像を生成し、差分器13に出力する。 インター予測部12は、入力された被符号化画像信号にフレーム間予測を適用してインター予測画像を生成し、差分器14に出力する。 なお、イントラ予測部11およびインター予測部12は、例えば、MPEG2方式やMPEG4方式、MPEG4-AVC方式等が適用される符号化部5に内蔵されたイントラ予測部およびインター予測部と同等の精度でイントラ予測画像あるいはインター予測画像を生成できるようなものである必要はなく、近似的にこれらと同様の傾向を示すイントラ予測画像あるいはインター予測画像を生成できればよい。

    差分器13は、イントラ予測部11によって生成されたイントラ予測画像とそれに対応する被符号化画像信号の画像との差分を算出し、その結果をイントラ予測残差として比較部15に出力する。 差分器14は、インター予測部12によって生成されたインター予測画像とそれに対応する被符号化画像信号の画像との差分を算出し、その結果をインター予測残差として比較部15に出力する。 比較部15は、差分器13から入力されたイントラ予測残差と差分器14から入力されたインター予測残差とをマクロブロック毎に比較し、その値の小さい方を疑似予測残差BDに採用して後段の予測残差予想部3に出力する。 なおここでの比較はマクロブロックの単位に限定することなく、被符号化画像を任意の単位で分割した領域ごとに行ってもよい。

    図3は、予測残差予想部3の構成例を示している。 図3の構成例において、疑似予測残差生成部2からのn(n=1,2,…)番目の画像に対応する疑似予測残差BD(n)は、予測残差計算部21および遅延部22に入力される。 予測残差計算部21は、次式(1)に示されるように、遅延部22によって1画像分だけ遅延されたn−1番目の画像の被符号化画像信号に対応する疑似予測残差BD(n-1)と、符号化部5によって実際に計算されたn−1番目の画像の被符号化画像信号に対応する予測残差SAD(n-1)との差に調整係数Gを乗算した値G(SAD(n-1)−BD(n-1))を、疑似予測残差生成部2から入力されたn番目の画像に対応する疑似予測残差BD(n)に加算することにより、n番目の画像の被符号化画像信号に対応する予想予測残差PRED(n)を算出する。 なお、調整係数Gは、1以下の正数であり、例えば0.9とする。
    PRED(n)=BD(n)+G(SAD(n-1)−BD(n-1)) …(1)

    なお、n−1番目の画像の被符号化画像信号に対応する疑似予測残差BD(n-1)と予測残差SAD(n-1)との代わりに、n−1番目以前の例えばn−2番目の画像の被符号化画像信号に対応する疑似予測残差BD(n-2)と予測残差SAD(n-2)とを用いるようにしてもよい。

    ただし、0番目の画像が存在しないので、予測残差予想部3では、1番目の画像に対応する予想予測残差PRED(1)を算出することはできない。 したがって、予測残差予想部3は、2番目以降の画像に対応する予想予測残差PREDを算出するものとする。 なお、1番目の画像に対応する被符号化画像信号の圧縮率制御については後述する。

    図4は、目標符号量決定部4の構成例を示している。 図4の構成例において、VBR割り当て部31は、例えば、次式(2)に示すように、予測残差予想部3から入力される予想予測残差PRED(n)に所定の係数k(例えば、0.2)を乗算するか、または次式(3)に示すように、予測残差予想部3から入力される予想予測残差PRED(n)を独立変数とする、関数f(PRED(n))を用いてVBR目標符号量BIT_VBR(n)を算出する。
    BIT_VBR(n)=k・PRED(n) …(2)
    BIT_VBR(n)=f(PRED(n)) …(3)

    なお、係数kおよび関数f(x)は、被符号化画像信号の画質や、符号化画像信号の用途に応じて任意に決定してもよい。 また、係数kおよび関数f(x)は、画像のピクチャタイプに応じて変更するようにしてもよい。

    CBR割り当て部32は、予測残差予想部3から入力される予想予測残差PRED(n)に基づき、被符号化画像信号を符号化したときの発生符号量がGOP(Group Of Picture)単位で所定の固定値となるように、被符号化画像信号のピクチャタイプに応じて、次式(4−1)乃至(4−3)のうちの1式を用いてCBR目標符号量BIT_CBR(n)を算出して、比較部33に出力する。

    n番目のピクチャがIピクチャの場合のCBR目標符号量BIT_CBR(n)_I
    =R/(1+(Np・PREDp)/(PRED(n)・Kp)+(Nb・PREDb)/(PRED(n)・Kb))
    …(4−1)
    n番目のピクチャがPピクチャの場合のCBR目標符号量BIT_CBR(n)_P
    =R/(Np+(Nb・PREDb・Kp)/(PRED(n)・Kb)) …(4−2)
    n番目のピクチャがBピクチャの場合のCBR目標符号量BIT_CBR(n)_B
    =R/(Nb+(Np・PREDp・Kb)/(PRED(n)・Kp)) …(4−3)

    ただし、式(4−1)乃至(4−3)において、Rは、GOPに対して予め割り当てられている符号量のうちのいずれの画像にも割り当てられていない未割り当ての符号量を示す仮想バッファの値であり、式(4−1)乃至(4−3)のうちの1式が演算される毎、演算結果がフィードバックされて、その分だけ減算された値となる。 例えば、GOPを構成する画像のピクチャタイプがI,B,B,P,…の順である場合、符号化はI,P,B,B,P,…の順に行われるので、始めに、式(4−1)のRに、その初期値を代入してBIT_CBR(n)_Iを演算し、次に、式(4−2)のRに、その初期値から先に演算したBIT_CBR(n)_Iを減算した値を代入してBIT_CBR(n)_Pを演算する。 すなわち、Rはピクチャを符号化するたびにそのピクチャの目標符号量で減じられる。

    Npは、GOPを構成する全画像数のうち、目標符号量BIT_CBR(n)_Pがまだ演算されていないPピクチャの数である。 Nbは、GOPを構成する全画像数のうち、目標符号量BIT_CBR(n)_Bがまだ演算されていないBピクチャの数である。 PREDpは、目標符号量BIT_CBR(n)を算出しようとする画像の以前であって最も近くのPピクチャに対応する予想予測残差である。 PREDbは、目標符号量BIT_CBR(n)を算出しようとする画像の以前であって最も近くのBピクチャに対応する予想予測残差である。 Kpは、Pピクチャの重み付け係数である。 Kbは、Bピクチャの重み付け係数である。

    なお、式(4−1)乃至(4−3)の代わりに、MPEG2 TM(Test Model)5 Step1に採用されている次式(5−1)乃至(5−3)を用い、被符号化画像信号のピクチャタイプに応じてCBR目標符号量BIT_CBR(n)を算出するようにしてもよい。
    n番目のピクチャがIピクチャの場合の目標符号量BIT_CBR(n)_I
    =R/(1+(Np・Xp)/(Xi・Kp)+(Nb・Xb)/(Xi・Kb))
    …(5−1)
    n番目のピクチャがPピクチャの場合の目標符号量BIT_CBR(n)_P
    =R/(Np+(Nb・Xb・Kp)/(Xp・Kb)) …(5−2)
    n番目のピクチャがBピクチャの場合の目標符号量BIT_CBR(n)_B
    =R/(Nb+(Np・Xp・Kb)/(Xb・Kp)) …(5−3)

    ただし、式(5−1)乃至(5−3)において、Rは、GOPに対して予め割り当てられている符号量のうちの残りの符号量であり、式(5−1)乃至(5−3)が演算される毎、前回の演算結果が減算された値となる。 例えば、GOPを構成する画像のピクチャタイプがI,B,B,P,…の順である場合、符号化はI,P,B,B,P,…の順に行われるので、始めに、式(5−1)のRに、その初期値を代入してBIT_CBR(n)_Iを演算し、次に、式(5−2)のRに、その初期値から先に符号化したIピクチャの符号量を減算した値を代入してBIT_CBR(n)_Pを演算する。 すなわち、Rはピクチャを符号化するたびにそのピクチャの実際の符号量で減じられる。

    Npは、GOPを構成する全画像数のうち、目標符号量BIT_CBR(n)_Pがまだ演算されていないPピクチャの数である。 Nbは、GOPを構成する全画像数のうち、目標符号量BIT_CBR(n)_Bがまだ演算されていないBピクチャの数である。 Xi,Xp,Xbは、それぞれIピクチャ、Pピクチャ、またはBピクチャのコンプレクシティである。 Kpは、Pピクチャの重み付け係数である。 Kbは、Bピクチャの重み付け係数である。

    比較部33は、VBR割り当て部31から入力されたVBR目標符号量BIT_VBRと、CBR割り当て部32から入力されたCBR目標符号量BIT_CBRとを比較し、VBR目標符号量BIT_VBRがCBR目標符号量BIT_CBRよりも小さい場合、VBR目標符号量BIT_VBRを目標符号量BIT_TGTとして出力し、VBR目標符号量BIT_VBRがCBR目標符号量BIT_CBR以上である場合、CBR目標符号量BIT_CBRを目標符号量BIT_TGTとして出力する。

    なお、比較部33において、VBR割り当て部31から入力されたVBR目標符号量BIT_VBRと、CBR割り当て部32から入力されたCBR目標符号量BIT_CBRとを比較することなく、VBR目標符号量BIT_VBRまたはCBR目標符号量BIT_CBRの一方に固定して目標符号量BIT_TGTとして出力するようにしてもよい。

    また、比較部33において、符号化部5にから供給されるVBVバッファ(またはCPBバッファ)のデータ占有量に基づいて、目標符号量BIT_TGTを決定するようにしてもよい。

    次に、画像信号処理装置1による、n番目の画像に対応する被符号化画像信号を圧縮符号化する画像圧縮処理について、図5のフローチャートを参照して説明する。

    ステップS1において、疑似予測残差生成部2は、入力されたn番目の画像に対応する被符号化画像信号に基づき、n番目の画像に対応する疑似予測残差BD(n)を算出して予測残差予想部3に出力する。 このステップS1の処理について、図6のフローチャートを参照して詳述する。

    ステップS11において、イントラ予測部11は、入力されたn番目の画像の被符号化画像信号に対し、フレーム内予測を適用してイントラ予測画像を生成し、差分器13に出力する。 これと同時に、インター予測部12は、入力されたn番目の画像の被符号化画像信号に対し、フレーム間予測を適用してインター予測画像を生成し、差分器14に出力する。

    ステップS12において、差分器13は、イントラ予測部11によって生成されたイントラ予測画像とn番目の画像との差分を算出し、その結果をイントラ予測残差として比較部15に出力する。 これと同時に、差分器14は、インター予測部12によって生成されたインター予測画像とn番目の画像との差分を算出し、その結果をインター予測残差として比較部15に出力する。

    ステップS13において、比較部15は、差分器13から入力されたイントラ予測残差と差分器14から入力されたインター予測残差とを、画像のマクロブロック毎に比較して、その値の小さい方を疑似予測残差BD(n)に採用して後段の予測残差予想部3に出力する。 以上で、ステップS1の処理の詳述を終了する。

    図5に戻る。 ステップS2において、予測残差予想部3は、疑似予測残差生成部2から入力された、n番目の画像に対応する疑似予測残差BD(n)を、n−1番目の画像の被符号化画像信号に対応する疑似予測残差BD(n-1)と、符号化部5から入力された、n−1番目の画像の被符号化画像信号に対する実際の予測残差SAD(n-1)に基づいて補正し、その補正結果として得られた予想予測残差PRED(n)を目標符号量決定部4に出力する。 このステップS2の処理について、図7のフローチャートを参照して詳述する。

    ステップS21において、予測残差計算部21は、n−1番目の画像の被符号化画像信号に対する実際の予測残差SAD(n-1)を符号化部5から取得するとともに、n−1番目の画像の被符号化画像信号に対応する疑似予測残差BD(n-1)を遅延部22から取得する。 ステップS22において、予測残差計算部21は、n番目の画像に対応する疑似予測残差BD(n)を疑似予測残差生成部2から取得する。

    ステップS23において、予測残差計算部21は、式(1)に示されたように、遅延部22によって1画像分だけ遅延されたn−1番目の画像の被符号化画像信号に対応する疑似予測残差BD(n-1)と、符号化部5から入力されているn−1番目の画像の被符号化画像信号に対応する予測残差SAD(n-1)との差に調整係数Gを乗算した値G(SAD(n-1)−BD(n-1))を、疑似予測残差生成部2から入力されたn番目の画像に対応する疑似予測残差BD(n)に加算して、n番目の画像の被符号化画像信号に対応する予想予測残差PRED(n)を算出する。 以上で、ステップS2の処理の詳述を終了する。

    図5に戻る。 ステップS3において、目標符号量決定部4は、予測残差予想部3から入力された、n番目の画像に対応する予想予測残差PRED(n)に基づき、n番目の画像に対応する目標符号量BIT_TGT(n)を決定して符号化部5に出力する。 ステップS3の処理について、図8のフローチャートを参照して詳述する。

    ステップS31において、VBR割り当て部31は、式(2)または式(3)を用い、予測残差予想部3から入力された予想予測残差PRED(n)に基づいて、n番目の画像に対応するVBR目標符号量BIT_VBR(n)を算出する。 図9は、任意のシーケンス(所定の期間の被符号化画像信号)に対して、VBR割り当て部31によって算出されるVBR目標符号量BIT_VBR(n)の一例を示している。 図9において、横軸は、シーケンスの時間経過を示しており、縦軸は、複数の符号化されたピクチャの符号量によって決定されるビットレートである。 VBR目標符号量BIT_VBR(n)は、図9に示す曲線51のように、各画像のコンプレクシティ(符号化の難易度)等に依存してその値が変動し、後段の符号化部5の出力である符号化画像の符号量によって決定されるビットレートが、あらかじめ目標とするビットレートの最大値(上限レートL)を超越することがある。

    ステップS32において、CBR割り当て部32は、予測残差予想部3から入力された予想予測残差PRED(n)に基づき、被符号化画像信号を符号化したときの発生符号量がGOP単位で固定値(図9の上限レートL)となるように、式(4−1)乃至(4−3)に示されたように、n番目の画像に対応する被符号化画像信号のピクチャタイプに応じたCBR目標符号量BIT_CBR(n)を算出する。

    なお、ステップS31の処理とステップS32の処理は、便宜上、異なるタイミングの処理のごとく説明したが、実際には同時に実行される。

    ステップS33において、比較部33は、VBR割り当て部31から入力されたVBR目標符号量BIT_VBR(n)が、CBR割り当て部32から入力されたCBR目標符号量BIT_CBR(n)よりも小さいか否かを判定する。 VBR目標符号量BIT_VBR(n)がCBR目標符号量BIT_CBR(n)よりも小さいと判定された場合、処理はステップS34に進み、比較部33は、VBR目標符号BIT_VBR(n)を目標符号量BIT_TGT(n)として後段の符号化部5に出力する。

    反対に、ステップS33において、VBR目標符号量BIT_VBR(n)がCBR目標符号量BIT_CBR(n)よりも小さくないと判定された場合には、処理はステップS35に進む。 ステップS35において、比較部33は、CBR目標符号量BIT_CBR(n)を目標符号量BIT_TGT(n)として後段の符号化部5に出力する。

    なお、比較部33から出力される目標符号量BIT_TGT(n)は、図9と同一のシーケンスを例とした場合、図10の曲線71に示すように、目標符号量BIT_TGT(n)は、各画像のコンプレクシティ(符号化の難易度)等に依存してその値が変動するが、後段の符号化部5の出力である符号化画像の符号量によって決定されるビットレートが、あらかじめ目標とするビットレートの最大値(上限レートL)に達した場合、その値は上限レートLで頭打ちとなる。 また、VBR目標符号量BIT_VBR(n)からCBR目標符号量BIT_CBR(n)への切り替えは、常にVBR目標符号量BIT_VBR(n)とCBR目標符号量BIT_CBR(n)が演算されていることに起因して速やかに行われる。

    目標符号量決定部4では、目標符号量BIT_TGT(n)を、実際の符号化の前に得られる予想予測残差PREDを用いて算出しているので、符号化しようとするピクチャの符号量の多寡を前もって反映することができる。 また、シーンチェンジやシーケンスの動きなどの傾向をそのピクチャの符号化前に反映することができるため、適切な符号量の割り当てができる。 したがって、画質の劣化を抑制することができる。 さらに、式(4−1)乃至(4−3)の手法を用いた場合には実際に符号化された後の発生符号をフィードバックして用いないので、目標符号量に対する実際の仕上がり符号量のズレが蓄積し難い性質をもつこととなり、動作が安定する。

    図5に戻る。 ステップS4において、符号化部5は、入力されたn番目の画像に対応する被符号化画像信号を、目標符号量決定部4から入力された、n番目の画像に対応する目標符号量BIT_TGT(n)に従って圧縮符号化し、符号化画像信号を生成する。 なお、目標符号量BIT_TGT(n)に従って圧縮符号化し、符号化画像信号を生成する方法については、任意の方法を適用することができる。 例えば、MPEG2 TM5 Step2に採用されている、マクロブロック毎に発生符号量を逐一監視して圧縮率を調整し、目標符号量を達成しようとするアルゴリズムを用いて符号化を行う方法を適用することができる。

    また例えば、MPEG2 TM5 Step2においてはピクチャタイプ毎に独立して設けられている仮想バッファ(目標とする符号量と発生符号量の差を示すもの)を単一の仮想バッファにまとめて、各ピクチャで共通な単一の仮想バッファが使用される方法等を適用すれば、符号化部5の動作を安定させることができるのでさらに効果的である。 なお、この方法については、本出願人が既に提案済であって特開2003-230151号公報として開示されている。

    ただし、特開2003-230151号公報では、特にピクチャのグローバルコンプレクシティの比に基づき、異なるピクチャタイプ間における発生ビット量の差を正規化しようとしているが、符号化部5では、予想された予測残差から直接的に目標符号量を算出している。

    Iピクチャを符号化する場合、次式(6−1)を用いて仮想バッファ占有量djを算出し、次式(7−1)を用いて、仮想バッファ占有量djを量子化スケールコードQiに変換する。 Pピクチャを符号化する場合、次式(6−2)を用いて仮想バッファ占有量djを算出し、次式(7−2)を用いて、仮想バッファ占有量djを量子化スケールコードQpに変換する。 Bピクチャを符号化する場合、次式(6−3)を用いて仮想バッファ占有量djを算出し、次式(7−3)を用いて、仮想バッファ占有量djを量子化スケールコードQbに変換する。
    dj=d0+B(j−1)−(Ti・(j−1))/MB_COUNT
    …(6−1)
    dj=d0+(Last_Ibit/Tp)・(B(j−1)−(Tp・(j−1))/MB_COUNT)
    …(6−2)
    dj=d0+(Last_Ibit/Tb)・(B(j−1)−(Tb・(j−1))/MB_COUNT)
    …(6−3)
    Qi=dj×QP/r …(7−1)
    Qp=dj×QP/r …(7−2)
    Qb=dj×QP/r+c …(7−3)

    ただし、d0は、仮想バッファの初期占有量であり、B(j−1)は、符号化する画像のj−1番目のマクロブロックまでの発生符号量の総和であり、Last_Ibitは最後に符号化されたIピクチャの発生符号量であり、Ti,Tp,Tbは、それぞれI,P,Bピクチャの目標符号量であり、MB_COUNTは、符号化する画像のマクロブロック数である。 また、QPは、MPEG2 TM5で推奨されている値(具体的には31)であり、rは、リアクションパラメータであり、cは補正値(例えば、2)である。

    なお、式(6−2)において(Last_Ibit/Tp)を乗算していること、および式(6−3)において(Last_Ibit/Tb)を乗算していることが、単一の仮想バッファを使用することに対する補正である。 また、式(7−3)において、補正値cを加算しているように、ピクチャタイプに応じて符号化時の相対的な重み付けを変更するようにしてもよい。

    次に、図11は、符号化部5に入力される被符号化画像信号の符号化の難易度(画像の複雑さ)と、符号化部5から出力される符号化画像信号のビットレートとの関係を示している。

    被符号化画像信号は、図11の横軸によって示される画像の難易度が低いうちは、VBRが適用されて符号化され、難易度とビットレートの関係は直線81Aのような対応になる。 したがって、符号化の難易度の増加とともに発生符号量も増加する。 そしてさらに、画像の難易度が増加し、発生符号量が上限レートLに達した場合、CBRが適用されて直線81Bで示すように、頭打ちとなる。 なお、図11の直線81Aの傾きが式(2)の係数kに相当する。 また、式(3)の関数fを用途に応じて任意にきめてやると、VBR時に、例えば曲線82のような特性をもたせることができる。

    したがって、符号化部5から出力される符号化画像信号の符号量は、その最大レートが保証される。 よって、例えば、符号化部5から出力される符号化画像信号を情報記録媒体に記録する場合の最大記録可能時間を保証することが可能となる。

    なお、CBRが適用されるときの上限レートLを、現状よりも高い値に設定すれば、画像をより高画質で符号化することができる高画質モードとすることができる。 反対に、上限レートLを、現状よりも低い値に設定すれば、同一容量の記録媒体に記録できる時間をより長くすることができる長時間モードとすることができる。

    また、式(2)の係数kの値を変更したり、式(3)の関数fを変更したりすることにより、高画質モードや長時間モードを実現するようにしてもよい。

    以上で、n番目の画像に対応する被符号化画像信号が符号化されたことになる。 次に、n+1番目の画像に対応する被符号化画像信号に対する画像圧縮処理として、ステップS1以降の処理が行われることになる。 以上で、画像圧縮処理の説明を終了する。

    ところで、上述した画像圧縮処理では、予想予測残差PRED(n)の算出に1画像前の実際の予測残差SAD(n-1)を利用しているので、1番目の画像(例えば、シーケンスの先頭のIピクチャ)に対する予想予測残差PRED(1)が算出されない。 したがって、1番目の画像に対する目標符号量BIT_TGT(1)も算出されない。 そこで、符号化部5は、1番目の画像に対しては、予め設定されている目標符号量BITの符号が発生されるような最適な量子化スケールQPを算出して、1番目の画像を符号化する。

    図12は、1番目の画像の符号化に関わる箇所に限定した符号化部5の構成例を示している。 図12において、全段からのIピクチャの被符号化画像信号は、イントラ予測部41、イントラ予測残差演算部42、および直交変換部44に入力される。

    イントラ予測部41は、入力されたIピクチャの被符号化画像信号に対応するイントラ予測画像を生成してイントラ予測残差演算部42に出力する。 イントラ予測残差演算部42は、イントラ予測部41から入力されたイントラ予測画像と、原画であるIピクチャとの差であるイントラ予測残差を演算して、レート制御部43に出力する。 レート制御部43は、イントラ予測残差演算部42から入力された、Iピクチャに対応するイントラ予測残差に基づき、量子化スケールQPを算出して量子化部45に出力する。 直交変換部44は、入力されるIピクチャの被符号化画像信号に対し、離散コサイン変換やカルーネン・レーベ変換等の直交変換処理を施し、その処理結果としてられる変換係数を量子化部45に出力する。 量子化部45は、直交変換部44から入力された変換係数を、レート制御部43から入力される量子化スケールQPに従って量子化し、可逆符号化部46に出力する。 可逆符号化部46は、量子化部45から入力された、量子化された変換係数を符号化して符号化画像信号を生成する。

    次に、Iピクチャに対応するイントラ予測残差に基づき、量子化スケールQPを算出しするレート制御部43の処理について説明する。 図13の線分91−A,91−B,91−Cは、それぞれ異なるシーケンスの先頭のIピクチャを、量子化スケールQPの値をいろいろに変えて符号化した際の、量子化スケールQPと発生符号量BITの関係を示している。 図13において、縦軸は、発生符号量BITの対数ln(BIT)であり、横軸は、量子化スケールQPである。

    線分91−A乃至91−Cから明らかなように、いずれのシーケンスでも、発生符号量の対数ln(BIT)は、量子化スケールQPの増加に対してほぼ直線的に減少することがわかる。 なお、上述した発生符号量の対数ln(BIT)と量子化スケールQPとの関係は一般周知である。

    ここで、各シーケンスの先頭のIピクチャを符号化した際の発生符号量BITを、次式(8)に示すように、それぞれに対応するIピクチャのイントラ予測残差ERRORで正規化した値NORM_BITの対数ln(NORM_BIT)を演算し、量子化スケールQPと対応付けてプロットすると、図14に示すように、図13においては互いに独立していた線分91−A,91−B,91−Cが、図14に示されるように、1本の直線状に凝集されることが確認できる。
    NORM_BIT=BIT・(NORM/ERROR) …(8)

    ただし、NORMは任意の定数である。 また、図14において、縦軸は、イントラ予測残差ERRORで正規化された発生符号量BITの対数ln(NORM_BIT)であり、横軸は、量子化スケールQPである。

    この線分の凝集は、図15に示すように、1本の直線(以下、代表直線と記述する)で近似することができる。 この代表直線101を、量子化スケールQPを独立変数とする1次関数によって表記すれば、次式(9)に示す通りとなる。 ただし、式(9)において、aは代表直線101の傾き、bは代表直線101の縦軸との切片であり、図14に示されたプロット結果に基づき、予め算出する必要がある。
    ln(BIT・(NORM/ERROR))=a・QP+b …(9)

    式(9)を変形すれば、発生符号量BITを実現するための量子化スケールQPを算出することが可能な次式(10)となる。
    QP=(ln(BIT・(NORM/ERROR))−b)/a …(10)

    従って、レート制御部43において、式(10)を用いれば、シーケンスの先頭のIピクチャを符号化した際に、所望の発生符号量BITを実現することができる量子化スケールQPを算出することができる。 この操作は、図15において、所望の発生符号量102から代表直線101をたどって量子化スケール103を求めたことになる。 なお、レート制御部43には、式(10)のBIT,NORM,a、およびbを予め供給しておくものとする。 式(10)のイントラ予測残差ERRORは、イントラ予測残差演算部42からレート制御部43に供給されているものを用いるが、必要ならば、擬似予測残差予測部3を構成するイントラ予測部11で代用してもよい。

    シーケンスの先頭のIピクチャを符号化する符号化部5の動作について、図16を参照して説明する。 ステップS41において、イントラ予測部41は、入力されたIピクチャの被符号化画像信号に対応するイントラ予測画像を生成してイントラ予測残差演算部42に出力する。 イントラ予測残差演算部42は、イントラ予測部41から入力されたイントラ予測画像と、原画であるIピクチャとの差であるイントラ予測残差を演算して、レート制御部43に出力する。

    ステップS42において、レート制御部43は、式(8)に示されたように、予め設定されている目標符号量BITを、イントラ予測残差演算部42から入力されたイントラ予測残差ERRORで正規化し、ステップS43において、式(10)に示されたように、正規化された目標符号量の対数からbを減算し、その演算結果をaで除算することにより、量子化スケールQPを算出して量子化部45に出力する。 なお、ステップS41乃至S43の処理が実行されている間において、直交変換部44は、入力されたIピクチャの被符号化画像信号に対して直交変換処理を施し、その処理結果としてられる変換係数を量子化部45に出力している。 ステップS44において、量子化部45は、直交変換部44から入力された変換係数を、レート制御部43から入力される量子化スケールQPに従って量子化し、可逆符号化部46に出力する。 可逆符号化部46は、量子化部45から入力された、量子化された変換係数を符号化して符号化画像信号を生成する。 以上で、シーケンスの先頭のIピクチャを符号化する符号化部5の動作の説明を終了する。

    また、以上説明した符号化部5の動作は、シーケンスの先頭のIピクチャのみならず、例えば、シーンチェンジ直後のIピクチャに対して適用してもよいし、通常のIピクチャに対しても適用可能である。

    以上説明した動作は、符号化部5において、特別に大きな計算量を必要とせず、また通号の符号化装置に備えられていないような特別な回路構成も必要としない、上述した動作は、適用できるシーケンスの幅が広く、当たり外れの差が小さい(最適ではない場合でも、その影響が小さい)、広範囲の圧縮率に適用することができるという効果を有する。

    ところで、本発明は、ディジタルビデオカメラにも適用することができる。 図17は、本発明を適用したディジタルビデオカメラの構成例を示している。 このディジタルビデオカメラ200は、被写体を撮影して被符号化画像信号を取得し、取得した被符号化画像信号を、上述した画像信号処理装置1と同様に、圧縮符号化して符号化画像信号を生成し、生成した符号化画像信号を記録媒体に記録するものである。

    ディジタルビデオカメラ200は、大別すると、カメラ部201、カメラDSP(Digital Signal Processor)202、および制御部205から構成される。 さらに、ディジタルビデオカメラ200は、SDRAM(Synchronous Dynamic Random Access Memory203、媒体インタフェース(I/F)204、操作部206、LCD(Liquid Crystal Display)コントローラ207、LCD208、外部インタフェース(I/F)209、および着脱可能な記録媒体210から構成される。

    記録媒体210は、半導体メモリを用いたいわゆるメモリカード、記録可能なDVD(Digital Versatile Disk)や記録可能なCD(Compact Disc)等の光記録媒体、磁気ディスクなどの種々のものを用いるようにすることが考えられるが、本実施の形態においては、記録媒体210として例えばメモリカードを用いるものとして説明する。

    カメラ部201は、光学ブロック211、CCD(Charge Coupled Device)212、前処理回路213、光学ブロック用ドライバ214、CCD用ドライバ215、およびタイミング生成回路216から構成される。 ここで、光学ブロック211は、レンズ、フォーカス機構、シャッタ機構、絞り(アイリス)機構などを備えたものである。

    制御部205は、CPU(Central Processing Unit)251、RAM(Random Access Memory)252、フラッシュROM(Read Only Memory)253、および時計回路254が、システムバス255を介して接続されているマイクロコンピュータであり、ディジタルビデオカメラ200の各部を制御することができるものである。

    RAM252は、処理の途中結果を一時記憶する等、主に作業領域として用いられるものである。 フラッシュROM253は、CPU251において実行する種々のプログラムや、処理に必要になるデータなどが記憶されたものである。 また、時計回路254は、現在年月日、現在曜日、現在時刻を出力することができるものである。

    制御部205は、画像の撮影時においては光学ブロック用ドライバ214を制御し、光学ブロック211を動作させるための駆動信号を形成させて光学ブロック211を動作させる。 これに対応して、光学ブロック211は、フォーカス機構、シャッタ機構、絞り機構を制御することにより、被写体の光画像を取得して、これをCCD212に集光する。

    CCD212は、光学ブロック211からの画像を光電変換して出力するものであり、CCDドライバ215からの駆動信号に応じて動作し、光学ブロック211からの被写体の光画像を取り込むとともに、制御部205によって制御されるタイミング生成回路216からのタイミング信号に基づいて、取り込んだ被写体の画像(画像情報)を電気信号として前処理回路213に供給する。 なお、上述のように、タイミング生成回路216は、制御部205からの制御に応じて、所定のタイミングを提供するタイミング信号を形成するものである。 また、CCDドライバ215は、タイミング生成回路216からのタイミング信号に基づいて、CCD212に供給する駆動信号を形成するものである。

    前処理回路213は、CCD212から入力された電気信号の画像情報に対して、CDS(Correlated Double Sampling)処理を行って、S/Nを良好に保つようにするとともに、AGC(Automatic Gain Control)処理を行って、利得を制御し、そして、A/D(Analog/Digital)変換を行って、ディジタル信号とされた画像データ(以下、被符号化画像信号と記述する)を形成し、DSP202に出力する。

    DSP202のAF AE AWB処理部221は、カメラ部1から供給された被符号化画像信号に対して、AF(Auto Focus)、AE(Auto Exposure)、AWB(Auto White Balance)等のカメラ信号処理を施す。 圧縮部222は、種々のカメラ信号処理が施された被符号化画像信号を圧縮符号化して符号化画像信号を生成する。 なお、圧縮部222は、図1の画像信号処理装置1と同様に構成され、また同様に動作するものであるので、その詳細な説明は省略する。

    圧縮部222によって生成された符号化画像信号は、システムバス255、および媒体I/F204を介して記録媒体210に記録される。 解凍部223は、操作部206に対するユーザの操作入力に応じて記録媒体210から読み出された符号化画像信号の解凍処理(伸張処理)を行い、解凍後の画像信号を、システムバス255を介してLCDコントローラ207に供給する。 LCDコントローラ207は、供給された画像信号をLCD208に適したフォーマットに変換してLCD208に供給する。 これにより、記録媒体210に記録されている符号化画像信号に応じた画像が、LCD208の表示画面に表示される。

    外部I/F209は、例えば外部のパーソナルコンピュータと接続して、パーソナルコンピュータから符号化画像信号の供給を受けたり、記録媒体210に記録されている符号化画像信号を外部のパーソナルコンピュータ等に供給したりする。 また、外部I/F209に通信モジュールを接続することにより、例えば、インタネット等のネットワークに接続して、ネットワークを通じて種々のデータを授受したりする。 なお、外部I/F209は、IEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)などの有線用インタフェースとして設けることも可能であるし、光や電波による無線インタフェースとして設けることも可能である。 すなわち、外部I/F209は、有線、無線のいずれのインタフェースであってもよい。

    ところで、一連の処理は、画像信号処理装置1やディジタルビデオカメラ200のようにハードウェアによって実行させることもできるが、ソフトウェアにより実行させることもできる。 一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図18に示されるように構成された汎用のパーソナルコンピュータ300に、記録媒体等からインストールされる。

    図18に示されたパーソナルコンピュータ300は、CPU301を内蔵している。 CPU301にはバス304を介して、入出力インタフェース305が接続されている。 バス304には、ROM302およびRAM303が接続されている。

    入出力インタフェース305には、ユーザが操作コマンドを入力するキーボード、マウス、リモートコントローラなどの入力デバイスよりなる入力部306、映像や音声を出力する出力部307、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部308、インタネットに代表されるネットワークを介して通信処理を実行する通信部309、および記録媒体311に対してデータを読み書きするドライブ310が接続されている。

    上述した一連の処理をパーソナルコンピュータ300に実行させるプログラムは、記録媒体311に格納された状態でパーソナルコンピュータに供給され、ドライブ310によって読み出されて記憶部308に内蔵されるハードディスクドライブにインストールされている。 記憶部308にインストールされているプログラムは、入力部306に入力されるユーザの操作に対応するCPU301の指令によって、記憶部308からRAM303にロードされて実行される。

    なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

    本発明を適用した画像信号処理装置の構成例を示すブロック図である。

    図1の疑似予測残差生成部の構成例を示すブロック図である。

    図1の予測残差予想部の構成例を示すブロック図である。

    図1の目標符号量決定部の構成例を示すブロック図である。

    画像信号処理装置による画像圧縮処理を説明するフローチャートである。

    図5のステップS1を詳細に説明するフローチャートである。

    図5のステップS2を詳細に説明するフローチャートである。

    図5のステップS3を詳細に説明するフローチャートである。

    任意のシーケンスに対するVBR目標符号量BIT_VBR(n)を示す図である。

    任意のシーケンスに対する目標符号量BIT_TGT(n)を示す図である。

    シーケンスの難易度に対する目標符号量BIT_TGTの変化を示す図である。

    図1の符号化部5の構成例を示すブロック図である。

    量子化スケールと発生符号量の対数との関係を示す図である。

    量子化スケールと予測残差により正規化された発生符号量の対数との関係を示す図である。

    量子化スケールと予測残差により正規化された発生符号量の対数との関係を2次関数で近似した図である。

    シーケンス先頭のIピクチャに対する符号化処理を説明するフローチャートである。

    本発明を適用したディジタルビデオカメラの構成例を示すブロック図である。

    本発明を適用したパーソナルコンピュータの構成例を示すブロック図である。

    符号の説明

    1 画像信号処理装置, 2 疑似予測残差生成部, 3 予測残差予想部, 4 目標符号量決定部, 5 符号化部, 11 イントラ予測部, 12 インター予測部, 13,14 差分器, 15 比較部, 21 予測残差計算部, 31 VBR割り当て部, 32 CBR割り当て部, 33 比較部, 41 イントラ予測部, 42 イントラ予測残差演算部, 43 レート制御部, 45 量子化部, 201 カメラ部, 222 圧縮部, 301 CPU, 311 記録媒体

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈