首页 / 专利库 / 信号处理 / 稀疏变换 / 小波变换 / 离散小波反变换 / Picture processor, its method and storage medium

Picture processor, its method and storage medium

阅读:455发布:2021-02-22

专利汇可以提供Picture processor, its method and storage medium专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To efficiently encode multi-valued picture information regardless of whether a shape is rectangular or not by repeating a dividing processing as against respective blocks which are constituted by means of conversion coefficients, generating encoding data including information which indicates the position of the effective conversion coefficient and outputting it. SOLUTION: A picture P to be encoded is inputted to an input part 1 with a data line 101. The input part 1 detects the contour shape of a vehicle being a non-rectangular object from picture data which indicates the inputted picture to be encoded P, generates binary pictures S expressed by permitting a background part to be '0' and an object part to be '1' and outputs them to the data lines 102 and 103. In the meantime, the multi-valued picture T expressing the object itself is generated and outputted to the data line 104. The multi-valued picture T is converted by discrete wavelet in a discrete wavelet converter 2 and the binary pictures S is converted by prediction in a prediction converter 3. Then, the conversion coefficients obtained by each conversion are inputted and encoded in an area divider 4.,下面是Picture processor, its method and storage medium专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 多値画像を入力する入力手段と、 該入力手段により入力された多値画像を第1の変換方式で変換し、第1の変換係数を発生する第1変換手段と、 前記第1変換手段により変換される多値画像の形状を示す形状情報を第2の変換方式で変換し、第2の変換係数を発生する第2変換手段と、 前記第1の変換係数で構成されるブロック及び第2の変換係数で構成されるブロックの各々に対して、分割処理を繰り返すことにより有効な変換係数の位置を示す情報を含む符号化データを生成し、該符号化データを出力する符号化手段とを有することを特徴とする画像処理装置。
  • 【請求項2】 前記第1の変換方式は直交変換を実行し、前記第2変換方式は予測符号化を実行することを特徴とする請求項1に記載の画像処理装置。
  • 【請求項3】 前記形状情報は、2値画像として表現されていることを特徴とする請求項1に記載の画像処理装置。
  • 【請求項4】 前記形状情報は、多値画像として表現されており、前記第1変換手段により変換される多値画像と他の画像との合成率を表す多値情報であることを特徴とする請求項1に記載の画像処理装置。
  • 【請求項5】 前記符号化手段は、入力された第1の変換係数を所定の閾値と比較することにより前記有効な変換係数を決定することを特徴とする請求項1に記載の画像処理装置。
  • 【請求項6】 前記有効な変換係数は、所定の閾値の範囲内に値を有する係数であることを特徴とする請求項1
    に記載の画像処理装置。
  • 【請求項7】 前記符号化手段は、前記第1の変換係数に対応する符号化データには、前記有効な変換係数の値も含ませることを特徴とする請求項1に記載の画像処理装置。
  • 【請求項8】 更に、前記第1及び第2の変換係数に対応する符号化データを復号化する復号化手段を有し、前記第1の変換係数に対応する符号化データに対応する復号化画像を、前記第2の変換係数に対応する符号化データに対応する形状情報に基づいて他の画像に合成する画像合成手段を有することを特徴とする請求項1に記載の画像処理装置。
  • 【請求項9】 多値画像を入力する入力ステップと、 該入力ステップで入力された多値画像を第1の変換方式で変換し、第1の変換係数を発生する第1変換ステップと、 前記第1変換ステップで変換される多値画像の形状を示す形状情報を第2の変換方式で変換し、第2の変換係数を発生する第2変換ステップと、 前記第1の変換係数で構成されるブロック及び第2の変換係数で構成されるブロックの各々に対して、分割処理を繰り返すことにより有効な変換係数の位置を示す情報を含む符号化データを生成し、該符号化データを出力する符号化ステップとを有することを特徴とする画像処理方法。
  • 【請求項10】 多値画像を入力する入力ステップと、 該入力ステップで入力された多値画像を第1の変換方式で変換し、第1の変換係数を発生する第1変換ステップと、 前記第1変換ステップで変換される多値画像の形状を示す形状情報を第2の変換方式で変換し、第2の変換係数を発生する第2変換ステップと、 前記第1の変換係数で構成されるブロック及び第2の変換係数で構成されるブロックの各々に対して、分割処理を繰り返すことにより有効な変換係数の位置を示す情報を含む符号化データを生成し、該符号化データを出力する符号化ステップとを有する画像処理プログラムをコンピュータから読み出し可能な状態に記憶した記憶媒体。
  • 【請求項11】 多値画像を入力する入力手段と、 該入力手段により入力された多値画像を第1の変換方式で変換し、第1の変換係数を発生する第1変換手段と、 前記第1変換手段により変換される多値画像から生成された別の画像を第2の変換方式で変換し、第2の変換係数を発生する第2変換手段と、 前記第1の変換係数で構成されるブロック及び第2の変換係数で構成されるブロックの各々に対して、分割処理を繰り返すことにより有効な変換係数の位置を示す情報を含む符号化データを生成し、該符号化データを出力する符号化手段とを有することを特徴とする画像処理装置。
  • 【請求項12】 多値画像を入力する入力ステップと、 該入力ステップで入力された多値画像を第1の変換方式で変換し、第1の変換係数を発生する第1変換ステップと、 前記第1変換ステップで変換される多値画像から生成された別の画像を第2の変換方式で変換し、第2の変換係数を発生する第2変換ステップと、 前記第1の変換係数で構成されるブロック及び第2の変換係数で構成されるブロックの各々に対して、分割処理を繰り返すことにより有効な変換係数の位置を示す情報を含む符号化データを生成し、該符号化データを出力する符号化ステップとを有することを特徴とする画像処理方法。
  • 【請求項13】 多値画像を入力する入力ステップと、 該入力ステップで入力された多値画像を第1の変換方式で変換し、第1の変換係数を発生する第1変換ステップと、 前記第1変換ステップで変換される多値画像から生成された別の画像を第2の変換方式で変換し、第2の変換係数を発生する第2変換ステップと、 前記第1の変換係数で構成されるブロック及び第2の変換係数で構成されるブロックの各々に対して、分割処理を繰り返すことにより有効な変換係数の位置を示す情報を含む符号化データを生成し、該符号化データを出力する符号化ステップとを有する画像処理プログラムをコンピュータから読み出し可能な状態に記憶した記憶媒体。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】本発明は画像を効率良く符号化することのできる画像処理装置及び方法及びこの方法を記憶した記憶媒体に関するものである。

    【0002】

    【従来の技術】近年PC(パーソナルコンピュータ)の性能が著しく向上するに従い、PC上で画像データが広く使われるようになってきている。 画像データは通常コンピュータ上でデジタル信号列として表現されるが、個々の画素が1つのデータに対応しているため、画像データは非常に大きい容量を占めるのが普通である。 特に画像データがコンピュータ及びこれらを相互に接続したネットワーク上で扱われる場合は、データ量の大きさが問題となることがある。

    【0003】上記背景から画像データを蓄積、伝送する際には圧縮符号化することが広く行われている。 このような画像圧縮技術としては、ITU−T勧告T. 81により多値静止画像を圧縮する標準化方式とされている通称JPEGが知られている。 JPEGは特に自然画像を圧縮するのに適しており、符号化対象画像を8×8画素サイズのブロックに分割し、ブロック毎に離散コサイン変換を施し、得られた変換係数を量子化し、エントロピー符号化される。

    【0004】コンピュータ、デジタルカメラなどの普及により画像データをPC上で扱うことが増えた結果、これらを加工編集する必要性も増大している。 このような用途においては、画像データは画像を構成する何等かの対象物(オブジェクト)を単位として構成されることが望ましい。

    【0005】例えば、背景に人物が映っている様な画像に対して、この人物の部分のみにカラーバランス調整を行いたい場合には、背景と人物が予め異なる単位のデータとして画像データに含まれていれば、人物のみを加工することが容易である。

    【0006】例えばJPEGの圧縮符号化を実行する際に、符号化対象画像は符号化処理の過程でブロックに分割されるが、基本的に符号化の対象となるのは画像全体であるのでJPEGで圧縮符号化された画像に対して上述の様なカラーバランス調整等の加工を行う場合は、復号された画像から対象物を抽出する処理を行ってから該当する部分に加工を行う必要があった。

    【0007】一方、動画像を符号化する方式として、対象物毎に圧縮符号化を行う技術が研究されている。

    【0008】

    【発明が解決しようとする課題】しかしながら、静止画像を画像内の各対象物を単位として圧縮符号化する効率の良い方式は未だ確立されていない。

    【0009】本発明は上記従来例に鑑みて成されたものであり、矩形、非矩形に関わらず多値画像情報を効率良く符号化するための符号化方式を提供することを目的とする。

    【0010】また同時に、同一の多値画像から得られる複数種類の画像データを効率良く符号化することのできる符号化方式を提供することも目的とする。

    【0011】

    【課題を解決するための手段】上述の課題を解決するために、本発明の請求項1に記載の画像処理装置によれば、多値画像を入する入力手段(例えば、本実施の形態における図1の入力部1に相当)と、該入力手段により入力された多値画像(同じく画像T)を第1の変換方式(同じく離散ウェーブレット変換に相当)で変換し、
    第1の変換係数を発生する第1変換手段(同じく離散ウェーブレット変換器2に相当)と、前記第1変換手段により変換される多値画像の形状を示す形状情報(同じく2値画像Sに相当)を第2の変換方式(同じく予測変換)で変換し、第2の変換係数を発生する第2変換手段(同じく予測変換器3に相当)と、前記第1の変換係数で構成されるブロック(同じく各サブバンドに相当)及び第2の変換係数で構成されるブロック(同じく2値画像Eに相当)の各々に対して、分割処理を繰り返すこと(同じく図3、図5に示す分割処理に相当)により有効な変換係数の位置を示す情報を含む符号化データ(同じく図4のビットデータ列に相当)を生成し、該符号化データを出力する符号化手段(同じく領域分割器4に相当)とを有することを特徴とする。

    【0012】また、請求項11に記載の画像処理装置によれば、多値画像を入力する入力手段(例えば、本実施の形態における図1の入力部1に相当)と、該入力手段により入力された多値画像(同じく画像T)を第1の変換方式(同じく離散ウェーブレット変換に相当)で変換し、第1の変換係数を発生する第1変換手段(同じく離散ウェーブレット変換器2に相当)と、前記第1変換手段により変換される多値画像から生成された別の画像(同じく2値画像Sに相当)を第2の変換方式(同じく予測変換)で変換し、第2の変換係数を発生する第2変換手段(同じく予測変換器3に相当)と、前記第1の変換係数で構成されるブロック(同じく各サブブロックに相当)及び第2の変換係数で構成されるブロック(同じく2値画像Eに相当)の各々に対して、分割処理を繰り返すこと(同じく図3、図5に示す分割処理に相当)により有効な変換係数の位置を示す情報を含む符号化データ(同じく図4のビットデータ列に相当)を生成し、該符号化データを出力する符号化手段(同じく領域分割器4に相当)とを有することを特徴とする。

    【0013】

    【発明の実施の形態】以下、本発明の実施の形態を、図面を用いて詳細に説明する。

    【0014】(第1の実施の形態)図1は、本発明による画像処理装置のブロック図である。 同図において、入力部1にはデータ線101を介して符号化の対象となる画像P(符号化対象画像P)が入力される。 本実施の形態では符号化対象画像Pに含まれる対象物(車)を符号化することが目的であるが、入力画像データそのものは非矩形の車を含む矩形の領域にする。 なお、上記対象物は本来の1画面の画像に点在する複数個の対象物の1つである。 よって、符号化対象画像Pの大きさは通常1画面よりも小さいサイズである。

    【0015】入力部1は、入力した符号化対象画像Pを示す画像データから非矩形の対象物である車の輪郭形状を検出し、背景部分(対象物でない部分)に0、対象物部分を1として表現する2値画像Sを生成し、データ線102、103に出力する。 一方で対象物そのものを表す多値画像Tを生成し、データ線104へ出力する。 なお画像Tは入力画像Pと全く同じであっても良いが、後段の符号化効率を向上させるために対象物以外である背景部分を適当な値(例えば白を表す値)に置き換えても良い。 ただし、この符号化対象画像Pの符号化データを復号して得られる画像の内、通常使用される画像は非矩形の車の部分だけであるので、データ線104へ出力される多値画像Tの背景部分はどのような値であっても特に問題はない。

    【0016】上記多値画像Tは離散ウェーブレット変換器2において離散ウェーブレット変換が施され、2値画像Sは予測変換器3において予測変換が施される。 そして、上記各変換により得られた変換係数は、領域分割器4に入力され符号化される。 更に符号化されたデータは伝送路を介して復号機能を有する外部装置に伝送したり、内外の記憶部に一時的に記憶しておき必要に応じて復号機能を有する自装置或いは他装置が読み出して復号再生することが可能である。

    【0017】ここで入力部1における2値画像Sの生成方法には、例えば画像Pからエッジを抽出し、このエッジからなる閉領域を対象物とする等の方法を適用しても良いし、直接オペレータが対象物の輪郭を指定する方法を適用しても良い。 以下符号化対象画像Pが多値画像T
    及び2値画像Sに分離された後の処理について詳細に説明する。

    【0018】離散ウェーブレット変換器2は、入力された多値画像Tに対して離散ウェーブレット変換を施し、
    所定数の周波数帯域(以降サブバンドと称する)に分解する。 なおこの離散ウェーブレット変換は公知であるので簡単に説明する。

    【0019】図2に、多値画像Tに対して離散ウェーブレット変換を施すことにより生成されるサブバンドの概念図を示す。 図2(b)において、入力されてくる多値画像Tは、図の様に平、垂直の各方向について低域通過フィルタH0及び高域通過フィルタH1の何れかを通過し、フィルタを通過する毎にサブサンプリングを行うことにより複数の周波数帯域に分解される。 上記離散ウェーブレット変換をを施した後に得られる結果を図2
    (a)に示す。 図において、サブバンドHL1,HH
    1,LH1のそれぞれは元の画像Tの最も高周波成分を表す変換係数を含み、サブバンドHL2,HH2,LH
    2がその次に高い周波数成分を表す変換係数を含み、サブバンドHL3,HH3,LH3が本実施の形態では一番低い周波数成分を表す変換係数を含んでいる。 なおサブバンドLLは元の画像Tを縮小した様な画像を示す変換係数で構成される。

    【0020】このようにして得られた各サブバンドには、各々異なる周波数成分の変換係数が含まれており、
    この変換係数は後段の領域分割器4に出力される。 なお本実施の形態では各サブバンド単位で、低周波成分に相当するサブバンドLLを最初に出力し、続いてHL3、
    LH3、HH3を出力し、続いてHL2、LH2、HH
    2を出力し、続いてHL1、LH12、HH1を出力する様にする。 この様に低周波成分のサブバンドから先に出力し、順次符号化データを得ることにより、復号の際には低周波成分から階層的に復号し、順次高画質な画像を再生することが可能になる。

    【0021】離散ウェーブレット変換器2から各サブブロックに相当する変換係数を入力する領域分割器4は、
    この変換係数の中から、ある一定範囲の値を有する係数(変換係数をビットプレーンで表現した場合に、各係数を示す最大の有意ビットが一定範囲のビットプレーンの高さ(後述のn max以上)に存在する様な変換係数)のみを抽出し、抽出された各変換係数の情報をビットデータ列として出力する。 この分割処理は、前記各サブバンドの変換係数を別のデータ形態に変換する符号化であると考えることができる。 なお、この領域分割器4の動作の詳細について以下に説明する。

    【0022】図3に、領域分割器4の動作を説明するための概念図を示す。

    【0023】領域分割器4は、順次入力するサブバンドの各々に対して、図3のフローチャートに示す手順に従って、各サブバンド内の変換係数をビットデータ列に変換する。 以下、このフローチャートを参照して説明する。

    【0024】なお、入力されてくる各サブバンドは図2
    の(a)に示した様にサイズが一様でない。 よって、説明を簡単にするため、各サブバンドの初期サイズは図5
    (a)に示す様な対象ブロックRのサイズであると仮定する。 即ち、対象ブロックRは領域分割器4において最初に処理されるサイズのブロックとして説明する。

    【0025】なお、図5(c)に示す各C0〜C3のサイズ或いは図5(a)及び(b)の斜線部のサイズは変換係数1つを表す最小のサイズである。 また、上記対象ブロックRは各サブバンドを領域分割器4で絶対値化された後のものである。 また、領域分割器4では各サブバンド(対象ブロックR)の各変換係数に相当する正負符号を別に保持しておき、必要に応じて符号化データとして利用するものとする。

    【0026】まず、対象ブロックR内の全ての変換係数ci(図5ではi=0〜63)に対する最大値cmax
    を求める。 そして更に、 n max =log 2 (|c max |) ・・・(式 1) となるn maxを求め、対象ビットプレーン番号nの初期値に設定する。

    【0027】図3において、S500では、現在設定されている番号nの値を用いて(式2)により対象ブロックTに関する閾値Thを求める。

    【0028】 Th=2 n・・・(式 2)

    【0029】次にS501において、現在の番号nが予め定められた最小ビットプレーン番号n min以上であるどうかを判断し、n min以上である場合にはS502に進み、n min以上でない場合には、対象ブロックRの処理を終了する。

    【0030】S502において、現在の番号nに関して、対象ブロックR内の係数の最大値c maxが |c max |≧Th ・・・(式 3) の場合、対象ブロックRに有意な変換係数があると判断し、S506に進む。

    【0031】一方、(式3)を満たさない場合はS50
    3に進み、対象ブロックRの中に有意な変換係数が存在しなかったことを示すためのビットデータ「0」を出力する。

    【0032】続いてS504、S505において、閾値Thの値をTh/2に更新すると共に、nの値を1つ減少(閾値とするビットプレーンの高さを1つ減少)させた後にステップS501に戻る。

    【0033】S506では、対象ブロックRの中に有意な変換係数が存在することを示すビットデータ「1」を出力する。

    【0034】S507では、現在の対象ブロックRが所定の大きさ(本実施の形態では2×2のサイズ)以下であるかどうか判別する。 この判別の結果、対象ブロックRが所定の大きさ以下である場合にはS508に進み、
    上記所定の大きさよりも大きい場合には、S509に進む。

    【0035】S508では、対象ブロックR内における全ての係数(本実施の形態の場合2×2=4つの変換係数)を表す第nビットプレーンからn minビットプレーンまでに相当するビットデータを出力すると共に、それら各係数に相当する正負符号を取り出して出力する。

    【0036】S509では、対象ブロックが2×2以上のサイズであり、まだ分割することができるので、対象ブロックRを更に小さいサイズの4つの対象ブロックR
    mに分割し、その各々の対象ブロックR mについて上記対象ブロックRに対する処理と同様にS500以降の処理を施す。

    【0037】以上の手順を、図5に示す実例を挙げて説明する。 図5の(a)は、最初に処理されるブロックとして定義された対象ブロックR(図2の各サブバンド)
    を示す図である。 本実施の形態の場合の対象ブロックR
    は、8×8の変換係数から構成されているものと考える。

    【0038】ここで説明する対象ブロックR内には、一定範囲内のビットプレーンに最大ビットが存在する有意な変換係数が1つ(斜線部の変換係数であり、値は「4
    0」とする)存在しており、ブロックR内では最大値である。 よって、それ以外の変換係数は有意でないものとし、それら変換係数の値は「0」として考える。 ただしこれにより多少の画質劣化が起こるが本実施例では許容範囲であるので問題にしない。 また、図3の手順に従って対象ブロックRを対象ブロックR mに順次分割する処理を行うと、図5の(a)→(b)→(c)の順番で分割されてゆくことになる。 以上の分割処理により順次出力されるビットデータは図4に示したものとなる。

    【0039】なお、上記処理はn=5となり、かつn
    min =3に設定されている場合である。 本処理を実行することにより、複数の多値変換係数からなるブロックから、各係数の位置及び係数値を表現できる図4の様なビットデータ列を出力できる。 なお、図4中に示す矢印は、本処理によりビットデータが生成される順番、
    及びこれを後段に出力する順番を示している。 矢印から、の順にビットが出力される。

    【0040】以下、上述の分割処理の様子を説明してゆく。

    【0041】対象ブロックが図5(a)のブロック、即ち対象ブロックRを処理する際には、まず多値変換係数の5ビット目のビットプレーン上に有意ビットが存在する係数があるか否かを検出する。 その際、その様な係数(有意係数)が左から2画素、右から2画素目に存在することが分かる。

    【0042】続いて、図5(a)の状態では有意係数の位置を定めるために、ステップS509に示す様にRを4分割する。 この結果、図5(b)に示すR0〜R3の対象ブロックが再構成される。 この時、対象ブロックR
    を4分割したことを示すビットデータ「1」が出力される。

    【0043】続いて、R0〜R3までの各対象ブロックについて同様の処理が行われる。 即ち、R0〜R3に対してもステップS500以降の処理が行われる。

    【0044】まず、対象ブロックR0について上記処理が行われるが、このブロックR0ではステップS502
    で「有意係数あり」と判断されるので、更にR00〜R
    03に4分割される。 その際、対象ブロックR0を4分割したこと示すビットデータ「1」が出力される。

    【0045】また、R0が更に4分割されたことにより、R1〜R3を処理する前に、先にR00〜R03の各ブロックについて、S500からの処理が行われる。

    【0046】対象ブロックR00について上記処理を施した場合、S507では対象ブロックR00のサイズが2×2であることから、S508に処理が進む。 よって、R00については、ブロック内の各係数に相当する第5〜3ビット目までのデータ、即ち有意係数の有無を示す3ビットデータ「000」、「000」、「00
    0」、「101」、と、各係数の正負符号を示す1ビットデータ「0」、「0」、「0」、「0」が図の順番で添付出力される。 以上が矢印のビットデータ列に相当する。

    【0047】以上でR00に関する全ての分割処理が終わるので、続いてR01の処理が行われる。 R01内の各変換係数には3ビット目から5ビット目までに有意係数が1つも存在しない。 よって、n=3、4、5に対して、ステップS502、ステップS503〜S505を繰り返し経て、番号nが3未満になるまで「有意係数無し」を示す「0」が出力される。 続いてR02、R03
    の処理も同様に行われることにより、「000」、「0
    00」、「000」が出力される。 以上が矢印のビットデータ列に相当する。

    【0048】以上でR0(R00〜R03)の分割処理の全てが終わるので、続いてR1〜R3を処理する。 R
    1〜R3内の何れの変換係数にも、3〜5ビット目に有意係数が1つも無いのでR01〜R04と同様に「00
    0」、「000」、「000」が出力される。 以上が矢印のビットデータ列に相当する。

    【0049】通常のテクスチャ画像のウェーブレット変換係数は、空間的に局在するため、このように、有意な係数の位置を領域分割の有無を表すビット情報に置き換えることにより、係数の位置と値を非常に少ないビット数で符号化することができる。

    【0050】次に、形状画像Sを符号化する場合について説明する。

    【0051】図1において入力部1から出力された形状画像Sは、予測変換器3においてその輪郭部分のみに値「1」を持つデータ列に変換される。 即ち予測変換器3
    は図6に示す様に、入力した形状画像Sの輪郭部分のみに値「1」が対応する予測誤差を2値画像Eとして出力する。 この予測誤差は(式4)に示す様に、隣接画素間の排他論理和を取ることにより生成し、出力される。

    【0052】 e(x)=s(x−1)〔排他的論理和〕s(x) ・・・(式 4) ここでs(x)は形状画像Sにおける予測変換の対象画素であり、e(x)はこの予測により得られる画像Eの個々の画素値すなわち予測誤差であり、xは各画素のインデックスである。 なお、x=0の場合にはs(x−
    1)が得られないが、本実施の形態ではこの位置が対象物外であると仮定し0と置く様にする。 上記予測により得られた2値画像Eは上述したテクスチャ画像Tと同様に領域分割器4に出力される。

    【0053】なお、本実施の形態においては横方向のエッジを輪郭部分とする為に上記2値画像Eの生成方法は画像の横方向に順次処理するものとして簡単に説明したが、本発明はこれに限らない。 即ち、縦方向のエッジを輪郭部分としたい場合には順次(式4)を用いて予測して行けば良く、更に、完全な輪郭部分(2値画像E)を抽出したければ、縦横の両方向について(式4)の予測を行った結果をOR処理等で合成すれば良い。

    【0054】次に予測変換器3により得られた2値画像Eは、領域分割器4に出力される。 領域分割器4は、この2値画像Eを、離散ウェーブレット変換器2から出力されたサブバンドと同様に扱うことにより、ほぼ同様のステップを用いて処理することができ、2値画像Eを分割した際の分割結果を示す分割情報と、上記変換により得られたビット情報を出力する。

    【0055】ただし、離散ウェーブレット変換器2から出力されたサブバンド内の変換係数(多値画像)とは異なり、2値画像E内の予測誤差値は0または1に限定されている。 よって、領域分割器4は、この分割器4に入力されてくるデータが離散ウェーブレット変換器2から発生したサブバンドを構成するものなのか、或いは予測変換器3から発生した2値画像Eを構成するものなのかを表す情報を、データ線103を介して入力部1から別に入力することにより、領域分割処理及びビットデータ列の出力方法を切り換える様にする。

    【0056】次に予測変換器3により得られた2値画像Eを領域分割器4で分割処理する際の具体的な処理を説明する。

    【0057】離散ウェーブレット変換器2から入力された各サブバンドを領域分割することにより図4の符号化データを出力するのに対して、予測変換器3から入力された2値画像Eを領域分割することにより符号化データを出力する場合には以下の2点について処理方法が異なる。

    【0058】1つは、初期化時において2値画像Eの全体を上述した対象ブロックRとして設定する。 なお、ここでの対象ブロックRとは、領域分割器4において最初に処理されるサイズのブロックであることを意味しており、2値画像Eのサイズが図5(a)に示すサイズであるわけではない。

    【0059】次に n max =0 (式 5) とし、対象ビットプレーン番号n及び最小ビットプレーン番号n minを0とする。

    【0060】もう1つは、2値画像Eの分割処理では、
    単に1ビットの予測誤差係数からなるブロックを分割すれば良いので、図4の様に有意係数の有無を示す3ビット及び正負符号を示す1ビットを出力する代わりに、予測誤差の1ビットを示すデータのみが出力される様になる。

    【0061】図を用いて具体的に説明すると、図5の(a)に示す対象ブロックRが2値画像E(この場合、
    斜線領域c3は予測誤差値「1」を示し、それ以外の領域は「0」を示すと考える。 )とすると、出力されるビットデータ列は図5の(d)において、 c0=c1=c2=0 c3=1 R01=R02=R03=0 R1=R2=R3=0 となる。 これに、対象ブロックR、或いはR0〜R3、
    或いはR00〜R03内に有意係数が存在するか否かを示す矢印の3つの「1」を考慮すると、矢印の順にビットデータ列「1110001000000」が出力される。 上記2点以外は基本的には多値の変換係数(サブバンド)を領域分割することによりビットデータ列(符号化データ)を生成した場合と同様であるので説明を省略する。

    【0062】図7に、以上で説明した多値画像T及び形状画像Sの符号化により生成される符号化データのデータ形態の概念図を示す。

    【0063】図7(a)は、本実施の形態の画像処理装置が最終的に出力する符号化データの全体構成を示したものであり、ヘッダ情報とコードストリームから構成されている。

    【0064】ヘッダ情報は、図7(b)に示される様に、符号化した画像Pのサイズ等の復号時に必要となるジオメトリ情報と、離散ウェーブレット変換(DWT)
    のレベル、フィルタの種別等の変換に要するパラメータから構成されている。

    【0065】またコードストリームは、図7(c)に示される様に、大別して形状画像Sに関する部分と、多値画像Tに関する部分から構成されており、それらの先頭には該当する種別を表すヘッダから始まっている。

    【0066】形状データには上述した方法で2値画像E
    を領域分割して得られたビットデータ列が図7(d)に示すように含まれている。

    【0067】一方テクスチャデータには、各サブバンド内の変換係数を示す多値ビットの内、有意係数が存在する最も高いビットプレーンの番号n maxが各サブバンド毎に含まれている。 なお、本実施の形態においてn min
    は符号化される各サブバンドで共通とするが、n maxと同様にn minの情報も符号化データに含ませる様にしても良く、この様にすれば各サブバンド毎にn minを異ならせることも可能である。 なお、形状データに関しては、符号化される値(2値画像Eの各係数)が2値であるのでn max 、n minの情報は必要ない。

    【0068】図7(e)は、多値画像Tのコードストリームの構成を示しており、このコードストリームは更に離散ウェーブレット変換のサブバンド毎に構成されている。 またLL〜HH1は図2に示したサブバンドの名称と同じである。 この様に高周波成分のサブバンドから先に出力することによりプログレッシブ符号化が可能である。

    【0069】図7(f)において、その内容は図に示す様に分割ビットと係数ビットの2種類のビットストリームが交互に現れている。 ここで分割ビットとは図3のフローチャートにおけるS503及びS506で出力されるビットに相当し、係数ビットとはS508で出力されるビットに相当する。

    【0070】次に本実施の形態の符号化で得られた符号化データを、更に復号化する方法について説明する。

    【0071】図8は、本実施の形態の符号化で得られた符号化データを復号化する装置を示すブロック図である。 以下に同図を用いて詳細に説明する。

    【0072】上述の符号化機能を有する外部装置から伝送路を介して入力、或いは内外の記憶部から読み出して入力した図7に示される符号化データは、まずヘッダ情報解析器6において原画像の大きさ等の必要な情報を認識し、復号化に必要な情報として記憶する。

    【0073】またヘッダ情報解析器6は符号化データにおけるヘッダ(図7(c)参照)に基づいて、順次読み込まれるコードストリームの一部が多値画像Tとして符号化されたデータであるか、形状を示す2値画像Sとして符号化されたデータであるかを判別し、判別の結果を切り換え器7へ出力する。 更にヘッダ情報解析器6は、
    多値画像Tを復号化する際には、復号化に必要な情報として、上記ヘッダに後続するコードストリームから多値画像Sとして符号化された各サブバンドに対してのn
    maxを認識し、領域分割器5に出力する。 なお2値画像Sを符号化した際のn maxについては符号化データに含まれていないので、2値画像Sの符号化データを復号化する際には、自動的に領域分割器5にn max =0を出力する。

    【0074】また、上記符号化データ中のコードストリーム(図7(c)〜(f)参照)は領域分割器5にも入力される。 領域分割器5は、符号化時に領域分割器4で各ブロックを分割した際に得られたビットデータ列(分割ビット及び係数ビット或いは予測誤差ビット等)から、図1の領域分割器4へ入力される直前のデータ(変換係数からなる各サブブロック或いは2値画像E)を復元するためのものである。

    【0075】以下図9のフローチャートにより、領域分割器5が、多値画像Tを符号化して得られたデータに基づいて多値画像Tを再生する動作を説明する。 なお、本実施の形態では、符号化側で複数のサブバンドを符号化(領域分割)する際の順序は、決まっているものとする。 よって復号化するサブバンドの順序も一意的に決定する。

    【0076】まず、あるサブバンドに対応するコードストリームから、これに該当するサブバンドの領域を確保し、このサブバンドの大きさに相当する領域を対象ブロックRの初期値とし、この領域内の係数を全て0に初期化し、かつブロック図7(e)のヘッダから得られるn
    maxを対象ビットプレーンnの初期値とする。

    【0077】次にS900において、nが所定の最小ビットプレーン番号n min未満の場合には対象ブロックR
    の処理を終了する。

    【0078】S901において、コードストリームから分割ビットを1ビット読み込む。

    【0079】S902,S903において、読み込んだ分割ビットの値を調べ、それが0の場合、nを1減じてステップS900に戻る。

    【0080】S904,S905において、現在の対象ブロックRが所定の大きさ、例えば縦横2画素以下の場合は、係数ビットをコードストリームから読み込み、領域内の全ての係数を復元する。

    【0081】S906において、現在の対象ブロックR
    を4つの小領域Rmに分割し、その各々についてS90
    0以降と同じ処理を順次行う。

    【0082】以上の手順を実例を挙げて詳細に説明する。 図11の(a)から(d)は対象ブロックRの復元状態を示し、図10は順次入力されてくる対象ブロックRに関するコードストリーム(ビットデータ列)を示したものである。 なお本説明では、図4のビットデータ列と図10のそれとは同一のものであるとして説明する。

    【0083】ここで図10中に示す矢印'''
    は、実際にビットデータ列が入力される順序を表しており、'→'→'の順に1ビット毎に入力される。

    【0084】初期状態では図11(a)に示す様に、対象ブロックRは全て0に初期化されており、分割されていない。 ここでステップS901により、矢印'の最初の1ビットの分割情報「1」が入力される。 これによりブロックR内には現在のビットプレーンnにおいて少なくとも1つの有意係数が存在することが判断できる。
    よって、ステップS906においてブロックRが4つの小ブロックR0〜R3に分割され、図9(b)の状態になる。

    【0085】次にR0の復元処理が行われる。 まずステップS901において矢印'の2番目のビット(分割ビット「1」)が入力される。 このビットによりR0内の変換係数に少なくとも1つの有意画素が存在することが判断できる。 よって、ブロックR0については更に4
    つの小ブロックR00〜R03に分割し、図9(c)の状態になる。

    【0086】なおこの時点で、最初の小ブロックR0が更に小ブロックに分割されたので、R1〜R3の分割処理よりも前に、R00〜R03の復元処理を優先的に行う。 これらの処理の優先度は符号化時のものと全く同じであるので、符号化時と同一の分割処理を行うことができる。

    【0087】まずブロックR00について、ステップS
    900から処理が行われる。 ここでステップS901で矢印'の3番目のビット(分割ビット「1」)に示す分割ビットが入力されと、R00内に少なくとも1つの有意な変換係数が存在すると判断できる。 しかしながら、R00の大きさが縦横2画素に相当しているので更なる分割は行われずにステップS905に進み、矢印'の残りのビットデータ列を変換係数を示す値であるとして扱う。

    【0088】ここでは、符号化データに含まれる情報からn max =5が分かっており、かつn minの値も予め分かっているので、各変換係数を何ビットで表現しているかが判断できている。 よって、入力するビットデータ列のうち最初の3ビットをc0の3〜5ビット目を示す値であると考えて扱い、続く1ビットをこの変換係数の正負符号であると考えて扱う。 これによりc1〜c3については変換係数「0」を復元し、c3については変換係数「40」を復元する(図9(d)参照)。

    【0089】以上でブロックR00が全て復元(分割)
    されたので、続いて矢印'で入力されるビットデータ列が、R01以降を復元(分割)するためのものであることが分かる。

    【0090】そしてブロックR01を復元するために入力される最初の1ビットが「1」でなく、最初から3ビットまでは「000」であるので、R01の5ビット目〜3ビット目に有意係数(即ち「1」)が1つも存在しないことが判断できる。 よって、ブロックR01内の変換係数を全て0として復元する。 同様にR02、R03
    も処理されて各ブロック内に変換係数0が復元される。

    【0091】更に、矢印'のビットデータ列に基づいて同様の処理を行うことにより、R1〜R3の各ブロックも変換係数「0」が復元される。 以上の動作は、対象物(本実施例では非矩形の車)の形状情報として符号化された2値画像Eを復元する場合も同様である。 ただし、この場合はn maxが符号化時と同様0に初期化され、正負符号のビットが含まれていない点が異なる。 これらの点を除き、復元処理についてはテクスチャ画像と同様の処理を行うだけで良いので詳細な説明を省略する。

    【0092】以上説明した手順により復元された係数(多値画像Tを表す各サブバンド或いは2値画像E)
    は、切り換え器7を介して逆離散ウェーブレット変換器8或いは逆予測変換器9に選択的に出力される。 この出力の切り換えは、上述したヘッダ情報解析器6による符号化データの解析結果に基づいて行われる。 即ち、ヘッダ情報解析器6は、切り換え器7に入力されてくる復元係数群が多値画像Tを離散ウェーブレット変換して得られた各サブバンドに相当するものであると判別した時には、これら復元係数群を離散ウェーブレット変換器8に出力し、切り換え器7に入力されてくる復元係数群が2
    値画像Sを予測変換して得られた2値画像Eに相当するものであると判別した時には、これら復元係数群を逆予測変換器9に出力する様に制御する。

    【0093】逆離散ウェーブレット変換器8は、入力された各サブバンドのデータに基づいて逆離散ウェーブレット変換を行うことにより多値画像Tを再生する。 また、逆予測変換器9は入力された2値画像E、即ち予測誤差に基づいて2値画像Sを再生する。

    【0094】以上のようにして復元された多値画像Tと2値画像Sは、後段の合成器10において1つの画像として復元され出力される。 具体的には2値画像Sが示す形状に基づいて矩形の多値画像Tにおける有効部分を判断し、有効部分に対応する多値画像Tのみを、対象物の画像として認識する。 この様にすれば非矩形の多値画像を効率良く符号化することが可能となる。 もちろん本実施の形態の符号化方法は、矩形の画像であっても符号化することが可能である。

    【0095】以上の様に再生された対象物は、図14に示す様に、この対象物よりも大きいサイズの1画面分の画像上の一部画像として使用されることができる。 即ち、図14の各対象物であるP1〜P4(非矩形)及び背景であるP5(矩形)を1画面を構成する部品として別々に上述の様に符号化すれば、必要な対象物のみ(例えばP3及び背景P5のみ)から構成される1画面分の画像を再生することが可能となる。

    【0096】また上記符号化復号化を行う際には、符号化側においては入力部の前段に図14に示す様な1画面分の画像からマニュアル或いは自動的に各対象物(画像P)を分離する分離手段を有し、復号化側には合成器1
    0により再生された各対象物(画像P)を、更に互いに合成する合成手段を装置内に有する。

    【0097】なお、上述した符号化機能と復号化機能は、必要に応じて別々の装置に存在しても良いし、1装置内に存在しても良い。

    【0098】以上の実施の形態によれば、任意形状を持つ対象物の多値画像を符号化する際に、対象物の形状情報(2値画像S)と実際の多値画像(画像T)とを効率良く符号化することができる。 即ち、離散ウェーブレット変換を用いることにより、多値画像Tの持つ空間領域の冗長性を除去できる。 また、予測変換を用いることにより、形状情報である2値画像の各変換係数も空間的に偏らせることができる。 よって、後段で共通して施される領域分割処理において、一部の有意係数とその他の大部分の非有意係数に効率良く符号化できる。 特に本発明ではこれらの係数からなる領域を分割する方法自体を符号化データとする効率の良い符号化方式を提供できる。

    【0099】なお、本実施の形態においては、矩形、非矩形の多値画像及びこの多値画像の形状情報を符号化するものとして説明したが、本発明はこれに限らない。 即ち、同一の多値画像から得られる画像(本実施の形態では画像T及び画像S)を別々の変換方式(同じく離散ウェーブレット変換及び予測変換)を用いて変換した後、
    分割処理を行う構成であれば本発明に含まれる。

    【0100】(第2の実施の形態)上記第1実施の形態では対象物の形状は2値画像としているが、本実施の形態では、これを多値画像とすることにより、復号時に対象物どうしで行われる画像合成に透かし合成を行うことを可能とする。 以下この方法について具体的に説明する。

    【0101】図12は本実施の形態における画像処理装置のブロック図である。 本実施の形態においては、入力部1に入力される画像に対して合成時に他の部分との合成比率を表す、いわゆるαチャンネルが指定できる様になっている。

    【0102】同図において、入力部1に入力された画像からは、多値画像T及びαチャンネルαが生成される。
    ここでαチャンネルは例えば4ビットの階調を持つ多値画像として表現される。 また符号化前の多値画像T上の位置(i、j)における係数値をx ijとし、復号化後の多値画像T上の位置(i、j)における画素値をx' ij
    とし、最終的に他の多値画像と合成する際の多値画像T
    上の位置(i、j)における画素値をx” ijとして表すと、この画素値x” ijは x” ij =(αij/15)x'ij (式 6) として表される。

    【0103】図12においてαチャンネルの値は、円形の対象物の中央部で高く、周辺部では低い値となっている。 よって、この対象物を他の多値画像と合成した場合には、合成画像においてこの対象物の周辺部分は薄く表現される。

    【0104】多値画像T及びαチャンネルαは、共に離散ウェーブレット変換器2で変換されるが、この処理の過程は第1実施の形態で説明したものと同様である。

    【0105】次に各変換係数は領域分割器4において位置と係数値が符号化されるが、αチャンネルαの分割処理を行う場合には、αチャンネルの役割上、復号された際に符号化前の元の値と等しい値が得られる様にすることが望ましい。 よって、本実施の形態においては最小ビットプレーン番号n minを0に設定する様にする。 これにより、離散ウェーブレット変換器2における変換が完全再構成条件を満たすものであれば、復号時にαチャンネルαの値は完全に復元される。

    【0106】図13に本実施の形態によるデータ形態の概念図を示す。 全体の構造は第1実施の形態によるものと同じであるが、本実施の形態においては形状データに関してもウェーブレット変換が用いられているために、
    テクスチャヘッダ内にも最大ビットプレーン及びウェーブレット変換レベルに関する情報が含まれている。 最小ビットプレーンに関しては0であることが明確であるため含まれていない。

    【0107】また形状データはテクスチャデータと同じ構造を取り、分割ビットと係数ビットを含む各サブバンドデータから構成されている。 復号処理に関しては、第1実施の形態におけるテクスチャデータの復号と同じであるので説明は省略する。

    【0108】このようにして復号化された多値画像T及びαチャンネルαは復号化側において順次記憶され、他の画像との合成の際には、復号化されたαチャンネルα
    を参照しつつ、多値画像Tを他の画像に合成する。

    【0109】なお、本実施の形態では形状情報であるα
    チャンネルαに対してウェーブレット変換を用いているが、αチャンネルの値が限られたものである場合は他の変換方式、例えば予測変換を用いても良い。 特にαチャンネルの値が2値である場合には、ウェーブレット変換を行うことにより係数のレンジが増えてしまうので符号化効率があまり良くない。 この様な場合には、第1実施の形態の様にした方が効率が高い圧縮効率を得ることができる。

    【0110】以上の実施の形態によれば、任意形状を持つ対象物の多値画像を符号化する際に、対象物の形状情報(αチャンネルα)と実際の多値画像(画像T)とを効率良く符号化することができる。 即ち、離散ウェーブレット変換を用いることにより、多値画像T及びαチャンネルαの持つ空間領域の冗長性を除去できる。 よって、後段で共通して施される領域分割処理において、一部の有意係数とその他の大部分の非有意係数に効率良く符号化できる。 特に本発明ではこれらの係数からなる領域を分割する方法自体を符号化データとする効率の良い符号化方式を提供できる。

    【0111】以上の様に再生された対象物は、第1の実施の形態と同じく、この対象物よりも大きいサイズの1
    画面分の画像上の一部画像として使用されることができる。 即ち、各対象物を1画面を構成する部品として別々に上述の様に符号化すれば、必要な対象物のみから構成される1画面分の画像を再生することが可能となる。

    【0112】また上記符号化復号化を行う際には、符号化側においては入力部の前段に図14に示す様な1画面分の画像からマニュアル或いは自動的に各対象物(画像P)を分離する分離手段を有し、復号化側には合成器1
    0により再生された各対象物(画像P)を、更に互いに合成する合成手段を装置内に有する。

    【0113】なお、上述した符号化機能と復号化機能は、必要に応じて別々の装置に存在しても良いし、1装置内に存在しても良い。

    【0114】(変形例)なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタ等)から構成されるシステムの1部として適用しても、1つの機器(たとえば複写機、ファクシミリ装置)からなる装置の1部に適用してもよい。

    【0115】また、本発明は上記実施の形態を実現するための装置及び方法のみに限定されるものではなく、上記システム又は装置内のコンピュータ(CPUあるいはMP
    U)に、上記実施の形態を実現するためのソフトウエアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させることにより上記実施の形態を実現する場合も本発明の範疇に含まれる。

    【0116】またこの場合、前記ソフトウエアのプログラムコード自体が上記実施の形態の機能を実現することになり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給するための手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。

    【0117】この様なプログラムコードを格納する記憶媒体としては、例えばフロッピーディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。

    【0118】また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施の形態の機能が実現される場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているOS(オペレーティングシステム)、あるいは他のアプリケーションソフト等と共同して上記実施の形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。

    【0119】更に、この供給されたプログラムコードが、コンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能格納ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上記実施の形態が実現される場合も本発明の範疇に含まれる。

    【0120】

    【発明の効果】以上説明した様に本発明によれば、矩形、非矩形に関わらず多値画像情報を効率良く符号化することができる。 また、同一の多値画像から得られる複数種類の画像データを効率良く符号化することができる。

    【図面の簡単な説明】

    【図1】第1の実施の形態のブロック図

    【図2】離散ウェーブレット変換器の動作説明図

    【図3】符号化での領域分割器の動作説明図

    【図4】領域分割により発生するビットデータ列を示す図

    【図5】領域分割の様子を示す図

    【図6】2値画像Eを作成する様子をを示す図

    【図7】第1の実施の形態の符号化データを示す図

    【図8】第1の実施の形態の復号器を示す図

    【図9】復号時の領域分割器の動作説明図

    【図10】復号時に処理されるビットデータ列を示す図

    【図11】領域分割により画像を復元する様子を示す図

    【図12】第2の実施の形態のブロック図

    【図13】第2の実施の形態の符号化データを示す図

    【図14】符号化前或いは復号化後における全体画像の様子を説明する図

    【符号の説明】

    1 入力部 2 離散ウェーブレット変換器 3 予測変換器 4 領域分割器 5 領域分割器 6 ヘッダ情報解析器 7 切り換え器 8 逆離散ウェーブレット変換器 9 逆予測変換器 10 合成器

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈