Device and method for picture compression专利检索-静态图像压缩标准多媒体工具与应用专利检索查询-专利查询网

Device and method for picture compression

阅读：1005发布：2020-08-29

专利汇可以提供Device and method for picture compression专利检索，专利查询，专利分析的服务。并且PURPOSE:To realize the compression method and device for a still picture in compliance with the JPEG standards with a simple arithmetic operation. CONSTITUTION:Picture element data are converted by a horizontal direction conversion section (adder array) 110 and rotated vertically by a rotation RAM 112 and then converted by a vertical direction conversion section (adder array) 116 and finally outputted via a single multiplier 120.，下面是Device and method for picture compression专利的具体信息内容。

权利要求

【特許請求の範囲】

【請求項１】あるビット幅を持つ入力画素を受け取り、加算器アレイ手段のみを使用して該入力画素を水平方向に変換するための水平方向変換手段、水平方向に変換された画素を垂直に回転させるための転換メモリ手段、垂直画素を受け取り、別の加算器アレイ手段のみを使用して該垂直画素を垂直方向に変換するための垂直方向変換手段、及び、変換された垂直画素を受け取り、該垂直画素に対し単一の乗算関数を実行して該入力画素を表わす圧縮された画素データを提供する単一乗算器手段を有することを特徴とする画像圧縮装置。

【請求項２】画像を表わす入力画像画素データを受け取るための手段を有し、また該画像データを圧縮するための一般化チェン変換（ＧＣＴ）手段を有し、該ＧＣＴ
手段は加算器のみを使用して該画像データを水平方向に変換するためのＧＣＴ加算器手段を含み、また水平方向に変換された画素を垂直に回転させるための転換メモリ手段を有し、該ＧＣＴ加算器手段は該加算器のみを使用して垂直画素を垂直方向に変換するための手段を含み、
また該変換された垂直画素に対し乗算関数を実行し、該入力画素を表わす圧縮された画素データを提供する乗算器手段を有することを特徴とする画像圧縮装置。

【請求項３】該ＧＣＴ加算器手段が、該水平方向変換及び垂直方向変換の前半部の変換のための第１のＧＣＴ
加算器ネットワークステージ、及び、該水平方向変換及び垂直方向変換の後半部（the second half）の変換のための第２のＧＣＴ加算器ネットワークステージを含むことを特徴とする請求項２記載の画像圧縮装置。

【請求項４】該第１及び第２の加算器手段が、タイムシェアリング方式で画像画素を水平方向及び垂直方向に変換することを特徴とする請求項３記載の画像圧縮装置。

【請求項５】該乗算器手段がジグザグ順序手段を含むことを特徴とする請求項４記載の画像圧縮装置。

【請求項６】該乗算器手段が丸め手段を含むことを特徴とする請求項５記載の画像圧縮装置。

【請求項７】画像圧縮装置において、あるビット幅を持つ入力画素を受け取り、加算器アレイ手段のみを使用して該入力画素を水平方向に変換するステップ、水平方向に変換された画素を垂直に回転させるステップ、垂直画素を受け取り、別の加算器アレイ手段のみを使用して該垂直画素を垂直方向に変換するステップ、及び、変換された垂直画素を受け取り、該垂直画素に対し単一の乗算関数を実行して該入力画素を表わす圧縮されたデータを提供するステップを有することを特徴とする画像圧縮方法。

说明书全文

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、画像を圧縮するための装置及び方法に係り、特にＪＰＥＧ(ＪointＰhotograph
ic Ｅxperts Ｇroup)の静止画像圧縮標準に適合した、
静止画像の圧縮のための装置及び方法に関する。

【０００２】

【従来の技術】メモリや伝送費用を節約するため高品質画像を圧縮しなければならない場合、通常のやり方は、
画像をその情報をよりコンパクトに表現可能な別の空間に変換することである。この変換は普通、１ブロックずつ線形変換（マトリクス乗算）により行なわれる。すなわち、典型的手法は、８画素の行セグメントに対し８ポイント変換を行ない、次に、この行変換後の画像の８エレメント列セグメントに対し８ポイント変換を行なう方法である。等価的に、８×８のブロックに配列した６４
画素の画素ブロックに対し、１回の６４ポイント変換を行なうことができる。

【０００３】一次元変換のための良い方法は、次の離散的チェビシェフ変換である。

【数１】

【０００４】この変換にはいくつかの利点がある。これには、ａ）この圧縮はいくつかの尺度に関しては、ほぼ最適であること、ｂ）この変換及び逆変換を実行するための高速演算アルゴリズムがあること、ｃ）引用文献［１］に述べられているある仮定をおけば、鮮明化（初期画像の品質向上）を変換空間内で容易におこなうことができること、がある。

【０００５】

【発明が解決しようとする課題】本発明の一つの目的は、静止画像の圧縮装置及び方法を提供することである。本発明の特に目的とするところは、ＪＰＥＧの変換と適合した静止画像の圧縮のための装置及びその方法を提供するにある。

【０００６】本発明の他の目的、利点及び新規な特徴は、以下の記述において一部示されるが、また一部は、
以下の説明から当業者にとって明らかになるであろうし、あるいは本発明の実施により学習できるであろう。
本発明の目的及び利点は、特許請求の範囲に示された手段とその組み合わせによって実現、達成できる。

【０００７】

【課題を解決するための手段】本発明の画像圧縮装置は、あるビット幅を持つ入力画素を受け取り、加算器アレイ手段のみを使用して該入力画素を水平方向に変換するための水平方向変換手段、水平方向に変換された画素を垂直に回転させるための転換メモリ手段、垂直画素を受け取り、別の加算器アレイ手段のみを使用して該垂直画素を垂直方向に変換するための垂直方向変換手段、及び、変換された垂直画素を受け取り、該垂直画素に対し単一の乗算関数を実行して該入力画素を表わす圧縮された画素データを提供する単一乗算器手段を有することを特徴とする。

【０００８】

【作用】本発明によれば、あるビット幅を持つ入力画素は、加算器アレイ手段のみを使用して水平方向に変換され、この変換後の画素は垂直に回転させられる。そして、この回転後の垂直画素は、別の加算器アレイ手段のみを使用して垂直方向に変換され、変換後画素に単一の乗算関数を実行することにより入力画素を表わす圧縮データが生成される。このように、演算コスト並びにハードコストが高い乗算を殆ど使用せず、ほぼ加算操作のみによって画像圧縮が可能である。

【０００９】

【実施例】以下、本発明の原理及び具体例について、必要に応じ関連する従来技術と対比しつつ詳細に説明する。

【００１０】発明の理論的説明画像の圧縮と再構築のための完全なシステムは次の（表１）のように示すことができる。

【表１】

【００１１】上記（表１）は本発明を説明しており、またオプションのステップ（Ｌ，Ｚ）を除き現行技術をも説明している。

【００１２】鮮明化ウエートによる乗算（ステップＥ）
も復号のステップとして（例えばステップＩの後に）行なうことができる。この鮮明化は、入力装置のポイント拡散関数（point-spread function）の補正のために行なわれるもので、入力装置に応じて調整されなければならず、あるいは入力画像が画質向上済みのときは省略しなければならない。他により優れた画像鮮明化方法があるが、ここで示した方法は計算コストが小さいので、ある種のアプリケーションに、例えばカラー・コピアにふさわしい。

【００１３】フォワード変換（ステップＡ，Ｂ）の計算を、最終の乗算ステージが計算負荷の大部分となるようにアレンジすることができる。これらの乗数とステップＣ，Ｅの乗数の積を予め計算することにより、圧縮プロセスの高速化が可能である。

【００１４】同様に、逆変換（ステップＪ，Ｒ）の計算を、その計算負荷の大部分が予備乗算ステージとなるようにアレンジすることができる。これもまた、積を予め計算することにより、ステップＨ，Ｉの計算量を効果的に削減できる。

【００１５】また、２−ＤＤＣＴ変換を他の変換で置き換えることにより、演算をさらに単純化できる。

【００１６】さらに、ステップＢ，Ｄのための結合した乗数の演算、例えば２のべき乗を効率化するように、心理的適応ウエートを選択的に変化させることができる。
低エネルギー出力変換要素の心理的適応ウエートの小変化は、画像の品質または圧縮率に殆ど影響を及ぼさない。

【００１７】最後に、（表１）のステップＬ，Ｚ、すなわち画像の複雑さ（Ｄifficulty）の類別のステップとブロック境界の平滑化のステップに注目する。これらはオプションであって、また基本発明とは無関係であるので、ここでは最小限の説明しかしない。

【００１８】チェン（Chen）のアルゴリズム１次元チェン・アルゴリズムは次のように規定する。

【数２】

【００１９】ここで、ｘはデータベクトル、Ｘは変換後ベクトル、またＡ _Nは次の通りである。Ａ _N ＝ｃ（ｋ） cos((2j + 1) kπ／2N) j,k = 0,1,2,....,N-1

【００２０】さらに、Ａ _Nは次のように展開できる。

【数３】

【００２１】ここでＲ _N/2は次の通りである。

【数４】Ｒ _N/2 = c(2k+1) cos((2j+1)(2k+1)π/2N j,k=0,1,2,....,N/2-1

【００２２】注意すべきは、行列Ｚがチェンの行列Ｐであることである。本発明で、このように表記を変更したのは、行列Ｐとの混乱を避けるためである。

【００２３】８ポイント（Ｎ＝８）１Ｄチェン変換の例８ポイント変換を１回行なうために、チェン・アルゴリズム（数３）が再帰的に２回用いられる。最初の繰り返しでは行列Ｚ ₈ ，Ｒ ₄ ，Ｂ ₈が用いられる。２回目の繰り返しでＡ ₄について解き、そして行列Ｚ ₄ ，Ｒ ₂ ，Ａ ₂ ，Ｂ
₄を用いる。これらの行列は、前記各式またはチェンの論文から容易に導くことができる。

【数５】

【００２４】ここで

【数６】

【数７】

【数８】

【数９】

【数１０】

【数１１】

【数１２】

【００２５】ここで、（数４）から Cn = cos(nπ/16)

【００２６】チェン−ウー（修正）変換またはパラメタライズされた（parameterized）変換ここまで行なったことは全てチェン変換である。これを強引に推し進め演算量を減らし、強力なＤＣＴを実現することもできない訳ではないが、これは本出願人の提案するところではない。乗算回数をできるだけ減らすために、各行列は次のように改めてパラメタライズ（repara
meterize）される。これは本出願人の考案であって、チェン−ウー（修正）変換と呼ぶ。

【数１３】

【数１４】

【数１５】

【００２７】ここで

【数１６】 a = C1/C7 = cos(π/16) / cos(7π/16) = tan(7π/16) b = C2/C6 = tan(6π/16) c = C3/C5 = tan(5π/16) r = C4 = cos(4π/16)

【００２８】注意すべきは、対角行列RF ₄はパラメタライズされない行列RA ₄の正規化因数を含んでおり、また対角行列はR ₂及びA2中の定数によって作ることができる。 A ₈行列の再構成の際、二つの行列は依然として別個である。対角行列は主行列からは分離されている。主行列はB _N項と乗算される。適当に並べ変えかつ定数項と乗算すると、（数２）は次のように簡略化される。 X = Q(a,b,c) P(a,b,c,r) x

【００２９】ここで

【数１７】

【数１８】

【００３０】一般化した変換一般化した８ポイントＤＣＴ変換は、４個のパラメータａ，ｂ，ｃ及びｒによって決定され、次のように記述できる。Ｔ（ａ，ｂ，ｃ，ｒ）＝Ｐ（ａ，ｂ，ｃ，ｒ）×Ｑ
（ａ，ｂ，ｃ）ここでＰ（），Ｑ（）は前記の通りである。

【００３１】この画像変換は、そのような画像を垂直方向及び水平方向にそれぞれれ変換するための二つの変換Ｔ、すなわちＴ _vとＴhを必要とする。完全な２次元変換は、

【数１９】

により表わされる。

【００３２】ここで、ｆは入力画像ブロックであり、Ｆ
は出力変換係数であり、添え字”ｔ”は行列転置を意味する。ここで全行列は８×８である。

【００３３】対角行列（Ｑのような行列）はそれ自体が転置行列であって、全行列について

【数２０】

【００３４】これは次のように変形される。Ｆ（ｉ，ｊ）＝ｑ（ｉ，ｊ）＊ｇ（ｉ，ｊ）ここで

【数２１】

【数２２】

【００３５】ひとつの画像ブロックを変換する時に、チェン-ウー(Chen-Wu)のアルゴリズムを用いて［ｇ］について解を求め、次に因数ｑ（ｉ，ｊ）と掛け合わせる必要がある。

【００３６】仮にＰ _v ＝Ｐ（ａ，ｂ，ｃ，ｒ _v ）Ｐ _h ＝Ｐ（ａ，ｂ，ｃ，ｒ _h ）とすれば、上記変換の逆変換は次のように表わされる。

【数２３】

【００３７】ここで、Ｐ' _v ＝Ｐ（ａ，ｂ，ｃ，１／２ｒ _v ）Ｐ' _h ＝Ｐ（ａ，ｂ，ｃ，１／２ｒ _h ）

【００３８】再度、チェン−ウーのアルゴリズムにより解が求められる。

【００３９】チェン（Ｃhen）のアルゴリズム１−Ｄまたは２−Ｄのチェビシェフ変換とその逆変換の計算を高速化するために、いくつかの方法が考案されている。１６回の掛け算と、１３回の加算、１３回の減算のみによって、任意の８タプル（tuple）と上記行列Ｔ
とを乗算する周知のアルゴリズム（チェン)［２，３］
がある。このアルゴリズムは、パラメータａ，ｂ，ｃ，
ｒの格別の特性に何等依存しない。

【００４０】チェン−ウー（Ｃhen-Ｗu）のアルゴリズム（修正）［Ｔ］＝［Ｐ］［Ｑ］を上述の如く因数分解することにより、チェン−ウーのアルゴリズムは二つのステージに分かれ、［Ｑ］による乗算に８回の掛け算が用いられ、
［Ｐ］による乗算に８回の掛け算とそれ以外の算術演算が用いられる。これは我々の［Ｑ］の選択の結果であって、［Ｐ］のいくつかの要素は１または−１になり、ひとつの乗算がなくなる。

【００４１】上に指摘したように、同様の単純化は、その逆変換、２−Ｄ変換及び２−Ｄ逆変換にも当てはまる。８×８のブロックの場合、フォワード２−Ｄ変換とその逆変換のいずれについても、１２８回の乗算が用いられる（［ｑ］による乗算を除く）。チェンのアルゴリズムの内部的なデータの流れを見ると、これらの乗算は、８つの加算／減算ステージと４つの乗算ステージの組み合わせに組み込まれる。強調すべきは、チェンのアルゴリズムはパラメータａ，ｂ，ｃ，ｒのいかんにかかわらず動作することである。しかしながら、従来用いられた８ポイントＤＣＴは“真（true）コサイン変換”のパラメータすなわちａ＝ｔａｎｇｅｎｔ（７＊ｐｉ／１６）ｂ＝ｔａｎｇｅｎｔ（６＊ｐｉ／１６）ｃ＝ｔａｎｇｅｎｔ（５＊ｐｉ／１６）ｒ＝ｓｑｒｔ（１／２）＝０．７０７１０６７８・・・を持ち、行列Ｔが直交行列となるに必要十分なｒを選んでいる。なお、“sqrt”は“√”を意味する。

【００４２】パラメータ値の選択チェン変換はパラメータａ，ｂ，ｃ，ｒに選ばれた値に関係なく働く。これは、ＱＰによって生成された変換が対角行列であることによる。任意の数値を用いることと、圧縮のために必要な画像データの望ましい非関連付け(decorrelation）を行なうことができる変換を得ることが、完全に可能である。この変換が離散的コサイン変換（ＤＣＴ）でもＤＣＴの近似でもないことに注意すべきである。全く別の変換である。

【００４３】しかしながら、入力画像の効率的な非関連付けのために、及び比較的有意の空間周波数係数への変換のために、ＤＣＴが非常に望ましいことは一般に認められることである。ＤＣＴの利点を活かすため、そのパラメータは（数１６）で与えられたＤＣＴパラメータに近い値に設定される。障害になる要因は、演算の効率である。加算は乗算より安価であるので（ハードウエアの面ではシリコンの面積の節約、ソフトウエアの面ではサイクル数の減少）、パラメータは演算が効率的となるように選ばれる。

【００４４】代替アルゴリズム離散的チェビシェフ変換（ＤＣＴ）のための計算法は他にも考案されている。例えば、リー（Lee）によるアルゴリズムは、８ポイントの１Ｄ変換と６４ポイントの２
Ｄ変換を、それぞれ１２回の乗算と１４４回の乗算によって実行する。

【００４５】しかし、これらの“高速(faster)”アルゴリズムは、チェンのアルゴリズムに比べ、いくつか欠点がある。すなわちａ）Ｔ＝Ｐ×Ｑの単純化（逆変換の場合と同様の因数分解）はもはや有効でない。対角行列Ｑの分離は、以後の単純化のために不可欠である。ｂ）これらのアルゴリズムは、任意のパラメータａ，
ｂ，ｃ，ｒで役立つのではなく、真コサイン・パラメーータに特に有効な様々な三角恒等式に依存している。ｃ）これらのアルゴリズムは、構造がより複雑である。これが具体化の妨げとなったり、数値が不安定になる危険を増加させることがある。

【００４６】発明の説明Ａ］再び（表１）を参照すると、ステップＣ，Ｄ，Ｅは［Ｑ］から導かれたフォワード変換の後乗数（post-mul
tipliers）に組み込ことができることに気付くであろう。同様に、ステップＨ，Ｉは逆変換の前乗数（pre-mu
ltipliers）に組み込みできる。これは、レート・スカラー（rate scalar ）演算、心理的適応ウエート操作（普通、正規化値として知られてる）、及び鮮明化ウエート操作は全てポイント乗算操作であるからである。
ｂ，ｃ，ｄ，ｅがそれぞれステップＢ，Ｃ，Ｄ，Ｅの出力であるとすると、 c(i,j) = b(i,j) * q(i,j) d(i,j) = c(i,j) * r(i,j) = b(i,j) * q(i,j) * r(i,
j) e(i,j) = d(i,j) * u(i,j) = b(i,j) * q(i,k) * r(i,
j) * u(i,j) または e(i,k) = b(i,j) * all(i,j) である。

【００４７】ここで、

【数２４】

であり、q（i,j）はレート・スカラー（rate scalar）

であり、r（i,j）は心理的適応的に選ばれた（あるいは同様のユーザーにより選ばれた）量子化ウエートであり、ｕ（i,j）は鮮明化ウエートである。同様にステップＨ，Ｉを結合できる。

【００４８】これは結局、レート・スケーリング(rate
scaling)、適応的重み付け、及び鮮明化の関数に余分な計算オーバーヘッドがないことを意味する。上記のように、この方法はリー（Ｌee）のアルゴリズムのような”
高速”アルゴリズムと一緒に適用できない。

【００４９】Ｂ］チェンのアルゴリズムは任意のパラメータａ，ｂ，ｃ，ｒで働くので、ＤＣＴと同様の品質と圧縮を得られ、かつ高速乗算を達成できるパラメータ値を選ぶことができる。

【００５０】下記のパラメータは、ＤＣＴのパラメータに十分に近いが、計算効率はより高い。ａ＝５．０ｂ＝２．５ｃ＝１．５ｒ＝０．７５

【００５１】ここで乗算は非常に簡単な計算に置き換えられる。例えば５を掛ける計算は、複写，２桁左シフト，加算となる。１．５を掛ける計算は、複写，１桁右シフト，加算となる。また、有理乗数の分子の逆数は結合した乗数［ｑ］に因数分解できる。ゆえに、２．５を掛ける計算は、影響される項と影響されない項のそれぞれに対し、５を掛ける計算と２を掛ける計算とにすることができる。

【００５２】この後者の考え方を用いると、単純なチェン・アルゴリズムにおけるパラメータｒ＝０．７５を扱うには、４を掛ける計算を９６回、３を掛ける計算を３
２回、必要とする。２Ｄ改良方法にウー-パオリーニ（Ｗu-Ｐaolini）を用いると、一つの乗算ステージ全体が省かれるので、これは１６を掛ける計算が３６回、１
２を掛ける計算が２４回、９を掛ける計算が４回となる。（逆変換には９を掛ける計算を３６回、６を掛ける計算を２４回、４を掛ける計算を４回、用いる。）

【００５３】演算速度のために、コサイン変換に極めて近いパラメータ値を選ぶことができる。ｂ＝１２／５及び／またはｒ＝１７／２４の代入が可能である。もうひとつの興味ある選択はｒＲｏｗ＝０．７０８３３３（１７／２４）ｒＣｏｌ＝０．７（７／１０）である。

【００５４】ここでは、少し異なった変換（異なったパラメータ）が行と列に用いられる。これは、ウー-パオリーニ法より導かれる乗数を単純にするためになされる。ここで、その方法は、１５との掛け算を３６回、８
５／８との掛け算を１２回、２１／２との掛け算を１２
回、１１９／１６との掛け算を４回、生じる。（逆変換は、１１９／１６との掛け算を３６回、８５／１６の掛け算を１２回、２１／４との掛け算を１２回、１５／４
との掛け算を４回、使用する。）

【００５５】ここで説明したやり方によれば、すべての乗算が高速化され費用も減少した。ただし、圧縮装置における結合乗数［ｑ］と伸長装置における結合乗数［ｑ］に関しては別である。これらはそれぞれ、１変換要素あたり１回の乗算が必要である。伸長装置の結合乗数［ｑ］は、変換係数の大半がゼロとなり、また非ゼロの係数の多くが特別扱いが可能なゼロに非常に近い整数になる、という点において簡単化される。

【００５６】Ｃ］さらに別の技法が、圧縮装置において結合乗数［ｑ］の計算コスト削減のために用いられる。
レート・スケーラは、実際上任意値であるから、［ｑ］
行列要素の全てに計算が簡単な値、例えば２のべき数を与えるように１ポイント毎に調整されることになる。これらの６４個の調整を一度だけ行なう必要がある（レート・スケーラと鮮明化フィルタの決定後）。

【００５７】例えば、結合乗数の一要素（Ｃ）及び対応した伸長乗数要素（Ｄ）がＣ＝０．００２７７３Ｄ＝０．００９３６７となったとすると、近似値Ｃ〜＝３／１０２４＝０．０
０２９３０が見出され、また乗算の簡単化のために用いられることになろう。その結果はＣ'＝３／１０２４、
Ｄ'＝Ｄ×Ｃ／Ｃ'〜＝０．００８８６６となる。

【００５８】プロセス（主要プロセス）の詳細な説明初めに一般的な注釈を示す。ａ）量子化された変換空間においては、”ＡＣ”係数量子化の非ゼロ・ステップを一定幅（ｗ）とし、ゼロ・
ステップを幅（ｗ＊ｑ）とすることが便利かつ効率的である。さらに、ｑ＝２が計算上都合がよく、また広範囲の圧縮率にわたり品質面でほぼ最適である。ここでの説明では、ｑ＝２（２倍幅ゼロ：double-width zero）とする。ただし本発明はそれに限るものではない。ｂ）以下説明するアルゴリズムは、低精度の２の補数の２進整数演算用にデザインされている。ただし、ステップ２，４，８における中間決定については例外で、それは高精度演算で行なわれる。さらに、ステップ（９．
１）も例外的で、ここで説明した整数乗算はコスト及びスピードに関して最適化される。例えば Nrr＊Nrc=Drr'＊Drc'=1.75＊4.25=7.4375 による掛け算を考える。恒等式 7.4375=(8-1)＊(1+1/1
6)を選ぶことにより、この乗算はシフトと加算により効率的に行なわれる。ｃ）鮮明化乗算は、ここではステップ８に示されるが、できることなら通常はステップ４で行なうべきである。多くのアプリケーションにおいて、伸長装置は、どのような方法で画像を鮮明化するのか、あるいは画像を鮮明化かするか否かの“知識”がない。注意すべきは、
Ｔｈｒ（）の最適値は入力装置及び鮮明化法によって変わることである。推奨される一方法は、ｍ（ｉ，ｊ）の値（ステップ８参照）が圧縮時（ステップ４）に計算され、圧縮画像の一部として伝送され、あるいは蓄積されることである。ｄ）連続する計算の並列化、タイムシーケンスまたはインタリーブには、いくつか明白な方法がある。あるハードウエア・アーキテクチャにとって好ましい方法は、
簡単な方法である。

【００５９】擬似コードの具体化例本明細書のこの部分は、本質的に本発明の一実施例で、
これは文章及び擬似コードにより説明される。パラメタライゼーション（parameterization）、前記（数２４）
のall(i,j）の計算、フォワードＧＣＴの主要部の計算、all(i,j）の逆数の計算、逆ＧＣＴの主要部の計算を含むいくつかのセクションがある。

【００６０】ステップ１．パラメータａ，ｂ，ｃ，ｒは以上に示されている。注意することは、ｒの値は行及び列のそれぞれ毎にあることである。２ＤＧＣＴは、分離可能な変換であって二つのパスで実行されるが、それが対称的でなければらないという制約はない。したがって、スケーリング係数は、ここで示すように非対称とすることができる。

【００６１】分子Ｎ及び分母Ｄの式が示すものは、分子と分母の可能な組み合わせであり、これは前記の値と一致することがある。ＧＣＴを実施しようとする設計者は、加算器アレイに用いられる実際値について自由度を持っている。この値の選択は、最終乗算ステージで修正される。

【００６２】上述の一般化チェン変換のパラメータとして次のものを選ぶ。 tan 7＊pi/16 〜＝ a ＝ Na/Da tan 6＊pi/16 〜＝ b ＝ Nb/Db tan 5＊pi/16 〜＝ c ＝ Nc/Dc sqrt(0.5) 〜＝rRow＝ Nrr/Drr sqrt(0.5) 〜＝ rCol ＝ Nrc/Drc 0.5/rRow 〜＝ rRow' ＝ Nrr'/Drr' 0.5/rCol 〜＝ rCol' ＝ Nrc'/Drc'

【００６３】“分子”Ｎ及び“分母”Ｄは整数である必要はないが、演算に都合のよいように選ばれる。有効な可能値には次のものがある。 Na= 5 Da=1 Nb=3 Db=1.25 Nc=1.5 Dc=1 Nrr=1.75 Drr=2.5 Nrc=4.25 Drc=6 Nrr'=1.25 Drr'=1.75 Nrc'=3 Drc'=4.25 しかし、本発明は上記タンジェント値の合理的な近似値をすべて包含する。これによって、必要な正規化スケーラが計算される。

【００６４】ステップ２．また U(0)=U(4)=sqrt(0.5) U(1)=U(7)=1/sqrt(Na*Na+Da*Da) U(2)=U(6)=1/sqrt(Nb*Nb+Db*Db) U(3)=U(5)=1/sqrt(Nc*Nc+Dc*Dc) を書く。

【００６５】ステップ３．次のように設定する。ｉ垂直方向位置（画像空間内）または垂直方向変化（変換空間内）のシーケンスを示す｛０，１，２，
３，４，５，６，７｝のインデックスとする。ｊ水平方向位置（画像空間内）または水平方向変化（変換空間内）のシーケンスを示す｛０，１，２，
３，４，５，６，７｝のインデックスとする。 Debl(i,j) 鮮明化係数を示すものとし、鮮明化を行なわない時はDebl()=1とする。 Thr(i,j) 例えばＣＣＩＴＴにより推奨されたような逆心理的適応ウェートを示すものとする。Ｍレート・スケーラを示すものとする。ここで典型的な圧縮率に対してはＭ＝１（近似）とする。 V(i,j) 画像（spatial）空間内のいくつかの輝度値を示すものとする。 L(i,j) 変換（圧縮）空間内の変換後輝度値を示すものとする。Ｓ再構築(reconstruction)に用いられる演算精度を示す任意の小整数とする。

【００６６】心理的適応ウェート１／Thr(i,j)は、一般化チェン変換のパラメータの各セット毎に再度最適化されるべきである。しかし、上記ステップ（１）で与えられたパラメータはＣＣＩＴＴのパラメータに十分近く、
同行列Thr()は最適である。

【００６７】ステップ４．ここではｇ（ｉ，ｊ）は全（ｉ，ｊ）に対して等しい。６４個の変換位置（ｉ，
ｊ）について、次式を満足させるｋ（ｉ，ｊ）及びｓ
（ｉ，ｊ）の解を求める。

【数２５】

ここで、右辺はg(i,j)にできる限り近づけ、s(i,j)は整数とする。

【００６８】また、 g(i,j) = 1.0 、k(i,j) は {1,3,5,7,9} （ i+j < 4 のとき） g(i,j) = 0.9、 k(i,j) は{1,3,5} （ i+j = 4 のとき） g(i,j) = 0.7、 k(i,j) = 1 （ i+j > 4 のとき） Zr(i) = 1 （i=0,1,2 or 3 の時） Zr(i) = Drr （i= 4,5,6 or 7 の時） Zc(j) = 1 （j= 0,1,2 or 3 の時） Zc(j) = Drc （j= 4,5,6 or 7 の時） Zr'(i)= 1 （i= 0,1,2 or 3 の時） Zr'(i)= Drr'（i= 4,5,6 or 7 の時） Zc'(j)= 1 （i= 0,1,2 or 3 の時） Zc'(j)= Drc'（j= 4,5,6 or 7 の時）因数 g(i,j) は量子化バイアスを選択サイズから無関係にするためのものである。

【００６９】ステップ５．フォワードＧＣＴの実行このステップはフォワード変換の擬似コード実行である。以下の各ステップはインターリーブ方式により２Ｄ
変換を行なう。画像全体にわたり、８×８の各ブロックの輝度値Ｖ（，）につき以下の処理の実行を繰り返す。すなわち、

【００７０】ステップ５．１ i=0,1,2,...,7 について次の値を準備する。 M(i,0)=V(i,0) + V(i,7) M(i,1)=V(i,1) + V(i,6) M(i,2)=V(i,2) + V(i,5) M(i,3)=V(i,3) + V(i,4) M(i,4)=V(i,3) - V(i,4) M5(i)=V(i,2) - V(i,5) M6(i)=V(i,1) - V(i,6) M(i,5)=M6(i) + M5(i) M(i,6)=M6(i) - M5(i) M(i,7)=V(i,0) - V(i,7)

【００７１】ステップ５．２ j=0,1,2,...,7 について次の値を用意する。 H(0,j)=M(0,j) + M(7,j) H(1,j)=M(1,j) + M(6,j) H(2,j)=M(2,j) + M(5,j) H(3,j)=M(3,j) + M(4,j) H(4,j)=M(3,j) - M(4,j) H5(j)=M(2,j) - M(5,j) H6(j)=M(1,j) - M(6,j) H(5,j)=H6(j) + H5(j) H(6,j)=H6(j) - H5(j) H(7,j)=M(0,j) - M(7,j)

【００７２】ステップ５．３各Ｈ（ｉ，ｊ）に次の値を掛ける。（i=0,2,3 or 4 の場合） Nrc （j= 5 or 6 のとき） Drc （j=4 or 7 のとき） 1 (何もせず) （j=0,1,2 or 3 のとき） (i=4 or 7 の場合) Drr Nrc （j=5 or 6 のとき） Drr Drc （j=4 or 7 のとき） Drr （j=0,1,1 or 3 のとき） (i=5 or 6 の場合) Nrr Nrc （j=5 or 6 のとき） Nrr Drc （j=4 or 7 のとき） Nrr （j=0,1,2 or 3 のとき）

【００７３】ステップ５．４ j =0,1,2,...,7に対し次の値を用意する。 E(0,j)=H(0,j) + H(3,j) E(1,j)=H(7,j) + H(5,j) E(2,j)=H(0,j) - H(3,j) E(3,j)=H(7,j) - H(5,j) E(4,j)=H(1,j) + H(2,j) E(5,j)=H(6,j) - H(4,j) E(6,j)=H(1,j) - H(2,j) E(7,j)=H(6,j) + H(4,j) F(0,j)=E(4,j) + E(0,j) F(4,j)=E(0,j) - E(4,j) F(2,j)=Db * E(6,j) + Nb * E(2,j) F(6,j)=Db * E(2,j) - Nb * E(6,j) F(1,j)=Da * E(7,j) + Na * E(1,j) F(7,j)=Da * E(1,j) - Na * E(7,j) F(3,j)=Dc * E(5,j) + Nc * E(3,j) F(5,j)=Dc * E(3,j) - Nc * E(5,j)

【００７４】ステップ５．５ i=0,1,2,...,7 について次の値を用意する。 Z(i,0)=F(i,0) + F(i,3) Z(i,2)=F(i,0) - F(i,3) Z(i,4)=F(i,1) + F(i,2) Z(i,6)=F(i,1) + F(i,2) Z(i,1)=F(i,7) + F(i,5) Z(i,3)=F(i,7) - F(i,5) Z(i,5)=F(i,6) - F(i,4) Z(i,7)=F(i,6) + F(i,4) G(i,0)=Z(i,4) + Z(i,0) G(i,4)=Z(i,0) - Z(i,4) G(i,2)=Db * Z(i,6) + Nb * Z(i,2) G(i,6)=Db * Z(i,2) - Nb * Z(i,6) G(i,1)=Da * Z(i,7) + Na * Z(i,1) G(i,7)=Da * Z(i,1) - Na * Z(i,7) G(i,3)=Dc * Z(i,5) + Nc * Z(i,3) G(i,5)=Dc * Z(i,3) - Nc * Z(i,5)

【００７５】また、この変換は二つの１次元変換のステージに分けることができる。次のものは、１次元変換パスの一例である。図８は、これらのステップを示す。 A1 = X0 + X7 B1 = A1 - A2 C1 = 1.25 B1 A2 = X3 + X4 B2 = A1 + A2 C2 = 3 B1 A3 = X2 + X5 B3 = A3 + A4 C3 = 1.25 B4 A4 = X1 + X6 B4 = A4 - A3 C4 = 3 B4 A5 = X0 - X7 B5 = A6 + A7 C5 = 1.5 A5 A6 = X1 - X6 B6 = A6 - A7 C6 = 1.0625 B5 A7 = X2 - X5 C7 = 1.0625 B6 A8 = X3 - X4 C8 = 1.5 A8 D1 = C5 + C6 E1 = 2.5 D1 Y0 = B2 + B3 D2 = C5 - C6 E2 = 1.25 D2 Y1 = E1 + (0.5 D3) D3 = C7 + C8 E3 = 2.5 D3 Y2 = C2 + C4 D4 = C7 - C8 E4 = 1.5 D4 Y3 = E2 + D4 Y4 = B2 - B3 Y5 = D2 - E3 Y6 = C1 - C4 Y7 = (0.5 D1) - E4

【００７６】なお、これら式の乗算はシフト操作と加算操作で実行される。これをＧＣＴの行列形式に関連させるため、ベクトル・ポイントY6を一例として説明する。

【数２６】

【００７７】ここで b=2.4である。これは式中の行列Ｐ
の第６行である。注意すべきは、１．２５による除算は、レート・スケーラ行列に集められるスケーリング係数である。８×８画素ブロックの行データは、この加算器アレイを通される。結果として得られる１次元周波数成分は、転送され同じアレイに再度通される。

【００７８】ステップ６．ステップ（５．５）の後で、
各画像サブブロックにおいて６４個の位置(i,j)のそれぞれについて、ステップ４より得られた k(i,j)とs(i,
j)を用い、次の値を用意する。

【数２７】

しかし、この値が負になったときは（すなわちｉ＝ｊ＝

０）、それに１を加える。その結果が変換係数L(i,j)

である。

【００７９】ステップ６に関するコメント：ここでの計算は簡単である。なぜなら、K(i,j)は常に１，３，５，
７または９であって、普通は１であるからである。また、２の−s(i,j)乗の乗算は単に右シフトであるからである（あるいは、Ｍが非常に大きな値に選ばれた場合には左シフトとなることもある）。

【００８０】算術右シフトは常に下向きの丸めとなる。
ゼロに向かう丸めが実際に好ましい。ゆえに、前記のように“負のときは１を加える”ということになる。 i=j=
0 のときに１を加えるのは、V(i,j)>=0 のためであり、
また後記のステップ（９．１）の記述を単純化するための工夫にすぎない。

【００８１】ステップ７．値 L(i,j)を符合化し、蓄積及び／または伝送を行なう。結局は、後続のステップによって、この値は検索されて画像が再構築されることになる。

【００８２】ステップ８．このステップは全（ｉ，ｊ）
に関する逆バージョンである。６４個の変換位置(i,j)
につき、m(i,j) を次の値に最も近い整数として求める。

【数２８】

ここで、s(i,j)とK(i,j) は上記ステップ（４）で解かれ、“ｚ”はステツプ（４）で定義される。

【００８３】また、A(i,j) を次の値に最も近い整数として選ぶ。

【数２９】

( i ＝ 0 または j ＝ 0 の場合）

【００８４】ステップ８についてのコメント：値m(i,j)
はステップ（４）で予め計算し圧縮画像と一緒に伝送しておいてもよい。これは、定数及びm(i,j) のみに依存するA(i,j)に関しては必要ない。レート・スケーラ及び鮮明化ウェートが固定されるアプリケーションにおいては、値 m(i,j)，A(i,j) は一定となるであろう。因数２Sは精度以上の余分なビットをもたらすが、このビットは最終的にはステップ（９．２）及びステップ（１
０）での算術右シフトによって除かれることになる。 A
(0,0)の調整により、丸めバイアスを修正し下記出力を丸め修正なしに利用できるようにする。ここで仮定した如く、A(0,0)はステップ（６）で L(0,0) へ１が加算されることを前提としている。挿入項”（２５−ｉ−
ｊ）／６４”はヒューリスティックであるが、平均二乗誤差の点でほぼ最適である。もう一度、２０インターリーブ・バージョン（20 interleaved vwersion）

【００８５】ステップ９．変換後画像に対し、上記ステップ（５）で導かれた８×８の各ブロックの変換後輝度値 L(＿ ,＿ ) に以下のことを繰り返す。

【００８６】ステップ９．１各(i,j) に対し、つぎの値を用意する。 E(i,j) = L(i,j) * m(i,j) + A(i,j) （ L(i,j) > 0 のとき） E(i,j ) = L(i,j) * m(i,j) - A(i,j) （ L(i,j) < 0 のとき） E(i,j) = 0 （ L(i,j) = 0 のとき）ただし、 i=0,1,2,...,7、 j=0,1,2,...,7である。 A(0,
0) は常に加えられなければならない。本発明は、L(0,
0)>0 の判定が成立せず、また上記ステップ（６，８）
（オプション）が簡略化される場合も包含する。実際上、小さな乗算、例えば -11 < L(i,j) < 11 は乗算の演算費用を減らすための特殊ケースと理解すべきである。

【００８７】ステップ９．２（半導体装置のコスト削減に都合がよければ、E(i,j)
の数値を任意桁数Ｓ１だけ右シフトする。ただし、これらのシフトは、本方法のある具体例では”自由”（fre
e）である。このシフトが自由でない具体例では、E(i,
j)=0 の時に、そのシフトを省略してよい。あるいは、S
1=0に設定することにより、全てのシフトを省いてよい。

【００８８】ステップ９．３再度、２次元形式でj=0,1,2,...,7 について次の値を用意する。 F(0,j) = E(4,j) + E(0,j) F(4,j) = E(0,j) - E(4,j) F(2,j) = Db * E(6,j) + Nb * E(2,j) F(6,j) = Db * E(2,j) - Nb * E(6,j) F(1,j) = Da * E(7,j) + Na * E(1,j) F(7,j) = Da * E(1,j) - Na * E(7,j) F(3,j) = Dc * E(5,j) + Nc * E(3,j) F(5,j) = Dc * E(3,j) - Nc * E(5,j) H(0,j) = F(0,j) + F(2,j) H(1,j) = F(4,j) + F(6,j) H(2,j) = F(4,j) - F(6,j) H(3,j) = F(0,j) - F(2,j) H(4,j) = F(7,j) - F(5,j) H5(j) = F(7,j) + F(5,j) H6(j) = F(1,j) - F(3,j) H(5,j) = H6(j) + H5(j) H(7,j) = F(1,j) + F(3,j)

【００８９】ステップ９．４ i=0,1,2,...,7 につき、次の値を用意する。 G(i,0) = H(i,4) + H(i,0) G(i,4) = H(i,0) - H(i,4) G(i,2) = Db * H(i,6) + Nb * H(i,2) G(i,6) = Db * H(i,2) - Nb * H(i,6) G(i,1) = Da * H(i,7) + Na * H(i,1) G(i,7) = Da * H(i,1) - Na * H(i,7) G(i,3) = Dc * H(i,5) + Nc * H(i,3) G(i,5) = Dc * H(i,3) - Nc * H(i,5) M(i,0) = G(i,o) + G(i,2) M(i,1) = G(i,4) + G(i,6) M(i,2) = G(i,4) - G(i,6) M(i,3) = G(i,0) - G(i,2) M(i,4) = G(i,7) - G(i,5) M5(i) = G(i,7) + G(i,5) M6(i) = G(i,1) - G(i,3) M(i,5) = M6(i) - M5(i) M(i,6) = M6(i) + M5(i) M(i,7) = G(i,1) + G(i,3)

【００９０】ステップ９．５各Ｍ（ｉ，ｊ）に次の値を掛ける。（i=0,2,3 or 4 の場合） Nrc' （ j= 5 or 6 のとき） Drc' （ j=4 or 7 のとき） 1 (何もせず) （ j=0,1,2 or 4 のとき） (i=4 or 7 の場合) Drr' Nrc' （ j=5 or 6 のとき） Drr' Drc' （ j=4 or 7 のとき） Drr' （ j=0,1,2 or 3 のとき） (i=5 or 6 の場合) Nrr' Nrc' （ j=5 or 6 のとき） Nrr' Drc' （ j=4 or 7 のとき） Nrr' （ j=0,1,2 or 3 のとき）

【００９１】ステップ９．６ i=0,1,2,...,7 につき、次の値を用意する。 Z(i,0) = M(i,0) + M(i,7) Z(i,1) = M(i,1) + M(i,6) Z(i,2) = M(i,2) + M(i,5) Z(i,3) = M(i,3) + M(i,4) Z(i,4) = M(i,3) - M(i,4) Z(i,5) = M(i,2) - M(i,5) Z(i,6) = M(i,1) - M(i,6) z(i,7) = M(i,0) - M(i,7)

【００９２】ステップ９．７ j=0,1,2,...,7 につき、次の値を用意する。 Y(0,j) = Z(0,j) + Z(7,j) Y(1,j) = Z(1,j) + Z(6,j) Y(2,j) = Z(2,j) + Z(5,j) Y(3,j) = Z(3,j) + Z(4,j) Y(4,j) = Z(3,j) - Z(4,j) Y(5,j) = Z(2,j) - Z(5,j) Y(6,j) = Z(1,j) - Z(6,j) Y(7,j) = Z(0,j) - Z(7,j)

【００９３】ステップ１０．ステップ（９．７）の後、
各画像サブブロックにおいて６４個の位置(i,j)それぞれに対し、次の値を用意する。

【数３０】

ここで、SとS1は、上記ステップ（７）及びステップ（９．２）において定義された任意の整数である。再び、この乗算は実際的には右シフトである。

【００９４】ステップ１１．具体的なシステム構成によっては、ここで範囲チェックが必要になることがある。
例えば、輝度の許容範囲が 0<=V(i,j) <=255 の場合、
０未満及び２５５より大きなV(i,j) 値は０及び２５５
にそれぞれ置き換えなければならない。 V(i,j) 値は、
ここで再構築された画像の輝度値である。

【００９５】二次的プロセスの説明圧縮率または画像品質を向上するために、主要（一次的）プロセスに付加的手段を追加するのが普通である。

【００９６】ステップ（１０）の後で、全ての画素ペア
V(8I+7,j)， V(8I+8,j) と全ての画素ペア V(i,8J+
7), V(i,8J+8) （すなわち、別の画像ブロックに分離された近傍画素）について繰り返し、またそれぞれに、その値を例えば(V2-V1) ／max (2,11 sqrt(M)) ずつインクリメント及びデクリメントすることにより、画像の正確さを向上できる。ここで、Ｍはステップ（４）で用いたレート・スケーラであり、また分母の式は最適値の便宜的近似にすぎない。

【００９７】ステップ（６）の実施前に、局所的画像領域の内容の複雑さを３タイプすなわち単精度、２倍精度及び４倍精度のいずれかに選択的に分類し、それぞれ'
０'，'１０'，'１１'のコード前書き（preface）
を出力することができる。そうすれば、ステップ（６）
の計算は次式で置き換えられる。

【数３１】

【００９８】ここで、単精度、２倍精度、４倍精度のそれぞれに対しＰは０、１、２となる。これは後にステップ（９．２）において補正される。このステップ（９．
２）では、精度の増加分を（余分の）右シフトにより除去しなければならない。

【００９９】残念なことに、非常に効果的で簡単な分類方法は見つかっていない。そこで現時では次の４つのソースから複雑さの尺度Ｐを導き出す面倒な方法を用いる。ａ） P_left とP_up 近傍画像領域の複雑さの尺度ｂ） sum((i+j)G(i,j)'2) ／sum(G(i,j)'2)変換エネルギー・スキューｃ） -G(0,0) 平均輝度の逆数ｄ） max(sum_over_fixed_width(ヒストグラム(V(i,
j)))) 均一性

【０１００】ステップ（７）において、蓄積または伝送すべき変換データ L(,) は、エントロピー符号化法を用いさらに減らすことができる。発明者らは、ビット・
レートに応じたいくつかの既定のハフマン・テーブルを用いるＣＣＩＴＴのジクザグ・ラン・テンプレート・コード(zigzag-run-and-template-code)の改良法を使用し、またこれを推奨する。明確にするため、その例を以下に説明する。

【０１０１】圧縮ファイル・フォーマットの例圧縮された画像は１）前書き（画像の幅，高さ，レート・スケーラＭ等）２）画素ブロック０画素ブロック１画素ブロック２．．．画素ブロックＮ−１３）後書き（もし置くのであれば）により表現される。

【０１０２】ここで、各画素ブロックは１）精度コード（オプションのステップＺで決定される）２）ＤＣ係数デルタ・コード３）ＡＣ係数コード（０回以上繰り返される）４）ＥＯＢ（End-of-Block）コードにより表現される。

【０１０３】ここで各ＡＣ係数コードは１）９−０拡張（Ｅ回繰り返し，Ｅ０）２）（Ｒ，Ｔ）を示すラン−テンプレート・コード３）係数値の符号（１ビット）４）ＭＳＢを除去した係数の絶対値（Ｔビット）により示される。ここで、R+9*E は、”ジクザグ”順（和i+jに基づいた順序)に先行する値が０の係数の個数である。またＴは、係数の絶対値の最上位ビット(MSB)
のビット位置であり、例えば係数が１１または−１１ビット位置：876543210 11=000001011 （二進数） -- 最上位ビットの時はＴ＝３である。

【０１０４】ＤＣ係数デルタの選択あるいは符号化については詳述しないが、高ビット・レートでＡＣラン・テンプレート・コードに有用なハフマン・コードの例を示す。コードＲＴ 0xx 0 w 100x 0 4+w 111110 0 6 1111110{0} 0 7+n 1010 1 0 10110 1 1 10111 2 0 1100xx 1+w max(0,2-w) 11010{0}1xx 1+w n+1+max(0,2-w) 11011xx 5+w 0 111100{0}>1xx 1+w n-1+max(0,2-w) 11011xx 5+w 0 111100{0}>1xx %+w 1+n 1111111 = 予約 111101 = ９−０拡張 1110 = ＥＯＢコードここで、{0} はｎ個の連続した０ (n=0,1,2,3,...) xx は w=0,1,2 or 3 として解釈された２ビット x は w=0 or 1 として解釈された１ビットを示す。

【０１０５】１２８ポイント変換と２５６ポイント変換以上の方法は、より大きな８×１６または１６×１６の一般化チェン変換で使用可能である。チェン変換をさらに一般化するための方法は、１Ｄ−１６ポイントＧＣＴ
が（行が”蝶状”（butterfly order）で、正規化のための後乗数が必要ないとして）

【数３２】

により与えられることに注目した上で明らかにされるべきである。

【０１０６】ここで

【数３３】

【数３４】

【０１０７】ここで、”真コサイン”パラメータは e = tangent 15pi/32〜= 10.1532 a = tangent 14pi/32〜= 5.0273 f = tangent 13pi/32〜= 3.2966 b = tangent 12pi/32〜= 2.4142 g = tangent 11pi/32〜= 1.8709 c = tangent 10pi/32〜= 1.4966 h = tangent 9pi/32〜= 1.2185 r = cosine 8pi/32〜= 0.7071 t = cosine 12pi/32〜= 0.3827 s = cosine 4pi/32 = t*b である。

【０１０８】発明者が使用するパラメータは e = 10 a = 5 f = 3.25 b = 2.4 g = 1.875 c = 1.5 h = 1.25 r = 17/240.708333 t = 5/13〜= 0.384615 s = t*b = 12/13 である。

【０１０９】GQ8(e,f,g,h,r,s,t) の逆行列は、GQ8(e,
f,g,h,1/2r,t',b,t') の転置行列である。ここで、 b = s/tt' = 1/(t+t*b*b) である。

【０１１０】行列の例行列ＴＰの転置行列コサイン変換(a=5.02734 b=2.41421 c=1.49661 r=0.70
711) ：

【数３５】

【０１１１】関連したチェン変換(a=5.0 b=2.4 c=1.5
r=0.7)：

【数３６】

【０１１２】装置の説明さて、本発明を詳細に説明したが、ここで本発明の態様を実施する装置について説明する。以下の説明中で、”
ポイント”(point）はスケーラ・レジスタあるいは任意精度（通常８から１２ビット）のデータ・パスを示すために用いる。適当な精度を決める方法は知られている。
ソフトウエア方法において、変換ステージは結合され、
またウー−パオリーニ（Wu-Paolini）の改良方法が採用された。半導体装置の場合、単純に二つの８ポイント変換ユニットすなわち、垂直方向と水平方向のためにそれぞれ１ユニットずつ用意すると好都合である。垂直方向変換と水平方向変換の間に６４ポイントのシフトアレイを設ける必要があり、また同様のバッファリングを変換セクションと符号化セクションとの間で行なう必要がある。

【０１１３】本発明は、圧縮及び伸長のための一つのモノクロ装置及び／または別々の複数の装置を包含するが、好ましい実施例は３色データに対して動作する圧縮装置（図１の（ａ））と伸長装置（図１の（ｂ））の両方を含む。データは８画素のベクトルの形で圧縮装置に入力して、辞書編集上の順番に６４画素のブロックに配列される。ブロックの処理はパイプライン処理による（図２（ｂ））。

【０１１４】圧縮装置への１個の画素の入力は、”Ｒ”
（赤），”Ｇ”（緑），”Ｂ”（青）のスケーラ(scale
r) からなる。これらは直ちに輝度−色差空間に変換される。（かかる変換を行なう理由は周知である。）この変換は任意の固定した、またはプログラマブルの係数を使用可能であり（図３の（ａ））、または用途によっては単純な値に“ハードワイヤド(hard-wired)”することも可能である（図３の（ｂ））。変換空間はここではＸ
ＹＺとして示されるが、どのような線形形式の３色入力を用いてよく、これはおそらくＣＣＩＴＴ標準（Ｙ，Ｒ
−Ｙ，Ｂ−Ｙ）ということになろう。そして三つの値Ｘ，Ｙ，Ｚは、実際的には、それぞれ別々のモノクロ圧縮装置に送られる。伸長装置は、ＸＹＺベクトルがＲＧ
Ｂベクトルに変換されることを除けば、図３と同一または同様の回路を用いる。

【０１１５】Ｘ，Ｙ，Ｚの値は次に３つのシフトレジスタ（図５）に入力し、第１変換ユニットへの転送を待つ。この変換ユニットは２．６画素時間で動作するので、データの一部は図示の如く遅延させなければならない。 ”ＸＹＺ”の表記は多少不適当で、最適化された符号化方法では輝度（”Ｙ”）が最初に処理される必要がある。伸長中は、ＸＹＺのスキュー問題は逆になる。注目すべきは、好ましい実施例において、伸長中にＹ−レジスタとＺ−レジスタの利用を逆にすることによって、
５ポイント分のレジスタが節約される。

【０１１６】図１（ａ）を参照すると、圧縮装置の主要部は入力をＸＹＺ空間へ変換し、それを次に変換ユニット３へ転送するためにバッファする入力セクション（３
ポイント変換セクション１、シフトレジスタ２）を含む。各８画素時間に、変換１ユニットは３回の周期的動作をしなければならない（Ｘ，Ｙ，Ｚのそれぞれにつき１回ずつ）。この変換１ユニットの出力はシフトアレイ４に入力し、そこで８×８画素ブロックが完全に読み込まれるまで保持される。変換２ユニット５，６は予め読み込まれた画素ブロックに対して動作し、これもまた各８画素時間に３回、周期的動作をして、符合器入力バッファ７，８ヘデータを与える。符合器９，１０，１１は三つの色座標に共用されるが、一つの輝度ブロック全体が中断なく符合化され、それに続けて色差ブロックが１
ブロックずつ符合化される。これらの３つのブロックの処理を６４画素時間内に完了できない場合、タイミング・コントロール論理が外部の入力回路に対する画素クロックを停止させる。

【０１１７】記憶エリア（入力シフトレジスタ２，シフトアレイ４，符合器入力バッファ７，８）は、３色用に三重化しなければならないが、計算ユニット３，５，
６，９，１０，１１はＹデータ，Ｘデータ，Ｚデータで共用（時間多重化）される。

【０１１８】符合器９，１０，１１、符合器入力バッファ７，８、符合プログラミング１２，１３，１４及びタイミング・コントロール論理（図示されていない）は、
在来技術によってよい。同様に、３色を単一回路に時間多重化する方法は周知である。３ポイント変換セクション１（図３）及びシフトレジスタ２（図５）もまた知られている。

【０１１９】スケーラ(scaler)６は、プログラムされたＲＡＭまたはＲＯＭと、（当然存在するところの）シフト回路、マルチプレクサ及び加算器からなるシステムを用いる。これは簡単に実現できる。一般化チェン変換と適切なパラメータが与えられれば、８ポイント変換器（図８（ａ），図８（ｂ））も簡単である。

【０１２０】シフトアレイ（図６（ａ））は特に説明する価値がある。現入力画素ブロックからの垂直（変換後）ベクトルは、先行の画素ブロックからの水平ベクトルが水平方向変換器へ送られる間に組み立てられる。特別な設計をしないと、このような処理は、１２８個のレジスタ（現ブロックと先行ブロックのそれぞれ毎に６４
個）が必要である。これは、ポイントが受信された順序と異なる順序で用いられるからである。しかし、偶数番画素ブロックの期間にデータを左から右へシフトし、また奇数番画素ブロックの期間にデータをトップからボトムへシフトすることにより、そのようにする必要はなくなる。説明したシフトアレイは双方向のものである。実施例によっては、４方向シフトアレイが好ましい。

【０１２１】図６（ｂ）は、図６（ａ）のシフトアレイの様態をより詳しく示す。図６（ｂ）において、ベクトルはシフトレジスタのボトムより一つ一つ取り出され、
図１（ａ）のＤＣＴ８セクションへ送られる。この期間に、他のＤＣＢ８セクションから出力された垂直ベクトルがシフトアレイへトップより入力される。徐々に古いベクトルはシフトアレイから出され、そして、このシフトアレイは次の画素ブロックからの垂直ベクトルによって満たされる。

【０１２２】次の画素ブロックについては、データの流れる向きが前画素ブロックのデータの流れる向きから９
０度変わる。そのようにして、水平ベクトルはシフトアレイの右側より取り出されてＤＣＴ８セクションへ送られ、新しい垂直ベクトルがシフトアレイに左側より入力する。ブロック N+1 まで進むと、さらに９０度回転することにより最初の形に戻る。以下同様である。

【０１２３】伸長装置（図１（ｂ））は、データの流れる向きが逆であることを除き、圧縮装置（図１（ａ））
と非常に類似した構成である。好ましい実施例では、単一の装置が二つのモードで、すなわち圧縮装置または伸長装置のいずれかとして動作する。

【０１２４】可能なＶＬＳＩのレイアウト（図４の（ａ），（ｂ））によれば、圧縮の場合（図４の（ｃ−
ａ），（ｃ−ｂ））と、伸長の場合（図４の（ｄ−
ａ），（ｄ−ｂ））とでデータの流れる向きが異なる。
注意すべきは、変換及びシフトアレイのユニットは、一方のレイアイト（図４の（ｂ））では圧縮と伸長の両方に同じ方向性を有するが、他方のレイアイト（図４の（ａ））ではそうでないことである。これは、結合した圧縮装置／伸長装置データフロー（図７）を考えた時に、より明確になる。二つの変換ユニットを、ＲＧＢデータ及び圧縮データのそれぞれに関与させた場合（図４
の（ａ））、４方向シフトアレイを用いない限りレイアイトが困難となる。故に、シフトアレイの入力セクション及び出力セクションを用いて、二つの変換ユニットとやり取りする（図４の（ｂ））。

【０１２５】一実施例において、圧縮装置（図８
（ａ））に用いられた変換ユニットは、３８個の加算器を使用する。１桁右シフト（”Ｒ１”）、２桁右シフト（”Ｒ２”）または４桁右シフト（”Ｒ４”）、あるいは１桁左シフト（”Ｌ１”）は容易になされる。図示回路はパラメータ(a,b,c,r)=(5,2.4,1.5,17/24) を用いる。別の実施例（図８（ｂ））において、b=2.5 として実現するには加算器は３６個だけで足りる。

【０１２６】伸長装置においては、逆変換ユニットのための関連回路が必要である。 ”出力イネーブル”信号の使い方に注意すれば、フォワード変換器内の加算器の大部分を再使用可能であり、それを具体化することは当業者であれば簡単である。

【０１２７】スケーラは、プログラムされたＲＡＭまたはＲＯＭと、当然存在するシフティング回路、マルチプレクサ及び加算器のシステムを用いる。その実現は容易である。

【０１２８】デスケーラ（descaler）は様々に具体化できるが、好ましくはＲＡＭ、アキュムレータ、タイミング・コントロール論理及び小さなタイムプレート・カットオフ(timeplate cutoff) を備えた小規模の布線論理乗算器である。専用の低コストのアプリケーションでは、デスケーラは、鮮明化ウエートが広い範囲にわたりほぼ最適であることに注目することにより、簡略化でき、したがってスケーラにおけるように単純なスケーリング(scaling) を利用できる。デスケーラは、図１と図７に示すように、符合器とその出力バッファとの間、あるいは、その出力バッファと変換器との間のいずれに置くこともできる。

【０１２９】符合器入力バッファは、様々に具体化できるが、例えばシフトアレイと類似のサイクル−シェアリング(cycle-sharing) によるレジスタ削減構成も可能である。より単純な設計では、３８４×１０ビットＲＡＭ
を、ＲＡＭアドレスを与えるための６４×７ビットＲＯ
Ｍとともに使用する。

【０１３０】ここで、図１（ａ）と図１（ｂ）を参照し、１サイクル動作の例を説明する。図１（ａ）において、データは３色情報すなわち赤、緑、青として圧縮装置に入力する。このデータは直ちに、ＸＹＺと呼ぶ代替空間へ変換される。Ｘ，Ｙ，Ｚの３要素は、それぞれのシフトレジスタに入る。

【０１３１】このシフトレジスタから、データは８ポイントＤＣＴユニットに送られる（ステップ２）。Ｘ，
Ｙ，Ｚの３色に多重化される一つの８ポイントＤＣＴユニットが設けられることもあるし、各色毎にＤＣＴ８−
ユニットが設けられることもある。

【０１３２】情報は次に６４ポイント・シフトアレイ４
に入力する。各色別々のシフトアレイが存在する。このシフトアレイ（ブロック４）から、情報はブロック３と同様のもう一つのＤＣＴユニット（ブロック５）へ送られる。この情報は次にスケーリングを行なわれなければならないが、これは加算シフトを余分に重ねることである。

【０１３３】情報は水平方向及び垂直方向の両方に変換されるだけである。シフトアレイは実は概念上データを９０度回転させるものであり、その結果、情報を他の方向へ変換可能である。データは、スケーリングされた後、データ保持のための別のバッファ、すなわち図示のブロック７，８（Ｚ１，Ｚ２）へ入力し、その結果、データは最終的に符合化されてチップから出力される（Ｚ
１，Ｚ２はジグザクである）。

【０１３４】概念上、これは、データが９０度回転されないことを除けば、シフトアレイすなわちブロック４と同様である。その代わり、それはジグザク順に変換されるが、これは従来このような事に用いられてきており、
またＣＣＩＴＴ標準に採用されている。情報は次にラン・テンプレート(run and template)コントロールユニットのブロック９へ送られ、このユニットはゼロを検出してゼロのランを生成し、また非ゼロと値の対数の概算値（テンプレートと呼ばれる）を検出する。このランとテンプレートの組（ＲＴコードと呼ばれる）はＲＡＭまたはＲＯＭ内で検索され、次にチップより出力される。

【０１３５】仮数、すなわち変換係数の有効ビットもチップから出力される。仮数とラン・テンプレート・コードは１ビット、２ビット等々の任意の長さであるが、チップの出力は常に１６ビットあるいは８ビット、３２ビット等々の同一ビット数であるので、ブロック１１（整列）は簡単になる。

【０１３６】図１（ａ）に示す他のブロック（オプション）はプログラミング・ブロック１２，１３，１４であり、これらはそれぞれに任意のＲＧＢ−ＸＹＺ変換、任意のレート・スケーラ及び心理的適応ウエート、ラン・
テンプレート用の任意のモデファイド・ハフマンコードを設定可能である。

【０１３７】図１（ｂ）は、図１（ａ）と非常に似ている。ラン・テンプレート・コードは、ランとテンプレートの組に復号されなければならず、また必要個数のゼロが省かれなければならない。

【０１３８】図１（ａ）において、スケーラは単なる加算器とシフター（shifter）のアレイである。図１
（ｂ）において、デスケーラはハードウエアにより非常に小さな乗算として実現されている。

【０１３９】図９は本発明による２次元の一般化チェン変換の説明図を示す。画素は、トップから入力するが、
典型的には８ビット幅である。この画素は、典型的には１２８ビットのデータ幅を持つ水平方向変換部１１０内の広い加算器アレイを通る。水平方向変換部１１０の出力は、水平から垂直への情報回転のための転換ＲＡＭ１
１２を通過する。次に、データは、これも加算器のみからなる垂直方向変換部１１６（典型的には１２８ビット幅）に入る。その出力係数は最終的に約１６ビット幅に縮小され、単一の乗算器１２０を通過するが、これは本発明によりＪＰＥＧ互換である。

【０１４０】図１０は、本発明によるＶＬＳＩ装置のためのブロック図を示す。図１０において、データは構成部４０より入力し入力ラッチ４２にラッチされ、マルチプレクサ４４を通ってＧＣＴ変換の前半部（first hal
f。加算器ネットワークである）５０に入る。この加算器ネットワークの後半部（second half）６０は中段ラッチ５４の右側にある。その出力はＭＵＸ６２を通って転換ＲＡＭ６６に達し、ここで水平から垂直への変換がなされる。

【０１４１】タイムシェアリングまたはタイムスライス方式による垂直方向変換の前半部（first half）を構成するために、転換ＲＡＭ６６の出力はＧＣＴの第１ステージ５０にフィードバックされる。ＧＣＴ５０の出力は垂直方向変換の第２ステージ６０の入力に送られる。最終的に、ＧＣＴ６０の出力は出力ラッチマルチプレクサ７０を通過させられ、乗算器７４及び丸め器（rounde
r）７６を通ってジクザグ順アレンジャ（arranger）８
０に達する。このアレンジャ８０の出力は１２ビットの係数８４として出力される。

【０１４２】図１０を再び参照して、本発明による逆変換プロセスについて以下に簡略に説明する。図１０において、１２ビット係数はブロック８４を介しジグザグ順アレンジャ８０のＹ入力に入力される。このジグザグ順アレンジャ８０の出力は、フォワードプロセスで行なわれたと同様の逆量子化プロセスを行なう乗算器７４及び丸め器７６を通る。乗算器７４の出力は逆変換プロセスの第１ステージであるラッチ４２へ入力される。

【０１４３】逆変換プロセスは、ラッチ４２から、フォワード変換が辿ったと同じ２ステージ時間多重パスを辿る。出力は出力ラッチ７０に出るが、同ラッチの出力が丸め器７６によって丸められる画素であって、丸め器７
６の出力はブロック４０へ送られ、出力される。

【０１４４】本発明の好ましい実施例に関する以上の記述は、説明を目的としてなされたものであって、本発明を開示した態様そのものに限定することを意図するものではなく、以上の説明に照らし多くの修正や変形が可能である。また、本発明は既存の標準、例えばＪＰＥＧ標準に適合する。前記好適実施例は、本発明の原理及び実際的な応用を最もよく説明することによって、当業者が本発明及び様々な態様を最善に、また特定用途に適するよう様々に修正して利用できるようにすることを目的として、選び説明したものである。本発明の範囲は、添付のクレームによってのみ定義されるものである。

【０１４５】

【発明の効果】以上説明したように、本発明によれば、
ほとんど加算操作のみを使用する非常に単純でかつコストも小さい処理によって画像圧縮を行ない、またＪＰＥ
Ｇ画像圧縮標準と互換性を維持できる画像圧縮装置及びその方法を実現できる。

【図面の簡単な説明】

【図１】本発明による圧縮装置および伸長装置の一実施例のブロック図である。

【図２】（ａ）は入力画素順の説明図、（ｂ）はデータのブロックタイミングの説明図、（ｃ）ベクトルタイミングの説明図である。

【図３】（ａ）はＲＧＢデータからＸＹＺデータへの３
ポイント変換の一構成例を示す図、（ｂ）はＲＧＢからＸＹＺデータへの３ポイント変換の他の構成例を示す図である。

【図４】（ａ）は可能なＶＬＳＩレイアウトの一例の説明図、（ｂ）は可能なＶＬＳＩレイアウトの他の例の説明図、（ｃ−ａ）は（ａ）のレイアウトでの圧縮時のデータフローの説明図、（ｄ−ａ）は（ａ）のレイアウトでの伸張時のデータフローの説明図、（ｃ−ｂ）は（ｂ）のレイアウトでの圧縮時のデータフローの説明図、（ｄ−ｂ）は（ｂ）のレイアウトでの伸張時のデータフローの説明図である。

【図５】シフトレジスタの説明図である。

【図６】（ａ）はシフトアレイの説明図、（ｂ）は（ａ）のシフトアレイの一例を示す図である。

【図７】結合されたデータフローの説明図である。

【図８】（ａ）はフォワード加算アレイの一例を示す図、（ｂ）はフォワード加算アレイの他の例を示す図である。

【図９】本発明による２次元一般化チェン変換の説明図である。

【図１０】本発明の好適な一実施例のブロック図である。

【符号の説明】

４２入力ラッチ４４マルチプレクサ５０ＧＣＴ変換の前半部（第１ステージ、加算器ネットワーク）５４中段ラッチ６０ＧＣＴ変換の後半部（第２ステージ、加算器ネットワーク）６２マルチプレクサ（ＭＵＸ）６６転換ＲＡＭ７０マルチプレクサ（ＭＵＸ）７４乗算器７６丸め器８０ジグザグ順アレンジャ１１０水平方向変換部１１２転換ＲＡＭ１１６垂直方向変換部１２０単一乗算器

标题	发布/更新时间	阅读量
一种城市路网机动车尾气排放遥感监控系统	2020-05-13	752
一种驾驶人实车考试扣分取证方法与装置	2020-05-18	813
一种基于FPGA的畜舍图像采集分析和传输系统	2020-05-19	953
汽车爆胎安全稳定控制系统	2020-05-21	585
基于高清智能摄像机的人脸检测与识别系统	2020-05-24	334
一种自动化检测恶意代码核心特征方法	2020-05-25	358
山火诱发钢结构杆塔结构失效的仿真模拟和安全预警方法	2020-05-18	232
一种针对变电站的基于机器学习的语义标注方法	2020-05-25	944
一种多模式复合式馈能型悬架作动器及其控制方法	2020-05-12	374
一种智能综合考试管理系统	2020-05-23	706

Device and method for picture compression

【発明の詳細な説明】

该功能需要专业版企业版VIP权限，您可以：