专利汇可以提供Picture coding system, prediction method of an image decoding system, and pixel values of blocks obtained by dividing an image专利检索,专利查询,专利分析的服务。并且本発明の実施形態は、ビデオ符号化もしくは符号化プロセスに使用される画素予測モードを推定し、ビデオ符号器及び復号器の間の画素予測モードを通信し、画素イントラ予測モードの順序付けをするための方法とシステムに関する。,下面是Picture coding system, prediction method of an image decoding system, and pixel values of blocks obtained by dividing an image专利的具体信息内容。
(関連参考資料)
本出願は、2002年5月28日出願の米国特許出願No. 60/319,272号明細書及び2002年7月11日出願の米国特許出願No. 60/319,390号明細書の利益を請求する。
本発明の実施形態は、画像のイントラ予測に関する。 デジタルビデオの場合、非圧縮状態デジタルビデオシーケンス(例えば、フレーム列)の各フレーム及び全てのフレームを表示するために大量のデータを必要とする。 大抵の用途において非圧縮デジタルビデオをコンピュータネットワークで伝送するのは帯域幅が制限されているので不可能である。 さらに、非圧縮デジタルビデオは大量の記憶容量を必要とする。 デジタルビデオは、記憶装置に対する要求を軽減し、帯域幅に対する要求を軽減するような方法で通常符号化される。
デジタルビデオの符号化技法の1つは、フレーム間符号化である。 フレーム間符号化は、異なるフレームのビデオは、通常xXx個の画素ブロックとして選択される略同一の画素領域を含むという事実を利用している。 符号化プロセス期間中、動きベクトルは、1フレーム内の画素ブロックの動きを他のフレーム内の同類画素ブロックと相互に関係付ける。 従って、このシステムは、この画素ブロックを二度符号化する必要が無く、この画素ブロックを一度符号化して他の画素ブロックを予測する動きベクトルを提供する。
もう1つのデジタルビデオ符号化技法は、フレーム内符号化である。 フレーム内符号化は、1つのフレーム又はその1部分を、他フレーム内の画素を参照することなく符号化する。 代表的なフレーム内符号化は、ブロック単位でフレーム又はその部分を符号化する。 例えば、MEPG−2において、フレーム内符号化は、1つの画素ブロックの離散余弦変換を用い、次に、変換係数を符号化する。 他のフレーム内符号化技法には、例えば、ウェーブレット符号化のような技法がある。
一般に、これらの技法は、予測モードを参照するために比較的大きなデータテーブルを採用する。 これらのデータテーブルのためのメモリは、多くの低価格の機器にとって高価で重荷である。 さらに、データテーブルを記憶するために処理装置内に十分なメモリを装備するのも又高価で重荷である。 又、その結果であるシステムは、大きなデータテーブルのために複雑さが増す。
本発明の実施形態は、画像のイントラ予測に関係する方法とシステムより成る。 全ての実施形態はイントラ予測に関するので、“イントラ予測”及び“予測”の用語は、イントラ予測プロセスを参照するために、代わりに使用することができる。
本発明の実施形態は、ビデオ画像内の空間冗長度を利用するためにフレーム内符号化もしくはイントラ符号化を用いる。 隣接ブロックは通常同じような属性を有しているので、符号化プロセスの効率は、隣接ブロック間の空間相関を参照することにより改善される。 この相関は、隣接ブロックにおいて用いられた予測モードに基づくターゲットブロックの予測に利用できる。
デジタル画像は、より効率的に処理するために又は他の理由によりブロックに分割することができる。 図1に示すように、ターゲットブロック“C”12は、そのターゲットブロック“C”12の真上に位置する隣接ブロック“A”14に隣接することができる。 別の隣接ブロック“B”16はターゲットブロック“C”12の直ぐ左側に隣接している。 ターゲットブロック“C”12と境界線を共有する他の隣接ブロックは、ブロック“C”12の隣接ブロックと見なしてよい。
ブロックは、異なる構成の種々の数の画素より構成することが出来る。 例えば、1つのブロックを4x4の画素列で構成でき、又、1つのブロックを16x16の画素列又は8x8の画素列で構成することができる。 正方形及び矩形の画素列を含む他の画素構成により1ブロックを構成することができる。
ターゲットブロック内の各画素は、隣接ブロック内の画素に関するデータを参照し予測することができる。 この隣接画素データ又は隣接ブロックデータは、これらの隣接ブロック又は隣接画素を予測するために使用された予測モードより成る。 特定の隣接画素及びターゲットブロック内の画素は、図2に示すように英数字インデックスを用いて参照することができる。 図2は、英小文字22で指定された16画素より成るブロック“C”12のような4x4画素列のターゲットブロックを示している。 ターゲットブロックの真上の隣接ブロック内の画素は、英大文字24で指定されている。 ターゲットブロックの直ぐ左の隣接ブロック内の画素は、英大文字26で指定されている。
予測モードは、ターゲットブロック内の特定のピクセルを予測するための命令もしくはアルゴリズムより成る。 これらのモードは、下記のモード記述に記載されているように1個以上の隣接ブロックの画素を参照できる。
予測モードモード0:垂直予測a,e,i,mは、Aにより予測できる。
b,f,j,nは、Bにより予測できる。
c,g,k,oは、Cにより予測できる。
d,j,l,pは、Dにより予測できる。
モード1:水平予測a,b,c,dは、Iにより予測できる。
e,f,g,hは、Jにより予測できる。
i,j,k,lは、Kにより予測できる。
m,n,o,pは、Lにより予測できる。
モード2:DC予測全サンプルA,B,C,D,I,J,K,Lが使用可能であれば、全サンプルは、(A+B+C+D+I+J+K+L+4)>>3により予測することができる。 A,B,C及びDが使用できず、I,J,K及びLが使用可能であれば、全サンプルは(I+J+K+L+2)>>2により予測できる。 I,J,K及びLが使用できず、A,B,C及びDが使用可能な場合は、(A+B+C+D+2)>>2により予測することができる。 8個のサンプル全てが使用できない場合、そのブロック内の全ての輝度サンプルの予測は、128である。 1ブロックは、常に、このモードで予測できる。
モード3:斜め左下方予測aは、(A+2B+C+I+2J+K+4)>>3により予測できる。
b,eは、(B+2C+D+J+2K+L+4)>>3により予測できる。
c,f,iは、(C+2D+E+K+2L+M+4)>>3により予測できる。
d,g,j,mは、(D+2E+F+L+2M+N+4)>>3により予測できる。
h,k,nは、(E+2F+G+M+2N+O+4)>>3により予測できる。
l,oは、(F+2G+H+N+2O+P+4)>>3により予測できる。
pは、(G+H+O+P+2)>>2により予測できる。
モード4:斜め右下方予測mは、(J+2K+L+2)>>2により予測できる。
i,nは、(I+2J+K+2)>>2により予測できる。
e,j,oは、(Q+2I+J+2)>>2により予測できる。
a,f,k,pは、(A+2Q+I+2)>>2により予測できる。
b,g,lは、(Q+2A+B+2)>>2により予測できる。
c,hは、(A+2B+C+2)>>2により予測できる。
dは、(B+2C+D+2)>>2により予測できる。
モード5:縦左方予測a,jは、(Q+A+1)>>1により予測できる。
b,kは、(A+B+1)>>1により予測できる。
c,lは、(B+C+1)>>1により予測できる。
d,は、(C+D+1)>>1により予測できる。
e,nは、(I+2Q+A+2)>>2により予測できる。
f,oは、(Q+2A+B+2)>>2により予測できる。
g,pは、(A+2B+C+2)>>2により予測できる。
hは、(B+2C+D+2)>>2により予測できる。
iは、(Q+2I+J+2)>>2により予測できる。
mは、(I+2J+K+2)>>2により予測できる。
モード6:横下方予測a,gは、(Q+I+1)>>1により予測できる。
b,hは、(I+2Q+A+2)>>2により予測できる。
cは、(Q+2A+B+2)>>2により予測できる。
dは、(A+2B+C+2)>>2により予測できる。
e,kは、(I+J+1)>>1により予測できる。
f,lは、(Q+2I+J+2)>>2により予測できる。
i,oは、(J+K+1)>>1により予測できる。
j,pは、(I+2J+K+2)>>2により予測できる。
mは、(K+L+1)>>1により予測できる。
nは、(J+2K+L+2)>>2により予測できる。
モード7:縦右方予測aは、(2A+2B+J+2K+L+4)>>3により予測できる。
b,iは、(B+C+1)>>1により予測できる。
c,jは、(C+D+1)>>1により予測できる。
d,kは、(D+E+1)>>1により予測できる。
lは、(E+F+1)>>1により予測できる。
eは、(A+2B+C+K+2L+M+4)>>3により予測できる。
f,mは、(B+2C+D+2)>>2により予測できる。
g,nは、(C+2D+E+2)>>2により予測できる。
h,oは、(D+2E+F+2)>>2により予測できる。
pは、(E+2F+G+2)>>2により予測できる。
モード8:横上方予測aは、(B+2C+D+2I+2J+4)>>3により予測できる。
bは、(C+2D+E+I+2J+K+4)>>3により予測できる。
c,eは、(J+K+1)>>1により予測できる。
d,fは、(J+2K+L+2)>>2により予測できる。
g,iは、(K+L+1)>>1により予測できる。
h,jは、(K+2L+M+2)>>2により予測できる。
l,nは、(L+2M+N+2)>>2により予測できる。
k,mは、(L+M+1)>>1により予測できる。
oは、(M+N+1)>>1により予測できる。
pは、(M+2N+O+2)>>2により予測できる。
各々のモードに対するより小さい予測誤差を生じる尤度に基づいた順序付けプロセスは、符号化効率を高め、メモリ要求を軽減することができ、又、少なくとも部分的に数学的に定義できる。
各予測モードは、上記名称(即ち、横上方、垂直及び斜め左下)の各モードにおいて一般的な予測方向によって文字通りに記述することができる。 予測モードは、角度方向により図式で記述することも可能である。 この角度方向は、図3に示すように中心から外側への矢印放射線図によって表現できる。 このタイプの線図において、各矢印と中心点で、1予測モードを表すことができる。 1予測モードに対応するこの角度は、ターゲット画素を予測するのに用いられた隣接画素の重み付け平均位置から実際のターゲット画素位置への方向に一般的な関係を有する。 しかしながら、これらのモードは、上記の規定及びJVT規格においてより厳密に定義されている。 図3において、中心点32は方向を表していないので、この点はDC予測モードと関連づけることができる。 水平矢34は、水平予測モードを表すことができる。 垂直矢36は、垂直予測モードを表すことができる。 中心点から斜め右下方に水平矢から略45度の角度を成して延びる矢38は、斜め右下方(DDR)予測モードを表すことができる。 中心点から斜め左下方に水平矢から略45度の角度を成して延びる矢40は、斜め左下(DDL)予測モードを表すことができる。 DDR予測モードとDDL予測モードは、両方共、斜め予測モードと称することができる。
中心点から斜め右上方に水平矢から略22.5度の角度を成して延びる矢42は、横上方(HU)予測モードを表すことができる。 中心点から斜め右下方に水平矢から略22.5度の角度を成して延びる矢44は、横下方(HD)予測モードを表すことができる。 中心点から斜め右下方に水平矢から略67.5度の角度で延びる矢46は、縦右方(VR)予測モードを表すことができる。 中心点から斜め左下方に水平矢から略67.5度の角度を成して延びる矢48は、縦左方(VL)予測モードを表すことができる。 HU、HD、VR及びVL予測モードは、まとめて、中間角予測モードと称することができる。
他の多くの予測モードは、この角度記述スキームを用いて作成し記述することができる。
予測モード順序 本発明では、これらの予測モードは、一般的に、少ない予測誤差を生み出す尤度と一致するように順序付ける。 より少ない予測誤差を生み出す一般的な尤度に基づいて順序付けた予測モードにより、結果として得られるデータ自身も、より矛盾なく順序付けられる傾向が大きくなる。 さらに、モードの通信は、メモリと帯域幅の要件を軽減する符号化技法の利点を利用できる。 例えば、本発明者は、水平予測モード及び垂直予測モードが斜め予測モードより一般的に尤度が高く、斜め予測モードは中間角度予測モードより一般的に尤度が高いことを確かめた。 さらに、(例えば、隣接ブロックをインターモードで符号化する際)DC予測モードは、水平及び垂直予測モードよりも一般的に尤度が低く、斜め予測モードよりは一般的に尤度が高い。
画像エッジ又は、スライス境界のような不連続点に接しないブロックの場合、本発明の幾つかの実施形態において確立した順序は、一般用語で次のように表現する。 垂直及び水平予測モードがDC予測モードより低減された予測誤差を生じる尤度は高く、DC予測モードが斜め予測モードより低減された予測誤差を生じる尤度は高く、斜め予測モードが中間角度予測モードよりも低減された予測誤差を生じる尤度は高い。
エッジ又は境界線付近のブロック、又は隣接ブロックもしくは画素予測モードデータが利用できないブロックの場合、本発明の幾つかの実施形態において確立した順序は、一般用語で次のように表現される。 DC予測モードが垂直及び水平予測モードより低減された予測誤差を生じる尤度は高く、垂直及び水平予測モードが斜め予測モードより低減された予測誤差を生じる尤度は高く、斜め予測モードが中間角度予測よりも低減された予測誤差を生じる尤度は高い。
図4に示されている実施形態の第1セットにおいて、モードは下記の順序で規定できる。
モード0:垂直予測モード1:水平予測モード2:DC予測モード3:斜め左下方予測モード4:斜め右下方予測モード5:横下方予測モード6:縦右予測モード7:縦左予測モード8:横上方予測
図5に示されている実施形態の第2セットにおいて、モードは下記の順序で規定できる。
モード0:水平予測モード1:垂直予測モード2:DC予測モード3:斜め左下方予測モード4:斜め右下方予測モード5:横下方予測モード6:縦右予測モード7:縦左予測モード8:横上方予測
図6に示されている実施形態の第3セットにおいて、モードは下記の順序で規定できる。
モード0:垂直予測モード1:水平予測モード2:DC予測モード3:斜め左下方予測モード4:斜め右下方予測モード5:縦右予測モード6:横下方予測モード7:縦左予測モード8:横上方予測
図7に示されている実施形態の第4セットにおいて、モードは下記の順序で規定できる。
モード0:水平予測モード1:垂直予測モード2:DC予測モード3:斜め左下方予測モード4:斜め右下方予測モード5:縦右予測モード6:横下方予測モード7:縦左予測モード8:横上方予測
図8に示されている実施形態の第5セットにおいて、モードは下記の順序で規定できる。
モード0:DC予測モード1:垂直予測モード2:水平予測モード3:斜め左下方予測モード4:斜め右下方予測モード5:縦右予測モード6:横下方予測モード7:縦左予測モード8:横上方予測
尚、このモード順序は、本発明の種々の実施形態において、上記の順序態様の範囲をこえて変更できる。
本発明の幾つかの実施形態において、水平予測(モード0)と垂直予測(モード1)は、望むならば、逆にすることができる。 又、斜め左下方予測モードと横下方予測モードも、望むならば、逆にしてよい。 さらに、斜め右下方予測(モード5)と縦右予測(モード6)と縦左予測(モード7)と横上方予測(モード8)とは、望むならば再順序付けることができると理解すべきである。 さらに、DC予測は、モード0/モード1のセットとモード3/モード4のセットの間に入れることが望ましいが、もし望むならば、モード3/モード4のセットとモード5/モード6/モード7/モード8のセットの間に入れることも、又は、任意の他の位置におくことも可能である。 さらに、角度モード3〜8は、望む通りに、符号化効率に重大な影響をもたらすことなく、番号を付け直すことができる。
本発明の幾つかの実施形態において、予測モードは、そのような予測基準を用いる個々のブロック(例えば、前述の予測スキームを用いるそれらのブロック)のすべてについて、再順序付けることができる。 さらに、個別のブロック(例えば、前述の予測スキームを用いるそれらのブロック)の全てよりも少ない、望むならば、例えば、50%、75%又は90%以上の、ブロックがそのような予測基準を用いることができる。 又、予測モードの順序は、異なるブロックについて同一とするか、又は変更することができる。 さらに、かような予測基準の各モードの再順序付け(例えば、予め決められた両立可能な方法での再順序付け)は、好ましくは、少なくとも5つのモード、6つのモード又は7つのモードを再順序付けし、残りは任意の他の方法で順序付けることができる。 さらに、予測モードの順序は、好ましくは、0,1,2,3,4,5,6,7及び8である。 予測モードの他の予め決められた順序も同様に採用することができる。
本発明の幾つかの実施形態は、モードデータを組織するための1つ以上のデータテーブルを含むことが出来る。 1つの順序で全体に順序されたモードの場合、より多くの順序されたセットを提供するために、データテーブル中の各セルと共に使用することができる。 例えば、データテーブル中のエントリは、番号0,1,2,3,4,5,6,7,8及び9の順序セットを含むことができる。 別の選択肢として、データテーブル中の番号順序セットは、データテーブル中の各エントリ毎に順序番号の5,6,7,8及び9のセットを含むことができる。 例えば、データテーブルのエントリは、下記のデータエントリのセット{1,2,3,5,7};{0,1,2,3,4,5,6};{0,1,3,5,6,7,8}を含むことができ、ここで、セット内の各番号は増加数である。 別の選択肢として、例えば、データテーブルのエントリは、下記のデータエントリのセット{1,2,3,5,7};{0,1,2,3,4,5,6};{0,1,3,5,6,7,8}を含むことができ、ここで、各セットは、セルの少なくとも25%又は35%又は50%又は75%又は90%又はそれ以上に含まれる。 このように、このテーブルは、公知のデータテーブル方法よりも予測能力がかなり高く、メモリ要件を低減する。
データエントリセットの順序の予め決められた方法は、隣接の画素のセット(例えば、マクロブロック)の予測モードとは無関係でなければならない。 このデータテーブルは本質的に“静的”であり得るが、データ中のパターンに基づき、必要に応じ、全体又は部分的に、効率よく動的に生成できると理解すべきである。 従って、数学等式又はアルゴリズムを、前記エントリを決定するために使用でき、この場合、テーブルはそのような技法によって生成できる。 従って、ここで用いられる“データテーブル”は、単に静的なテーブルに限定されるだけでなく、さらに、そのような予測に使用される、但し特定された数値セットを含むことができる。
残念ながら、前のモード番号を新しいモード番号で置換する(例えば、代わりの番号を既知のデータテーブルに代入する)ことは、多分、改善であっても、依然、全体的には順序の付かないデータセットをもたらす結果となる。
隣接ブロックデータに基づく画素予測モードの推定 全体的に順序をつけていない前述のデータセットと異なり、代替した場合でも、本発明では、最も尤度の高い予測モードを第1位に、もし望むならば、次に最も尤度の高い予測モードを第2位に順序付けし、予め決められた方法で残りのモードを順序付けすべきことが確認された。 予め決められた方法は、隣接するマクロブロックの予測モードとは無関係でなければならない。 残りモードの好ましい順序付けは、残りモード発生の尤度の降順(最も尤度の高い予測モード及び、もし望むならば、次に最も尤度の高い予測モード)とすべきである。
図1に示すように、ブロックAとブロックBのイントラ予測モードに基づくブロックCに対するイントラ予測モードは下記のように規定できる。
(1)ブロックAとブロックBの両方が“外部”であれば(例えば、利用できない場合は)、DC予測(モード2)だけが許され、従って、ブロックCのイントラ予測モードの順序は{2}である。
(2)ブロックAが“外部”であり(例えば、利用できない場合は)、ブロックBが“外部”でなければ、ブロックCに対しては、DC予測(モード2)と水平予測(モード0)だけが許され、従って、
(i)ブロックBが2であれば、ブロックCに対するイントラ予測モードの順序は{2,0}であり;
(ii)そうでなければ、ブロックCに対するイントラ予測モードの順序は{0,2}である。
(3)ブロックAが“外部”でなく、ブロックBが“外部”であれば、ブロックCに対しては、DC予測(モード2)と垂直予測(モード1)だけが許され、従って、
(i)ブロックAが2であれば、ブロックCに対するイントラ予測モードの順序は{2,1}であり;
(ii)そうでなければ、ブロックCに対するイントラ予測モードの順序は{1,2}である。
(4)ブロックAもブロックBも“外部”でなければ、
(i)ブロックAの予測モードがブロックBの予測モードより小さければ、ブロックCに対するイントラ予測モードの順序は、{イントラ予測ブロックモードA、イントラ予測ブロックモードB、昇順のその他のモード}であり;
(ii)ブロックAの予測モードがブロックBの予測モードより大きければ、ブロックCに対するイントラ予測モードの順序は、{イントラ予測ブロックモードB、イントラ予測ブロックモードA、昇順のその他のモード}であり;
(iii)ブロックAの予測モードがブロックBの予測モードと等しければ、ブロックCに対するイントラ予測モードの順序は、{イントラ予測ブロックモードA、昇順のその他のモード}である。
例えば、ブロックAの予測モードが3で、ブロックBの予測モードが1であれば、ブロックCに対するイントラ予測モードの順序は{1,3,0,2,4,5,6,7,8}である。
全体的に減少(又は増加)する出現尤度順に配列したモードでは、出現する残存モードを自動的に並べても適切な並びに全体的に配置される。 その並びをより高い確率からより低い確率に順序付けると、前面に向かって適切な予測の尤度を増加させる。 エントロピ符号化を用いれば、これにより、結果として生じる符号化ビットストリームを減少する。 他の順序も同様に使用することができる。
概念的には、前記選択スキームは、ブロックAの予測がXであり、ブロックBの予測がYであればブロックCの予測はX又はYである尤度が高いという原理に基づいている。 X及び/又はYに対する予測は、リストの開始位置に配置され、残りモードはその後に順次列記される。
他の方法では、(A又はB又は両方がスライスの外側である場合を含み)AとBの予測モードが既知である場合、Cの最も確率の高いモードが与えられる、即ち、ブロックA及びBのために用いられたモードの中の最小のモードが与えられる。 ブロックA又はBのうちの1つが“外側”の場合、最も尤度の高いモードは予測モード2に等しい。 ブロックCに割り当てられた予測モードの順序は、従って、最も尤度の高いモードであり、続く残りのモードは昇順とする。
図9を参照し、本発明の実施形態を説明する。 これらの実施形態において、予測するためにターゲットブロックを選択する(ステップ50)。 前記ターゲットブロックに隣接する第1隣接ブロックの予測に用いられた予測モードを次に決定する(ステップ52)。 前記ターゲットブロックに隣接する第2隣接ブロックの予測に用いられた予測モードを決定する(ステップ54)。 これらの隣接ブロックの予測モードをチェックし、どちらがより小さい予測誤差を生じる尤度が高いかを決定する(ステップ56)。
本発明の他の実施形態においては、図10に示すように、予測モードのセットを、より小さい予測誤差を生じるモードの尤度に従って順序付ける(ステップ58)。 1つのターゲットブロックを選択する(ステップ60)。 第1隣接ブロックの予測に用いられた予測モードを決定し(ステップ62)、第2隣接ブロックの予測に用いられた予測モード決定する(ステップ64)。 これらの2つの予測モードを、順序づけたモードのセットにおいてどちらが最初に出現するか、即ち、どちらがより小さい予測誤差を生じる尤度の高いモードに該当するかをチェックして決定する(ステップ66)。
本発明の他の実施形態においては、図11に示すように、予測モードのセットを、より小さい予測誤差を生じる尤度に従って順序付ける(ステップ68)。 順序づけたセット内のこれらのモードを、より小さい予測誤差を生じる尤度のより高いモードがより低い数値に関係するように数値付ける(ステップ70)。 第1隣接ブロックの予測に用いられたモードを決定し(ステップ72)、第2隣接ブロックの予測に用いられた予測モードも決定する(ステップ74)。 これらの隣接ブロックのモードを、どちらのモードがより低い数値に関係するかを決定する。 このモードは、ターゲットブロックの予測のための推定モードとして指定する。
本発明のさらに他の実施形態においては、図12に示すように、予測モードのセットを、より小さい予測誤差を生じるモードの尤度に従って順序付ける(ステップ78)。 順序付けたセット内のこれらのモードを、より小さい予測誤差を生じる尤度のより高いモードがより低い数値に関係するように数値付ける(ステップ80)。 第1隣接ブロックの予測に用いられたモードを決定することを試み(ステップ82)、第2隣接ブロックの予測に用いられたモード決定することを試みる(ステップ84)。 第1隣接ブロックの予測に用いられたモードが得られない場合(ステップ86)、DC予測モードのようなデフォルト予測モードをターゲットブロック用の推定予測モードとして指定することができる(ステップ90)。 又、第2隣接ブロックの予測に用いられたモードが得られない場合(ステップ88)、DC予測モードのようなデフォルトモードをターゲットブロック用の推定予測モードとして指定できる(ステップ90)。 これらの隣接ブロックの予測モードが得られる場合、これらの隣接ブロックモードをチェックし、どちらのモードがより低い数値に関係するかを決定する。 次にこのモードを、ターゲットブロックの予測のための推定モードとして指定する(ステップ92)。
隣接ブロックデータに基づく予測モード順序の変更本発明の幾つかの実施形態において、隣接ブロックデータとは無関係に決定した前述の予測モードの順序は、隣接ブロックデータによって変更することができる。 隣接ブロックデータを参照して決定した予測モードの推定は、予測モードの順序に導入して隣接ブロックデータから得られた追加情報を反映させるように順序を変更することができる。
これらの実施形態の幾つかにおいて、隣接ブロックデータに基づいた予測モードの推定を、予測モードの順序セット中に直接挿入することができる。 代表例として、この予測モードの推定を、低減された予測誤差を生み出す最も尤度の高いモードの位置にある予測モード順序の先頭に挿入又は付加する。 しかしながら、幾つかの実施形態においては、この推定をモード順序中の異なる位置に挿入することができる。
本発明の幾つかの実施形態において、図13に示すように、予測モードの順序を選択する(ステップ102)。 ここで、予測モード順序要素はより小さい予測誤差を生じる尤度に従って順序することができる。 即ち、順序中の第1要素は、より小さい予測誤差を生み出す最も尤度の高い予測モードを表し、順序中の次の要素は、より小さい予測誤差を生み出す次に最も尤度の高い予測モードを表し、同様に順序中の最後の要素まで記述する。 順序中の最後の要素は、より小さい予測誤差を生み出す最も尤度の低い予測モードを表す。
上述のように、1つの予測モードの推定を決定する(ステップ104)。 この推定は隣接ブロックデータを用いて決定する。 一般的に、この推定は、より小さい予測誤差を生じるであろう1つ以上の隣接ブロックに用いられた予測モードである。 しかしながら、この推定は、別の方法で決定できる。 画像のエッジ又はスライス境界等において十分な隣接ブロック予測モードデータが得られない場合は、ターゲットブロックに対する予測モードは、1つ以上の隣接ブロック又はその予測モードデータが欠けていることに基づいて推定することができる。 多くの場合、隣接ブロックデータが制限されているか又は利用できなければ、DC予測モードが推定される。
幾つかの実施形態において、推定予測モードが推定されると、その推定予測モードをモード順序中に、より小さい予測誤差を生じる最も尤度の高いモードとして配置することができる(ステップ106)。 幾つかの実施形態において、これは、その順序中の最初のモードであるかもしくは最も低い数値に関係するモードである。
他の実施形態において、推定予測モードは、予め選択されたモード順序に優先することができる。 これらの実施形態の中の幾つかの場合、図14に示されているように、予め選択されたモードの順序は、符号化器又は復号器において指定される(ステップ110)。 この順序は、より小さい予測誤差を生じる尤度順序又は他の順序に順序した1組の予測モードより成る。 1つの推定予測モードを、又、隣接ブロックデータに基づき決定する(ステップ112)。 この推定予測モードは、符号化器及び復号器において同じアルゴリズム又は方法に従って、決定される。 符号化器は、又、動きベクトル又は他の公知の技術に基づき、画素予測のための実際に最良の予測モードを決定する(ステップ114)。 この符号化器は、実際に最良な予測モードを推定予測モードと比較し、それらのモードが同じであるかどうかを判定する(ステップ116)。 推定予測モードが実際に最良な予測モードと同じであれば、符号化器は、推定予測モードを使用するよう復号器に信号を送る(ステップ118)。 幾つかの実施形態において、この推定予測モードの信号は、推定されたモードを使用するか否かを示す1ビットのフラグによって実行される。
推定予測モードが実際に最良の予測モードでなければ、符号化器は他のモードが使用できることを復号器に信号を送って知らせる(ステップ120)。 これは、予め設定したモード順序を参照して実行される。 符号化器は、モード順序中のどのモードが実際に最良の予測モードに該当するかを決定し、そのモードを使用することを復号器に信号を送り知らせる。
順序付けた予測モードのセットを使用する場合、この順序セットは、さらにデータが得られれば、再順序することができる。 例えば、予測モードの順序セットは、推定予測モードが決定されるか、実際に最良の予測モードが決定された場合は、再び順序付けることができる。 これらの場合、変更モードを順序セットに挿入し、順序セットの前に置くか、幾つかの場合には順序セットから除去することができる。
本発明の幾つかの実施形態において、モード順序中の各モードは、順序に従い数値に関係させることができる。 これらの実施形態において、使用するモードに関係するその数値を復号器に送り、その予測モードを使用するために復号器に信号を送ることができる。 幾つかの実施形態において、図15に示すように、9つの予測モードより成るモード順序を選択することができる(ステップ130)。 又、隣接ブロックデータに基づく推定予測モードであって、その順序中の9つのモードの中の1つのモードを決定することができる(ステップ132)。 最良予測モードは、動きベクトル法又は他の方法によって決定することができる(ステップ134)。 この最良予測モードは次に推定予測モードと比較することができる(ステップ136)。 推定予測モードが最良予測モードと略同じであれば、復号器は、その推定予測モードを用いるために、復号器において既に特定されている1ビット指定子で通知される。 推定予測モードが最良予測モードと等しくない場合、この推定予測モードは、モード順序から本質的に除去される(ステップ140)。 この除去は、順序セットを再び順序付けるか、順序中の推定モードをスキップするか、又は、別の手段で実行することができる。 残りの順序は、8つのモードより有効に構成され、3ビットの指定子で表現できる。 この3ビットの指定子を、予測に使用するモードを指定するために復号器に送ることができる(ステップ142)。
これまでの説明において使用した用語と表現は、説明のために使用したもので、制限を目的とするものではなく、図示説明された特徴の用語と表現又はその部分と等価の用語と表現を除外する意図はなく、本発明の範囲はクレームによってのみ規定されることを確認する。
図面は、本発明の代表的な実施形態を示すものであり、発明の請求範囲を制限するものではない。 添付図面を用い、追加の特性及び細部を含めて本発明を記述し説明する。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种适用于HEVC标准的帧内预测编码单元划分方法 | 2020-05-08 | 613 |
基于频谱地图的卫星通信系统用户链路干扰规避方法 | 2020-05-08 | 262 |
视频编码方法及装置 | 2020-05-08 | 832 |
一种使用纹理平滑信息的3D视频残差编码模式选择方法 | 2020-05-08 | 302 |
运动图像编码方法、装置以及运动图像解码方法、装置 | 2020-05-11 | 63 |
采样方法、模型生成方法、视频行为识别方法及装置 | 2020-05-08 | 13 |
图像编码装置 | 2020-05-08 | 236 |
触控检测装置及其控制方法、显示模组 | 2020-05-08 | 177 |
一种编解码方法、装置及其设备 | 2020-05-11 | 480 |
一种基于3D残差网络的镜头边界检测方法 | 2020-05-08 | 900 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。