首页 / 专利库 / 多媒体工具与应用 / 视频编码 / ビデオ符号化のための方法および装置

ビデオ符号化のための方法および装置

阅读:1发布:2021-03-29

专利汇可以提供ビデオ符号化のための方法および装置专利检索,专利查询,专利分析的服务。并且【課題】ビデオ符号器、ビデオ復号器、及び対応する方法が提供される。 【解決手段】画像ブロックのためのビデオ 信号 データを符号化するビデオ符号器は、共通の予測器を使用して、ビデオ信号データの全ての色成分を符号化するための符号器を含む。画像ブロックのためのビデオ信号データを復号化するビデオ復号器は、共通の予測器を使用して、ビデオ信号データの全ての色成分を復号化するための復号器を含む。加えて、画像ブロックのための信号データを符号化及び復号化する装置及び方法は、残差色変換を適用せずにビデオ信号データの色成分を符号化/復号化するための符号器及び復号器を含む。さらに、画像ブロックのためのビデオ信号データを符号化/復号化するビデオ符号器及び復号器は、ビデオ信号データの色成分毎に独自の予測器を使用して、ビデオ信号データを符号化/復号化するための符号器及び復号器を含む。 【選択図】図1,下面是ビデオ符号化のための方法および装置专利的具体信息内容。

画像ブロックのためのビデオ信号データを符号化するためのビデオ符号器であって、共通の予測器を使用して、前記ビデオ信号データのすべての色成分を符号化するための符号器(100)を含む、前記ビデオ符号器。前記共通の予測器が、前記ビデオ信号データの輝度および色度成分の両方に対して使用される輝度予測器である、請求項1に記載のビデオ符号器。前記符号器(100)が、前記ビデオ信号データの前記色成分のすべてに対して共通の空間予測モードを使用する、請求項1に記載のビデオ符号器。前記共通の空間予測モードが、国際電気通信連合電気通信標準化部門のH.264規格のprev_intra8×8_pred_mode_flag、rem_intra8×8_pred_mode、prev_intra4×4_pred_mode_flag、およびrem_intra4×4_pred_modeパラメータによって設定される、請求項3に記載のビデオ符号器。前記符号器(100)が、BフレームおよびPフレームについて、前記ビデオ信号データの前記色成分のすべてに対して共通の補間フィルタを使用する、請求項1に記載のビデオ符号器。前記符号器(100)が、前記ビデオ信号データの前記色成分のすべてを、それらに残差色変換を適用することなく符号化する、請求項1に記載のビデオ符号器。前記ビデオ信号データのサンプリングが、国際電気通信連合電気通信標準化部門のH.264規格の4:4:4、4:2:2、および4:2:0フォーマットの何れかに対応する、請求項1に記載のビデオ符号器。画像ブロックのためのビデオ信号データを符号化するための方法であって、共通の予測器を使用して、前記ビデオ信号データのすべての色成分を符号化(315)するステップを含む、前記方法。前記共通の予測器が、前記ビデオ信号データの輝度および色度成分の両方に対して使用される輝度予測器である、請求項8に記載の方法。共通の空間予測モードが、前記ビデオ信号データの前記色成分のすべてに対して使用される、請求項8に記載の方法。前記共通の空間予測モードが、国際電気通信連合電気通信標準化部門のH.264規格のprev_intra8×8_pred_mode_flag、rem_intra8×8_pred_mode、prev_intra4×4_pred_mode_flag、およびrem_intra4×4_pred_modeパラメータによって設定される、請求項10に記載の方法。共通の補間フィルタが、BフレームおよびPフレームについて、前記ビデオ信号データの前記色成分のすべてに対して使用される、請求項8に記載の方法。前記符号化ステップが、前記ビデオ信号データの前記色成分のすべてを、それらに残差色変換を適用することなく符号化する、請求項8に記載の方法。前記符号化ステップに先行する前処理ステップにおいて、前記ビデオ信号データ上で色変換を実行(308)するステップをさらに含む、請求項8に記載の方法。前記ビデオ信号データのサンプリングが、国際電気通信連合電気通信標準化部門のH.264規格の4:4:4、4:2:2、および4:2:0フォーマットの何れかに対応する、請求項8に記載の方法。

画像ブロックのためのビデオ信号データを符号化するためのビデオ符号器。

说明书全文

本出願は、2005年4月13日に出願された米国仮特許出願第60/671,255号、および2005年7月20日に出願された米国仮特許出願第60/700,834号の優先権を主張する。さらに、本出願は、各々が本出願と併せて出願された、整理番号がPU060023の「METHOD AND APPARATUS FOR VIDEO ENCODING(ビデオ符号化のための方法および装置)」と題する米国特許出願、整理番号がPU060029、PU060030の「METHOD AND APPARATUS FOR VIDEO DECODING(ビデオ復号化のための方法および装置)」と題する米国特許出願、および整理番号がPU050159の「METHOD AND APPARATUS FOR VIDEO ENCODING AND DECODING(ビデオ符号化および復号化のための方法および装置)」と題する米国特許出願に関係する。

本発明は一般に、ビデオ符号器(encoder:エンコーダ)および復号器(decoder:デコーダ)に関し、より詳細には、ビデオ符号化および復号化のための方法および装置に関する。

現在、国際電気通信連合電気通信標準化部門(ITU−T)のH.264規格(以降「H.264規格」)の4:4:4フォーマットは、3つのチャネルのうちの1つだけを輝度(luma:ルマ)として符号化し、他の2つのチャネルは、より低効率のツールを使用して、色度(chroma:クロマ)として符号化される。符号復号器(codec:コーデック)への入が、すべての入力成分においてフル解像度を有する4:4:4フォーマットをとる場合、3つの入力成分のうちの2つをより低効率の色度符号化アルゴリズムを用いて符号化することは、それら2つのチャネルにおけるより多くのビットの使用をもたらす。この問題は、イントラ・フレームにおいてより顕著である。例えば、イントラ・オンリー・モード(Intra−Only mode)で動作するH.264規格は、40dB(PSNR)以上において、全体的圧縮品質がJPEG2k(JPEG2000)よりも低効率である。

従って、上述した従来技術の問題点を克服するビデオ符号化および復号化のための方法および装置をもつことが望ましく、非常に有利である。

上記およびその他の従来技術の問題点および不都合は、ビデオ符号化および復号化のための方法および装置に関する本発明によって対処される。

本発明の一態様によれば、画像ブロックのためのビデオ信号データを符号化するためのビデオ符号器が提供される。ビデオ符号器は、共通の予測器を使用して、ビデオ信号データのすべての色成分を符号化するための符号器を含む。

本発明の別の態様によれば、画像ブロックのためのビデオ信号データを符号化するための方法が提供される。この方法は、共通の予測器を使用して、ビデオ信号データのすべての色成分を符号化するステップを含む。

本発明のまた別の態様によれば、画像ブロックのためのビデオ信号データを復号化するためのビデオ復号器が提供される。ビデオ復号器は、共通の予測器を使用して、ビデオ信号データのすべての色成分を復号化するための復号器を含む。

本発明のさらに別の態様によれば、画像ブロックのためのビデオ信号データを復号化するための方法が提供される。この方法は、共通の予測器を使用して、ビデオ信号データのすべての色成分を復号化するステップを含む。

本発明の上記およびその他の態様、特徴、および利点は、添付の図面と併せて読むための、例示的な実施形態についての以下の詳細な説明から明らかとなるであろう。

本発明は、下記の例示的な図によって、より良く理解することができる。

本発明の原理が適用され得る、例示的なビデオ符号化装置を示すブロック図である。

本発明の原理が適用され得る、例示的なビデオ復号化装置を示すブロック図である。

本発明の原理による、符号化前色変換ブロックを伴う、例示的なビデオ符号化プロセスを示すフロー図である。

本発明の原理による、復号化後逆色変換ブロックを伴う、例示的なビデオ復号化プロセスを示すフロー図である。

残差色変換(RCT)の簡略化モデルを示すブロック図である。

本発明の原理による、ATVイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、ATVイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、CTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、CTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、DTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、DTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、MIR_HDイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、MIR_HDイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、RTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、RTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、STB_HDイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、STB_HDイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットである。

本発明の原理による、H.264シーケンス・パラメータ・シンタックスを示す表である。

本発明の原理による、H.264残差データ・シンタックスを示す表である。

本発明の原理による、H.264残差データ・シンタックスを示す表である。

本発明の原理による、H.264残差データ・シンタックスを示す表である。

本発明の原理による、H.264残差データ・シンタックスを示す表である。

本発明の原理による、符号化前色変換ブロックを伴う、例示的なビデオ符号化プロセスを示すフロー図である。

本発明の原理による、復号化後逆色変換ステップ・ブロックを伴う、例示的なビデオ復号化プロセスを示すフロー図である。

本発明の原理による、H.264マクロブロック予測シンタックスを示す表である。

本発明の原理による、H.264マクロブロック予測シンタックスを示す表である。

本発明は、ビデオ信号データをビデオ符号化および復号化するための方法および装置に関する。本発明は主として、国際電気通信連合電気通信標準化部門(ITU−T)のH.264規格の4:4:4フォーマットを使用してサンプリングされるビデオ信号データに関して説明するが、本発明が、本発明の範囲を維持しながら、H.264規格のその他のフォーマット(例えば、4:2:2および/または4:2:0フォーマット)、ならびにその他のビデオ圧縮規格を使用してサンプリングされるビデオ信号データにも適用され得ることを理解されたい。

本発明の原理による方法および装置が、輝度または色度圧縮アルゴリズム用の新しいツールの使用を必要としないことを理解されたい。代わりに、既存の輝度符号化ツールを使用することができる。従って、それから生じる1つの有利な結果は、下位互換性を保ち、且つ既存のH.264(またはその他の適用可能な)規格に対する変更を最小限に抑えながら、4:4:4フォーマットの符号化性能を最大化できることである。

一実施形態において構成される本発明の原理によれば、例えば、4:4:4コンテンツの3つの成分チャネルのすべてを符号化するために、輝度符号化アルゴリズムが使用される。この実施形態の利点は、4:4:4コンテンツを圧縮するための全体的な符号化性能の、従来技術に対する改善を含む。現在、既存のH.264規格では、3つのチャネルのうちの1つだけが、輝度として符号化され、他の2つは、より低効率のツールを使用して、色度として符号化される。

さらに、一実施形態において構成される本発明の原理によれば、前処理ステップとして、色変換が実行される。従って、この実施形態によれば、圧縮ループ内では、残差色変換(RCT:Residual Color Transform)は実行されない。この実施形態の利点は、すべての色フォーマット間で一貫性のある符号器/復号器アーキテクチャの提供を含む。

さらに、一実施形態において構成される本発明の原理によれば、3つの成分すべてに対して同じ動き/空間予測モードが使用される。この実施形態の利点は、符復号化の複雑さの低減、および下位互換性を含む。

また、別の実施形態によれば、3つの成分すべてに対して同じ予測器を使用する代わりに、3つの成分に対して3つの制限された空間予測器からなる組(またはその一部)が利用されてよい。この実施形態の利点は、4:4:4コンテンツを圧縮するための全体的な符号化性能の、従来技術に対する改善を含む。

上記および以下本明細書で説明する様々な実施形態は、独立型の実施形態として実施することができ、または当業者であれば容易に理解できる方式で組み合わせることができる。従って、例えば、第1の組合せ実施形態では、3つの成分チャネルのすべてを符号化するために、輝度符号化アルゴリズムが有利に使用され、前処理ステップとして、色変換が実行され、3つの成分チャネルすべてに対して、単一の予測器が使用される。第2の組合せ実施形態では、3つの成分チャネルのすべてを符号化するために、輝度符号化アルゴリズムが有利に使用され、前処理ステップとして、色変換が実行され、3つの成分に対して、3つの制限された空間予測器からなる組(またはその一部)が利用されてよい。もちろん、上述したように、本発明の範囲を維持しながら、本明細書で提供される本発明の原理の教示に鑑みて、様々な実施形態のその他の組合せを実施することもできる。

本説明は、本発明の原理について説明する。従って、本明細書で明示的に説明されまたは示されていないが、本発明の原理を実施し、本発明の主旨および範囲に含まれる様々な構成を、当業者が考案できることが理解されよう。

本明細書で述べられるすべての例および条件的表現は、本発明の原理および発明者が当技術分野の発展のために提供した概念を理解する際に、読者を教育的目的で支援することを意図しており、そのような具体的に述べられた例および条件に限定するものではないと解釈すべきである。

さらに、本発明の原理、態様、および実施形態、ならびに本発明の具体的な例について述べる本明細書のすべての言説は、本発明の構造的および機能的均等物の両方を包含することを意図している。加えて、そのような均等物が、現在知られている均等物および将来開発される均等物の両方、すなわち、構造に関わりなく同じ機能を実行する開発された任意の要素を含むことが意図されている。

従って、例えば、本明細書で提示されるブロック図が、本発明の原理を実施する例示的な回路の概念図を代表することは、当業者であれば理解されよう。同様に、フローチャート、フロー図、状態遷移図、および擬似コードなどが、実質的にコンピュータ可読媒体内に表現され、コンピュータまたはプロセッサが明示的に示されているかどうかに関わらず、コンピュータまたはプロセッサによってそのように実行される様々なプロセスを代表することが理解されよう。

図に示された様々な要素の機能は、専用ハードウェアの使用および適切なソフトウェアと共同するソフトウェアを実行可能なハードウェアの使用を通して提供することができる。プロセッサによって提供される場合、機能は、単一の専用プロセッサによって、単一の共用プロセッサによって、または共用されるものがあってもよい複数の個別プロセッサによって提供することができる。さらに、「プロセッサ」または「コントローラ」という用語の明示的な使用は、ソフトウェアを実行可能なハードウェアを排他的に指示すると解釈すべきではなく、ディジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを保存するための読み取り専用メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)、および不揮発性記憶装置を、これらに限定することなく、暗黙に含んでよい。

従来のおよび/またはカスタムのその他のハードウェアを含んでもよい。同様に、図に示されたスイッチは、どれも概念的なものに過ぎない。それらの機能は、プログラム・ロジックの動作を通じて、専用ロジックを通じて、プログラム制御と専用ロジックとの対話を通じて、または手動的にさえも実施することができ、特定の技法は、文脈からより具体的に理解されるように、作成者によって選択可能である。

本明細書に添付された特許請求の範囲において、指定された機能を実行する手段として表されるどの要素も、例えば、a)その機能を実行する回路要素の組合せ、またはb)任意の形式の、従って、ファームウェアもしくはマイクロコードなどを含むソフトウェアであって、そのソフトウェアを動作させるための適切な回路と組み合わされて機能を実行するソフトウェアを含む、その機能を実行する任意の方法を包含することが意図されている。そのような特許請求の範囲によって確定される本発明は、様々な述べられた手段によって提供される機能が、特許請求の範囲が要求する方式で、組み合わされ、集められるという事実にある。従って、それらの機能を提供できる任意の手段は、本明細書に示される手段と均等であると見なされる。

図1に移ると、例示的なビデオ符号化装置が、参照番号199によって全体的に示されている。ビデオ符号化装置199は、ビデオ符号器100と、符号化前色変換モジュール(pre−encoding color transform module)105を含む。

符号化前色変換モジュール105は、ビデオ信号をビデオ符号器100に入力する前に、ビデオ信号の色前処理(color pre−processing)を実行するためのものである。符号化前色変換モジュール105によって実行される色前処理を、以下本明細書でさらに説明する。符号化前色変換モジュール105は、いくつかの実施形態では省略できることを理解されたい。

符号化前色変換モジュール105の入力およびビデオ符号器100の入力は、ビデオ符号化装置199の入力として入手可能である。

符号化前色変換モジュール105の出力は、ビデオ符号器100の入力と信号通信で接続される。

ビデオ符号器100の入力は、加算接合器(summing junction)110の非反転入力と信号通信で接続される。加算接合器110の出力は、変換器/量子化器120と信号通信で接続される。変換器/量子化器120の出力は、エントロピー符号器140と信号通信で接続される。エントロピー符号器140の出力は、ビデオ符号器100の出力として、またビデオ符号化装置199の出力としても利用可能である。

変換器/量子化器120の出力はさらに、逆変換器/量子化器150と信号通信で接続される。逆変換器/量子化器150の出力は、デブロック・フィルタ(deblock filter)160の入力と信号通信で接続される。デブロック・フィルタ160の出力は、参照ピクチャ・ストア(reference picture stores)170と信号通信で接続される。参照ピクチャ・ストア170第1の出力は、動きおよび空間予測推定器180の第1の入力と信号通信で接続される。ビデオ符号器100への入力はさらに、動きおよび空間予測推定器180の第2の入力と信号通信で接続される。動きおよび空間予測推定器180の出力は、動きおよび空間予測補償器190の第1の入力と信号通信で接続される。参照ピクチャ・ストア170第2の出力は、動きおよび空間補償器190の第2の入力と信号通信で接続される。動きおよび空間補償器190の出力は、加算接合器110の反転入力と信号通信で接続される。

図2に移ると、例示的なビデオ復号化装置が、参照番号299によって全体的に示されている。ビデオ復号化装置299は、ビデオ復号器200と、復号化後逆色変換モジュール293を含む。

ビデオ復号器200の入力は、ビデオ復号化装置299の入力として入手可能である。ビデオ復号器200への入力は、エントロピー復号器210の入力と信号通信で接続される。エントロピー復号器210の第1の出力は、逆量子化器/変換器220の入力と信号通信で接続される。逆量子化器/変換器220の出力は、加算接合器240の第1の入力と信号通信で接続される。

加算接合器240の出力は、デブロック・フィルタ290と信号通信で接続される。デブロック・フィルタ290の出力は、参照ピクチャ・ストア250と信号通信で接続される。参照ピクチャ・ストア250は、動きおよび空間予測補償器260の第1の入力と信号通信で接続される。動きおよび空間予測補償器260の出力は、加算接合器240の第2の入力と信号通信で接続される。エントロピー復号器210の第2の出力は、動き補償器260の第2の入力と信号通信で接続される。デブロック・フィルタ290の出力は、ビデオ復号器200の出力として、またビデオ復号化装置299の出力としても利用可能である。

さらに、復号化後逆色変換モジュール(post−decoding,inverse color transform module)293の出力が、ビデオ復号化装置299の出力として利用可能であってもよい。そのような場合、ビデオ復号器200の出力は、ビデオ復号器200に対する後処理モジュールである、復号化後逆色変換モジュール293の入力と信号通信で接続される。復号化後逆色変換モジュール293の出力は、ビデオ復号器200の出力に対して後処理を施した逆色変換信号を提供する。復号化後逆色変換モジュール293の使用が任意選択であることを理解されたい。

本発明の原理による拡張4:4:4符号化について次に説明する。説明される第1の実施形態は、すべての色成分に対して輝度符号化アルゴリズムが使用され、すべての色成分に対して同じ空間予測モードが使用され、圧縮ループから残差色変換(RCT)が省略される、組合せ実施形態である。この組合せ実施形態に関する試験結果も提供される。その後で、すべての色成分に対して輝度符号化アルゴリズムが使用され、すべての色成分に対して(単一の空間予測モードの代わりに)制限された空間予測器からなる組(またはその一部)が使用され、圧縮ループから残差色変換(RCT)が省略される、第2の組合せ実施形態を説明する。従って、第1および第2の組合せ実施形態の間の相違は、第1の組合せ実施形態ではすべての色成分に対して単一の空間予測モードを使用するのに対して、第2の組合せ実施形態ではすべての色成分に対して制限された空間予測器からなる組(またはその一部)を使用する点にある。もちろん、上述したように、本明細書で説明する実施形態は、独立型の実施形態として実施することができ、または当業者であれば容易に理解できる方式で組み合わせることができる。例えば、一実施形態において構成される本発明の原理によれば、圧縮ループからのRCTの省略など、その他の実施形態と組み合わせることなく、単一の空間予測モードだけが使用される。本明細書で提供される本発明の原理の教示に鑑みて、本発明の実施形態の上記およびその他の変形、実施、および組合せが、本発明の範囲を維持しながら、当業者によって容易に確認可能であることを理解されたい。

図3に移ると、例示的なビデオ符号化プロセスと、それに付随する符号化前色変換ブロックが、それぞれ参照番号300および301によって全体的に示されている。

符号化前色変換ブロック301が、ブロック306、308、310を含むことを理解されたい。さらに、符号化前色変換ブロック301は、任意選択であること、従って、本発明のいくつかの実施形態では省略できることも理解されたい。

符号化前色変換ブロック301は、画像内の各ブロックに関するループを開始し、制御を機能ブロック308に渡す、ループ端ブロック306を含む。機能ブロック308は、現在の画像ブロックのビデオ信号データの色前処理を実行し、制御をループ端ブロック310に渡す。ループ端ブロック310は、ループを終了する。さらに、ループ端ブロック310は、ビデオ符号化プロセス300に含まれるループ端ブロック312に制御を渡す。

ループ端ブロック312は、画像内の各ブロックに関するループを開始し、制御を機能ブロック315に渡す。機能ブロック315は、現在の画像ブロックの各色成分に対して共通の予測器を使用して、現在の画像ブロックの動き補償または空間予測を形成し、制御を機能ブロック320に渡す。機能ブロック320は、現在の画像ブロックから動き補償または空間予測を減算して、予測残差を形成し、制御を機能ブロック330に渡す。機能ブロック330は、予測残差を変換および量子化し、制御を機能ブロック335に渡す。機能ブロック335は、予測残差を逆変換および量子化して、符号化予測残差を形成し、制御を機能ブロック345に渡す。機能ブロック345は、符号化残差を予測に追加して、符号化ピクチャ・ブロックを形成し、制御をループ終了ブロック350に渡す。ループ終了ブロック350は、ループを終了し、制御を終了ブロック355に渡す。

図4に移ると、例示的なビデオ復号化プロセスと、それに付随する復号化後逆色変換ブロックが、それぞれ参照番号400および460によって全体的に示されている。

復号化後逆色変換ブロック460が、ブロック462、464、466、468を含むことを理解されたい。さらに、復号化後逆色変換ブロック460は、任意選択であること、従って、本発明のいくつかの実施形態では省略できることも理解されたい。

復号化プロセス400は、画像内の現在のブロックに関するループを開始し、制御を機能ブロック415に渡す、ループ端ブロック410を含む。機能ブロック415は、符号化残差をエントロピー復号化し、制御を機能ブロック420に渡す。機能ブロック420は、復号化残差を逆変換および量子化して、符号化残差を形成し、制御を機能ブロック430に渡す。機能ブロック430は、符号化残差を、各色成分に対して共通の予測器から形成された予測に追加して、符号化ピクチャ・ブロックを形成し、制御をループ端ブロック435に渡す。ループ端ブロック435は、ループを終了し、制御を終了ブロック440に渡す。

いくつかの実施形態では、ループ端ブロック435は任意選択で、復号化後逆色変換ブロック460に、詳細には、復号化後逆色変換ブロック460に含まれるループ端ブロック462に制御を渡す。ループ端ブロック462は、画像内の各ブロックに関するループを開始し、制御を機能ブロック464に渡す。機能ブロック464は、現在の画像ブロックのビデオ信号データの逆色後処理(inverse color post−processing)を実行し、制御をループ端ブロック466に渡す。ループ端ブロック466は、ループを終了し、制御を終了ブロック468に渡す。

H.264 4:4:4フォーマットでは、すべての成分チャネルがフル解像度をもつ。従って、上述された第1の組合せ実施形態によれば、最大の全体的圧縮効率を達成するために、すべての色成分上で、輝度符号化アルゴリズムが使用される。従って、この実施形態では、イントラ・フレームの場合、あらゆる色成分を、例えば、ISO/IEC 14496 10 Advanced Video Coding 3rd Edition(ITU−T Rec. H.264)、ISO/IEC JTC1/SC29/WG11およびITU−T SG16 Q.6、Document N6540、2004年7月の、Table 8−2、Table 8−3、およびTable 8−4に列挙された予測モードを使用して、圧縮することができる。

加えて、前記実施形態では、さらに符号復号器(codec:コーデック)の複雑さを減らし、性能を向上させるために、3つのピクセル成分すべてに対して同じ空間予測モードが使用される。例えば、マクロブロック予測ヘッダ内の輝度用パラメータprev_intra4×4_pred_mode_flag、rem_intra4×4_pred_mode、prev_intra8×8_pred_mode_flag、およびrem_intra8×8_pred_modeによって設定される予測モードが、3つの成分すべてによって使用される可能性がある。従って、追加ビットおよびシンタックス要素は必要とされない。BおよびP(予測)フレームの場合、分数ピクセル位置にある参照ピクセルは、3つのチャネルすべてについて、H.264規格のセクション8.4.2.2.1に記載された補間方法によって計算することができる。現行のH.264規格に対するシンタックスおよびセマンティック変更の詳細を、以下本明細書でさらに説明する。

残差色変換(RCT)が、ハイ4:4:4プロファイル(High 4:4:4 Profile)において、符号器/復号器に追加された。その結果、4:4:4フォーマット用の圧縮構造は、4:2:0および4:2:2フォーマット用のH.264規格の他のプロファイルすべてで現在使用されている圧縮構造と異なる。これは、実装にいくつかの追加の複雑さをもたらす。さらに、その他の任意の色変換と同様に、YCOCGは、全体的な圧縮性能を常に向上させるとは限らない。YCOCGの有効性は、非常に内容依存的である。従って、全体的な圧縮および堅牢性を向上させるために、前記実施形態では、色変換は、前処理ブロックの一部として、予測ループの外側に配置される。これを行うことによって、特定の圧縮タスクにとって最適な色変換を選択することは、運用上の問題となり、特定の入力系列にとっての最良解は、複数の選択肢の中から見つけることができる。3つの成分のすべてが、イントラ・フレームについて同じ空間予測器を使用し、BおよびP(予測またはインター符号化)フレームについて同じ補間フィルタを使用する一実施形態によれば、予測残差上で色変換を実行することは、丸め/切り捨て誤差を無視すれば、符号復号器の外において原画像上で色変換を実行することと同じである。これはさらに、以下本明細書で説明する。従って、すべての色フォーマットの間で符号化構造を一貫させるために、RCTブロックは、符号化構造から取り除かれる。

図5に移ると、RCTの簡略化モデルが、参照番号500によって全体的に示されている。RCTモデル500は、参照ピクセル生成器510と、加算接合器520と、線形変換モジュール530を含む。参照ピクセル生成器510への入力は、動き/エッジ情報と、ベクトル[X1]、[X2]…[Xn]を受け取るように構成される。参照ピクセル生成器510の出力は、加算接合器520に予測ベクトル[Xp]を提供する、加算接合器520の反転入力と信号通信で接続される。加算接合器520の非反転入力は、入力ベクトル[Xin]を受け取るように構成される。加算接合器520の出力は、線形変換モジュール530にベクトル[Xd]を提供する、線形変換モジュール530の入力と信号通信で接続される。線形変換モジュール530の出力は、ベクトル[Yd]を提供するように構成される。

RCTの簡略化モデル500では、3×3行列によって表される色変換(線形変換)は、以下のように定義される。

[Xin]、[Xd]、[Xp]、[X1]、[X2]…[Xn]は、RGB領域においてピクセルを表す3×1ベクトルである。[Yd]は、色変換の結果を表す3×1ベクトルである。従って、以下のようになる。

前記実施形態では、一実施形態において構成される本発明の原理によれば、マクロブロック内の3つの成分すべてに対して同じ空間予測器および補間フィルタが使用されるので、参照ピクセル[Xp]は、以下のように表現することができる。

ここで、n×1ベクトル[C]は、H.264規格で定義される空間予測器および補間フィルタに含まれる線形演算を表す。ここでは、参照ピクセルは、全部でn個の近隣ピクセル[X1]、[X2]…[Xn]を使用することによって計算されると仮定されている。

式(3)の[Xp]を式(2)に代入すると、以下が得られる。

丸め/切り捨て誤差を無視し、RGBまたはY領域で同じ予測モードが選択されると仮定すると、以下が得られる。

従って、以下のようになる。

従って、式(6)は明らかに、この実施形態において構成される本発明の原理による符号器/復号器への入力としてYUVを使用することは、RCTを実行することと同じであることを示している。

また、一実施形態において構成される本発明の原理によれば、新しい4:4:4プロファイルが、H.264規格に追加され、本明細書では、「profile_idc=166を有するアドバンスト4:4:4プロファイル(Advanced 4:4:4 Profile)」と呼ばれる。この新しいprofile_idcは、シーケンス・パラメータ・ヘッダ内に追加することができ、マクロブロック・レイヤ・ヘッダおよび残差データ・ヘッダ内で使用することができる。

輝度アルゴリズムを使用して3つの色成分すべてを符号化することをサポートするために、いくつかの変更が、残差データ・シンタックスに施されてよい。加えて、マクロブロック・ヘッダ、残差データ・ヘッダ内などのいくつかの要素のセマンティクスにも、変更が施されてよい。一般に、H.264仕様における輝度用の既存シンタックスは、無変更のままであり、3つの成分の1つを符号化するために使用される。変更は下位互換である。シンタックスおよびセマンティクスの変更の詳細は、以下本明細書で説明する。

様々な実施形態において構成される本発明の原理に従って実行されたシミュレーション結果に関して、次に説明する。

図6Aおよび図6Bに移ると、ATVイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットが、それぞれ参照番号600および650によって全体的に示されている。

図7Aおよび図7Bに移ると、CTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットが、それぞれ参照番号700および750によって全体的に示されている。

図8Aおよび図8Bに移ると、DTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットが、それぞれ参照番号800および850によって全体的に示されている。

図9Aおよび図9Bに移ると、MIR_HDイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットが、それぞれ参照番号900および950によって全体的に示されている。

図10Aおよび図10Bに移ると、RTイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットが、それぞれ参照番号1000および1050によって全体的に示されている。

図11Aおよび図11Bに移ると、STB_HDイントラ・オンリーの場合の平均PSNR対ビット・レートのプロットが、それぞれ参照番号1100および1150によって全体的に示されている。

具体的には、図6A、図7A、図8A、図9A、図10A、および図11Aは、(「新しい(NEW)」という語によって示され、この語が前に置かれる)提案するアドバンスト4:4:4プロファイル対それに対応する近似結果についての試験結果を示す。さらに、図6B、図7B、図8B、図9B、図10B、および図11Bは、(「新しい」という語によって示され、この語が前に置かれる)提案するアドバンスト4:4:4プロファイル対JPEG2000についての試験結果を示す。

図6A、図6Bから図11A、図11Bのすべてにおいて、PSNRはデシベル(dB)で表され、ビット・レートはビット毎秒(bps)で表される。ATV、CT、DT、MIR、RT、STBは、試験チップの名前である。

JVT−J042、Film−Originated Test Sequencesに記載されているすべてのJVT/FRExt試験系列が、試験で使用された。それらはすべて、4:4:4 10ビットのフィルム材料(film material)であり、各クリップは58のフレームを有する。

提案するアドバンスト4:4:4プロファイルは、JVT参照ソフトウェアJM9.6で実施された。イントラ・オンリーおよびIBBP符号化構造の両方が、試験で使用された。量子化パラメータは、R−D曲線の各々について、6、12、18、24、30、および42に設定された。RD最適化モード選択が使用された。

提案するアドバンスト4:4:4プロファイルは、すべての個別入力成分上でYUVFormat=0(4:0:0)とした参照ソフトウェアを実行することによって達成された結果とも比較された。圧縮ビット・レートを計算するための総圧縮ビットを得るために、3つの別々の個別圧縮ビット・カウントが単純に足し合わされた。

JPEG2kに関して、KaKadu V2.2.3ソフトウェアが、試験で使用された。試験結果は、9/7タップ双直交ウェーブレット・フィルタを用いる5レベルのウェーブレット分解を使用することによって生成された。フレーム当たり唯一のタイルが存在し、与えられた目標レートについてのRD最適化も使用された。

PSNR測定のすべてが、RGB領域で実行された。全体的な圧縮品質を比較するために、(PSNR(赤)+PSNR(緑)+PSNR(青))/3として定義される平均PSNRが使用された。これは主に、JPEG2k圧縮データが、ソフトウェアによって提供される未知のレート制御アルゴリズムを使用して計算されるためである。いくつかの場合、特にJPEG2k色変換が使用された場合、RGB PSNR値は、互いに非常に大きく離れている。

圧縮比較は、以下のように実行された。 ・New1:単一の予測モードを用いる提案するアドバンスト4:4:4プロファイル。 ・New3:3つの予測モードを用いる提案するアドバンスト4:4:4プロファイル。 ・RCT−OFF:RCT=offとしたRGB入力。 ・RCT−ON:RCT=onとしたRGB入力。 ・YCOCG:RGBからYCOCGへの変換が符号復号器の外で実行された。その後、変換YCOCGが、JVTソフトウェアへの入力として使用された。 ・R+G+B:R、G、およびB信号を別々に圧縮することによって近似された提案する方法。 ・Y+CO+CG:変換Y、CO、およびCG信号を別々に圧縮することによって近似された提案する方法。 ・J2k_RGB:JPEG2k圧縮がRGB領域で実行された。JPEG2k色変換はオフにされた。 ・J2k_YUV:JPEG2k圧縮がYUV領域で実行された。JPEG2k色変換が使用された。

試験結果によれば、一実施形態において構成される本発明の原理に従った実施は、一般に、全体的な圧縮効率に関して、JPEG2kと非常に類似している。いくつかの場合では、僅かながらもより優れている。

さらに、一実施形態において構成される本発明の原理に従った実施は、40dB(PSNR)を超える品質について現行のハイ4:4:4プロファイルよりも非常に優れた性能(圧縮)を提供する。具体的には、New1−YCOCGまたはNew3−YCOCGは、YCOCGおよびRCT−ONよりも優れており、New1−RGBまたはNew3−RGBは、RCT−OFFよりも優れている。45dB(PSNR)以上のPSNRでは、平均PSNRにおける平均的な改善は、1.5dBよりも大きい。最後の例では、45dBに等しいPSNRにおいて、改善は25%より大きいビット節約に変換され得る。

試験結果によれば、色変換は、TP、RTなど、内容がより大きく色飽和(color saturated)している場合に、符号化性能を助けると思われる。すなわち、色が無彩であまり飽和していない場合、RGB領域における符号化が、正しい選択であるかもしれない。上の観察は、どの色変換が使用されるかとは無関係である。

New1−YCOCGまたはNew3−YCOCGとJPEG−2k_YUVの結果を比較すると、符号化効率の改善に関する特定の色変換の性能が、非常に内容依存であることが観察された。常に最善である単一の色変換は存在しない。従って、発明者らのデータは、符号化(または復号化)ループの内側にRCTなどの色変換をもつことが良いアイデアでないことがあることを確認した。代わりに、必要であれば、符号器/復号器の外側で色変換を実行することは、全体的な圧縮システムに、より優れ且つより堅牢な性能を提供させることができる。

YCOCGをRCT−ONと比較すると、試験結果は、RCTからの符号化効率の改善を示していない。加えて、RCTがオンにされた参照ソフトウェアを実行することは、符号化時間を著しく増大させることに留意されたい。実行時間は、2.5倍よりも長くなった。

一実施形態において構成される本発明の原理によるシンタックスおよびセマンティクス変更に関して、次に説明する。

図12に移ると、H.264シーケンス・パラメータ・シンタックスについての表が、参照番号1200によって全体的に示されている。一実施形態において構成される本発明の原理によるシンタックスへの変更は、イタリック体テキストによって示されている。

図13に移ると、H.264残差データ・シンタックスについての表が、参照番号1300によって全体的に示されている。一実施形態において構成される本発明の原理によるシンタックスへの追加/変更は、イタリック体テキストによって示されている。表1300では、luma1およびluma2をそれぞれサポートするために、残差データ・ヘッダ内の輝度セクションは、必要なテキスト修正を伴って、2回繰り返される。

上述したように、上で説明した第1の組合せ実施形態は、JVT参照ソフトウェアJM9.6で本発明の原理を実施することによって、評価および試験された。New1−RGBまたはNew1−YCOCGによってマークされた試験結果は、第1の組合せ実施形態を表す。

上述したように、一実施形態において構成される本発明の原理によれば、単一の空間予測モードの代わりに、3つの制限された空間予測器からなる組(またはその一部)が、成分チャネル(例えば、RGB、YUV、YCrCbフォーマットなど)に対して利用される。さらに、上述したように、この実施形態は、例えば、内容の3つの成分チャネルすべてを符号化するために輝度符号化アルゴリズムだけを使用すること、および/または前処理ステップとして色変換を使用することなど、本明細書で説明するその他の実施形態と組み合わされてもよい。

色成分に対して3つの制限された空間予測器からなる組(またはその一部)を使用すること、3つの色成分のすべてを符号化するために輝度符号化アルゴリズムだけを使用すること、および前処理ステップとして色変換を使用する(すなわち、圧縮ループ内にRCTをもたない)ことを含む、上で説明した第2の組合せ実施形態に関して、次に説明する。この実施形態のいくつかの変形も一緒に説明する。

図14に移ると、例示的なビデオ符号化プロセスと、それに付随する符号化前色変換ステップが、それぞれ参照番号1400および1401によって全体的に示されている。

符号化前色変換ブロック1401が、ブロック1406、1408、1410を含むことを理解されたい。さらに、符号化前色変換ブロック1401は、任意選択であること、従って、本発明のいくつかの実施形態では省略できることも理解されたい。

符号化前色変換ブロック1401は、画像内の各ブロックに関するループを開始し、制御を機能ブロック1408に渡す、ループ端ブロック1406を含む。機能ブロック1408は、現在の画像ブロックのビデオ信号データの色前処理を実行し、制御をループ端ブロック1410に渡す。ループ端ブロック1410は、ループを終了する。さらに、ループ端ブロック1410は、ビデオ符号化プロセス1400に含まれるループ端ブロック1412に制御を渡す。

ループ端ブロック1412は、画像内の各ブロックに関するループを開始し、制御を機能ブロック1415に渡す。機能ブロック1415は、現在の画像ブロックの各色成分に対して共通の予測器を使用して、現在の画像ブロックの動き補償または空間予測を形成し、制御を機能ブロック1420に渡す。機能ブロック1420は、現在の画像ブロックから動き補償または空間予測を減算して、予測残差を形成し、制御を機能ブロック1430に渡す。機能ブロック1430は、予測残差を変換および量子化し、制御を機能ブロック1435に渡す。機能ブロック1435は、予測残差を逆変換および量子化して、符号化予測残差を形成し、制御を機能ブロック1445に渡す。機能ブロック1445は、符号化残差を予測に追加して、符号化ピクチャ・ブロックを形成し、制御をループ終了ブロック1450に渡す。ループ終了ブロック1450は、ループを終了し、制御を終了ブロック1455に渡す。

図15に移ると、例示的なビデオ復号化プロセスと、それに付随する復号化後逆色変換ステップが、それぞれ参照番号1500および1560によって全体的に示されている。

復号化後逆色変換ブロック1560が、ブロック1562、1564、1566、1568を含むことを理解されたい。さらに、復号化後逆色変換ブロック1560は、任意選択であること、従って、本発明のいくつかの実施形態では省略できることも理解されたい。

復号化プロセス1500は、画像内の現在のブロックに関するループを開始し、制御を機能ブロック1515に渡す、ループ端ブロック1510を含む。機能ブロック1515は、符号化残差をエントロピー復号化し、制御を機能ブロック1520に渡す。機能ブロック1520は、復号化残差を逆変換および量子化して、符号化残差を形成し、制御を機能ブロック1530に渡す。機能ブロック1530は、符号化残差を、各色成分に対して共通の予測器から形成された予測に追加して、符号化ピクチャ・ブロックを形成し、制御をループ端ブロック1535に渡す。ループ端ブロック1535は、ループを終了し、制御を終了ブロック1540に渡す。

いくつかの実施形態では、ループ端ブロック1535は任意選択で、復号化後逆色変換ブロック1560に、詳細には、復号化後逆色変換ブロック1560に含まれるループ端ブロック1562に制御を渡す。ループ端ブロック1562は、画像内の各ブロックに関するループを開始し、制御を機能ブロック1564に渡す。機能ブロック1564は、現在の画像ブロックのビデオ信号データの逆色後処理を実行し、制御をループ端ブロック1566に渡す。ループ端ブロック1566は、ループを終了し、制御を終了ブロック1568に渡す。

上述したように、アドバンスト4:4:4プロファイル用の新しいプロファイル(profile_idc=166)が開示される。この新しいプロファイルは、第2の組合せ実施形態について以下本明細書で説明する対応するセマンティックおよびシンタックス変更を施して、第2の組合せ実施形態のために使用することもできる。この新しいprofile_idcは、シーケンス・パラメータ・セット内に追加され、入力フォーマットが4:4:4であり、3つの入力チャネルすべてが輝度として同じように符号化されることを示すために、後続ヘッダ内で主に使用される。

H.264規格に対する必要な変更を最小限に抑えるため、アドバンスト4:4:4プロファイル用の新しいマクロブロック・タイプは開示されない。代わりに、H.264規格のTable 7−11、Table 7−13、およびTable 7−14に列挙された、関連する符号化パラメータを伴うマクロブロック・タイプのすべては、依然として有効である。イントラ・マクロブロックの場合、輝度、Cr、およびCbの3つの入力チャネルのすべてが、H.264規格のTable 7−11で定義されるMbPartPredModeに基づいて符号化される。例えば、アドバンスト4:4:4プロファイルにおけるIntra_4×4マクロブロックは、すべての入力成分チャネルが、H.264規格のTable 8−2で与えられる9個の可能な予測モードのすべてを使用することによって符号化できることを意味する。参考として、現行のハイ4:4:4プロファイルでは、Intra_4×4マクロブロック用のチャネルのうちの2つが、色度として扱われ、H.264規格のTable 8−5内の4個の可能なイントラ予測モードのうちの1つだけが使用される。BおよびPマクロブロックの場合、アドバンスト4:4:4プロファイルのために施される変更は、分数ピクセル位置にある参照ピクセル値の計算のための補間プロセスにおいて発生する。ここでは、H.264規格のセクション8.4.2.2.1に記載された手続きである、輝度サンプル補間プロセス(Luma sample interpolation process)が、輝度、Cr、およびCbに適用される。再び参考として、現行のハイ4:4:4プロファイルは、入力チャネルのうちの2つに対して、H.264規格のセクション8.4.2.2.2の色度サンプル補間プロセス(Chroma sample interpolation process)を使用する。

CABACがエントロピー符号化モードとして選択された場合、輝度用に現在定義されているのと同じコンテキスト・モデルの2つの別個の組が、CrおよびCb用に生成される。それらも、符号化の最中に独立に更新される。

最後に、前記実施形態では、符号化ループ内にRCTブロックが存在しないので、ResidueColorTransformFlagは、アドバンスト4:4:4プロファイルのシーケンス・パラメータ・セットから取り除かれる。

この時点まで、大部分のシンタックス変更は、図13に示される残差データにおいて発生し、提案するアドバンスト4:4:4プロファイルにおいてCrおよびCbをサポートするために、輝度用の元のシンタックスが2度繰り返される。

H.264マクロブロック・レイヤ表(図示せず)に関して、対応するシンタックスに対するセマンティック変更は以下を含む。

coded_block_pattern(追加)。chroma_format_idcが3に等しく、且つcoded_block_patternが存在する場合、CodedBlockPatternChromaは0に設定される。加えて、CodedBlockPatternLumaは、マクロブロックの12個の8×8輝度、Cb、およびCrブロックの各々について、以下のケースの一方、すなわち、(1)8×8輝度ブロック、8×8Cbブロック、および8×8Crブロック内の12個の4×4輝度ブロックのすべての変換係数レベルが0に等しいケース、(2)8×8輝度ブロック、8×8Cbブロック、および8×8Crブロック内の1つまたは複数の4×4輝度ブロックの1つまたは複数の変換係数レベルが非0の値をもつケースの一方を指定する。

第2の組合せ実施形態(または3つの制限された空間予測器からなる組(またはその一部)の使用に関する単独の実施形態)によるイントラ・ブロックのための空間予測モード選択に関して、次に説明する。

各入力チャネルを別々に符号化する場合のように、各成分が、その最良のMbPartPredModeと、後続の最良の空間予測モードを独立に選択するため、いくつかの新しいイントラ・ブロック・タイプが、H.264規格のTable 7−11に追加されてよい。その結果、H.264規格に対する大きな変更が行われる。第2の組合せ実施形態に関係する一実施形態では、現行のmb_typesは無変更のままであり、代替策が提供される。前記実施形態では、3つの入力チャネルは、同じMbPartPredModeまたはマクロブロック・タイプを用いて符号化されるように制限される。その後、3つの別個の予測モードをサポートするために、僅かな新しい要素が、マクロブロック予測シンタックスに追加される。従って、各成分チャネルに対する予測誤差を最小化するために、各成分は、理論的にはまだ、その最良の空間予測モードを独立に選択することができる。例えば、Intra_4×4マクロブロックがmb_typeとして選択されると仮定すると、輝度、Cr、およびCbは依然として、例えば、輝度にはIntra_4×4_Vertical、CrにはIntra_4_4_Horizontal、CbにはIntra_4×4_Diagonal_Down_Leftなど、H.264規格のセクション8.3.1.1のTable 8−2内に、その最良の空間予測モードを見出すことができる。

上で説明した第1の組合せ実施形態に関係する別のアプローチは、3つの入力チャネルすべてを、同じ予測モードを共用するように制約するものである。これは、マクロブロック予測シンタックス内の、prev_intra4×4_pre_mode_flag、rem_intra4×4_pred_mode、pre_intra8×8_pred_mode_flag、およびrem_intra8×8_pred_modeなど、既存のシンタックス要素によって現在は保持される、予測情報を使用することによって行うことができる。このオプションは、H.264規格に対するより僅かな変更と、さらに符号化効率の僅かな低下ももたらす。

試験結果に基づいて、3つの予測モードの使用は、第1の組合せ実施形態よりも約0.2dBだけ全体的な符号化性能を向上させることができる。

図16に移ると、H.264マクロブロック予測シンタックスについての表が、参照番号1600によって全体的に示されている。参考として、3つの予測モードの使用をサポートする修正マクロブロック予測シンタックスを以下に列挙する。 輝度用にprev_intra4×4_pred_mode_flag0およびrem_intra4×4_pred_mode0。 Cr用にprev_intra4×4_pred_mode_flag1およびrem_intra4×4_pred_mode1。 Cb用にprev_intra4×4_pred_mode_flag2およびrem_intra4×4_pred_mode2。

第2の組合せ実施形態についての、一実施形態において構成される本発明の原理に従って実行されたシミュレーション結果に関して、次に説明する。

JVT−J042、Film−Originated Test Sequences、JVT J039(Viper)に記載されているすべてのJVT/FRExt試験系列。それらはすべて、4:4:4 10ビットの材料であり、各クリップは58のフレームを有する。

提案するアルゴリズムは、JVT参照ソフトウェアJM9.6で実施され、修正ソフトウェアが試験で使用された。イントラ・オンリーおよびIBRrBPの両方が試験された。ここで、「Br」は、記録Bピクチャを意味する。イントラ・オンリーのケースは、量子化パラメータが6、12、18、24、30、36、および42に等しいすべてのシーケンスについて行われた。シミュレーションには多くの時間が必要とされるため、量子化パラメータが12、18、24、30、および36に等しいフィルム・クリップについては、IBRrBP GOP構造だけが行われた。4:4:4 AHGの説明に従って、以下のキー・パラメータが試験で使用された。

SymbolMode=1 RDOptimization=1 ScalingMatrixPresentFlag=0 OffsetMatrixPresentFlag=1 QoffsetMatrixFile=“q_offset.cfg” AdaptiveRounding=1 AdaptRndPeriod=1 AdaptRndChroma=1 AdaptRndWFactorX=8 SearchRange=64 UseFME=1 JPEG2kに関して、KaKadu V2.2.3ソフトウェアが、試験で使用された。試験結果は、9/7タップ双直交ウェーブレット・フィルタを用いる5レベルのウェーブレット分解を使用することによって生成された。フレーム当たり唯一のタイルが存在し、与えられた目標レートについてのRD最適化も使用された。

PSNR測定は主に、上で説明したクリップの場合はRGBである、原内容の元の色領域で計算された。全体的な圧縮品質を比較するために、(PSNR(赤)+PSNR(緑)+PSNR(青))/3として定義される平均PSNRが使用された。

圧縮比較は、以下のように実行された。 New1:単一の予測モードを用いる提案するアドバンスト4:4:4プロファイル。 New3:3つの予測モードを用いる提案するアドバンスト4:4:4プロファイル。 RCT−OFF:RCT=offとしたRGB入力。 RCT−ON:RCT=onとしたRGB入力。 YCOCG:RGBからYCOCGへの変換が符号復号器の外で実行された。その後、変換YCOCGが、JVTソフトウェアへの入力として使用された。 R+G+B:R、G、およびB信号を別々に圧縮することによって近似された提案する方法。 Y+CO+CG:変換Y、CO、およびCG信号を別々に圧縮することによって近似された提案する方法。 JPEG2k_RGB:JPEG2k圧縮がRGB領域で実行された。JPEG2k色変換はオフにされた。 JPEG2k_YUV:JPEG2k圧縮がYUV領域で実行された。JPEG2k色変換が使用された。

イントラ・オンリーのケースの場合、本発明の原理による提案するアドバンスト4:4:4プロファイルは、全体的な圧縮効率に関して、JPEG2kと非常に類似している。いくつかの場合では、僅かながらもより優れている。

本発明の原理によるアプローチは明らかに、現行のハイ4:4:4プロファイルよりも優れている。45dB(PSNR)以上のPSNRでは、平均PSNRにおける平均的な改善は、1.5dBよりも大きい。いくつかのケースでは、45dBに等しいPSNRにおいて、改善は25%より大きいビット節約に変換され得る。

同じブロック・タイプを用いたとしても、3つの予測モードの使用は、単一モードよりも僅かに優れている。しかし、より多くのシンタックスおよびセマンティック変更が、利用されることがある。

本発明の実施形態の原理によって提供される多くの関連する利点/特徴のうちのいくつかに関して、次に説明する。

試験結果は、本発明の原理に対応する改善を利用する提案するアドバンスト4:4:4プロファイルが、現行のハイ4:4:4プロファイルと比較した場合に、改善された性能を達成することを示している。性能増加は著しい。加えて、色変換を符号復号器の外に移動することは、符号復号器の構成をすべての色フォーマット間で一貫したものにする。その結果、それは実施をより容易にし、コストを低減する。それはまた、より良い符号化効率を達成するための最適化色変換に関して、符号復号器をより堅牢にもする。また、提案するアプローチは、新しい符号化ツールを追加せず、シンタックスおよびセマンティクスに対するいくつかの僅かな変化を必要とするだけである。

従って、一実施形態において構成される本発明の原理によれば、ビデオ符号化および復号化のための方法および装置が提供される。現在達成可能な性能を超えて性能を改善する、既存のH.264規格に対する変更が提供される。さらに、性能は、高品質アプリケーション用のJPEG−2000さえも超えて改善される。一実施形態において構成される本発明の原理によれば、H.264規格における4:4:4符号化性能の著しい改善は、輝度符号化アルゴリズムを使用して、4:4:4コンテンツの3つの色成分のすべてを符号化することによって、達成することができる。すなわち、輝度(または使用されない色度)圧縮アルゴリズム用の新しいツールは必要ない。代わりに、既存の輝度符号化ツールが利用される。さらに、現行の4:4:4プロファイルに対するシンタックスおよびセマンティック変更は、3つの成分チャネルすべての輝度符号化をサポートするように、本発明の原理に従って実施され得る。本発明の一実施形態に従って行われた試験では、原内容が多くの空間テクスチャおよびエッジを有する場合、輝度で使用される空間予測ツールは明らかに、色度で使用されるツールよりも優れた性能を示した。試験系列のいくつかについては、すべての色成分が輝度として符号化されたとき、45db(平均PSNR)以上の圧縮品質において、30%を超えるビット削減が観察された。

本明細書では、本発明は主に、H.264規格の4:4:4フォーマットを使用してサンプリングされるビデオ信号データに関して説明したが、本発明は、H.264規格のその他のフォーマット(例えば、4:2:0フォーマットおよび/または4:2:2フォーマット)ならびにその他のビデオ圧縮規格を使用してサンプリングされるビデオ信号データに関しても容易に実施できることを理解されたい。本明細書で提供される本発明の教示に鑑みて、本発明の上記およびその他の変形も、本発明の範囲を維持しながら、当業者によって容易に実施されよう。

本発明の上記およびその他の特徴および利点は、本明細書の教示に基づいて、当業者によって容易に確認されよう。本発明の教示が、様々な形式のハードウェア、ソフトウェア、ファームウェア、専用プロセッサ、またはそれらの組合せで実施できることを理解されたい。

最も好ましくは、本発明の教示は、ハードウェアとソフトウェアの組合せとして実施される。さらに、ソフトウェアは、プログラム記憶ユニット上に有形に実施されるアプリケーション・プログラムとして実施することができる。アプリケーション・プログラムは、適切な構成からなるマシンにアップロードされ、そのマシンによって実行することができる。好ましくは、マシンは、1つまたは複数の中央処理装置(「CPU」)、ランダム・アクセス・メモリ(「RAM」)、および入力/出力(「I/O」)インタフェースなどのハードウェアを有するコンピュータ・プラットフォーム上で実施される。コンピュータ・プラットフォームは、オペレーティング・システムおよびマイクロ命令コードも含むことができる。本明細書で説明した様々なプロセスおよび機能は、CPUによって実行できるマイクロ命令コードの一部もしくはアプリケーション・プログラムの一部、またはそれらの組合せとすることができる。加えて、追加のデータ記憶ユニットおよび印刷ユニットなどの様々なその他の周辺ユニットが、コンピュータ・プラットフォームに接続されてよい。

添付の図面に示された成分システム構成要素および方法のいくつかは、好ましくはソフトウェアで実施されるので、システム構成要素とプロセス機能ブロックの間の実際の接続は、本発明がプログラムされる方式に応じて異なり得ることをさらに理解されたい。本明細書の教示に鑑みて、当業者であれば、本発明の上記および類似の実施または構成を企図することができる。

本明細書では、添付の図面を参照して、例示的な実施形態を説明したが、本発明は、それらと寸分違わぬ実施形態に限定されるものではなく、様々な変更および修正が、本発明の主旨および範囲から逸脱することなく、当業者によってそれらに実施され得ることを理解されたい。そのような変更および修正のすべては、添付の特許請求の範囲で説明する本発明の範囲内に含まれることが意図されている。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈