首页 / 专利库 / 银行与财务事项 / 数字货币 / 加密货币 / 比特币 / Method and apparatus for transcoding group of macroblock of partially coded input bitstream

Method and apparatus for transcoding group of macroblock of partially coded input bitstream

阅读:830发布:2020-10-26

专利汇可以提供Method and apparatus for transcoding group of macroblock of partially coded input bitstream专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To transcode groups of macroblocks of an input bitstream which is partially coded. SOLUTION: The groups of macroblocks include macroblocks of intra-mode and macroblocks of inter-mode. Each macroblock includes an DCT coefficient and at least one motion vector. The modes of each group of macroblocks are mapped so as to be identical only if an inter-mode block and an intra-mode macroblock exist in the group. If any of the macroblocks in the group are mapped, the DCT coefficients and the motion vector for the mapped macroblocks are modified according to the mapping to generate a macroblock with reduced resolution to output compressed bitstream for compensating for drift.,下面是Method and apparatus for transcoding group of macroblock of partially coded input bitstream专利的具体信息内容。

  • 【特許請求の範囲】 【請求項1】 イントラモードマクロブロック及びインターモードマクロブロックを含み、各マクロブロックがDCT係数及び運動ベクトルを含む部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する方法において、 前記群内にインターモードブロック及びイントラモードマクロブロックが存在する場合にのみ各マクロブロック群のモードを同じになるようにマッピングし且つ前記D
    CT係数及び運動ベクトルを各変更されたマクロブロックに対しマッピングに従い修正し、 前記各マクロブロック群をダウンサンプリングして縮減された解像度のマクロブロックを生成し圧縮されたビットストリーム出力とすることを特徴とする符号化変換方法。 【請求項2】 各変更されたマクロブロックのモードをインターモードにマッピングし、各変更されたマクロブロックの運動ベクトル及びDCT係数を、ビットストリームが比較的小さい運動を有する場合に零にセットすることを特徴とする請求項1に記載の方法。 【請求項3】 各変更されたマクロブロックのモードをインターモードにマッピングし且つ変更されたブロックの運動ベクトルを予測し、ビットストリームが比較的大きい運動を有する場合に前記変更されたマクロブロックのDCT係数をインターモードに変換することを特徴とする請求項1に記載の方法。 【請求項4】 各変更されたマクロブロックのモードをイントラモードにマッピングし且つ変更されたマクロブロックの運動ベクトルを零にセットし、ビットストリームが比較的大きい運動を有する場合に前記変更されたマクロブロックのDCT係数をイントラモードに変換することを特徴とする請求項1に記載の方法。 【請求項5】 ダウンサンプリングが低解像度の運動ベクトルへの運動ベクトルのマッピングを含み、更に、 圧縮されたビットストリームを可変長復号し部分的に復号されたビットストリームの逆DCT係数及び運動ベクトルを生成し、 第1の空間量子化器を用いて逆DCT係数を逆量子化してDCT係数を求め、 第2の空間量子化器を用いて各縮減された解像度のマクロブロックを量子化し、 各量子化された縮減解像度のマクロブロック及び低解像度の運動ベクトルを可変長符号化することを特徴とする請求項1に記載の方法。 【請求項6】 更に、各ダウンサンプリングされたマクロブロックに対し縮減解像度ドリフト補償信号を生成し、 縮減解像度ドリフト補償信号を各ダウンサンプリングされたマクロブロックに加算して圧縮ビットストリーム出力におけるドリフトを補償することをことを特徴とする請求項1に記載の方法。 【請求項7】 更に、各ダウンサンプリングされたマクロブロックに対し全解像度ドリフト補償信号を発生し、 各全解像度ドリフト補償信号を前記群の各マクロブロックに加算することを特徴とする請求項1に記載の方法。 【請求項8】 更に、逆量子化信号及びアプサンプリングされた信号を元解像度の基準信号から減算して全解像度信号を生成することを特徴とする請求項1に記載の方法。 【請求項9】 更に、縮減解像度の基準信号から逆量子化信号を減算し、 縮減解像度差信号をアプサンプリングして全解像度信号を生成することを特徴請求項7に記載の方法。 【請求項10】 更に、逆量子化され且つアプサンプリングされた信号を元解像度の基準信号から減算して全解像度信号を生成することを特徴請求項7に記載の方法。 【請求項11】 各ダウンサンプリングされたマクロブロックに対し縮減解像度差信号を発生し、 各縮減解像度差信号を全解像度ドリフト補償信号にアプサンプリングし、 各全解像度ドリフト補償信号を前記群の各マクロブロックに加算することを特徴請求項1に記載の方法。 【請求項12】 各ダウンサンプリングされたマクロブロックに対し縮減解像度差信号を発生し、 各全解像度ドリフト補償信号を前記群の各マクロブロックに加算することを特徴請求項1に記載の方法。 【請求項13】 各マクロブロックが【数1】 個のピクセルを含み、ダウンサンプリングが更に、 【数2】 個のマクロブロックの群にフィルタリングを行って単一の【数3】 マクロブロックを生成する段階を含むことを特徴請求項1に記載の方法。 【請求項14】 部分的に復号された入力ビットストリームがMPEG−2フォーマットであり、圧縮された出力ビットストリームがMPEG−4フォーマットであることを特徴とする請求項1に記載の方法。 【請求項15】 マルチメディアコンテンツ配布システムの適応型サーバで符号変換(transcoding)を行うことを特徴とする請求項1に記載の方法。 【請求項16】 符号変換を家庭用ネットワークのトランスコーダにおいて行うことを特徴とする請求項1に記載の方法。 【請求項17】 更に、 複数のDCTフィルタを各マクロブロックのDCT係数に適用し各マクロブロック毎に複数のアプサンプリングされたマクロブロックを発生し、その場合、1つのアプサンプリングされたマクロブロックを各フィルタによって生成し、前記マクロブロック及びアプサンプリングされたマクロブロックが同じ次元を有することを特徴とする請求項1に記載の方法。 【請求項18】 イントラモードマクロブロック及びインターモードマクロブロックを含むマクロブロックの群であって、前記各マクロブロックがDCT係数及び運動ベクトルを含む部分的に復号された入力ビットストリームのマクロブロック群を変換符号化する装置において、 前記群内にインターモードブロック及びイントラモードマクロブロックが存在する場合にのみ各マクロブロック群のモードを同じになるようにマッピングし且つ前記D
    CT係数及び運動ベクトルを各変更されたマクロブロックに対するマッピングに従って修正するための手段と、 前記各マクロブロック群をダウンサンプリングして縮減された解像度のマクロブロックを生成し圧縮された出力ビットストリームを発生するための手段を含むことを特徴とする符号化変換装置。
  • 说明书全文

    【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、一般にビットストリームのトランスコーディング(transcoding)もしくは変換符号化の技術分野に係わり、特に、ビデオビットストリームのトランスコーディング、即ち符号変換中に空間解像度を縮減する技術に関する。 殊に、本発明は、
    空間像度の縮減機能を有するビデオトランスコーダ(変換符号化器或いは変換符号化装置)に関する。 【0002】[発明の背景]ビデオ圧縮は、少ない記憶、ネットワーク及びプロセッサ資源で画像情報の記憶、伝送及び処理を可能にする。 最も広範に用いられているビデオ圧縮規格には、動画の記憶及び検索のためのMPEG−1、ディジタルテレビジョン用のMPEG−
    2及びビデオ会議用のH.263がある。 これ等については、ISO/IEC 11172-2: 1993 「Information Technolo
    gy - Coding of Moving Pictures and Associated Audi
    o for Digital Storage Media up to about 1.5 Mbit/s
    Part 2: Video」、D. LeGallの「MPEG: A Video Comp
    ression Standard for Multimedia Applications」、 C
    ommunications of the ACM, Vol. 34, No. 4, pp. 46-5
    8, 1991, ISO/IEC 13818-2: 1996, 「Information Tech
    nology Generic Coding of Moving Pictures and Asso
    ciated Audio Information Part 2: Video」、1994,IT
    UT SG XV, DRAFT H. 263, 「Video Coding for Low Bi
    trate Communication」1996, ITU-T SG XVI, DRAFT13
    H. 263 + Q15-A-60 rev. 0, 「Video Coding for Low B
    itrate Communication」1997を参照されたい。 【0003】上述の規格は、主に画像或いはフレームの空間圧縮並びにフレームシーケンスの空間及び時間圧縮を取り扱う比較的低レベルの仕様である。 共通の特徴として、これら規格はフレームベースで圧縮を行う。 これら規格によれば、広範囲の用途に対して高い圧縮率を達成することができる。 【0004】マルチメディア用途のためのMPEG−4
    のような新たなビデオ符号化規格(ISO/IEC 14496-2: 1
    999, 「Information technology-coding of audio/visu
    al objects, Part 2: Visual」、参照)の出現で、任意の形状のオブジェクトを別個のビデオオブジェクト平面(VOP)として符号化したり或いは復号することが可能である。 この場合オブジェクトとしては、ビジュアルオブジェクト、オーディオオブジェクト、自然オブジェクト、人工オブジェクト、原始オブジェクト、混成オブジェクト或いはそれらの組み合わせからなるオブジェクトがある。 また、無線チャンネルのようなエラーの起こりがちなチャンネルを介して堅実な(即ち、ロバストな)伝送を可能にするために相当量の耐エラー対策が組み込まれている。 【0005】新たに出現したMPEG−4規格は、インタラクチブビデオのようなマルチメディア用途、即ち、
    自然及び人工材料が統合され、アクセスが普遍(一方的ではない)であるマルチメディアへの適用を可能にするように企図されている。 ビデオ伝送と関連して、ネットワーク上での帯域幅の大きさを減少もしくは縮減するのに圧縮規格が必要とされる。 この場合ネットワークは無線でもインターネットでも良い。 いずれにせよ、ネットワークの容量には制限があり、従って、少ない資源に対する競合は最小に抑止すべきである。 【0006】装置がコンテンツをロバストに、即ち堅実に伝送したりコンテンツの品質を利用可能なネットワーク資源に適合することを可能にするシステム及び方法に関して多大な努が払われている。 これと関連し、コンテンツをエンコードもしくは符号化する場合、低ビットレート或いは低解像度でネットワークを介しビットストリームを伝送できるようにするために先ず前に該ビットストリームを復号(デコーディング)する必要がある場合がある。 【0007】これは、図1に示すように、変換符号化器(トランスコーダ)100により達成することができる。 最も単純な構成において、該変換符号化器100
    は、カスケード接続されたデコーダ(復号器)110及びエンコーダ(符号化器)120を有する。 圧縮された入力ビットストリーム101は入力ビット・レート【数4】

    で完全に復号され、次いで、再符号化されビットレート【数5】 の出力ビットストリーム103が生成される。 通常、出力ビットレートは入力ビットレートよりも小さい。 しかしながら、実際例では、復号されたビットストリームの再符号化が非常に複雑であるために変換符号化器で完全な復号化及び完全な再符号化は行われていない。 【0008】MPEG−2規格の変換符号化(トランスコーディング)に関する初期の研究として、Sun外により公表された論文「Architectures for MPEG compresse


    d bitstream scaling」、IEEE Transactions on Circui


    ts and Systems for Video Technology(1996年4


    月)がある。 この論文には、複雑性及びアーキテクチャの変更に伴い4つのレート縮減方法が記述されている。 【0009】図2は、開ループアーキテクチャと称する第1の方法例200を示している。 このアーキテクチャにおいては、入力ビットストリーム201は部分的にのみ復号されるだけである。 具体的に述べると、入力ビットストリームのマクロブロックは可変長復号(VLD)


    210及び微細量子化器【数6】 での逆量子化220を受け、それにより離散コサイン変換(DCT)係数が生成される。 所与の所望の出力ビット・レート202に対し、DCTブロックは、量子化器230の粗レベル量子化【数7】 で再量子化される。 これら再量子化されたブロックは、


    次いで240で示すように可変長符号化(VLC)され、その結果として低ビットレートで新たな出力ビットストリーム203が形成される。 この方式は、図1に示した方式よりも相当に単純である。 その理由は、運動ベクトルが再使用され、逆DCT演算が不必要であるからである。 ここで、 【数8】 及び【数9】 の選択は厳密にビットストリームのビットレート特性に依存する。 場合によりあり得る他の要因、例えばビットストリームの空間特性のようなファクタ(要因)は考慮されない。 【0010】図3は、第2の方法例300を示す。 この方法は閉ループアーキテクチャと称されている。 この方法においては、入力ビデオビットストリームが再び部分的に復号され、即ち、入力ビットストリームのマクロブロックが可変長復号(VLD)310並びに量子化器【数10】 での逆量子化320を受け、それにより離散コサイン変換(DCT)係数321が生成される。 上述した第1の方法例とは対照的に、入力DCT係数321に対して補正DCT係数332が加算(330参照)され、それにより、再量子化によって生じた不整合(ミスマッチ)が補償される。 この補正により、終局的に復号もしくはデコーディングに用いられる基準フレームの品質、即ちクオリティが改善される。 補正を行った後、新たに形成されたブロックは、新たなビットレートとなるように【数11】 で再量子化(340)されると共に既述のように可変長符号化(350)される。 この場合にも、 【数12】 及び【数13】 はビットレートに基づいて定められることを注記しておく。 【0011】補正コンポーネント(成分)332を得るために、再量子化されたDCT係数は逆量子化(36


    0)され、元の部分的に復号されたDCT係数から減算(370)される。 この減算から得られる差は、逆DC


    T(IDCT)365を介して空間ドメインに変換されてフレームメモリ380に記憶される。 ここで、各入力ブロックと関連の運動ベクトル381が、運動補償(3


    90)を行うために対応の差ブロックを再読み出しするのに用いられる。 そこで、対応のブロックは、DCT3


    32を介して変換され、それにより補正コンポーネントが生成される。 図3に示した方法の派生例が、Assuncao


    外の論文「A frequency domain video transcoder for


    dynamic bit-rate reduction of MPEG-2 bitstream


    s」、IEEE Transaction on Circuits and System for V


    ideo Technology, pp. 953-957, 1998に記述されている。 【0012】即ち、Assuncao外はまた、同じタスクのための別の方法をも提案している。 この別の方法においては、ドリフト補償の目的で、周波数ドメインで動作する運動補償(MC)ループを用いている。 周波数ドメインでMCブロックの高速計算を行うために近似行列(マトリックス)が導出される。 変換符号化(transcoding)


    に対し最良の量子化スケールを算出するためにラグランジェの最適化が採用されている。 この方法によれば、I


    DCT/DCTコンポーネントに対する必要性が除かれる。 【0013】従来の圧縮規格に従えば、テクスチャ情報の符号化に割り当てられるビット数は、量子化パラメータ(QP)により制御される。 上に述べた方法は、元のビットストリームに含まれている情報をベースとするQ


    P、即ち量子化パラメータを変えることによりテクスチャ・ビットレートを縮減する点で類似性を有している。


    効率的に実施するために、情報は通常、圧縮されたドメインから直接抽出され、マクロブロックの運動またはD


    CTブロックの残存エネルギーに関する尺度を含むことができる。 上述の方法はビットレートの縮減に対してのみ適用可能である。 【0014】ビットレートの縮減に加えて、他の形式のビットストリームの変換をも行うことができる。 例えば、オブジェクトベースの変換が、Vetro外の2000


    年2月14日付けの米国特許出願09/504,323


    号明細書(発明の名称:Object-Based Bitstream Trans


    coder)に記述されている。 また、空間解像度に関する変換が、Shanableh及びGhanbariの論文「Heterogeneous


    video transcoding to lower spatio-temporal resolu


    tion, and different encoding formats」、IEEE Trans


    action on Multimedia(June 2000)に記述されている。 【0015】これらの方法では、品質の面で不満がある低い空間解像度でビットストリームが生成され、品質を高めようとすれば複雑性が増加する。 また、再構成マクロブロックを形成する手段に関し適切な考慮が払われいない。 これは、品質及び複雑性双方に関し大きなインパクトを与えるばかりでなく2とは異なる縮減因数を考慮した場合に特に問題となる。 更にまた、これらの方法には具体的なアーキテクチャの詳細が伴っていない。 関心の多くは因数「2」による運動ベクトルの種々なスケーリング手段に注がれている。 【0016】図4は、入力ビットストリームを低い空間解像度で出力ビットストリーム402に変換符号化(tr


    anscoding)する方法400の詳細を示す。 この方法は、図1に示した方法を拡張したものに対応するが、デコーダ110及びエンコーダ120の詳細を示すと共に、復号化プロセス及び符号化プロセス間にダウンサンプリング・ブロック410を有する。 デコーダ110


    は、ビットストリームの部分的復号を行う。 ダウンサンプリング・ブロック410は、部分的にマクロブロックを含む群の空間解像度を縮減する。 デコーダにおける運動補償420では全解像度の運動ベクトル【数14】 421が用いられ、他方、エンコーダにおける運動補償430では低解像度の運動ベクトル【数15】 431が用いられる。 低解像度の運動ベクトルはダウンサンプリングした空間ドメインフレーム【数16】 403から推定されるか或いは全解像度の運動ベクトルからマップされる。 変換符号化器(トランスコーダ)4


    00の詳細について更に下に説明する。 【0017】図5は、入力ビットストリーム501を低空間解像度で出力ビットストリーム502にトランスコード即ち変換符号化するための開ループ方法500の詳細を示す。 この方法においては、ビットストリーム10


    1はやはり部分的に復号される。 即ち、入力ビットストリームのマクロブロックが可変長復号(VLD)(51


    0)及び逆量子化(520)され、それにより離散コサイン変換(DCT)係数が生成される。 なお、これらの処理ステップは周知のものである。 【0018】次いで、DCTマクロブロックは、16×


    16(2

    ×2

    ) マクロブロック内の各8×8 (2

    ×2


    ) ルミナンスブロックの高周波係数をマスキングすることにより「2」の因数でダウンサンプリング(53


    0)され、それにより4つの4×4DCTブロックが生成される。 これに関しては、1993年11月16日付けのNgの米国特許第5,262,854号「Low-resoluti


    on HDTV receivers」を参照されたい。 言い換えるならば、ダウンサンプリングにより、例えば、4個のブロックからなるブロック群は、小さいサイズの4ブロックからなるグループ、即ちブロック群に変換される。 【0019】変換符号化器においてダウンサンプリングを行うことにより、変換符号化器は、従属16×16マクロブロックを再形成するための付加的なステップを取らなければならない。 即ち、空間ドメインへの逆変換と、それに続くDCTドメインへの再変換である。 ダウンサンプリング後、ブロックは、同じ量子化レベルを用いて再量子化され(540)、次いで、可変長符号化される(550)。 なお、縮減された解像度ブロックに関するビットレート制御の実施に関する方法は何ら記載されていない。 【0020】全運動ベクトル559から縮減運動ベクトル561への運動ベクトルマッピング560を行うのに、従来、フレームベースの運動ベクトルに対し幾つかの適切な方法が提案されている。 4個のフレームベースの運動ベクトルを、1つの群内の各マクロブロックに対し1つづつ、新たに形成される16×16マクロブロックに対する1つの運動ベクトルに写像するため、単純な平均化もしくはメディアン・フィルタを適用することができる。 これは、4:1マッピングと称されている。 【0021】しかしながら、MPEG−4及びH.26


    3のような或る圧縮規格では、8×8ブロック毎に1つの運動ベクトルを許容する高度な予測モードを支持している。 この場合、各運動ベクトルは、元の解像度での1


    6×16マクロブロックから、縮減された解像度マクロブロックでの8×8ブロックに写像される。 これは、


    1:1マッピングと称されている。 【0022】図6は、4つの16×16マクロブロック群601から1つの16×16マクロブロック602または4つの8×8マクロブロック群603のいずれかに運動ベクトルを写像、即ちマッピングする(600)例が示してある。 常に1:1マッピングを用いるのは、4


    つの運動ベクトルを符号化するのに多くのビットが用いられるため非効率である。 また、一般に、インターレースされた画像のためのフィールドベースの運動ベクトルへの拡張は無意味ではない。 周知のように、ダウンサンプリングされたDCT係数及びマッピングされた運動ベクトルについては、データを可変長符号化し、縮減された解像度のビットストリームを形成することが可能である。 【0023】更にまた、ドリフトを補償したり変換符号化もしくはトランスコーディング処理中良好なアプサンプリング技術を採用するのが望ましい。 【0024】 【発明の概要】本発明は、圧縮されたビットストリームをアプサンプリング(up-sampling)する方法を提供する。 圧縮されたビットストリームを部分的に復号してマクロブロックを生成する。 各マクロブロックは、該マクロブロックの予め定められた次元(dimensionality)に従いDCT係数を有する。 【0025】DCTフィルタを各マクロブロックのDC


    T係数に適用して各マクロブロックに対しアプサンプリングされたマクロブロックを生成する。 ここで、1つのアプサンプリングされたマクロブロックは各フィルタによって生成される。 各アプサンプリングされ生成されたマクロブロックは予め定められた次元を有する。 【0026】[好適な実施の形態の詳細な説明]導入本発明は、ディジタルビデオ信号の圧縮されたビットストリームを最小のドリフトで縮減した空間解像度にトランスコーディング、即ち、変換符号化するシステム及び方法を提供するものである。 先ず、本発明による変換符号化器もしくはトランスコーダを使用することができるコンテンツの配信に関する幾つかの用途例について説明する。 次に、低空間解像度でビットストリームを発生するための基本的な方法について解析的に説明する。 この解析に基づき、基本的な方法に対する幾つかの実施例並びに各実施例と関連する対応のアーキテクチャについて述べる。 【0027】第1の実施例(図9参照)においては、開ループアーキテクチャが採用され、他方、他の3つの実施例(図10及び図11A乃至図11B参照)は、ダウンサンプリング、再量子化及び運動ベクトル打ち切りにより生ずるドリフトを補償する手段を構成する閉ループアーキテクチャに対応するものである。 なお、これら閉ループアーキテクチャの内の1つは上記補償を縮減解像度で行い、他方、他の2つの閉ループアーキテクチャは上記補償を良好な品質を確保するためにDCTドメインで元解像度で行う。 【0028】追って詳細に説明するように、図9の開ループアーキテクチャはあまり複雑ではない。 復元ループも存在しなければDCT/IDCTブロックも存在せず、またフレームメモリも設けられておらず、従って、


    品質は低い画像解像度及びビット・レートに相応のものである。 このアーキテクチャは、インターネットでの使用及びソフトウエアでの実現に適している。 図10に示した第1の閉ループアーキテクチャも複雑性は中程度のものである。 この第1の閉ループアーキテクチャは、復元ループ、IDCT/DCTブロック及びフレームメモリを備えている。 このアーキテクチャによれば、縮減解像度ドメインでドリフトを補償し品質を改善することができる。 図11Aに示した第2の閉ループアーキテクチャの複雑性も中程度である。 この第2のアーキテクチャは、復元ループ、IDCT/DCTブロック及びフレームメモリを備えている。 このアーキテクチャによれば、


    元解像度ドメインでドリフトを補償し品質を改善することができるが、縮減解像度のフレームのアプサンプリング(up-sampling)が要求される。 第3の閉ループアーキテクチャでは、縮減解像度ドメインで得られる補正信号が用いられる。 【0029】本発明によるアーキテクチャについて深い理解を得るために、縮減解像度で「混合モード(mixed


    mode)」のマクロブロック群を有するブロックを処理するための幾つかの付加的な技術についても説明する。 【0030】ダウンサンプリング(down-sampling)すべき1群のブロック、例えば、4つのブロックは、これらブロック群がイントラモード(intra-mode)及びインターモード(inter-mode)の双方で符号化されたブロックを含む場合に「皇后ブロック(mixed block)」と称する。 MPEG規格においては、I−フレームはイントラモードに従って符号化されたマクロブロックだけを含むが、P−フレームはイントラモード及びインターモードで符号化されたブロックを含み得る。 これらモードは、特にダウンサンプリングに際して考慮する必要がある。 然もなければ、出力の品質、即ち画質が劣化する可能性があるからである。 【0031】また、ドリフト補償並びにDCTベース・


    データのアプサンプリング方法についても説明する。 これら方法は、アプサンプリング後の動作もしくは演算を付加的な変換ステップを伴うことなく適切に行うことができ、第2及び第3の閉ループアーキテクチャにとって有用である。 【0032】縮減空間解像度の変換符号化(transcodin


    g)への適用本発明の目標とする主たる用途は、ディジタルテレビジョン(DTV)放送及びインターネットのコンテンツを、例えば無線電話、ページャ及びPDA(personal d


    igital assistance)のような低解像度のディスプレイを有するデバイスもしくは装置へ配布もしくは配信することである。 現在、DTV放送及びDVD記録のための圧縮フォーマットとしてMPEG−2が採用されており、インターネットを介してMPEG−1コンテンツが利用可能である。 【0033】MPEG−4は、移動ネットワークを介してのビデオ伝送用の圧縮フォーマットとして採用されていたものであるので、本発明では、MPEG−1/2コンテンツを低解像度のMPEG−4コンテンツに変換符号化する方法を取り上げる。 【0034】図7は、本発明を利用したマルチメディア・コンテンツ分配システム700の第1の例を示す。 システム700は、外部ネットワーク703を介してクライアント702に接続された適応型サーバ701を有する。 このシステムの1つの特徴は、クライアントのディスプレイはサイズが小さく、また、低いビットレートのチャンネルで接続されていることである。 従って、クライアント702に配信されるコンテンツの解像度を縮減する必要がある。 【0035】マルチメディアコンテンツの入力ソース7


    04はデータベース710に格納される。 コンテンツは特徴抽出及びインデキシング処理(指標付け処理)72


    0を受ける。 データベースサーバ740により、クライアント702は、データベース710のコンテンツを走査検索し特定のコンテンツに対する要求を行うことができる。 マルチメディアコンテンツを探索するのにサーチエンジン730を使用することができる。 所望のコンテンツが検索されたならば、データベースサーバ740はマルチメディアコンテンツを本発明による変換符号化器(トランスコーダ)750に送る。 【0036】変換符号化器750は、ネットワーク及びクライアントの特性を読み取る。 コンテンツの空間解像度がクライアントのディスプレイの特性よりも高い場合には、本発明による方法を用いて、コンテンツの解像度をクライアントのディスプレイ特性と整合するように縮減する。 また、ネットワークチャンネル上のビット・レートがコンテンツのビット・レートよりも小さい場合にも本発明を適用することができる。 【0037】図8は、コンテンツ配信システム800の第2の実施例を示す。 このシステム800はローカルな「ホーム(home)」ネットワーク801、外部ネットワーク703、放送ネットワーク803及び図7と関連して説明した適応型サーバ701を具備する。 この実施例においては、高品質の入力ソースコンテンツ804を、


    放送ネットワーク803、例えば、ケーブル、地上或いは衛星放送のネットワークを介してホームネットワーク801に接続されているクライアント805に転送することができる。 コンテンツはセットトップ・ボックスもしくはゲートウエイ820により受信されてローカルメモリ或いはハードディスクドライブ(HDD)830に格納される。 受信したコンテンツは、ホーム即ち家庭内のクライアント805に配送することができる。 加えて、コンテンツは、全解像度のコンテンツを復号したり表示する能力を有しないクライアントにも利用可能なように変換符号化(850)を行うことができる。 これは、例えば、ハイデフィニションテレビジョン(HDT


    V)のビットストリームを標準デフィニションのテレビジョンセットで受信する場合に相当する。 従って、コンテンツは、ホーム(家庭)内のクライアントの能力を満足するようにトランスコード、即ち変換符号化すべきである。 【0038】更にまた、外部ネットワーク802を介し低解像度の外部クライアント806よりローカルメモリ(HDD)830に格納されているコンテンツへのアクセスが要求された場合には、変換符号化器850を用いて当該クライアントに対して低解像度のマルチメディアコンテンツを配布することができる。 【0039】基本的方法の分析複雑性及び品質が可変である変換符号化器を設計するために図4に示した方法で発生される信号について更に分析し説明することにする。 なお、式中の表記法と関連し、小文字の変数は空間ドメインの信号を表し、他方、


    大文字の変数はDCTドメインにおける等価の信号を表すものとする。 また、変数に付した下付け文字は時間を、他方、1に等しい上付け文字はドリフトを有する信号を表し、そして2に等しい上付け文字はドリフトの無い信号を表すものとする。 なお、ドリフトは、例えば再量子化、運動ベクトルの打ち切り(丸め)或いはダウンサンプリングのようなロスの多いプロセスで生じ得る。


    ドリフトの補償方法については追って説明する。 【0040】I−フレイムI−フレームについては運動補償予測は不可能である。


    即ち、 【数17】 であり、従って、信号はダウンサンプリングされる(4


    10)。 即ち、 【数18】 である。 次いで、符号化器もしくはエンコーダ120で次式に従い符号化される。 【数19】 【0041】信号【数20】 はDCT440を受け、次いで、量子化パラメータ【数21】 で量子化される(450)。 量子化された信号【数22】 は可変長符号化され(460)、符号変換されたビットストリーム(transcodedbitstream)402に書き込まれる。 エンコーダにおける運動補償ループの一部分として【数23】 は逆量子化され(470)、IDCT480を受ける。


    このようにして、縮減された解像度の基準信号【数24】 481がフレームバッファ490に、将来のフレーム予測に対する基準信号として格納される。 【0042】P−フレームP−フレームの場合には、下式【数25】 から、再構成もしくは復元された全解像度の画像が生成される。 I−フレームの場合と同様に、この信号は次いで式(2)に従いダウン変換(縮減変換)される。 次いで、下式(5)に従い縮減解像度残留分(reduced reso


    lution residual)が生成される。 【数26】 上式(5)は、等価的に次のように表される。 【数27】 【0043】式(6)によって与えられる信号は、本発明によるアーキテクチャが近似する基準信号を表す。 なお、この基準信号の発生における複雑性は高く、従って複雑性を相当に低減しつつ品質の近似を実現するのが望ましいことは言うまでもない。 【0044】開ループアーキテクチャ近似として、 【数28】 とすると、式(6)の縮減解像度残留分信号は下式で表される。 【数29】 【0045】上式は、図9に示した変換符号化器900


    のための開ループアーキテクチャを示唆する。 【0046】変換符号化器900において、入力ビットストリーム901の信号は、可変長復号され(91


    0)、それにより逆量子化DCT係数911及び全解像度の運動ベクトル【数30】 902が生成される。 全解像度の運動ベクトルは、MV


    マッピング(MV写像)920によって縮減解像度の運動ベクトル【数31】 903に写像、即ちマップされる。 量子化されたDCT


    係数911は、量子化【数32】 930で逆量子化され、信号【数33】 931が生成される。 次いで、この信号は、追って詳述するように、ブロック群のプロセッサ1300に供給される。 プロセッサ1300の出力は、ダウンサンプリング(950)され、それにより信号【数34】 951が生成される。 ダウンサンプリング後、この信号は量子化【数35】 (960)される。 最後に、縮減解像度の再量子化されたDCT係数及び運動ベクトルは、可変長符号化(97


    0)されて、変換符号化された出力ビット902に書き込まれる。 【0047】ブロック群プロセッサ1300の好適な実施例に関する詳細については追って説明するが、ここでは簡単に、このプロセッサの目的は、ダウンサンプリングプロセス950で、サブブロックが異なった符号化モード、例えば、インターブロック及びイントラブロックモードを有するマクロブロック群が発生することのないように、選択されたマクロブロック群を予備処理することにあることを述べておく。 なお、マクロブロック内の混合符号化モード(ミックストコーディングモード)は公知のいずれのビデオ符号化規格によっても支持されていない。 【0048】縮減解像度におけるドリフト補償式(7b)で与えられた近似だけだとすると、式(6)


    の縮減解像度残留信号は下式で表される。 【数36】 【0049】上式は、縮減解像度でのドリフト補償を行う図10に示した閉ループアーキテクチャ1000を示唆している。 【0050】このアーキテクチャにおいては、入力信号1001は、可変長復号(1010)され、それにより、量子化されたDCT係数1011及び全解像度の運動ベクトル【数37】 1012が生成される。 全解像度の運動ベクトル101


    2はMVマッピング1020によってマップされる。 それにより縮減解像度の運動ベクトル【数38】 の集合1021が生成される。 量子化されたDCT係数は量子化【数39】 で逆量子化され(1030)、それにより信号【数40】 1031が生成される。 この信号は次いでブロック群プロセッサ1300に供給されてダウンサンプリング(1


    050)される。 ダウンサンプリング1050後、縮減解像度ドリフト補償信号1051がDCTドメインの低解像度残留信号1052に加算される(1060)。 【0051】信号1061は空間量子化器【数41】 1070で量子化される。 最後に、縮減解像度の再量子化されたDCT係数1071及び運動ベクトル1021


    が可変長符号化(1080)されて、変換符号化された出力ビットストリーム1002が生成される。 【0052】縮減解像度ドリフト補償信号が生成される基準フレームは、再量子化残留分【数42】 1071を逆量子化(1090)し、ダウンサンプリングされた残留分【数43】 1052から減算(1092)することにより得られる。 この差信号は、IDCT1094に与えられて、フレームメモリ1091に格納されている前のマクロブロックの低解像度予測コンポーネント1096に加算(1


    095)される。 この新しい信号は、差【数44】 1097を表し、現在のブロックに対する低解像度の運動補償のための基準として用いられる。 【0053】格納された基準信号に対して、低解像度の運動補償1098が行われ、DCT1099に対し予測がなされる。 このDCTドメイン信号は、縮減解像度ドリフト補償信号1051である。 この動作は、低解像度の運動ベクトル集合【数45】 1021を用いてマクロブロックベースで行われる。 【0054】元解像度での第1のドリフト補償方法近似【数46】 に対し、式(6)の縮減解像度残留信号は下記のように表される。 【数47】 【0055】上式は、元解像度のビットストリームにおけるドリフトを補償する図11に示した閉ループアーキテクチャ1100を示唆している。 【0056】このアーキテクチャにおいて、入力信号1


    001は、可変長復号(1110)され、量子化されたDCT係数1111及び全解像度の運動ベクトル【数48】 1112が生成される。 量子化されたDCT係数111


    1は量子化器【数49】 で逆量子化され(1130)、それにより信号【数50】 1131が生成される。 この信号は次いでブロック群プロセッサ1300に供給される。 ブロック群処理(13


    00)後、元解像度ドリフト補償信号1151がDCT


    ドメインの残留信号1141に加算される(116


    0)。 次いで信号1162はダウンサンプリング(11


    50)され、量子化器【数51】 で量子化(1170)される。 最後に、縮減解像度の復元されたDCT係数1171及び運動ベクトル1121


    は可変長符号化(1180)されて、変換符号化された(transcoded)ビットストリーム1102に書き込まれる。 【0057】元解像度ドリフト補償信号1151が生成される基準フレームは、再量子化残留分【数52】 1171を逆量子化(1190)し、アプサンプリング(1191)することにより得られる。 この例では、アプサンプリング後にアプサンプリングされた信号は元解像度残留分1161から減算(1192)される。 この差信号は、IDCT1194に与えられて、前のマクロブロックの元解像度予測コンポーネント1196に加算(1195)される。 この新しい信号は、差【数53】 1197を表し、元解像度における現在のマクロブロックに対する運動補償のための基準として用いられる。 【0058】フレームバッファ1181に格納された基準信号に対して、元解像度での運動補償1198が行われ、DCT1199に対し予測がなされる。 このDCT


    ドメイン信号は、元解像度のドリフト補償信号1151


    である。 この演算は、元解像度の運動ベクトル集合【数54】 1121を用いてマクロブロック・ベースで行われる。 【0059】元解像度での第2のドリフト補償方法図11Bは図11Aに示した閉ループアーキテクチャの別の変形例を示す。 この実施例においては、再量子化残留分【数55】 1172の逆量子化出力1190がアプサンプリング1


    191前に縮減解像度信号から減算(1192)される。 【0060】元解像度における上述の2つのドリフト補償アーキテクチャでは、ドリフト補償信号1151を発生するのに運動ベクトル近似を用いていない。 これは、


    アプサンプリング(up-sampling)1191を採用することにより実現可能である。 上述の2つの代替アーキテクチャは、主として、差信号を発生するのに用いられる信号の選択において異なる。 第1番目の方法においては、差信号は再量子化及び解像度変換に起因するエラーを表し、他方、第2番目の方法における差信号においては再量子化に起因するエラーだけが考慮される。 【0061】アプサンプリングされた信号は、変換符号化ビットストリームの将来の復号もしくはデコーディングにおいて考慮されることはないので、ドリフト補償信号における連続的なダウンサンプリング及びアプサンプリングによって計測される如何なるエラーをも排除しておくのが合理的である。 しかしながら、アプサンプリングが2つの理由から採用される。 即ち、以降の近似を回避するために全解像度の運動ベクトル1121を利用し、ドリフト補償信号を元解像度にしてダウンサンプリング1150前に入力残留分1161に加算(116


    0)できるようにするためである。 【0062】混合ブロックプロセッサブロック群プロセッサ1300の目的は、ダウンサンプリングによって、サブブロックが異なった符号化モード、例えばインターブロックモード及びイントラブロックモードを有するマクロブロックが発生されないように選択されたマクロブロックを予備処理することである。


    マクロブロック内に混在する符号化モードは周知の如何なるビデオ符号化規格によっても支持されていない。 【0063】図12は、変換符号化1203後に縮減解像度でブロック群1202を生成することができるマクロブロック群1201の一例を示す。 この例においては、3つのインターモードブロックと1つのイントラモードブロックが存在する。 イントラモードブロックの運動ベクトル(MV)は零(ゼロ)であることを注記しておく。 特定のブロック群が混合モード群(ミックストモード群)であるか否かの判定はもっぱらマクロブロックモードに依存する。 ブロック群プロセッサ1300は、


    縮減解像度で単一のマクロブロック1202を形成している4つのマクロブロック群1201を取り扱う。 換言すれば、ルミナンス成分に対し、MB(0)1210


    は、縮減解像度のマクロブロック1202内のサブブブロックb(0)1220に対応し、同様に、MB(1)


    1211はb(1)1221に対応し、MB(k)12


    12はb(2)1222に対応し、そしてMB(k+


    1)1213はb(3)1223に対応する。 なお、ここでkは元解像度における列毎のマクロブロック数を表す。 クロミナンス成分も、ルミナンスモードと整合する類似の仕方で処理される。 【0064】MBモードの群は、ブロック群プロセッサ1300が特定のMB(マルチブロック)を処理すべきか否かを決定する。 ブロック群が少なくとも1つのイントラモードブロック及び少なくとも1つのインターモードブロックを含んでいる場合にはブロック群の処理が行われる。 マクロブロックの選択後、そのDCT係数及び運動ベクトルデータは修正もしくは変更される。 【0065】図13は、ブロック群プロセッサ1300


    の構成要素、即ちコンポーネントを示す。 選択された混合ブロック群1301に対し、ブロック群プロセッサは、モードマッピング1310、運動ベクトル修正13


    20及びDCT係数修正1330を行い、非混合モードブロック出力1302を生成する。 ブロック群1301


    が識別もしくは同定されている場合には、マクロブロックのモードを全てのマクロブロックが同じになるように変更する。 これは、縮減解像度ブロックにおける各サブブロックのモードを整合する予め特定されたストラテジーに従って行われる。 【0066】選択されたモード写像に従い、MVデータは次いで修正もしくは変更処理1320を受ける。 対応のモード写像に適合する可能な修正もしくは変更について、下に図14A乃至図14Cを参照し詳細に説明する。 なお、この場合、新しいMB(マクロブロック)モード及びMV(運動ベクトル)データに対し、対応のD


    CT係数も写像と適合するように修正もしくは変更される(1330)。 【0067】図14Aに示してあるブロック群プロセッサの第1の実施例においては、ブロック群1301のM


    Bモードをモード写像1310によりインターモードに変更する。 従って、イントラブロックのMVデータは運動ベクトル処理により零にリセットされ、イントラブロックに対応するDCT係数もDCT処理1330により零にリセットされる。 このようにして、変換されたブロックは基準フレーム内の対応のブロックからのデータで複製される。 【0068】図14Bに示したブロック群プロセッサの第2の実施例においては、混合モードブロック群のMB


    モードは、写像、即ちマッピング1310によりインターモードに変更される。 従って、第1の好適な実施例とは異なり、イントラMB(マクロブロック)用のMV


    (運動ベクトル)データは推定されることになる。 この推定は、テクスチャ及び運動データ双方を含み得る隣接のブロック内のデータに基づいて行なわれる。 そして、


    この推定された運動ベクトルに基づき、修正されたブロックに対する新しい残留分が算出される。 最終ステップ1320でインターDCT(離散コサイン変換)係数がイントラDCT係数にリセットされる。 【0069】図14Cに示した第3の実施例においては、ブロック群のMBモードはイントラモードに変更される(1310)。 この場合、縮減解像度のマクロブロックと関連する運動情報は存在しないので、全ての関連の運動ベクトルデータは零にリセットされる(132


    0)。 これは、変換符号化器において行う必要がある。


    その理由は、隣接ブロックの運動ベクトルがこのブロックの運動から推定もしくは予測されるからである。 デコーダにおいて適切な復元を確保するためには、ブロック群のMVデータを変換符号化器において零にリセットしなければならない。 最終ステップ1330においては、


    上述のように、インターDCT係数と入れ替わるべきイントラDCT係数が発生される。 【0070】上に述べた第2及び第3の実施例を実現するために、全解像度に再生する復号ループ(レコーディングループ)を用いることができる。 この再生されたデータは、DCT係数をイントラモードとインターモード間或いはインターモードとイントラモード間で変換するための基準データとして用いることができる。 しかしながら、そのための符号化ループの使用は必ずしも要求されない。 別法として、ドリフト補償ループ内で変換を行うことができるからである。 【0071】運動の大きさが小さくディティルが低レベルである一連のフレームに対しては、図14Aに示す複雑性が小さいストラティジを使用することができる。 それ以外の場合には、図14B或いは図14Cに示した応分の複雑性を有するストラティジを採用すべきである。


    なお、図14Cに示したストラティジが最良の品質を保証することを付記する。 【0072】ブロック処理でのドリフト補償ブロック群プロセッサ1300はまた、ドリフトを制御或いは最小化するのにも使用することができる。 イントラ符号化ブロック(intra-coded block)は、ドリフトを受けないので、インター符号化ブロック(inter-code


    d block)をイントラ符号化ブロックに変換することによりドリフトの影響を軽減できる。 【0073】図14Cの第1のステップ1350において、圧縮ビットストリームにおけるドリフト量を測定する。 閉ループアーキテクチャの場合には、このドリフトは、1092及び1192によって発生される差信号のエネルギー或いは1091及び1191に格納されているドリフト補償信号のエネルギーに従って計測することができる。 なお、信号のエネルギーの計算には周知の方法を用いることができる。 計算されたエネルギーは、再量子化、ダウンサンプリング及び運動ベクトル打ち切り(丸め)を含む各種近似に当たって考慮される。 【0074】開ループアーキテクチャにも適用可能であるドリフトの別の計算方法では、運動ベクトルの打ち切りもしくは丸めによってもたらされるエラーを推定する。 元解像度での半ピクセル運動ベクトルは、解像度を縮減した場合に大きな再生エラーを招来することは知られている。 これに対して、全ピクセル運動ベクトルにはこのようなエラーは生じない。 と言うのは、全ピクセル運動ベクトルは半ピクセル領域に正しくマッピングすることができるからである。 従って、ドリフトを計測する1つの可能な方法は、半ピクセル運動ベクトルの百分率もしくはパーセンテージを記録することである。 しかしながら、運動ベクトル近似のインパクドはコンテンツの複雑性に依存するので、計測されたドリフトが半ピクセル運動ベクトルを有するブロックと関連する残留コンポーネントの関数となる可能性もある。 【0075】ドリフトの測定の目的で差信号のエネルギー及び運動ベクトルデータを利用する方法は組み合わせて実施することもできるし、また、フレーム内の部分領域に亘って採用することも可能である。 ドリフト補償方法により最も利便的なマクロブロックの位置を同定もしくは識別することができるので、フレーム内の部分領域について上記方法を適用するのが有利である。 上記の方法を組み合わせて用いるためには、差信号または元解像度で半ピクセル運動ベクトルを有するマクロブロックに対するドリフト補償信号のエネルギーによりドリフトを計測する。 【0076】第2のステップで、ドリフトの測定値は、


    ブロック群プロセッサ1300に対して入力として用いられる「イントラ再生率(intra refresh rate)」13


    51に変換される。 イントラ符号化ブロックの百分率の制御は、従来、エラー常駐伝送でビデオを符号化するのに当たり考慮されていた。 例えば、「Analysis of Vide


    o Transmission over Lossy Channels」Journal of Sel


    ected Areas of Communications, by Stuhlmuller, et


    al, 2000を参照されたい。 この論文においては、受信部からエンコーダへの逆チャンネルで、伝送チャンネルによってもたらされる損失量を伝達し、予測符号化方式における損失データに起因するエラー率を阻止するために、ソース側からイントラ符号化ブロックの符号化が直接行われている。 【0077】これとは対照的に、本発明では、既に符号化されているビデオに対し圧縮ドメインに新たなイントラブロックが生成され、インターモードからイントラモードへの変換はブロック群プロセッサ1300によって達成される。 【0078】ドリフトがドリフト閾値量を越えると、図14Cに示してあるブロック群プロセッサ1300が起動してインターモードブロックをイントラモードブロックに変換する。 この場合、変換は、予め特定された固定のイントラリフレッシュレート(intra refrech rate)


    で行われる。 別法として、上記変換は、測定ドリフト量に比例するイントラリフレッシュレートで行うこともできる。 また、信号のレート歪み特性を考慮して、イントラリフレッシュレートと、イントラブロック及びインターブロックの符号化に用いられる量子化器との間で適当な妥協を設定することも可能である。 【0079】ここで、本発明は新しいイントラブロックを圧縮ドメインにおいて発生するものであり、そしてこのドリフト補償方式は解像度の縮減を伴い或いは伴わずに任意のトランスコーダ即ち変換符号化器で行うことができる。 【0080】ダウンサンプリング本発明による変換符号化器では、任意のダウンサンプリング方法を採用することができる。 しかしながら、好適なダウンサンプリング方法は、Sun外の1999年11


    月10日付けの米国特許第5,855,151号「Method


    and apparatusfor down-converting a digital signa


    l」に記載されているダウンサンプリング方法が有利である。 なお、この米国特許明細書の開示内容は本明細書において参考のために援用する。 【0081】このダウンサンプリング方法の概念は図1


    5Aに示してある。 1つの群は4つの【数56】 DCTブロック1501を含む。 即ち、群の大きさもしくはサイズは、 【数57】 である。 ブロック群に周波数合成もしくはフィルタリング1510を適用して単一の【数58】 DCTブロック1511を発生する。 この合成されたブロックからダウンサンプリングされたDCTブロック1


    512を抽出することができる。 【0082】上記動作は、2D演算を用いるDCTドメインに関して説明したが、しかしながら、演算はまた分離可能な1Dフィルタを用いて行うことも可能である。


    更にまた、演算は、完全に空間ドメイン内で行うこともできる。 また、Vetro外の1998年3月6日付けの米国特許願Sn. 09/135,969「Three layer sca


    lable decoder and method of decoding」に記述されている方法を用いて等価な空間ドメインフィルタを導出することができる。 なお、この米国特許願明細書の開示内容も参考のために本明細書において援用する。 【0083】本発明による変換符号化器においてダウンサンプリング方法を使用する主たる利点は、マクロブロック内のサブブロックの正しい次元(dimension)が直接得られることである。 例えば、4つの8×8DCTブロックから単一の8×8ブロックを形成することができる。 他方、従来のダウンサンプリング方法では、マクロブロックの出力サブブロックにおいて所要の次元に等しくない次元でダウンサンプリングされたデータが生成されている。 例えば、8×8DCTブロックから、4つの4×4DCTブロックを得ている。 従って、従来方法では、単一の8×8DCTブロックを構成するために付加的なステップが必要とされることになる。 【0084】上述のフィルタは、アプサンプリングを必要とする図11に示したアーキテクチャを効率的に実現する上に有用なコンポーネントである。 一般に、ここで導出されるフィルタは、解像度縮減或いはドリフト補償を伴う或いは伴わずに、アプサンプリングされたDCT


    データに対し演算を必要とする任意のシステムに適用可能である。 【0085】アプサンプリング本発明においては、従来の任意のアプサンプリング手段を使用することができる。 しかしながら、先に引用した


    Vetro外の米国特許願「Three layer scalabledecoder a


    nd method of decoding」には、最適なアプサンプリング方法は、ダウンサンプリング方法に依存することが述べられている。 従って、ダウンサンプリングフィルタ【数59】 に対応するアプサンプリングフィルタ【数60】 を使用するのが有利である。 なお、上記2つのフィルタ間の関係は次式で与えられる。 【数61】 【0086】上式から導出されるフィルタに関連し2つの問題がある。 第1の問題は、DCTフィルタが反転可能ではないために、これらフィルタは空間ドメインフィルタにしか適用できないことである。 しかしながら、対応の空間ドメインフィルタを導出してDCTドメインに変換することはできるので、これはそれほど大きな問題とはならない。 【0087】しかしながら、第2の問題は、このようにして得られるアプサンプリングフィルタが図15Bに示すプロセスに対応する点で事情は異なってくる。 このプロセスにおいて、例えば、 【数62】 ブロック1502は単一の【数63】 ブロック1530にアプサンプリング(1520)される。 アプサンプリングが全て空間ドメイン内で行われる場合には問題は生じない。 しかしながら、アプサンプリングがDCTドメインで行われる場合には1つの【数64】 DCTブロック、即ち、1つのDCTコンポーネントに対処しなければならない。 これは、アプサンプリングされるDCTブロックが標準のMBフォーマット、即ち、


    4つの【数65】 DCTブロック(但し、N=4)であることを要求する演算には適さない。 即ち、アプサンプリングされたブロックはそれより大きな数の元ブロックと同じフォーマット或いは次元を有する。 【0088】DCTドメインにおける上述のアプサンプリング方法は、本発明と関連して述べた変換符号化器での使用には適していない。 図11Aを参照するに、アプサンプリングされたDCTデータは混合ブロックプロセッサ1300から出力されるDCTデータから減算される。 これら2つのブロックの2つのDCTデータは同じフォーマットを有さねばならない。 従って、図15Cに示したアプサンプリングを行うことが可能なフィルタが要求される。 ここで、単一の【数66】 ブロック1502は4つの【数67】 ブロック1550にアプサンプリング(1540)されている。 このようなフィルタは従来考慮されていなかったし、また従来技術としても存在しないので、1Dの事例についての式を以下に説明する。 【0089】なお、以下に述べる式における表記法と関連し、小文字の変数は空間ドメインの信号を表し、他方、大文字の変数はDCTドメインにおける等価信号を表すものとする。 【0090】図16に示すように、C1601はDCT


    ドメインでアプサンプリングすべきDCTブロックを表し、c1602は空間ドメインにおける等価ブロックを表す。 これら2つのブロックはN−ptDCT及びID


    CT1603の定義により互いに関連付けられる。 例えば、Rao及びYipの「Discrete Cosine Transform: Algor


    ithms, Advantages and Applications」Academic, Bost


    on, 1990を参照されたい。 便宜上、下に数式で表す。 【0091】DCTの定義は、下式で与えられる。 【数68】 また、IDCTの定義は、下式で与えられる。 【数69】 上式(13)及び(14)において、 【数70】 である。 【0092】上から、ブロックE1610は【数71】 1611でのフィルタリングCに基づくアプサンプリングされたDCTブロックを表し、eは式(12)で与えられる【数72】 1621でのフィルタリングcに基づくアプサンプリングされた空間ドメインブロックを表す。 e及びEは2N


    −ptDCT/IDCT1630により関連付けられる点に注意されたい。 フィルタリングされる入力の入/出力関係は次式で与えられる。 【数73】 【0093】図16を参照するに、所望のDCTブロックはA1611及びB1612で表されている。 この目的とするところは、Cから直接それぞれA及びBを計算するのに使用することができるフィルタ【数74】 1641及び【数75】 1642を導出することである。 【0094】第1番目のステップで、式(14)を式(16b)に代入する。 【0095】これによって得られる式は、DCT入力C


    の関数としての空間ドメイン出力eの式であり、次式のように表される。 【数76】 【0096】式(17)を用いCでA及びBを表すと、


    a、b及びe間の空間ドメイン関係は次のようになる。 【数77】 上式中iは空間ドメイン指標(インデックス)を表す。


    aに関するDCTドメイン表現式は次式で与えられる。 【数78】 【0097】式(17)乃至(19)から次式が得られる。 【数79】 上式は等価的に次のように表される。 【数80】 上式中、 【数81】 である。 同様にして、下式が成り立つ。 【数82】 上式は等価的に下式で表される。 【数83】 上式中、 【数84】 である。 【0098】次いで、上記のフィルタは、所与の次元もしくは大きさの単一のブロックを、それぞれが元ブロックと同じ次元を有する多数のブロックにアプサンプリングするのに用いることができる。 一般に、ここで導出したフィルタは、アプサンプリングされるDCTデータに演算が要求される任意のシステムに適用可能である。 【0099】式(22)及び(25)によって与えられるフィルタを実現するために、フィルタタップのk×q


    行列を考える。 ここでkは出力ピクセルの指標(インデックス)であり、qは入力ピクセルの指標(インデックス)である。 1Dデータに対しては、出力ピクセルは行列乗算として計算される。 2Dデータに対しては2つのステップが取られる。 先ず第1に、データを第1の方向、例えば平方向にアプサンプリングする。 次いで、


    水平方向にアプサンプリングしたデータを第2の方向、


    例えば垂直方向にアプサンプリングする。 アプサンプリングのための方向の順序は、逆にしてもその結果には影響はない。 【0100】水平方向のアプサンプリングの場合には、


    ブロック内の各列が個別に演算操作され、N次元の入力ベクトルとして取り扱われる。 各入力ベクトルは、式(21)及び(24)に従ってフィルタリング処理を受ける。 このプロセスの出力として2つの標準のDCTブロックが得られる。 【0101】垂直方向のアプサンプリングでは、ブロック内の各行が個別に演算操作され、N次元の入力ベクトルとして取り扱われる。 水平方向におけるアプサンプリングの場合と同様に、各入力ベクトルは、式(21)及び(24)に従ってフィルタリング処理を受ける。 このプロセスの出力として図15Cに示すように4つの標準のDCTブロックが得られる。 【0102】構文変換本発明による変換符号化器もしくはトランスコーダの用途もしくは適用に関する以上の説明から明らかなように、本発明の主要な用途の1つはMPEG−2からMP


    EG−4への変換である。 従って、力点は主に、低空間解像度への変換符号化の際のドリフト補償に用いられるアーキテクチャ並びに低空間解像度への変換を支持する付加的な技術に置いた。 【0103】しかしながら、標準の符号化方式間の構文変換も別の重要な対象である。 しかしながら、このことについては、既に出願中の米国特許明細書に記述されているところであるので、ここでは詳細に立ち入らないことにする。 【0104】以上、好適な実施例と関連して本発明について説明したが、本発明の精神及び範囲内で種々な他の適応及び変更が可能であることは理解されるでべきである。 従って、特許請求の範囲に記載の対象は、上記のような変形及び変更例をも包摂するものであることを付記する。

    【図面の簡単な説明】 【図1】 従来のカスケード接続の変換符号化器もしくはトランスコーダのブロックダイヤグラムである。 【図2】 ビットレート縮減用の従来の開ループ変換符号化器のブロックダイヤグラムである。 【図3】 ビットレート縮減用の従来の閉ループ変換符号化器のブロックダイヤグラムである。 【図4】 空間解像度縮減用の従来のカスケード接続の変換符号化器のブロックダイヤグラムである。 【図5】 空間解像度縮減のための従来の開ループ変換符号化器のブロックダイヤグラムである。 【図6】 従来の運動ベクトル写像もしくはマッピングのブロックダイヤグラムである。 【図7】 本発明による第1のビットストリーム変換符号化を空間解像度縮減に適用した本発明の第1の実施例を示すブロックダイヤグラムである。 【図8】 本発明によるビットストリームの縮減空間解像度への符号化変換を適用した本発明の第2の実施例を示すブロックダイヤグラムである。 【図9】 本発明による空間解像度縮減のための開ループ符号化変換器のブロックダイヤグラムである。 【図10】 本発明による縮減解像度でドリフト補償を行う空間解像度縮減用の第1の閉ループ変換符号化器のブロックダイヤグラムである。 【図11A】 本発明による元の解像度でドリフト補償を行う空間解像度縮減用の第2の閉ループ変換符号化器のブロックダイヤグラムである。 【図11B】 本発明による元の解像度でドリフト補償を行う空間解像度縮減用の第3の閉ループ変換符号化器のブロックダイヤグラムである。 【図12】 マクロブロックモード、DCT係数データ及び対応の運動ベクトルデータを含むマクロブロック群の一例を示す図である。 【図13】 本発明によるブロック群プロセッサのブロックダイヤグラムである。 【図14A】 本発明による第1のブロック群処理方法を図解するブロックダイヤグラムである。 【図14B】 本発明による第2のブロック群処理方法を図解するブロックダイヤグラムである。 【図14C】 本発明による第3のブロック群処理方法を図解するブロックダイヤグラムである。 【図15A】 DCTもしくは空間ドメインにおけるダウンサンプリングの従来の考え方を図解する図である。 【図15B】 DCTもしくは空間ドメインにおける従来のアプサンプリングを図解するブロックダイヤグラムである。 【図15C】 本発明によるDCTドメインにおけるアプサンプリングを図解するブロックダイヤグラムである。 【図16】 本発明によるDCTドメインにおけるアプサンプリングを図解するダイヤグラムである。

    ───────────────────────────────────────────────────── フロントページの続き (72)発明者 アンソニー・ヴェトロ アメリカ合衆国、ニューヨーク州、ステー トン・アイランド、レジス・ドライブ 113 (72)発明者 ハイファン・スン アメリカ合衆国、ニュージャージー州、ク ランベリー、キングレット・ドライブ・サ ウス 61 (72)発明者 ペン・イン アメリカ合衆国、ニュージャージー州、プ リンストン、ホールジー・ストリート 222ビー(72)発明者 ベデ・リュー アメリカ合衆国、ニュージャージー州、プ リンストン、ハートリー・アベニュー 248 (72)発明者 トミー・シー・プーン アメリカ合衆国、ニュージャージー州、マ レイ・ヒル、マレイ・ヒル・ブールバード 75 Fターム(参考) 5C059 KK41 LB05 LB15 LB18 MA00 MA04 MA05 MA23 MC11 MC38 ME01 PP05 PP06 RC16 SS02 SS08 SS10 TA41 TB07 TB13 TC12 TD05 TD12 UA02 UA05 5J064 AA01 AA02 BB01 BB03 BC01 BC08 BC16 BD02

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈