首页 / 专利库 / 视听技术与设备 / 块匹配运动估计 / Method for estimating image motion by block matching

Method for estimating image motion by block matching

阅读:635发布:2021-06-17

专利汇可以提供Method for estimating image motion by block matching专利检索,专利查询,专利分析的服务。并且PURPOSE: To provide a block matching method for generating motion vectors. CONSTITUTION: Block matching is performed on images having continuously rising resolution by improving motion vectors which are decided to images having lower resolution. In each image having rising resolution, a search area is defined in a limited search range by the motion vector related to the corresponding image area at the search having the next lower resolution. At at least one level of image resolution, a search block is overlapped so that a plurality of search areas in the limited search range can be obtained (2081 ,2 ) and block matching search is performed on each block at the next higher level.,下面是Method for estimating image motion by block matching专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 現イメージ・フレームの二次元デジタル化された全解像度イメージ、二次元デジタル化された全解像度の前イメージ・フレーム、ピラミッド手法で得た連続的に減少する該現イメージ・フレームのNレベルの解像度イメージ、およびピラミッド手法で得た連続的に減少する該前イメージ・フレームのNレベルの解像度イメージに応答するブロック・マッチング・イメージ・モーション推定方法であって、Nは正の整数であり、該全解像度の現イメージ・フレームおよび前イメージ・フレームの各々は、ゼロ(0)のピラミッド・レベルを構成しているものにおいて、該推定方法は、 (a)前記現イメージ・フレームの第M番目のピラミッド・レベル(M≦N)を、前記2つの次元のうちの少なくとも一方にオーバラップされた第1サイズの複数のサーチ・ブロックに分割し、 (b)前記オーバラップされたサーチ・ブロックを用いて、前記前イメージ・フレームの第M番目のピラミッド・レベルの突合わせ探索を、ある与えられた範囲エリアにわたって行い、当該サーチ・ブロックに対して最低一致値を示す、前記前イメージ・フレームの前記第M番目のピラミッド・レベルの当該ブロックまでのモーション・ベクトルを決定するステップを有することを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項2】 請求項2に記載の方法において、さらに、 (c)前記現イメージ・フレームの第(M−1)番目のピラミッド・レベルを、前記第1サイズよりも大きくない複数の第2のサーチ・ブロックに分割し、 (d)第2サーチ・ブロックの所定エリアが投影される前記第M番目のレベルのブロックXを決定し、 (e)前記ブロックXの各々について、対応するモーション・ベクトルを利用してレベル(M−1)における限定されたサーチ範囲のXサーチ・エリアを決定し、 (f)レベル(M−1)における前記サーチ・エリアの各々についてブロック・マッチング・サーチを行い、前記第2サーチ・ブロックに対して最低誤差値が得られるブロック・マッチング・サーチを選択するステップを含むことを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項3】 請求項2に記載の方法において、 前記第1サイズの前記複数のサーチ・ブロックは、前記2つの次元の両方においてほぼ50%オーバラップされていることを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項4】 請求項2に記載の方法において、 前記Nの値は3であり、 第M番目のピラミッド・レベルは第3ピラミッド・レベルであり、第(M−1)番目のピラミッド・レベルは第2ピラミッド・レベルであることを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項5】 請求項4に記載の方法において、 前記ステップ(c)は、前記現イメージ・フレームの第2ピラミッド・レベルを、前記2つの次元の少なくとも一方においてオーバラップされた複数の前記第2サーチ・ブロックに分割することを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項6】 請求項5に記載の方法において、 前記第1サイズの前記複数のサーチ・ブロックと前記複数の前記第2サーチ・ブロックは共に、前記2つの次元の両方においてほぼ50%オーバラップされていることを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項7】 請求項6に記載の方法において、前記第1サイズの前記サーチ・ブロックは矩形形状であり、 前記ステップ(c)は、前記現イメージ・フレームの第2ピラミッド・レベルを、その各々のそれぞれの寸法が前記第1サイズのサーチ・ブロックの対応する寸法のサイズの半分になっている複数の矩形第2サーチ・ブロックに分割することを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項8】 請求項5に記載の方法において、さらに、 (g)前記現イメージ・フレームの第1ピラミッド・レベルを、前記第3サーチ・ブロックよりもサイズが大きくない複数の第3サーチ・ブロックに分割するステップであって、該第3サーチ・ブロックの各々は前記現イメージ・フレームの前記オーバラップされた第2サーチ・
    ブロック上に投影されているものと、 (h)前記第3サーチ・ブロックの与えられた1つが投影されている前記第2ピラミッド・レベルの各ブロックの±1,±1 範囲にわたって別個の突合わせ探索を行う際に使用するために、前記第3サーチ・ブロックの与えられた1つを用いるステップであって、各々の別個の突合わせ探索は、前記第2ピラミッド・レベルのブロックの異なる1つに関連するモーション・ベクトルを採用して、前記第3サーチ・ブロックの当該1つに対して行われた総数の突合わせの中で最低一致値を示している、前記別個の突合わせ探索のすべての前記±1,±1範囲の単一ブロックに対して精練化されたモーション・ベクトルを決定するステップを含むことを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項9】 請求項8に記載の方法において、さらに、 (i)前記第3サーチ・ブロックの各々を、前記第3サーチ・ブロックの与えられた1つとして用いるステップを含むことを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項10】 請求項8に記載の方法において、 前記第1サイズの前記複数のサーチ・ブロックと前記複数の前記第2サーチ・ブロックは共に、前記2つの次元の両方においてほぼ50%オーバラップされていることを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項11】 請求項10に記載の方法において、前記第1サイズの前記複数のブロックと前記複数の前記第2サーチ・ブロックは共に、矩形形状であり、 前記ステップ(c)は前記現イメージ・フレームの第2
    ピラミッド・レベルを、その各々のそれぞれの寸法が前記第1サイズのサーチ・ブロックの対応する寸法のサイズのほぼ半分になっている複数の矩形第2サーチ・ブロックに分割することを含み、 前記ステップ(g)は前記現イメージ・フレームの第1
    ピラミッド・レベルを、その各々のそれぞれの寸法が第2サーチ・ブロックの対応する寸法のサイズのほぼ半分になっている複数の矩形第3サーチ・ブロックに分割することを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項12】 請求項8に記載の方法において、さらに、 (j)前記現イメージ・フレームの0ピラミッド・レベルを、前記第3サーチ・ブロックよりもサイズが大きくない複数の第4サーチ・ブロックに分割し、 (k)前記前イメージ・レベルの前記0ピラミッド・レベルの各ブロックの±1,±1範囲にわたって突合わせ探索を行う際に使用するために、前記第4サーチ・ブロックの与えられた1つを用いて、前記第4サーチ・ブロックの当該1つに対して最低一致値を示している、前記±1,±1 範囲の単一ブロックに対して精練化されたモーション・ベクトルを決定するステップを含むことを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項13】 請求項12に記載の方法において、さらに、 (l)前記第4サーチ・ブロックの各々を、前記第4サーチ・ブロックの与えられた1つとして用いるステップを含むことを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項14】 請求項12に記載の方法において、前記第1サイズの前記複数のサーチ・ブロック、前記複数の前記第2サーチ・ブロックおよび前記第3サーチ・ブロックはすべて矩形形状であり、 前記ステップ(c)は、前記現イメージ・フレームの第2ピラミッド・レベルを、その各々のそれぞれの寸法が前記第1サイズのサーチ・ブロックの対応する寸法のサイズの半分になっている複数の矩形第2サーチ・ブロックに分割することを含み、 前記ステップ(g)は前記現イメージ・フレームの第1
    ピラミッド・レベルを、その各々のそれぞれの寸法が第2サーチ・ブロックの対応する寸法のサイズのほぼ半分になっている複数の矩形第3サーチ・ブロックに分割することを含み、 前記ステップ(j)は前記現イメージ・フレームの第0
    ピラミッド・レベルを、その各々のそれぞれの寸法が第3サーチ・ブロックの対応する寸法のサイズとほぼ等しい複数の矩形第4サーチ・ブロックに分割することを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項15】 請求項14に記載の方法において、 前記第3,第2および第3ピラミッド・レベルの解像度はそれぞれ、2つの次元の各々において、全解像度の0
    ピラミッド・レベルの1/8,1/4および1/2であることを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 【請求項16】 請求項14に記載の方法において、 前記第3,第2および第1ピラミッド・レベルのサーチ・ブロックの各々は、当該ピラミッド・レベルの8×8
    ピクセルのブロックを含み、前記0ピラミッド・レベルのサーチ・ブロックは前記0ピラミッド・レベルの16
    ×16ピクセルのブロックを含むことを特徴とするブロック・マッチングによるイメージ・モーション推定方法。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【産業上の利用分野】本発明は、イメージ・モーションを能率よく計算で推定する方法に関する。

    【0002】なお、本明細書の記述は本件出願の優先権の基礎たる米国特許出願第08/200,599号(1
    994年2月23日出願)の明細書の記載に基づくものであって、当該米国特許出願の番号を参照することによって当該米国特許出願の明細書の記載内容が本明細書の一部分を構成するものとする。

    【0003】

    【背景技術】モーション・エスティメータ(motion esti
    mator)を用いたビデオ信号デジタル・プロセッサはこの技術分野では公知である。 このようなプロセッサは、デジタル化イメージ・フレームのシーケンスによって定義される時変化イメージ(time-varying image)において描写されたモーションを推定するために使用される。 このようなモーション推定は、モーション補正コード化(mot
    ion-compensated coding) 、フレーム・レート変換(fra
    me rate conversion) 、スキャン(走査)変換、ノイズ低減、三次元の時変化シーン分析、およびコンピュータ・ビジョンにおけるオブジェクト・トラッキングといったアプリケーションで有用である。

    【0004】モーション推定を行う1つの公知のアプローチでは、二次元ブロック・マッチング・プロセス(2-d
    imensional block matching process)を採用しているが、このプロセスでは、現イメージ・フレームと前イメージ・フレームとの間において全ピクセル解像度(full
    pixel resolution) でブロックごとの探索が行われている。 現イメージの各ターゲット・ブロックについて、問題となっていることは、予測イメージ(prediction imag
    e)において最良マッチング・ブロック・エリアまでの平行変位(translational displacement)を計算することである。 探索範囲(search range)がテレビジョンにおける典型的モーションを十分にカバーするために、従来の網羅的探索(exhaustive search) アプローチでは、費用がかかり、あるいは実用化が困難となる。 さらに、網羅的探索から得られるモーション・ベクトルは、場面(scen
    e) におけるオブジェクトの物理的モーションを正確に反映していない場合があり、従って、最適なイメージ圧縮((image compression)や誤差隠蔽(error concealmen
    t) を促進することになっていない。

    【0005】モーション推定を行う他の公知のアプローチでは、階層ストラテジ(hierarchical strategy) を採用している。 この階層ストラテジでは、全解像度イメージはピラミッド手法によって、連続的に減少する解像度の複数のイメージに分解され、そのあと、これらのイメージはイメージ・モーションの推定を粗から精細に向かって行うために使用されている。 この階層ストラテジの一例としては、ハードウェアで実現され、モーション推定をリアルタイムで行うことを可能にするものがあり、
    本出願と同一の出願人に譲渡された、1994年1月4
    日付け米国特許第5,276,513号(van der Waal)
    に開示されている。 このvan der Waal特許によれば、モーション・ベクトルは、連続するイメージ・フレーム間の最大イメージ変位よりも大きい、あるサイズのピクセルを含んでいるピラミッド手法で得た(pyramid-derive
    d) 低減解像度イメージについて最初に粗推定され、そのあと、これらの粗推定されたモーション・ベクトルは、増加していく解像度のイメージについて連続的に精細化され、最終的に、全解像度イメージのモーション・
    ベクトルが得られる。 各ピラミッド・レベルにおいて連続するイメージ・フレーム間の最大イメージ変位は、そのレベルで±1ピクセルになっている。 この階層ストラテジの別の例は、International Journal of Computer
    Vision 2, 283-310 (1989)に掲載の論文「計算フレームワークおよびビジュアル・モーションの測定アルゴリズム」(Computational Framework and an Algorithm for
    the Measurement of Visual Motion) に開示されており、これはソフトウェアで実現され、オーバラップ・ピラミッド粗−精細投影方式(overlapped pyramid coarse
    -to-fine projection scheme) を採用して、イメージ・
    モーションの推定をより正確化している。 この階層ストラテジによるモーション推定は全解像度イメージだけで行われる非階層モーション分析よりも計算効率が大幅に向上しているが、van der Waalおよび前記論文による、
    高精細イメージ(high-definition image) のシーケンスに対して必要とされる計算総数については、依然として高価なものとなっている。

    【0006】公知のように、現在意図しているようなデジタル・テレビジョン・システム(高精細および標準解像度の両方を含む)では、デジタル化ビデオ信号を限られたバンド幅のビデオ・チャネル上で送信する前にビデオ圧縮(video compression)が必要である。 従って、費用的に見合いかつ実用化に足りる、十分に正確にかつ効率的にモーション・ベクトルを計算する能をもつビデオ圧縮エンコーダ(videocompression encoder)が望まれている。

    【0007】

    【発明の概要】本発明は、計算の複雑性(computational
    complexity)を軽減化するブロック・マッチングによるイメージ・モーション推定方法を意図している。

    【0008】より詳細には、このブロック・マッチング・イメージ・モーション推定方法は、現イメージ・フレームの二次元デジタル化された全解像度イメージ、二次元デジタル化された全解像度の前イメージ・フレーム、
    現イメージ・フレームのNレベルのピラミッド手法で得た連続的に減少する解像度イメージ、および前イメージ・フレームのNレベルのピラミッド手法で得た連続的に減少する解像度イメージを受けて動作するものである。
    ここで、Nの値は少なくとも2であり、全解像度の現および前イメージ・フレームの各々はゼロ(0)のピラミッド・レベルを構成している。

    【0009】本発明の方法は、(a)現イメージ・フレームのN番目のピラミッド・レベルを、2つの次元の少なくとも一方においてオーバラップされた第1サイズの複数の探索ブロックに分割し、(b)前イメージ・フレームのN番目のピラミッド・レベルの一致探索(match s
    earch)を、ある与えられた範囲エリアにわたって行うときに使用するために、オーバラップされた探索ブロックの各々を利用して、その探索ブロックに対して最低一致値(lowest match value)を示す、前イメージ・フレームのN番目のピラミッド・レベルのそのブロックまでのモーション・ベクトルを決定するステップを含んでいる。
    関連するN番目のピラミッド・レベル・ブロックの集合は、それぞれの(N−1)番目のピラミッド・レベル・
    ブロックをN番目のレベル上に投影することによって定義される。 複数の(関連ブロックの個数と同数の)ブロック・マッチング探索は各(N−1)番目のレベル・ブロックについて行われ、その探索において、それぞれの関連するN番目のレベル・ブロックのモーション・ベクトルは、それぞれの複数の探索の各探索ごとに、限られた(N−1)番目のレベル探索エリアを定義するために利用される。 各複数の探索ごとに、最低誤差値(lowest
    error value)が得られるようなブロック・マッチング探索が対応する(N−1)番目のレベル・ブロックについて選択される。

    【0010】

    【実施例】以下、図面を参照して本発明の実施例を詳細に説明する。

    【0011】図1は、16×16ピクセルの全解像度ブロック100とm×nピクセルの全解像度イメージ10
    2を示したものである。 ブロック100は、ソース・イメージの現在のm×nピクセル全解像度イメージ・フレームが分割されている、複数のかかる隣接ブロックから選択されたx,y座標をもつ16×16ピクセルのブロックである場合があり、イメージ102は先行するm×
    nピクセル全解像度イメージ・フレームである。 前イメージ・フレーム(previous image frame)と現イメージ・
    フレーム(current image frame) との間でイメージ・モーションが起こると、ゼロ・ピクセル(つまり、その次元における静止イメージ)と、ある与えられた最大数のピクセル(つまり、単一フレーム期間中にその次元で予想される最大移動)との間でイメージが平方向と垂直方向の各々に変位(displacement)することになる。 図1
    に例示する従来の方法では、連続する突合わせ(match)
    は、ピクセル座標が選択されたブロック100のそれに対応している、m×nピクセル・イメージ102のブロックを中心にして、水平方向に±R x (例えば、±12
    8)ピクセルの範囲にわたって、垂直方向に±R y (例えば、±128)ピクセルの範囲にわたって、m×nピクセル・イメージ102の16×16ピクセル・ブロックと16×16ピクセルの選択されたブロックとの間で交互に行われている。 従って、サーチエリアのサイズは、R(例えば、±128×±128=65,536)
    ピクセルになっている。

    【0012】選択されたブロック100の突合わせ位置
    (match position)は、連続する突合わせの間で1ピクセルだけ変位されている。 マッチング・プロセスは、m×
    nピクセル・イメージ102のブロックと選択されたブロック100の対応するピクセルの256個のそれぞれのペアのデジタル値の間の差の絶対値(または差の正関数)を計算し、次に、256個の差の和をとってその突合わせの一致値を求めることからなっている(その結果、求めた一致値がゼロであるときは、完全に一致していることを示している)。 このマッチング・プロセスはサーチ範囲 R内の各ピクセル突合わせ位置ごとに繰り返されて(つまり、65,536回)、m×nピクセル・
    イメージ102のどの特定の16×16ブロックが最小一致値になっているかが決定される。

    【0013】最小一致値を持つと計算されたm×nピクセル・イメージ102のブロックのx,yピクセル座標と、選択されたブロック100自体のx,yピクセル座標との間の変位(つまり、モーション・ベクトル)により、前イメージ・フレームと現イメージ・フレーム間で行われたイメージ・モーション量の正確な推定値が得られる。 しかし、図1に示す従来のブロック・モーション推定方法でこのイメージ・モーションの正確な推定値を得るためには、計算の複雑性が比較的高くなるという犠牲を伴っている(ここで言う「計算の複雑性」とは数量的なもので、すべてのブロックをサーチするために必要な「計算オペレーションの総数」を、全解像度イメージ全体に含まれるピクセル数Nで除したものである)。 ある「計算オペレーション」とは、任意のピラミッド・レベルの分解能において2つのピクセル間を比較し、その残余をアキュムレータに加えることである。 範囲エリアがRであるとすると、網羅的サーチの複雑性はRに等しくなる。 これは、現イメージの各全解像度ピクセルが、
    前イメージのRだけ異なる全解像度ピクセルと比較されることになるためである。

    【0014】マッチング・プロセスは、最良のブロック・マッチにより定義されたイメージ・エリア内の実ピクセル値の間隙を縫うように内挿ピクセル値を生成することによりさらに改善することができる。 さらに別のブロック・マッチング探索(サーチ)を±1/2ピクセル範囲にわたって行うと、半ピクセル解像度の正確さでモーション・ベクトルが得られる。

    【0015】最低一致値(lowest match value)をもつ前フレームのブロックのx,y座標と現フレームの選択されたブロック100のx,y座標との間の差によって、
    最低一致値をもつ前フレームのブロックに関連するモーション・ベクトルが決定される。

    【0016】本発明のモーション推定方法によれば、図2ないし図7を参照して以下に説明するように、図1に例示した従来のモーション推定方法による計算の複雑性を、約720分の1に減少できるので、イメージ・モーション推定を実用化すると共に、コストを効率的にすることができる。

    【0017】より具体的には、本発明によれば、公知のピラミッド手法を利用することにより、全解像度ソース・イメージの現イメージ・フレームと全解像度の前イメージ・フレームは、連続的に減少していく解像度の複数のイメージ・フレームに分解される。 バンドパス、ローパス、エネルギといった異なるピラミッド・タイプが使用可能であるが、以下では、説明を分かりやすくするために、フィルタ・カーネル係数1,4,6,4,1をもつ4レベルのガウス・ピラミッド(Gaussian pyramid)
    (つまり、レベル0,1,2,3)を使用することを想定する。 これは、このガウス・ピラミッドによると、本発明を効率よく実現できるためである。

    【0018】図2,図3および図4は、ピクセル・ブロックのサイズと、現m×nピクセルの全解像度イメージ・フレームがそれぞれのピラミッド・レベル0,1,2
    および3の各々で分割される複数のブロックのサイズとの間に存在する関係を示し、この関係は、本発明のモーション推定方法の好適実施例で使用されているものである。 より詳細に説明すると、ピラミッド・レベル0については、図2において、16×16ピクセルの全解像度ブロック200(これは図1で上述したブロック100
    とほぼ同じである)と、現m×nピクセルの全解像度イメージ・フレーム202のピラミッド・レベル0を構成する複数の16×16ピクセルの全解像度ブロック20
    1,1 …200 m/16,n/16の隣接配列(contigu
    ous arrangement)とを一緒に示している。 ピラミッド・レベル1については、図2において、
    8×8ピクセルの1/2解像度(2つの次元の各々における)ブロック204と、現m/2×n/2ピクセルの1/2解像度イメージ・フレーム206のピラミッド・
    レベル1を構成する複数の8×8ピクセルの1/2解像度ブロック204 1,1 …204 m/16,n/16の隣接配列とを一緒に示している。 ピラミッド・レベル2については、図3において、8×8ピクセルの1/4解像度ブロック208と、現m/4×n/4ピクセルの1/4解像度イメージ・フレーム210のピラミッド・レベル2を構成する複数の8×8ピクセルの1/4解像度ブロック208 1,1 …208 m/16,n/16の50%オーバラップ(各次元において)配列とを一緒に示している。 ピラミッド・レベル3については、図4において、8×8ピクセルの1/8解像度ブロック212と、現m/32×n
    /32ピクセルの1/8解像度イメージ・フレーム214
    のピラミッド・レベル3を構成する複数の8×8ピクセルの1/8解像度ブロック212 1,1 …212
    m/32,n/32の50%オーバラップ(各次元において)配列とを一緒に示している。 以上から明らかなように、現イメージのピラミッド・レベル2と3の各次元において、イメージ・ブロックを50%だけオーバラップさせると、ブロックの数は、非オーバラップ(つまり、隣接)配列に対して4倍に増加することになる。

    【0019】両次元においてレベル2と3を50%オーバラップさせることは、単なる例である。 このオーバラップは2つの次元で異なるもにすることも、両次元においてそれぞれのオーバラップを50%以上または以下にすることも可能である。 本発明の実施例では、オーバラップするブロックを1つのピラミッド・レベルだけにすることも、2つまたはそれ以上のピラミッド・レベルにすることも可能である。

    【0020】図2,図3および図4に示すように、各8
    ×8ピクセルの1/2解像度ブロック204は16×1
    6ピクセルの全解像度ブロック200と同じサイズのイメージ・エリアを占めており、各8×8ピクセルの1/
    4解像度ブロック208は16×16ピクセルの全解像度ブロック200の4倍のサイズのイメージ・エリアを占めており、各8×8ピクセルの1/8解像度ブロック212は16×16ピクセルの全解像度ブロック200
    の16倍のサイズのイメージ・エリアを占めている。 従って、ブロック212の各ピクセルは、ブロック200
    の64ピクセルが占めているのと同じエリアを占めており、ブロック208の各ピクセルは、ブロック200の16ピクセルが占めているのと同じエリアを占めており、ブロック204の各ピクセルは、ブロック200の4ピクセルが占めているのと同じエリアを占めている。

    【0021】本発明のモーション推定方法の好適実施例は次の4つのステップからなり、その詳細を以下に説明する。

    【0022】ステップ1:現m/8×n/8ピクセルの1/8解像度イメージ・フレーム214のピラミッド・レベル3のオーバラップされたブロック212 1,1 …21
    m/32,n/32の各々はサーチブロックとして使用されて、1/8解像度の前イメージのピラミッド・レベル3
    の網羅的突合わせ探索(ehaustive match search)が、ある与えられた範囲エリアRにわたってそのサーチブロックの座標に対して行われ(つまり、サーチブロックは、
    連続する突合わせの間で、各次元においてピラミッド・
    レベル3の1ピクセル分の距離だけ変位されている)、
    そのピラミッド・レベル3のサーチブロックによるこれらの突合わせのうち、最低一致値をもつもののモーション・ベクトルが決定される。

    【0023】ステップ2:現m/4×n/4ピクセルの1/4解像度イメージ・フレーム210のピラミッド・
    レベル2のオーバラップされたブロック208 1,1 …2
    08 m/16,n/16の各々はサーチブロックとして使用されて、1/4解像度の前イメージのピラミッド・レベル2
    のP回の突合わせ探索(P match search)が、例えば、制限された±1,±1ピクセル範囲にわたって行われ、これらのP回の突合わせ探索の各々は、ピラミッド・レベル2のサーチブロックのあらかじめ決められた部分(例えば、中央)が投影されている、ピラミッド・レベル3
    のオーバラップしているP個のブロックのそれぞれのモーション・ベクトルに対応する個別の「候補」投影モーション(a separate "candidate" projected motion) に対して行われ、そのピラミッド・レベル2のサーチブロックによるこれらの突合わせのうち、最低一致値をもつもののモーション・ベクトルが決定される。

    【0024】ステップ3:現m/2×n/2ピクセルの1/2解像度イメージ・フレーム206のピラミッド・
    レベル1の隣接するブロック204 1,1 …204
    m/16,n/16の各々はサーチブロックとして使用されて、
    1/2解像度の前イメージのピラミッド・レベル1のQ
    回の突合わせ探索が±1,±1ピクセル範囲にわたって行われ、これらのQ回の突合わせ探索の各々は、レベル1
    のサーチブロックのあらかじめ決めたエリアが投影されているピラミッド・レベル2のオーバラップしているQ
    個のブロックのそれぞれのモーション・ベクトルに対応する個別の「候補」投影モーションに対して行われ、そのピラミッド・レベル1のサーチブロックによるこれらの突合わせのうち、最低一致値をもつもののモーション・ベクトルが決定される。

    【0025】ステップ4:現m×nピクセルの全解像度イメージ・フレーム206のピラミッド・レベル0の隣接するブロック204 1,1 …204 m/16,n/16の各々はサーチブロックとして使用されて、全解像度の前イメージのピラミッド・レベル0の1回の突合わせ探索が、±
    1,±1ピクセル範囲にわたって、ピラミッド・レベル1の突合わせ探索時に最低一致値をもつと見つかった、
    前イメージのピラミッド・レベル1のブロックに対して行われ、そのピラミッド・レベル0のサーチブロックによるこれらの突合わせのうち、最低一致値をもつもののモーション・ベクトルが決定される。

    【0026】大きなエリアのサーチブロックを上位のピラミッド・レベルで使用することは、正しいモーションに対応しておらず、たまたま残余が小さくなっている変位で低解像度ブロックが突き合わされるという可能性が減少し、ピラミッド・レベル0で得られたモーション・
    フィールドの円滑化が促進される点で望ましい。

    【0027】他方、大きなブロックは、特にブロックがほぼ等しい2つの部分に分割されていると、異なった動きをする領域間の境界をまたがる可能性が大になり、突合わせが低下するという問題がある。 ステップ1と2で使用されているオーバラップによると、この問題は最小化される。 その理由は、イメージ場面(シーン)における2つの大きなオブジェクト間の境界を取り巻くブロック群をサーチするとき、そのグループのブロックの少なくとも一部が2つの等しい部分に分割されることがないためである。

    【0028】ステップ1では、全解像度範囲±R x , ±
    yに相当するサーチ範囲をカバーするように±R x
    8, ±R y /8ピクセル変位にわたってブロック突合わせ探索が行われる。 従って、各ブロック突合わせ探索を行うには、R/64回の突合わせ計算オペレーションが必要になる。 全解像度ピラミッド・レベル0のピクセルのエリアと各ピラミッド・レベル3のピクセルのエリアとの比率は1/64である。 しかし、ステップ1では水平方向と垂直方向にオーバラップしているので、その比率は4倍(50%オーバラップのとき)に増加し、1/
    16になる。 その結果、ステップ1の計算の複雑性(その定義は上述したとおり)はR/64×1/16=R/
    1024である。 ±R xと±R yの各々が±128全解像度ピクセルである(その結果、範囲エリアRは65,
    536全解像度ピクセルである)との上記想定に基づくと、ステップ1の計算の複雑性はわずか65,536/
    1024=64である。

    【0029】図5の(A),(B)および図6は、ステップ2をもっと詳しく説明するために示した図である。
    ここで図5(A)は、ピラミッド・レベル2のサーチブロック300Sと、現フレーム・イメージの4つの50
    %水平方向および50%垂直方向オーバラップ・ピラミッド・レベル3の対応するサーチブロック302S,3
    04S,306Sおよび308S群の各サーチブロックとの関係を示す図である。 図5(B)において、ブロック302Pは、ピラミッド・レベル3のサーチ期間に、
    サーチブロック302Sに対して最低一致値をもつとわかった、前フレーム・イメージのブロックである。 同様に、ブロック304P,306Pおよび308Pは、それぞれ、ピラミッド・レベル3のサーチ期間に、対応するサーチブロック304S,306Sおよび308Sの各々に対して最低一致値をもつとわかった、前フレーム・イメージのブロックである。 図5(B)のブロック3
    02P,304P,306Pおよび308Pが図6において空間的に相互に切り離されて示されているのは、図5(A)に示した現フレーム・イメージのサーチブロック300Sに対応する、前フレーム・イメージのピラミッド・レベル2のブロック300P−1,300P−
    2,300P−3および300P−4の各々を分かりやすく示すためである。

    【0030】図6に詳しく示すように、ピラミッド・レベル2のブロック300P−1はそれに関連するサーチブロック300Sに対して「候補」モーション・ベクトル310−1をもっている(この「候補」モーション・
    ベクトル310−1は図5(A)に示す現フレーム・イメージのピラミッド・レベル3のサーチブロック302
    Sと、ステップ1のサーチ期間に、サーチブロック30
    2Sによって最低一致値をもつとわかった、図5(B)
    に示すフレーム・イメージのピラミッド・レベル3のブロック302Pとの間のイメージ変位に対応している)。 「候補」モーション・ベクトル310−2,31
    0−3または310−4は、ピラミッド・レベル2のブロック300P−2,300P−3および300P−4
    とそれぞれ、同じように関連している。

    【0031】図5(A),(B)および図6は、ステップ2で上述したのと同じ方法で、ステップ3の「候補」
    モーション・ベクトルを決定する場合に適用される。

    【0032】ステップ2、3および4の各々では、ブロック突合わせ探索が、例えば、±1,±1ピクセル変位の限られたサーチ範囲(図7参照)にわたって、当該ステップの解像度で前フレームのブロック400に対して行われる。 従って、±1,±1ブロックの突合わせ探索
    (block-match search)は9回のマッチ計算オペレーションを必要とし、当該解像度のサーチブロックが使用されて、ブロック400自体と8個の変位した他のブロックの各々が図7のサーチ範囲内で突き合わせ(マッチ)される。

    【0033】従って、ステップ1では水平方向と垂直方向のオーバラップを使用しているので、ステップ2では、その4つの「候補」モーション・ベクトルの各々についてそのサーチ範囲全体をカバーするために、ブロック208の36回(つまり、9×4)の突合わせ(マッチ)計算オペレーション(50%オーバラップのとき)
    が必要になる。 全解像度ピクセルのエリアとピラミッド・レベル2の各ピクセルのエリアとの比率は、1/16
    である。 しかし、ステップ2では、水平方向と垂直方向の両方の50%オーバラップが使用されているので、その比率は4倍に増加し、1/4になる。 従って、ステップ2自体の付加的「計算の複雑性」(その定義は上述したとおり)は1/4×36=9である。

    【0034】ステップ2でも、50%水平方向オーバラップと50%垂直方向オーバラップを使用していれば、
    ステップ3では、そのサーチ範囲全体をカバーするために、ブロック204の36回(つまり、9×4)の突合わせ計算オペレーションが必要になる。 全解像度ピクセルのエリアとピラミッド・レベル1の各ピクセルのエリアとの比率は1/4倍である。 ステップ3ではオーバラップがないので、この比率は増加しない。 従って、ステップ3自体の付加的「計算の複雑性」(その定義は上述したとおり)は1/4×36=9である。

    【0035】ステップ3ではオーバラップが採用されていないので、ステップ4では、そのサーチ範囲をカバーするために必要とされるブロック200の突合わせ計算オペレーションは9回だけである。 全解像度ピクセルのエリアとピラミッド・レベル1の各ピクセルのエリアとの比率は1である。 ステップ4ではオーバラップがないので、この比率は増加しない。 従って、ステップ4自体の付加的「計算の複雑性」(その定義は上述したとおり)も9である。

    【0036】本発明のブロック・マッチング・モーション推定方法による上述した好適実施例のステップ1から4までのすべての総「計算の複雑性」は64+9+9+
    9=91であるのに対し、図1に例示した従来のブロック・マッチング・モーション推定方法の「計算の複雑性」は65,536である。 従って、本発明のブロック・マッチング・モーション推定方法による上述した好適実施例によれば、「計算の複雑性」は、図1に例示した従来のブロック・マッチング・モーション推定方法に比べて、720(つまり、65,536/91)をわずか越えるまでに減少することができる。

    【0037】さらに、本発明のブロック・マッチング・
    モーション推定方法のステップ4によって最低一致値をもつと見つかった単一ブロックに関連するモーション・
    ベクトルの値の精度は、図1に例示した従来のブロック・マッチング・モーション推定方法に関連して上述したのと同じように向上することができる。

    【0038】本発明は、上述したブロック・マッチング・モーション推定方法の好適実施例の特定パラメータに限定されるものではなく、「計算の複雑性」を減少するために本発明の原理を採用していれば、どのブロック・
    マッチング・モーション推定方法にも適用可能である。

    【図面の簡単な説明】

    【図1】ブロックごとのサーチが現デジタル化イメージ・フレームと、先行するデジタル化イメージ・フレームから計算された前イメージ・フレームとの間で全解像度で行われるような二次元ブロック・マッチング・プロセスを採用した、当該技術分野で公知の従来ブロック・モーション推定方法の例を示す図である。

    【図2】図1に示した全解像度サーチ・ブロックと全解像度の現イメージ・フレームの両方が、本発明によるモーション推定方法の好適実施例を実現する際に採用されている1/2解像度のブロックにピラミッド手法で分解されている様子を示す概略図である。

    【図3】図1に示した全解像度サーチ・ブロックと全解像度の現イメージ・フレームの両方が、本発明によるモーション推定方法の好適実施例を実現する際に採用されている1/4解像度のブロックにピラミッド手法で分解されている様子を示す概略図である。

    【図4】図1に示した全解像度サーチ・ブロックと全解像度の現イメージ・フレームの両方が、本発明によるモーション推定方法の好適実施例を実現する際に採用されている1/8解像度のブロックにピラミッド手法で分解されている様子を示す概略図である。

    【図5】本発明の好適実施例によるモーション推定方法のステップを説明するための図である。

    【図6】本発明の好適実施例によるモーション推定方法のステップを説明するための図である。

    【図7】本発明の好適実施例によるモーション推定方法のステップを説明するための図である。

    【符号の説明】

    100 現フレームにおける16×16ピクセル全解像度のブロック 102 m×nピクセル全解像度の前イメージ 200 現フレームにおける16×16ピクセル全解像度のブロック 202 m×nピクセル全解像度の現イメージ(ピラミッド・レベル0) 204 8×8ピクセル1/2解像度のブロック 206 m/2×n/2ピクセル1/2解像度の現イメージ(ピラミッド・レベル1) 208 現フレームにおける8×8ピクセル1/4解像度のブロック 210 m/4×n/4ピクセル1/4解像度の現イメージ(ピラミッド・レベル2) 212 現フレームにおける8×8ピクセル1/8解像度のブロック 214 m/8×n/8ピクセル1/4解像度の現イメージ(ピラミッド・レベル3)

    フロントページの続き (72)発明者 パドマンアブハン アナンダン アメリカ合衆国 08648 ニュージャージ ー州 ローレンスヴィル カーバー プレ イス ビー2

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈