首页 / 专利库 / 广播 / 帧内预测 / 用于执行高质量快速预测运动搜索的方法和设备

用于执行高质量快速预测运动搜索的方法和设备

阅读:934发布:2023-12-26

专利汇可以提供用于执行高质量快速预测运动搜索的方法和设备专利检索,专利查询,专利分析的服务。并且一种用于使用 运动矢量 在 视频编码 器系统中执行预测运动搜索的方法和设备,所述运动矢量代表当前视频数据 帧 内数据宏 块 坐标与参考视频数据帧内相关数据宏块坐标之间的误差。获取多个运动矢量预测值(620),其中该运动矢量预测值代表用于当前宏块的可能运动矢量的近似值。定义一种搜索模式(630)。使用该搜索模式围绕该多个运动矢量预测值的每个运动矢量预测值搜索。然后确定最终运动矢量(660)。,下面是用于执行高质量快速预测运动搜索的方法和设备专利的具体信息内容。

1.一种使用运动矢量视频编码器系统中执行预测运动搜索的 方法,所述运动矢量代表当前视频数据内数据宏坐标与参考视频 数据帧内相关数据宏块坐标的误差,该方法包括:
获取至少三个运动矢量预测值,所述运动矢量预测值代表用于当 前宏块的可能运动矢量的近似值;
定义搜索模式;
使用所述搜索模式围绕所述至少三个运动矢量预测值的每个运动 矢量预测值搜索;以及
确定最终运动矢量。
2.根据权利要求1的方法,进一步包括计算代表宏块匹配质量 的误差度量。
3.根据权利要求2的方法,其中,所述误差度量是绝对误差度 量和以及平方误差度量和至少之一。
4.根据权利要求1的方法,其中,所述至少三个运动矢量预测 值包括估计的全局运动矢量。
5.根据权利要求4的方法,其中,所述估计的全局运动矢量是 前一帧内误差度量低于特定阈值的所有最终运动矢量的平均值。
6.根据权利要求4的方法,其中,所述估计的全局运动矢量如 下确定:
计算对于前一帧内最终运动矢量的每一个的误差度量;
将所述对于前一帧内最终运动矢量的每一个的误差度量和预定阈 值比较;以及
根据前一帧内具有低于所述阈值的误差度量的最终运动矢量的每 一个来确定所述全局运动矢量。
7.根据权利要求1的方法,其中,所述搜索步骤进一步包括:
使用所述搜索模式围绕所述至少三个运动矢量预测值的每个运动 矢量预测值搜索;
确定最佳运动矢量,该最佳运动矢量具有高于预定阈值的误差度 量;以及
围绕一组新的运动矢量预测值执行搜索模式。
8.根据权利要求1的方法,其中,所述搜索步骤进一步包括:
对运动矢量预测值执行搜索模式;
确定用于当前运动矢量的当前误差度量;
比较当前误差度量和先前的最小误差度量;
如果当前误差度量低于先前的最小误差度量,则设定新的最小误 差度量;以及
如果所述误差度量比先前最小的度量超出预定量,则终止该搜索 模式。
9.根据权利要求1的方法,进一步包括:
计算误差度量;
根据预测值运动矢量和候选运动矢量计算偏差;以及
根据所述误差度量和所述偏差确定修正的误差度量。
10.根据权利要求1的方法,其中,所述定义搜索模式的步骤进 一步包括定义在平方向上比在垂直方向上范围更大的搜索模式。
11.根据权利要求1的方法,其中,所述至少三个运动矢量预测 值包括零运动矢量。
12.根据权利要求1的方法,其中,所述至少三个运动矢量预测 值包括来自前一帧的共同定位的宏块的运动矢量。
13.根据权利要求1的方法,其中,所述至少三个运动矢量预测 值包括位于当前宏块左侧的宏块的运动矢量。
14.根据权利要求1的方法,其中,所述至少三个运动矢量预测 值包括位于当前宏块上部的宏块的运动矢量。
15.根据权利要求1的方法,其中,所述至少三个运动矢量预测 值包括位于当前宏块右上部的宏块的运动矢量。
16.根据权利要求1的方法,其中,所述至少三个运动矢量预测 值包括从以下运动矢量的中值水平和垂直坐标得到的中值运动矢量:
位于当前宏块左侧的宏块的运动矢量,
位于当前宏块上部的宏块的运动矢量,和
位于当前宏块右上部的宏块的运动矢量。
17.一种使用基于块的运动估计在视频编码器系统中执行快速预 测运动搜索的方法,包括:
确定多个运动矢量预测值;
对所述多个运动矢量预测值的至少一个执行搜索模式;
确定最佳运动矢量,该最佳运动矢量具有高于预定阈值的误差度 量;以及
围绕一组新的运动矢量预测值执行新的搜索模式。
18.根据权利要求17的方法,其中,所述执行新的搜索模式的 步骤进一步包括:基于最佳运动矢量,围绕一组新的运动矢量预测值 执行新的搜索模式。
19.根据权利要求17的方法,其中,所述新的搜索模式在水平 方向比垂直方向偏离更多。
20.一种使用基于块的运动估计在视频编码器系统中执行快速预 测运动搜索的方法,包括:
围绕运动矢量预测值执行搜索模式;
确定用于当前运动矢量的当前误差度量;
比较当前误差度量和先前的最小误差度量;
如果当前误差度量低于先前的最小误差度量,则设定新的最小误 差度量;以及
如果所述误差度量比先前最小的度量超出预定量,则终止该搜索 模式。
21.一种使用运动矢量在视频编码器系统中执行快速预测运动搜 索的方法,所述运动矢量代表当前视频数据帧内数据宏块坐标与参考 视频数据帧内相关数据宏块坐标的误差,该方法包括:
定义在水平方向上比在垂直方向上范围更大的搜索模式;
根据定义的搜索模式执行候选值搜索;以及
确定最终运动矢量。
22.一种使用运动矢量在视频编码器系统中执行快速预测运动搜 索的设备,所述运动矢量代表当前视频数据帧内数据宏块坐标与参考 视频数据帧内相关数据宏块坐标的误差,该设备包括:
当前图像宏块输入;
连接到所述当前图像宏块输入的快速预测运动搜索运动估计电 路,其包括
运动矢量预测值存储电路
搜索模式定义电路,
连接到所述运动矢量预测值存储电路和搜索模式定义电路的、至 少三个运动矢量预测值的搜索电路,以及
最终运动矢量确定电路;以及
运动矢量输出。
23.根据权利要求22的设备,进一步包括:
连接到所述快速预测运动搜索运动估计电路的运动补偿电路;以 及
连接到所述当前图像宏块输入并连接到运动补偿电路的加法器。
24.根据权利要求23的设备,进一步包括:
连接到所述加法器的离散余弦变换电路;以及
连接到所述离散余弦变换电路的量化器。
25.根据权利要求22的设备,其中,所述快速预测运动搜索运 动估计电路进一步包括全局运动矢量确定电路。
26.根据权利要求22的设备,其中,所述快速预测运动搜索运 动估计电路进一步包括捕获模式电路。
27.根据权利要求22的设备,其中,所述快速预测运动搜索运 动估计电路进一步包括如果误差度量比先前最小度量超出预定量则搜 索模式终止的电路。
28.根据权利要求22的设备,其中,所述快速预测运动搜索运 动估计电路进一步包括绝对误差修正和确定电路。
29.根据权利要求22的设备,其中,所述运动矢量预测值存储 电路存储多个运动矢量预测值。
30.根据权利要求29的设备,其中,所述多个运动矢量预测值 包括零运动矢量。
31.根据权利要求30的设备,其中,所述多个运动矢量预测值 包括来自前一帧的共同定位的宏块的运动矢量。
32.根据权利要求30的设备,其中,所述多个运动矢量预测值 包括从以下运动矢量的中值水平和垂直坐标得到的中值运动矢量:
位于当前宏块左侧的宏块的运动矢量,
位于当前宏块上部的宏块的运动矢量,和
位于当前宏块右上部的宏块的运动矢量。
33.一种移动通信设备,包括用于使用运动矢量在视频编码器系 统中执行快速预测运动搜索的装置,所述运动矢量代表当前视频数据 帧内数据宏块坐标与参考视频数据帧内相关数据宏块坐标的误差,该 设备包括:
当前图像宏块输入;
连接到所述当前图像宏块输入的快速预测运动搜索运动估计电 路,其包括
运动矢量预测值存储电路,
搜索模式定义电路,
连接到所述运动矢量预测值存储电路和搜索模式定义电路的、至 少三个运动矢量预测值的搜索电路,以及
最终运动矢量确定电路;以及
运动矢量输出。
34.一种使用基于块的运动估计在视频编码器系统中执行快速运 动搜索的方法,包括:
在第一阶段确定多个运动矢量预测值;
在所述第一阶段对所述多个运动矢量预测值的至少一个执行搜索 模式;
确定最佳运动矢量预测值;以及
在第二阶段围绕所述最佳运动矢量预测值执行新的搜索模式。
35.根据权利要求34的方法,其中,所述新的搜索模式以近似 螺旋形的模式执行。

说明书全文

技术领域

发明涉及运动估计领域,更具体的,涉及应用于视频图像压缩 的基于的运动估计。

背景技术

近来,运动估计成为多种视频压缩技术的关键部分。运动估计的 目的在于减少视频序列之间的暂时冗余。运动估计算法使用一个或 多个先前编码的图像帧或未来帧来预测某图像帧的图像数据。通过得 出原始像素数据和对应的预测像素数据之间的算术差来计算误差图 像。具有较大变化的误差图像指示图像帧之间存在极少或没有暂时冗 余。反之,具有较小变化的误差图像指示图像帧之间暂时冗余程度较 高。误差图像代表了图像帧简化的暂时冗余表示,其产生较高的编码 效率。
一种类型的运动估计算法是基于块的运动估计算法。基于块的运 动估计算法在图像数据的块上操作。从前一图像帧的数据块预测当前 帧的图像数据块。该运动估计算法输出用于图像数据块的运动矢量, 该矢量指定来自前一图像帧的最佳块匹配位置。在视频压缩方法 中,压缩该运动矢量信息并随压缩的误差数据一起传输或存储。
诸如H.263,MPEG-2和MPEG-4的国际视频压缩标准通过提供 用于指定运动矢量的语法来允许基于块的运动估计。这些标准没有要 求特定的运动估计算法。在这些压缩标准中,在表示为宏块的16×16 像素的基础块大小上计算运动补偿。还允许在8×8像素的块大小上操 作来估计用于更小图像区域的运动。
运动估计是在视频编码系统中处理器最密集的单元之一。有多种 现有的基于块的运动估计技术,这些技术试图在计算复杂性和运动矢 量效率之间取得折衷。
全搜索运动估计(FSME)将当前图像帧的块与位于先前处理帧 搜索窗口内的每个像素位置全部比较。通过测量其对应失真来确定在 每个像素位置的块匹配的品质因数(goodness)。块匹配度量使用的标 准失真测量是绝对误差和(SAD)度量:

其中BC是当前图像帧内的块,BP是前一图像帧内的块。下标m 和n表示在一个N行和M列块内的像素。较小SAD值对应良好的块 匹配,较大SAD值对应较差块匹配。不幸的是,当搜索窗口增加时, 全搜索运动估计是不被允许的。
目前,有几种低复杂性运动算法。所有这些算法或者提供较差质 量,或者不能充分的降低计算复杂性。还建议了一些运动估计算法, 它们在某种程度上以相对降低的复杂性提供改进的质量
一种可能的方法是基于区域的方法。首先,计算运动矢量预测值 (PMV)作为最佳匹配运动矢量。然后,执行遵从区域模式的围绕该 PMV的运动矢量搜索。随后是类似的围绕零运动矢量的区域搜索。在 每一步骤,如果获得足够好的标准(criterion)则存在结束该搜索的 标准。不幸的是,此种方法在大范围视频序列上不能提供一贯的良好 结果。
另一种称为PMVFAST的运动估计算法和上述区域方法非常相 似。然而,不是区域搜索模式,而是使用一种迭代式菱形搜索模式。 根据特定标准可以使用较大或较小菱形搜索模式。不幸的是,和区域 方法比较,该方法给出了非常类似的结果。

发明内容

使用基于块的运动估计在视频编码器系统中执行快速预测运动搜 索的方法和设备。该方法包括获取多个运动矢量预测值,其中所述运 动矢量预测值能够表示用于当前宏块的可能运动矢量的近似值。该方 法还包括定义搜索模式,使用该搜索模式围绕该多个运动矢量预测值 的每个运动矢量预测值搜索,并确定最终的运动矢量。
附图说明
图1是根据一个实施例的视频压缩系统的示范框图
图2是根据一个实施例的当前宏块的邻域的示范显示;
图3是在优选实施例第一阶段使用的示范搜索模式;
图4是在优选实施例第一阶段捕获模式中使用的示范搜索模式;
图5是在优选实施例第二阶段使用的搜索模式的示范显示;
图6是根据优选实施例的概述本发明操作的示范流程图
图7是根据一个实施例的快速预测运动搜索运动估计电路的示范 框图。

具体实施方式

本发明给出了在大范围视频序列上改进的性能。存在能实现较高 质量的若干改进以及新的算法革新。实际上,当在若干视频序列上平 均时,本发明在实现视频压缩效率方面甚至优于传统的全搜索算法。
现有技术中使用的所有方法都注重于优化块匹配,然而,除了其 他益处,本发明清楚地考虑到编码视频序列所需的比特数目。本发明 还利用在现实生活视频捕获中遇到的运动特性。
目前,随着无线市场的出现,越来越需要在手持装置上允许使用 视频编码技术。多数此类装置没有执行运动估计的大量计算的处理能 。因此,本发明提供的高质量、低复杂性的运动估计算法在此类装 置上非常有用。
根据一个实施例,本发明可在两个阶段执行。在第一阶段中,可 以考虑若干预测值运动矢量,并使用固定搜索模式围绕候选值的每一 个进行搜索。在第一阶段期间,如果发现不能获得良好匹配,则选择 一组新的候选运动矢量,并执行新的搜索。这样做从而捕获出现在屏 幕上的任何新的物体运动。在第二阶段,可考虑第一阶段的最佳结果, 并执行使用移动、加权、螺旋形搜索模式的新搜索以达到最佳块匹配
图1是用于根据一个实施例的视频编码器的视频压缩系统100的 示范框图。视频压缩系统100可包括快速预测运动搜索运动估计电路 110,运动补偿电路115,加法器120,离散余弦变换电路(DCT)125, 量化器130,可变长度代码(VLC)编码器135,逆量化器140,逆离 散余弦变换电路(IDCT)145,另一个加法器150,以及前帧电路155。
操作中,使用一个或多个先前处理的图像帧为来自当前图像帧的 图像数据块计算运动估计。运动估计电路110输出对应处理块的运动 矢量。运动补偿电路115使用计算的运动矢量从前一帧中形成预测块。 由加法器120从当前图像帧中减去预测图像数据计算出误差图像。使 用DCT电路125变换该误差图像。运动估计电路110和运动补偿电 路125用于降低图像帧之间的暂时冗余,而DCT电路125用于降低 帧内的空间冗余。DCT系数随后经历量化器140的降低的精度。量化 器140增加压缩,同时引入数字损失。量化的DCT系数然后由VLC 编码器135编码,并在压缩视频比特流中和运动矢量一起传输。本地 重建环路包括逆量化器140、IDCT 145以及加法器150。逆量化器140 重新构造DCT系数。IDCT 145将DCT系数重新变换到空间域,以形 成量化的误差图像。重建帧由加法器150通过将运动补偿数据加到量 化的误差图像上来计算。然后在前帧电路155中存储该重建的数据, 以用于在处理随后的图像帧中使用。
快速预测运动搜索运动估计电路110的操作包含两个阶段。在第 一阶段,可围绕若干运动矢量预测值作较小搜索。这些运动矢量预测 值(MVP)可从其它运动矢量(MV)获得。对于初始定义,MV是 当前视频数据帧内数据块的坐标和与之匹配的参考帧内数据块的坐标 之差。MV有两个分量:X和Y。MV的值被描述为有序对(X,Y), 当执行匹配时,MVP是被用作最佳MV的较好“推测”的MV。宏块 (MB)是视频帧内16×16数据块。MB还可以指不同大小的数据块(例 如8×8,4×8,4×4,16×8等)而不失其普遍性。
一个运动矢量预测值可基于一个零运动矢量。基于特定运动矢量 的运动矢量预测值可定义该运动矢量预测值等于该特定运动矢量。零 运动矢量是具有坐标(0,0)的运动矢量。第二运动矢量预测值可基 于前一帧中共同定位的宏块的运动矢量。
图2是用于确定额外运动矢量的当前宏块和相邻宏块的位置的示 范显示。因此,第三运动矢量预测值可基于当前宏块左侧的宏块运动 矢量。第四运动矢量预测值可基于当前宏块顶部或上部宏块的运动矢 量。第五运动矢量预测值可基于当前宏块右上部宏块的运动矢量。第 六运动矢量预测值可基于第三、第四、第五运动矢量预测值的中值运 动矢量。可以独立计算用于该运动矢量的X和Y分量的中值运动矢量 预测值。
第七运动矢量预测值可基于估计的全局运动矢量。该全局运动矢 量由运动估计电路110估计,是前一帧误差度量低于特定阈值 THRESH1的所有最终运动矢量的平均值。该误差度量可以是绝对误 差度量和、平方误差度量和、绝对误差度量修正和或任何其他有用的 度量。在优选实施例中,选择的THRESH1的值是:
THRESH1=SAD1+OFFSET,
其中OFFSET可以标定设置为500,SAD1由以下公式给出:
SAD 1 = Σ n = 0 N - 1 Σ m = 0 M - 1 | B nm c - mean | , mean = Σ n = 0 N - 1 Σ m = 0 M - 1 B nm c MN .
在此m和n是像素索引。M和N是块的维度。对于示范的宏块, M=N=16。全局运动矢量也可由其他装置确定,例如视频摄像机上的 运动感测器,或由其他算法,或用于确定全局运动矢量的任何其他方 法来确定。
可根据为相同宏块在不同的先前编码帧上所作的运动估计的结果 来确定进一步的运动矢量预测值。
因此,运动估计电路110可以通过使用前一帧内误差度量低于特 定阈值的所有最终运动矢量的平均值来确定该全局运动矢量。更具体 的,运动估计电路110可通过为前一帧内最终运动矢量的每一个计算 误差度量,将该前一帧内最终运动矢量的每一个的误差度量和预定阈 值比较,并根据前一帧内具有低于该阈值的误差度量的最终运动矢量 的每一个来确定该全局运动矢量。
可以搜索围绕在每个MVP小范围内的所有MV。然后,具有最 小绝对误差修正和(MSAD)度量的MV可被选择作为用于第二阶段 的候选MV。在下面确定MSAD度量。
因此,运动估计电路110能通过获取多个运动矢量预测值、定义 搜索模式、使用该搜索模式围绕该多个运动矢量预测值的每一个运动 矢量预测值来搜索,并确定最终运动矢量来执行预测运动搜索,其中 所述运动矢量预测值代表当前宏块的可能运动矢量的近似值。运动估 计电路可进一步计算代表宏块匹配质量的误差度量,其中该误差度量 可以是绝对误差度量和、平方误差度量和或在运动估计中有用的任何 其他度量。
图3显示了围绕每个MVP的示例搜索模式。如图所示,搜索模 式在平方向上比在垂直方向上扩展更多。这可以利用在多数现实生 活的视频数据中,水平方向上的运动存在更多移动和变化的特点。
如果在计算第一组6个运动矢量之后,最佳MV具有高于阈值 THRESH2的MSAD度量,第一阶段可以进入捕获模式。在优选实施 例中,THRESH2由下式给出:
THRESH2=4*MMSADAVG,
MMSADAVG=前一帧所有MMSAD(即最佳MV的MSAD)的 平均值。
在捕获模式中,可以考虑额外的MVP,例如图4所示的那些。 例如,这8个点可以是:
(-12,0)(12,0)(0,-8)(0,8)(-6,4)(6,4)(6,-4)(-6,-4)
使用图3所示的相同搜索模式执行围绕MVP中每一个的搜索。 在优选实施例中,仅为宏块考虑8个MVP中的4个。对于第一宏块, 考虑头4个。对于下一宏块,考虑其余的4个MVP等。这样做可以 减少计算数目。
捕获模式的目的在于检测任何快速移动到屏幕内的新的物体。在 此种情形中,基于相邻运动矢量的MVP将失效。使用8个新的点来 增进获得较好运动矢量匹配的机会。可以选择这8个点,使其偏好水 平方向,因为该方向通常有较多移动。
因此,运动估计电路110可使用搜索模式围绕多个运动矢量预测 值的每个运动矢量预测值搜索,确定具有高于预定阈值的误差度量的 最佳运动矢量,并围绕一组新的运动矢量预测值执行搜索模式。
在第一阶段中,当评价了围绕MVP的搜索模式时,可采用先前 的退出标准终止用于该MVP的搜索。如果获取的用于该MV的MSAD 比当前最小的MSAD(MMSAD)高出阈值THRESH3,即如果(MSADi> (MMSAD+THRESH3))。其中MSADi是获取的用于MVPi的MSAD, MMSAD是直至该当前MB的点所获取的所有MSAD值的最小值。更 具体的,它是最佳MV的MSAD。在优选实施例中,THRESH3的值 可被选择为大约768。
因此,运动估计电路110可对运动矢量预测值执行搜索模式,确 定用于当前运动矢量的当前误差度量,比较该当前误差度量和先前的 最小误差度量,如果当前误差度量小于先前最小误差度量,则设定新 的最小误差度量,并且如果该误差度量比先前最小度量超出预定量, 则终止该搜索模式。
然后,在所有在第一阶段搜索的MV中,选择给出最小MSAD 度量的MV,这是第二阶段的起始点。
在第二阶段,选择来自第一阶段的最佳MV(即给出最小MSAD 的MV),并围绕该MV执行搜索。例如,可以图5所示模式执行搜索。 该搜索模式可从中心开始,以图5所示序列作为序号螺旋形散开。只 要发现较好的MV(即给出较小MSAD的MV),则该搜索模式以新 的MV为中心并且开始螺旋形搜索模式。该过程继续直至满足以下3 个条件之一:
条件1:MSAD低于阈值THRESH4,THRESH4=A*Q+B
其中Q是编码器用于当前MB的量化步长,A和B是常数。在 优选实施例中,A=8,B=0。
条件2:早已在阶段2考虑了候选值的最大数目N。在优选实施 例中,N=30。
条件3:在最后M个候选MV中没有任何对最小MSAD (MMSAD)的改进。在此M是螺旋形搜索模式中最后一个MV候选 值的位置索引的函数。例如,搜索模式从索引0开始。它螺旋形的围 绕点1,2,3...,每当发现较佳的MV,螺旋形搜索模式重新以该新 的MV为中心并且索引再次从0开始。使用该索引以确定M的值。 在优选实施例中,根据索引从以下值组中选择M{4,4,4,4,4,4, 4,4,4,5,5,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8, 8,8,9,9}。
第二阶段末尾的最佳MV被选择作为用于该宏块的最佳MV。在 随后阶段使用公知的技术可以进一步对该MV求精,用于半像素 分之一像素或更高精度。
如上所述,可选择搜索模式从而在水平方向比在垂直方向给出更 宽的覆盖范围。
MSAD度量是本发明有用的部分。虽然误差度量修正和给出了较 佳的结果,但在本发明需要绝对误差度量和、误差度量修正和或任何 其他误差度量的各个实施例中可以替换的使用任何误差度量。MSAD 度量是上述绝对误差度量和(SAD)、评价的候选MV以及预测值运 动矢量(PMV)的函数。PMV通常由视频编码器在最终运动矢量的 编码中使用。最终运动矢量被编码为相对于PMV的误差,它不同于 MVP。例如,它可以是在H.261,H.263,MPEG-1,MPEG-2和MPEG-4 标准中单独定义用于编码运动矢量目的的唯一MV。SAD是在上述标 准运动估计算法中使用的度量。
对于具有给定PMV的宏块以及对于候选运动矢量MV,MSAD 由下式给出:MSAD=SAD+偏差,其中偏差是基于MV和PMV之间 误差度量的任何值。例如,
MSAD=SAD+C*(|MVx-PMVx|+|MVy-PMVy|)
其中SAD是用于匹配先前定义的块的标准度量,MVx和MVy是 候选运动矢量的X和Y分量,PMVx和PMVy是PMV的X和Y分量, C是常数。在优选实施例中,C近似为5。PMV通常对于MB中所有 候选值保持固定,而MV是变化的。
MSAD度量独立于运动估计算法,并可实际上用于有益于所有算 法。新度量的好处在于通过将算法偏向PMV,减少了编码运动矢量所 需的比特数目,从而改进了整体压缩效率。
用于零运动矢量MV=(0,0)的MSAD被看作特例。零MV可以潜 在的导致改进的压缩效率。但这仅仅是当得到的宏块在H.261,H.263, MPEG-1,MPEG-2和MPEG-4标准中以“未编码(not coded)”模式 来编码时才发生。这可以通过在低于特定阈值的情况中偏移SAD来 考虑:
If(SAD<THRESH5)
MSAD=SAD-THRESH6
Else
MSAD=SAD+C*(|PMVx|+|PMVY|)
Endif
C,PMVx和PMVy如前所述。
THRESH5=D*Q+E,
THRESH6=F
其中Q是量化步长。D,E和F是常数。在优选实施例中,D近 似为128,E=0,F近似为100。
因此,运动估计电路110可计算误差度量,根据预测值运动矢量 和候选运动矢量计算偏差,并根据误差度量与偏差来确定修正的误差 度量。
在搜索处理中,可能不同MVP的搜索区域会重叠,导致重复的 候选运动矢量。可维持一个记录表,其中包含所有先前已经评价过的 候选值,并且如果已经考虑过它们则忽略它们。
在此说明的搜索顺序是优选实施例中使用的。它们被优化从而在 较大范围视频序列上以最快的可能时间获得较好匹配。还能使用替换 的搜索模式。
公开的发明没有对运动矢量范围做出任何假定。任何对运动矢量 值的限定都可应用到候选值上,如果它们超出了允许的范围,则丢弃。
在优选实施例的第二阶段,螺旋形搜索模式可重新集中于获取新 的最佳匹配候选MV。因此,需要评价的下一点可能并不是先验的知 道。要评价的下一候选值潜在的取决于当前候选值的评价结果。因此, 可能难于同时实现若干候选MSAD的计算(某些硬件结构可能希望这 样做)。为缓解该情况,可在评价一组候选值之后进行重定(re-center) 搜索模式的中心,允许并行处理该组。
图6是概述根据一个实施例的运动估计电路110的操作的示范流 程图600。在步骤610,流程开始。在步骤620,运动估计电路110获 取多个运动矢量预测值。在步骤630,运动估计电路110定义搜索模 式。在步骤640,运动估计电路110围绕每个运动矢量预测值搜索。 在步骤650,运动估计电路110确定最终运动矢量。在步骤660,运 动估计电路110输出最终运动矢量。
图7是根据一个实施例的快速预测运动搜索运动估计电路110的 示范框图。运动估计电路110可包括运动矢量预测值存储电路710, 搜索模式定义电路720,多个运动矢量搜索电路730,以及最终运动 矢量确定电路740。运动估计电路110还可包括全局运动矢量确定电 路750,捕获模式电路760,模式终止电路770,以及绝对误差修正和 电路780。这些电路根据上述它们的功能操作。
根据另一个相关实施例,可用两个阶段执行快速预测运动搜索方 法。在第一阶段,可如上所述计算7个MVP候选。然后,对于每个 MVP,可根据图3所示搜索模式评价所有的MV候选,并可采用退出 标准终止MVP或进入捕获模式。然后,如果在捕获模式,可在图4 所示MVP或围绕图4所示MVP使用与图3相同的搜索模式以及相同 的退出标准进行搜索。然后,在第二阶段,选择来自第一阶段的最佳 MV,并以图5所示螺旋形方式执行搜索。确螺旋形可以被重定中 并重置,,每当发现匹配,可将索引重新设定为零。最后,继续该处 理直至发现三个退出标准之一。
根据另一个相关实施例,本发明提供一种使用基于块的运动估计 在视频编码器系统中执行快速预测运动搜索的方法。该方法可以包括 确定多个运动矢量预测值,对该多个运动矢量预测值至少之一执行搜 索模式,确定具有高于预定阈值的误差度量的最佳运动矢量,并围绕 一组新的运动矢量预测值执行新的搜索模式。执行新的搜索模式的步 骤可进一步包括基于最佳运动矢量围绕一组新的运动矢量预测值执行 新的搜索模式。该新的搜索模式在水平方向上比在垂直方向上偏移更 多。
根据另一个相关实施例,本发明提供一种使用基于块的运动估计 在视频编码器系统中执行快速预测运动搜索的方法。该方法可包括围 绕运动矢量预测值执行搜索模式;确定用于当前运动矢量的当前误差 度量;比较当前误差度量和先前的最小误差度量;如果当前误差度量 低于先前的最小误差度量,则设定新的最小误差度量;并且如果该误 差度量比先前最小度量超出预定量则终止该搜索模式。
根据另一个相关实施例,本发明提供一种使用运动矢量在视频编 码器系统中执行快速运动搜索的方法,其中所述运动矢量代表当前视 频数据帧内数据宏块坐标和参考视频数据帧内相关数据宏块坐标的差 值。该方法包括定义在水平方向上比在垂直方向上范围更大的搜索模 式,根据定义的搜索模式执行候选值搜索,并确定最终运动矢量。
公开的发明能够实现较高程度的压缩效率,同时保持较低的复杂 性。此复杂性和APDZS和PMVFAST的复杂性类似。然而,获得的 质量更高。当和作为该行业中公认基准的标准全搜索算法比较时,本 发明对于确定的视频质量能获得大约0.6%的更好的压缩效率。该数字 是在平均24个不同QCIF视频序列之后获得的。
本发明的一种应用是手持装置上的实时视频编码器。此种编码视 频的标准带宽是32kbps到512kbps,标准的视频帧大小是QCIF和CIF。
本发明的方法优选的在可编程处理器上实施。然而,视频压缩系 统100、快速预测运动搜索运动估计电路110以及其他元件也可在通 用或专用计算机、可编程微处理器或微控制器以及外围集成电路元 件、ASIC或其他集成电路、诸如离散元件电路的硬件电子或逻辑电 路、以及诸如PLD、PLA、FPGA或PAL的可编程逻辑装置等上实施。 通常,任何驻留有能实现图中所示流程以及所述方法的有限状态机的 装置都能被用于实现本发明的处理器功能。
虽然本发明关于其特定实施例进行说明,多种替换、修改以及变 换对于本领域普通技术人员是显而易见的。例如,在其他实施例中可 以交换、添加或替换这些实施例中的不同元件。因此,在此公开的本 发明的优选实施例是说明性而非限制性的。可以作出不同的改变,而 不背离本发明的精神和范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈