首页 / 专利库 / 视听技术与设备 / 运动估计 / 一种基于AVS的亚像素运动估计方法

一种基于AVS的亚像素运动估计方法

阅读:26发布:2021-03-04

专利汇可以提供一种基于AVS的亚像素运动估计方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于AVS的亚 像素 运动估计 方法,该方法的步骤是:1)利用整像素搜索结果对1/2像素进行 运动矢量 搜索,确定最佳1/2像素点的 位置 ;2)如果最匹配1/2像素点仍为中心整像素点,则比较其他候选点的匹配函数值是否大于 阈值 T,如果大于阈值T,不再进行1/4像素的运动矢量搜索,否则执行步骤3);3)对最佳1/2像素点周围的1/4像素点进行运动估计预测,确定最佳1/4像素点。本发明通过最佳整像素点及其周围整像素点的匹配误差值来预测1/2像素点所在区域,并通过阈值判断提前结束搜索。既保证了分数像素搜索的准确性,又有效地减少了搜索点数,同时还尽量保持其编码效率。,下面是一种基于AVS的亚像素运动估计方法专利的具体信息内容。

1.一种基于AVS的亚像素运动估计方法,包括以下步骤:
步骤1)利用整像素搜索结果,对1/2像素进行运动矢量搜索,确定最佳1/2像素点的位置
步骤2)如果最佳1/2像素点仍为中心整像素点,则比较其他候选点的匹配函数值是否大于阈值T;如果它们大于阈值T,不再进行1/4像素的运动矢量搜索;否则,继续进行1/4像素的运动矢量搜索,即执行步骤3);采用如下方法确定阈值:
T=a×min(MinJ1,MinJ2,MinJ3,MinJ4)+b
其中MinJ1,MinJ2,MinJ3,MinJ4为当前的左、上、右上3个相邻块和参考同一位置块在16×16模式下的最小匹配误差,a=(H×V)/256,H为当前块的行像素数,V为当前块的列像素数,b值为128;
步骤3)对最佳1/2像素点周围的1/4像素点进行运动估计预测,确定最佳1/4像素点。
2.根据权利要求1所述的基于AVS的亚像素运动估计方法,其特征在于所述步骤1)中对1/2像素运动矢量搜索的具体方法如下:
(1)在整像素的搜索过程中,记录A,B,C,D,E这5个整像素点的匹配函数值J(x)(x∈{A,B,C,D,E}),
其中, 为当前正在考察的运动向量, 为当前块的运动向量的预
测值, 为编码相应运动向量所需要的比特数;λmotion为运动估计的拉格朗日因子:
SATD为Hadamard变换后的绝对误差和,S为原始值,C为预测值;SATD按公式(A)和(B)计算,首先计算原始值和预测值之间的差值:
d(x,y)=s(x,y)-c(x-mx,y-my) (A)
对d进行二维的Hadamard变换,得到dT:
(2)根据J(x)的值将最匹配整像素点周围的亚像素区域分成4个部分,令J(1)=J(B)+J(D),J(2)=J(C)+J(D),J(3)=J(C)+J(E),J(4)=J(E)+J(B);J(1),J(2),J(3),J(4)中较小者预测为最佳1/2像素所在区域;
(3)比较预测区域内除最匹配整像素点外的另外两个整像素点,然后选择偏向匹配值小的整像素数点一侧的1/2像素点作为候选点;
(4)执行上述步骤2)。

说明书全文

一种基于AVS的亚像素运动估计方法

技术领域

[0001] 本发明属于音视频编解码技术领域,具体涉及一种基于数字音视频编码技术标准(Audio Video coding Standard,AVS)的亚像素运动估计方法。

背景技术

[0002] 在AVS、H.264等标准中,间运动估计和帧内预测的计算复杂度较高,特别是运动估计部分,通常约占全部编码时间的50%以上。运动估计由整像素运动估计和亚像素运动估计两部分组成,随着整像素运动估计快速算法的发展,整像素的搜索点数大幅度减少,一般可降至10个点以下,导致亚像素运动估计的计算量占整个运动估计过程计算量的比重增大。
[0003] 整数像素搜索已经比较成熟,经典的主要有三步搜索法、钻石搜索算法、基于的梯度下降搜索法、运动矢量场自适应搜索算法、UMHexagonS等。其中,由于非对称十字型多层次六边形网格搜索算法的运算量相对于原有的快速全搜索算法,可节约90%以上,而且在高码率、大运动图像序列编码时,在保持较好率失真性能的条件下运算量十分低。现有的亚像素快速搜索算法中,比较典型的算法如下:基于亚像素的抛物线预测算法(PPFPS),PPFPS根据SAD函数在最优匹配点周围子区域内为凸函数的特性,先求出最优的1/2像素点;然后再根据最优和次优1/2像素点求出最优的1/4像素点;基于MSE(均方误差)的亚2
像素运动估计快速算法,根据MSE均方误差在[0,1]内可近似为二次曲线D(x)=ax+bx+c的特性,可求出当D(x)在[0,1]中取最小值时的值;基于运动补偿误差的数学模型快速算法,此方法不需要通过整像素内插的方法求亚像素,而是先根据最优整像素点及其周围的八个整像素点的运动补偿误差值来求出模型的系数,然后再用模型估计亚像素位置的绝对误差和(SAD)值,从而求出最优的亚像素位置。
[0004] 虽然这些方法相对全搜索算法有了很大的改进,但是算法都相对较复杂,也不利于在硬件平台的实现,因此降低亚像素运动估计算法的复杂度,缩短运动估计时间是当务之急。

发明内容

[0005] 本发明目的在于尽量减少亚像素搜索点数,提供了一种使用分区域预测策略和阈值判决方法的亚像素运动估计快速算法,在保证图像质量和编码效率的同时,减少了运算量,缩短了编码时间。本发明主要应用在采用AVS1-P2标准的视频编解码系统。
[0006] 该方法采用分区域预测策略和阈值判决方法,即通过最佳整像素点及其周围整像素点的匹配误差值来预测1/2像素点所在区域,并通过自适应阈值判断提前结束搜索。本发明发法中所用匹配准则如下:
[0007]
[0008] 其中, 为当前正在考察的运动向量, 为当前块的运动向量的预测值, 为编码相应运动向量所需要的比特数。λmotion为运动估计的拉格朗日因子:
[0009]
[0010] SATD为Hadamard变换后的绝对误差和,S为原始值,C为预测值,SATD按公式(A)和(B)计算,首先计算原始值和预测值之间的差值:
[0011] d(x,y)=s(x,y)-c(x-mx,y-my) (A)
[0012] 对d进行二维的Hadamard变换,得到dT:
[0013]
[0014] 本发明一种基于AVS的亚像素运动估计方法,包括以下步骤:
[0015] 步骤1)利用整像素搜索结果,对1/2像素进行运动矢量搜索,确定最佳1/2像素点的位置;
[0016] 步骤2)如果最佳1/2像素点仍为中心整像素点,则比较其他候选点的匹配函数值是否大于阈值T;如果它们大于阈值T,认为此时1/2像素运动矢量搜索的精度已经足够高,不再进行1/4像素的运动矢量搜索;否则,继续进行1/4像素的运动矢量搜索,即执行步骤3);采用如下方法确定阈值:
[0017] T=a×min(MinJ1,MinJ2,MinJ3,MinJ4)+b
[0018] 其中MinJ1,MinJ2,MinJ3,MinJ4为当前块的左、上、右上3个相邻块和参考帧同一位置块在16×16模式下的最小匹配误差,a=(H×V)/256,H为当前块的行像素数,V为当前块的列像素数,b值为128;
[0019] 步骤3)对最佳1/2像素点周围的1/4像素点进行运动估计预测,确定最佳1/4像素点。
[0020] 采用步骤2)中所述方法确定阈值不受视频运动类型的影响,具有较强的自适应性,能够得到合适的阈值在搜索过程中进行阈值判决,可以以较小的搜索代价得到较好的搜索结果。
[0021] 如图3所示,本发明中对1/2像素运动矢量搜索的具体方法如下:
[0022] (1)在整像素的搜索过程中,记录A,B,C,D,E这5个整像素点(如图2所示)的匹配函数值J(x)(x∈{A,B,C,D,E}),
[0023]
[0024] 其中, 为当前正在考察的运动向量, 为当前块的运动向量的预测值, 为编码相应运动向量所需要的比特数;λmotion为运动估计的拉格朗日因子:
[0025]
[0026] SATD为Hadamard变换后的绝对误差和,S为原始值,C为预测值;SATD按公式(A)和(B)计算,首先计算原始值和预测值之间的差值:
[0027] d(x,y)=s(x,y)-c(x-mx,y-my) (A)
[0028] 对d进行二维的Hadamard变换,得到dT:
[0029]
[0030] (2)根据J(x)的值将最匹配整像素点周围的亚像素区域分成4个部分(如图2中虚线所示),令J(1)=J(B)+J(D),J(2)=J(C)+J(D),J(3)=J(C)+J(E),J(4)=J(E)+J(B);J(1),J(2),J(3),J(4)中较小者预测为最佳1/2像素所在区域;
[0031] (3)比较预测区域内除最匹配整像素点外的另外两个整像素点,然后选择偏向匹配值小的整像素数点一侧的1/2像素点作为候选点;
[0032] (4)执行上述步骤2)。
[0033] 如图4所示,本发明中1/4像素运动矢量搜索的方法如下:
[0034] (1)如图2所示,其中A~E为整像素,a~h为1/2像素,1~16为1/4像素,当最佳1/2像素点为a~h其中的一点时,则搜索与该1/2像素点在同一度且与该点相邻的两个1/4像素点。例如当最优1/2像素点为a点时,则搜索1点和9点,当最佳1/2像素点为b点时,则搜索2点和10点,其它以此类推;
[0035] (2)当最优点为最优整像素点时,要根据运动矢量的预测值来决定1/4像素的搜索模板。在整像素搜索中,使用最匹配整像素点的运动矢量mv的整数部分来预测最佳整像素点的位置。本文利用mv的余数来判别搜索方向,运动矢量平和垂直方向的余数分别为:
[0036] x=mvx%4,y=mvy%4
[0037] 当x或y等于0时,说明运动方向是水平或垂直的,此时使用“十”字模板进行1/4像素搜索,即搜索2,4,5,7这4个点;若两者都不为0,表明运动方向可能是斜方向的,此时使用“×”字模板进行搜索,即搜索1,3,6,8这4个点.
[0038] 本发明总结已有算法特点的基础上,对其进行改进,通过最佳整像素点及其周围整像素点的匹配误差值来预测1/2像素点所在区域,并通过阈值判断提前结束搜索。实验结果显示该算法既保证了分数像素搜索的准确性,又有效地减少了搜索点数,同时还尽量保持其编码效率。附图说明
[0039] 图1亚像素运动估计算法流程图
[0040] 图2亚像素搜索图示,其中A~E为整像素,a~h为1/2像素,1~16为1/4像素;
[0041] 图31/2像素运动矢量搜索算法流程图;
[0042] 图41/4像素运动矢量搜索算法流程图。

具体实施方式

[0043] 下面结合附图和实例做进一步说明。
[0044] 如图1所示,亚像素搜索运动估计快速算法整体流程如下:
[0045] 步骤S101整像素搜索得到的最匹配整像素点;
[0046] 步骤S102执行1/2像素快速搜索算法;
[0047] 步骤S103判断最佳1/2像素点是否还是最优整像素点,如果不是,则执行步骤S105,即执行1/4像素快速搜索算法,否则执行步骤S104;
[0048] 步骤S104预测像素点匹配函数值是否大于阈值T,如果不是,则执行步骤S105,即执行1/4像素快速搜索算法,否则执行步骤S106,终止1/4像素点搜索,该预测像素点即为最优亚像素点。
[0049] 步骤S105执行1/4像素快速搜索算法;
[0050] 步骤S106该预测像素点即为最优亚像素点。
[0051] 如图3所示,1/2像素运动矢量搜索算法流程如下:
[0052] 步骤S201以最优整像素点为中心,将周围亚像素区域分为I,II,III,IV4个区域,如图2所示;
[0053] 步骤S202根据像素点的匹配函数值确定亚像素搜索区域,本发明假设预测区域为II象限;
[0054] 步骤S203比较预测区域内除最匹配整像素点外的另外两个整像素点,然后选择偏向匹配值小的整像素数点一侧的1/2像素点作为候选点,本发明假设J(C)<J(D),可预测最佳1/2像素点偏向C点,所以选取c,e作为候选点,如图2中所示;
[0055] 步骤S204比较中心整像素点和步骤S203中预测的候选点,预测出最佳亚像素点,如果不是中心整像素点,则执行步骤S206,否则执行步骤S205;
[0056] 步骤S205计算改点匹配函数值是否大于阈值T,如果大于阈值T,执行步骤S207,否则执行步骤S206;
[0057] 步骤S206执行1/4像素快速搜索算法;
[0058] 步骤S207该预测像素点即为最优亚像素点。
[0059] 如图4所示,1/4像素运动矢量搜索算法流程如下:
[0060] 步骤S301在最佳1/2像素点的基础上,来预测需要搜索的1/4像素点;
[0061] 步骤S302当最佳1/2像素点为中心整像素点,执行步骤S304;
[0062] 步骤S303当最佳1/2像素点不是中心整像素点,执行步骤S309;
[0063] 步骤S304根据最佳整像素点运动矢量mv预测1/4像素搜索方向;
[0064] 步骤S305当mv_x%4或者mv_y%4等于零,执行步骤S307;
[0065] 步骤S306当mv_x%4和mv_y%4都不为零,执行步骤S308;
[0066] 步骤S307搜索水平和垂直方向1/4像素点;
[0067] 步骤S308搜索搜索45°和-45°方向1/4像素点;
[0068] 步骤S309搜索与该1/2像素点在同一方向且相邻的2个1/4像素点。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈