首页 / 专利库 / 视听技术与设备 / 块匹配运动估计 / 一种运动估计方法及装置

一种运动估计方法及装置

阅读:1027发布:2020-11-16

专利汇可以提供一种运动估计方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 运动估计 方法及装置。方法包括:对参考 帧 进行半 像素 插值;采用3抽头非对称 滤波器 ,对参考帧整像素 水 平方向和垂直方向、以及半像素水平方向和垂直方向上的四分之一像素进行插值;采用对称滤波器,对参考帧整像素对 角 线方向上的四分之一像素进行插值;在插值后的参考帧中,搜索与当前 块 最匹配的预测块。本发明提高了四分之一像素插值的 精度 ,从而提高了运动估计的精度。,下面是一种运动估计方法及装置专利的具体信息内容。

1.一种运动估计方法,其特征在于,该方法包括:
对参考进行半像素插值;
采用3抽头非对称滤波器,对参考帧整像素平方向和垂直方向、以及半 像素水平方向和垂直方向上的四分之一像素进行插值;
采用对称滤波器,对参考帧整像素对线方向上的四分之一像素进行插值;
在插值后的参考帧中,搜索与当前最匹配的预测块。
2.如权利要求1所述的方法,其特征在于,所述采用3抽头非对称滤波器, 对参考帧整像素水平方向和垂直方向上的四分之一像素进行插值为:
                   u=(16U+15uu+V+16)/25
且,所述采用3抽头非对称滤波器,对参考帧半像素水平方向和垂直方向 上的四分之一像素进行插值为:
                 z=(2vv+15ww+15xx+16)/25;
或者,
所述采用3抽头非对称滤波器,对参考帧整像素水平方向和垂直方向上的 四分之一像素进行插值为:
                   u=(8U+7uu+V+8)/24
且,所述采用3抽头非对称滤波器,对参考帧半像素水平方向和垂直方向 上的四分之一像素进行插值为:
                 z=(2vv+7ww+7xx+8)/24;
或者,
所述采用3抽头非对称滤波器,对参考帧整像素水平方向和垂直方向上的 四分之一像素进行插值为:
                 u=(32U+31uu+V+32)/26
且,所述采用3抽头非对称滤波器,对参考帧半像素水平方向和垂直方向 上的四分之一像素进行插值为:
            z=(2vv+31ww+31xx+32)/26
其中,u为参考帧中整像素水平方向或整像素垂直方向上的四分之一像素, U、uu、V与四分之一像素同一方向,且,U为距四分之一像素最近的整像素, V为距四分之一像素次最近的整像素,uu为距四分之一像素最近的半像素;
z为参考帧中半像素水平方向或半像素垂直方向上的四分之一像素,vv、 ww、xx与四分之一像素同一方向,且,ww、xx为距四分之一像素最近的半像 素,vv为距四分之一像素次最近的半像素。
3.如权利要求1所述的方法,其特征在于,所述采用对称滤波器,对整像 素对角线方向上的四分之一像素进行插值为:
                      o=(U+ww+1)/2
其中,o为参考帧中整像素对角线方向上的四分之一像素,U、ww与四分 之一像素同一方向,且,U为距四分之一像素最近的整像素,ww为距四分之一 像素最近的半像素。
4.如权利要求1所述的方法,其特征在于,所述对参考帧进行半像素插值 为:采用H.264标准中的半像素插值方法,对参考帧进行半像素插值。
5.一种运动估计装置,其特征在于,包括:
插值模块,对参考帧进行半像素插值;采用3抽头非对称滤波器,对参考 帧整像素水平方向和垂直方向、以及半像素水平方向和垂直方向上的四分之一 像素进行插值;采用对称滤波器,对参考帧整像素对角线方向上的四分之一像 素进行插值;
匹配模块,在插值后的参考帧中,搜索与当前块最匹配的预测块。
6.如权利要求5所述的装置,其特征在于,所述插值模块包括:
半像素插值模块,采用H.264标准中的半像素插值方法,对参考帧进行半 像素插值;
四分之一像素插值模块,采用(16,15,1)滤波器对整像素水平方向或整 像素垂直方向上的四分之一像素插值,采用(15,15,2)滤波器对半像素水平 方向或半像素垂直方向上的四分之一像素插值;或者,采用(8,7,1)滤波器 对整像素水平方向或整像素垂直方向上的四分之一像素插值,采用(7,7,2) 滤波器对半像素水平方向或半像素垂直方向上的四分之一像素插值;或者,采 用(32,31,1)滤波器对整像素水平方向或整像素垂直方向上的四分之一像素 插值,采用(31,31,2)滤波器对半像素水平方向或半像素垂直方向上的四分 之一像素插值;采用(1,1)滤波器对整像素对角线方向上的四分之一像素插 值。

说明书全文

技术领域

发明涉及视频编码技术领域,具体涉及一种运动估计方法及装置

背景技术

间编码时需要进行运动估计,最初的运动估计算法是在整像素基础 上进行的,在参考帧中搜索到与当前最匹配的块作为当前块的预测块,然 后根据该预测块对当前块进行编码。最常用的匹配原则是使当前块与预测块 的像素值的绝对误差和最小,以4×4块为例,其定义见公式(1):
SAD = Σ i = 0 3 Σ j = 0 3 | S ( i , j ) - O ( i , j ) | - - - ( 1 )
其中,S(i,j)表示当前块中的像素值,O(i,j)表示参考帧中的搜索块的像 素值,使得SAD最小的搜索块即为与当前块最匹配的预测块。
为了达到更好的编码性能,H.264标准中引入了半像素和四分之一像素 插值技术。在每个整像素的周围插值得到半像素,再以整像素与半像素为参 考,插值得到四分之一像素。这种分数精度像素插值技术的引入,经过实验 证明会明显提高编码性能,尤其提高了帧间编码时运动估计预测的准确性。
在H.264标准中,当进行运动估计预测时,运动向量的搜索不只限定在 整像素范围内,利用半像素与四分之一像素插值技术,能搜索到与当前块更 加匹配的预测块。图1为H.264标准中的半像素和四分之一像素插值示意图, 如图1所示,大写字母如:A、B、...、T、U表示整像素,双小写字母如: aa、bb、...、gg、hh表示半像素,单小写字母如:a、c、...、q、r表示四 分之一像素。
H.264标准中的半像素插值技术使用6抽头滤波器(1,-5,20,20,-5,1), 根据半像素的位置,可分为三种情况:
情况一、平方向上的半像素,例如:图1中的aa、bb,以aa为例, 利用公式(2)和公式(3)插值得到。
       X=A-2-5A-1+20A+20B-5B1+B2         (2)
       aa=Clip1((X+16)/25)               (3)
其中,公式(2)中大写字母的脚标-2、-1、1、2代表相邻整像素的索 引值,例如:A-1表示与A同一行且位于A左边的第一个整像素,B2表示与B同 一行且位于B右边的第二个整像素。Clip1(s)函数的作用是将s的值限定在0 到255之间。
情况二、垂直方向上的半像素,例如:图1中的jj、nn,以jj为例,利 用公式(4)和公式(5)插值得到:
       Y=A-5C+20G+20M-5R+T               (4)
       jj=Clip1((Y+16)/25)               (5)
情况三、对线方向上的半像素,例如:图1中的kk,利用公式(6) 和公式(7)插值得到:
       Z=aa-5bb+20ii+20ll-5gg+hh         (6)
       kk=Clip1((Z+16)/25)               (7)
H.264标准中的四分之一像素插值利用双线性滤波器(1,1),根据四 分之一像素所处的位置可分成三种情况:
情况一、整像素水平方向和半像素水平方向上的四分之一像素,例如: 图2中的a、b、e、f。以a和e为例,利用公式(8)插值得到:
       a=(A+aa+1)/2
       e=(bb+cc+1)/2                     (8)
即:对整像素或半像素水平方向上距四分之一像素最近的一个整像素和 一个半像素或者两个半像素插值,可得到整像素或半像素水平方向上的四分 之一像素。
情况二、整像素垂直方向和半像素垂直方向上的四分之一像素,例如: 图2中的c、d、g、h。以c和g为例,利用公式(9)插值得到:
       c=(A+bb+1)/2
       g=(aa+cc+1)/2                     (9)
即:对整像素或半像素垂直方向上距四分之一像素最近的一个整像素和 一个半像素或者两个半像素插值,可得到整像素或半像素垂直方向上的四分 之一像素。
情况三、整像素对角线方向上的四分之一像素,例如:图2中的i、j、 k、l,以i点为例,利用公式(10)插值得到:
       i=(aa+bb+1)/2                     (10)
即:对整像素对角线方向上的两个半像素插值,可得到整像素对角线方 向上的四分之一像素。
引入分数精度的像素插值技术之后,当进行运动估计时,首先在参考帧 的整像素上进行搜索,得到整数精度的最优匹配像素之后,再利用一定的搜 索策略在最优整数精度像素的周围搜索分数精度像素,最终得到最佳匹配块 和匹配精度。
从以上描述可以看出,在进行四分之一像素插值时,使用的是两个像素, 这样虽然实现简单,但是插值精度不高,最终会导致运动估计的精度不高。

发明内容

本发明提供一种运动估计方法及装置,以提高运动估计的精度。
本发明的技术方案是这样实现的:
一种运动估计方法,该方法包括:
对参考帧进行半像素插值;
采用3抽头非对称滤波器,对参考帧整像素水平方向和垂直方向、以及半 像素水平方向和垂直方向上的四分之一像素进行插值;
采用对称滤波器,对参考帧整像素对角线方向上的四分之一像素进行插值;
在插值后的参考帧中,搜索与当前块最匹配的预测块。
所述采用3抽头非对称滤波器,对参考帧整像素水平方向和垂直方向上的 四分之一像素进行插值为:
                 u=(16U+15uu+V+16)/25
且,所述采用3抽头非对称滤波器,对参考帧半像素水平方向和垂直方向 上的四分之一像素进行插值为:
               z=(2vv+15ww+15xx+16)/25;
或者,
所述采用3抽头非对称滤波器,对参考帧整像素水平方向和垂直方向上的 四分之一像素进行插值为:
                  u=(8U+7uu+V+8)/24
且,所述采用3抽头非对称滤波器,对参考帧半像素水平方向和垂直方向 上的四分之一像素进行插值为:
                z=(2vv+7ww+7xx+8)/24;
或者,
所述采用3抽头非对称滤波器,对参考帧整像素水平方向和垂直方向上的 四分之一像素进行插值为:
                u=(32U+31uu+V+32)/26
且,所述采用3抽头非对称滤波器,对参考帧半像素水平方向和垂直方向 上的四分之一像素进行插值为:
               z=(2vv+31ww+31xx+32)/26
其中,u为参考帧中整像素水平方向或整像素垂直方向上的四分之一像素, U、uu、V与四分之一像素同一方向,且,U为距四分之一像素最近的整像素, V为距四分之一像素次最近的整像素,uu为距四分之一像素最近的半像素;
z为参考帧中半像素水平方向或半像素垂直方向上的四分之一像素,vv、 ww、xx与四分之一像素同一方向,且,ww、xx为距四分之一像素最近的半像 素,vv为距四分之一像素次最近的半像素。
所述采用对称滤波器,对整像素对角线方向上的四分之一像素进行插值为:
                    o=(U+ww+1)/2
其中,o为参考帧中整像素对角线方向上的四分之一像素,U、ww与四分 之一像素同一方向,且,U为距四分之一像素最近的整像素,ww为距四分之一 像素最近的半像素。
所述对参考帧进行半像素插值为:采用H.264标准中的半像素插值方法, 对参考帧进行半像素插值。
一种运动估计装置,包括:
插值模块,对参考帧进行半像素插值;采用3抽头非对称滤波器,对参考 帧整像素水平方向和垂直方向、以及半像素水平方向和垂直方向上的四分之一 像素进行插值;采用对称滤波器,对参考帧整像素对角线方向上的四分之一像 素进行插值;
匹配模块,在插值后的参考帧中,搜索与当前块最匹配的预测块。
所述插值模块包括:
半像素插值模块,采用H.264标准中的半像素插值方法,对参考帧进行半 像素插值;
四分之一像素插值模块,采用(16,15,1)滤波器对整像素水平方向 或整像素垂直方向上的四分之一像素插值,采用(15,15,2)滤波器对半 像素水平方向或半像素垂直方向上的四分之一像素插值;或者,采用(8,7, 1)滤波器对整像素水平方向或整像素垂直方向上的四分之一像素插值,采 用(7,7,2)滤波器对半像素水平方向或半像素垂直方向上的四分之一像 素插值;或者,采用(32,31,1)滤波器对整像素水平方向或整像素垂直 方向上的四分之一像素插值,采用(31,31,2)滤波器对半像素水平方向 或半像素垂直方向上的四分之一像素插值;采用(1,1)滤波器对整像素对 角线方向上的四分之一像素插值。
现有技术相比,本发明采用3抽头非对称滤波器,对参考帧整像素水 平方向和垂直方向、以及半像素水平方向和垂直方向上的四分之一像素进行 插值;采用对称滤波器,对参考帧整像素对角线方向上的四分之一像素进行 插值,在不增加插值复杂度的前提下,经过实验证明明显提高了插值精度, 从而提高了运动估计的精度。
附图说明
图1为现有的H.264标准中的半像素和四分之一像素插值示意图;
图2为现有的H.264标准中的四分之一像素插值示意图;
图3为本发明实施例提供的运动估计流程图
图4为本发明实施例提供的运动估计装置的组成图。

具体实施方式

下面结合附图及具体实施例对本发明再作进一步详细的说明。
图3为本发明实施例提供的运动估计流程图,如图3所示,其具体步骤 如下:
步骤301:采用H.264标准中的半像素插值方法,对参考帧进行半像素 插值。
步骤302:采用3抽头非对称滤波器对参考帧进行四分之一像素插值。
本步骤的具体过程如下:
01:整像素水平方向或整像素垂直方向上的四分之一像素,例如:图2 中的a、b和c、d,采用(16,15,1)滤波器插值得到。以a、d为例,利 用公式(11)插值得到:
       a=(16A+15aa+B+16)/25
       d=(A+15bb+16C+16)/25              (11)
即:利用同一方向上距四分之一像素最近的两个整像素和一个半像素插 值得到。其中,距四分之一像素最近的整像素的滤波系数为16,最近的半 像素的滤波系数为15,次最近的整像素的滤波系数为1。
02:半像素水平方向或半像素垂直方向上的四分之一像素,例如:图2 中的e、f、g、h,以f、g为例,利用公式(12)插值得到:
       f=(2bb+15cc+15dd+16)/25
       g=(15aa+15cc+2ee+16)/25           (12)
即:利用同一方向上最近的三个半像素插值得到。其中:距四分之一像 素最近的两个半像素的滤波系数为15,次最近的一个半像素的滤波系数为 2。
03:整像素对角线方向上的四分之一像素,例如:图2中的i、j、k、l, 以i、k为例,利用公式(13)插值得到:
       i=(A+cc+1)/2
       k=(C+cc+1)/2                      (13)
即:利用同一方向上最近的一个整像素和一个半像素插值得到。
步骤303:在插值后的参考帧的整像素上搜索与当前块最匹配的块,然 后在该最匹配块上的整数精度的最优匹配点周围搜索分数精度最优匹配点, 最终得到最匹配的预测块。
在实际应用中,整像素水平方向及整像素垂直方向上的四分之一像素也 可采用(8,7,1)滤波器插值得到,同时,半像素水平方向及半像素垂直 方向上的四分之一像素采用(7,7,2)滤波器插值得到,仍然以图2中的 a、d,f、g为例,即:
       a=(8A+7aa+B+8)/24
       d=(A+7bb+8C+8)/24                 (14)
即:距四分之一像素最近的整像素的滤波系数为8,最近的半像素的滤 波系数为7,次最近的整像素的滤波系数为1;
       f=(2bb+7cc+7dd+8)/24
       g=(7aa+7cc+2ee+8)/24              (15)
即:距四分之一像素最近的两个半像素的滤波系数为7,次最近的一个 半像素的滤波系数为2。
或者,整像素水平方向及整像素垂直方向上的四分之一像素也可采用 (32,31,1)滤波器插值得到,同时,半像素水平方向及半像素垂直方向 上的四分之一像素采用(31,31,2)滤波器插值得到,仍然以图2中的a、 d,f、g为例,即:
       a=(32A+31aa+B+32)/26
       d=(A+31bb+32C+32)/26              (16)
即:距四分之一像素最近的整像素的滤波系数为32,最近的半像素的 滤波系数为31,次最近的整像素的滤波系数为1;
       f=(2bb+31cc+31dd+32)/26
       g=(31aa+31cc+2ee+32)/26           (17)
即:距四分之一像素最近的两个半像素的滤波系数为31,次最近的一 个半像素的滤波系数为2。
图4为本发明实施例提供的运动估计装置组成示意图,如图4所示,其 主要包括:插值模块41和匹配模块42,其中:
插值模块41:采用H.264标准中的半像素插值技术,对参考帧进行半 像素插值;采用3抽头非对称滤波器,对参考帧整像素水平方向和垂直方向、 以及半像素水平方向和垂直方向上的四分之一像素进行插值;采用对称滤波 器,对参考帧整像素对角线方向上的四分之一像素进行插值。
匹配模块42:在插值后的参考帧的整像素上搜索与当前块最匹配的块, 然后在该最匹配的块上的整数精度的最优匹配点周围搜索分数精度最优匹 配点,最终得到最匹配的预测块。
插值模块41可包括:半像素插值模块411和四分之一像素插值模块412, 其中:
半像素插值模块411:采用H.264标准中的半像素插值方法,对参考帧进 行半像素插值。
四分之一像素插值模块412:采用(16,15,1)滤波器对整像素水平 方向或整像素垂直方向上的四分之一像素插值,采用(15,15,2)滤波器 对半像素水平方向或半像素垂直方向上的四分之一像素插值;或者,采用(8, 7,1)滤波器对整像素水平方向或整像素垂直方向上的四分之一像素插值, 采用(7,7,2)滤波器对半像素水平方向或半像素垂直方向上的四分之一 像素插值;或者,采用(32,31,1)滤波器对整像素水平方向或整像素垂 直方向上的四分之一像素插值,采用(31,31,2)滤波器对半像素水平方 向或半像素垂直方向上的四分之一像素插值;采用(1,1)滤波器对整像素 对角线方向上的四分之一像素插值。
与现有的H.264标准中的四分之一像素插值方法相比,本发明实施例提 供的四分之一像素插值方法改变了滤波系数,使用了三种滤波系数(16,15, 1)、(15,15,2)、(1,1),或者:(8,7,1)、(7,7,2)、(1, 1),或者:(32,31,1)、(31,31,2)、(1,1)。以(16,15,1)、 (15,15,2)、(1,1)为例,在硬件实现算法时,乘16操作可以利用左 移4位来实现,乘15可以利用左移4位再减1实现。由于移位操作和加减 法操作在硬件实现上是等价的,所以本发明实施例提出的滤波系数与现有的 H.264标准中四分之一像素插值方法中的滤波系数的计算复杂度是相当的。
经过实验证明,本发明实施例提供的四分之一像素插值方法明显提高了 插值精度,从而提高了运动估计精度,提高了帧间编码效率。且经过实验证 明,滤波系数(16,15,1)、(15,15,2)、(1,1)的插值精度最高。
以上所述仅为本发明的过程及方法实施例,并不用以限制本发明,凡在 本发明的精神和原则之内所做的任何修改、等同替换、改进等,均应包含在 本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈