首页 / 专利库 / 视听技术与设备 / 运动补偿时间滤波 / 基于六边形搜索及三帧背景对齐的动背景视频对象提取

基于六边形搜索及三背景对齐的动背景视频对象提取

阅读:1027发布:2020-06-10

专利汇可以提供基于六边形搜索及三背景对齐的动背景视频对象提取专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于六边形网格整 像素 运动估计 及三 帧 背景对齐的动背景下视频对象提取方法,包括如下步骤:首先将参考帧K帧,K-1帧,K+1帧分成8×8宏 块 ,根据宏块预判断准则对所有的宏块进行筛选;对筛选后的宏块采用六边形网格整像素运动估计方法进行 块匹配 ,得到K-1帧相对于K帧的 运动矢量 场,K+1帧相对于K帧的运动矢量场,并通过最小二乘法计算全局运动参数;对第K-1帧和K+1帧分别进行 运动补偿 ,使第K-1帧和第K+1帧分别与第K帧背景对齐,得到重建帧K-1'和K+1';对重建帧K-1'、参考帧K及重建帧K+1'分别采用Roberts算子提取边缘信息,分别计算其相对于参考帧边缘的帧差,最大方差 阈值 进行二值化;最后采用形态学及中值滤波等进行后处理,实现对于动背景下视频对象的快速有效分割。,下面是基于六边形搜索及三背景对齐的动背景视频对象提取专利的具体信息内容。

1.一种基于六边形网格整像素运动估计及三背景对齐的动背景下视频对象提取方法,其特征在于包括以下步骤:
(1)将参考帧K帧,K-1帧,K+1帧分成8×8宏,根据纹理信息对K-1帧、K+1帧中所有宏块进行预判断、筛选;
(2)对上述筛选后的宏块采用SAD准则、基于六边形网格整像素搜索策略进行块匹配,以K-1帧作为当前帧、K帧作为参考帧,得到K-1帧相对于K帧的运动矢量场;以K+1帧作为当前帧、K帧作为参考帧,得到K+1帧相对于K帧的运动矢量场,并通过最小二乘法计算全局运动参数,获得摄像机六参数模型;
(3)对第K-1帧进行运动补偿,使第K-1帧与第K帧背景对齐,得到重建帧K-1',对第K+1帧进行运动补偿,使第K+1帧与第K帧背景对齐,得到重建帧K+1';
(4)分别采用Roberts算子提取边缘信息,分别计算其相对于参考帧K边缘的帧差,并采用最大方差阈值进行二值化;
(5)采用与运算及形态学、中值滤波进行后处理,实现动背景下视频对象的快速有效分割。
2.根据权利要求1所述的方法,其特征在于所述步骤(1)的对于当前帧K-1帧、K+1帧中分成的8×8宏块进行预判断及筛选,具体步骤如下:
由于在下述步骤中应用最小二乘法计算全局运动参数的时候,很多误差大的宏块被直接删除,如果能够在最小二乘法运算之前将误差大的宏块剔除,将显著的提高运算速度,并降低运算量;而决定宏块误差大小、影响计算准确性的重要因素便是宏块的纹理信息,也就是梯度信息;本部分提出的宏块预判断及筛选的方法正是从宏块的梯度信息出发,根据设定的阈值对于宏块进行筛选抑或保留,当宏块的信息量小于该阈值时,对该宏块进行筛选,不作为下述步骤中参与块匹配的宏块;当信息量大于该阈值时,则对宏块进行保留,作为有效特征块参与进行下述的运动估计等运算:
其主要步骤如下:
第一步:将每一帧分成8×8子块,经试验证明,若采用分成16×16子块的形式则计算量过大,若分成4×4子块则块匹配等方法不够精确,故采用8×8子块的形式;
第二步:采用Sobel算子得到每一帧的梯度图,将梯度信息作为宏块剔除的判断依据;
其中 表示该点的梯度信息,Gx、Gy分别表示偏导数;
第三步:计算每一个宏块的梯度量;以8×8子块为例,其梯度量为:
第四步:确定宏块预断的阈值,一般保留所有宏块的40%,根据这个确定的值,对所有宏块的梯度量进行排序,确定保留40%下宏块筛选的最佳阈值T;
第五步:完成对于宏块的筛选,若其梯度量>T,则对宏块进行保留,作为有效特征块参与进行下述的运动估计等运算;若其梯度量3.根据权利要求1所述的方法,其特征在于所述步骤(2)的分别以K-1帧、K+1帧作为当前帧,以K帧作为参考帧,对筛选后的宏块采用SAD准则、六边形网格整像素搜索策略进行块匹配,并将块匹配求得的运动矢量场利用最小二乘法获得摄像机六参数模型,其具体步骤如下:
(i)块匹配准则SAD
本部分采用SAD块匹配准则,该准则不仅能够找到最佳匹配点,并且计算量小、耗时短:
其中(i,j)为位移量,fk和fk-1分别为当前帧和上一帧的灰度值,M×N为宏块的大小,若在某一点处SAD(i,j)达到最小,则该点为要找的最优匹配点;
(ii)六边形网格整像素搜索策略
六边形网格整像素搜索策略的基本思想是采用多种模板进行宏块匹配,同时利用时空相关性进行运动矢量场的预测,搜索时针对不同的运动类型采用了大范围粗搜索混合模板、细搜索六边形模板和精细搜索菱形模板完成搜索;
方法各步骤如下:
第一步:起始点预测:使用如下5种预测模式预测运动矢量MV,分别是:
①中值预测:利用空间相关性,令当前子块的左、上、右邻块的运动矢量的中间值为预测运动矢量;
②原点预测:令运动矢量为(0,0);
③Uplayer预测:利用H.264运动估计可变宏块划分的特点,从模式1(16×16)到模式
7(4×4)的分级搜索顺序,取已求出的同位置上一级、大一倍块的运动矢量;
④对应块预测:利用时间相关性,取前一帧同位置块的运动矢量作为预测结果;
⑤相邻参考帧预测:利用时间相关性,令前一参考帧中对应位置块的MV按比例进行预测;
第二步:对以上MV所指向的点使用非对称十字模板搜索,获得当前的最佳预测起点;
随后根据不同起始点的率失真结果使用阈值进行判断,分为非满意区域、满意区域和很满意区域,分别转入第三步,第四步和第五步;
第三步:对于不满意的块使用如下方式进行搜索;
⑥以目前最优点为中心,在(-2,2)的方形区域中进行逐点搜索;获得当前最优点,判断此处是否属于满意或很满意区,跳到相应的第四步或第五步;或继续搜索;
⑦用不断扩大一倍直径的大六边形模板进行搜索,直至搜索到能符合相应阈值而进入第四步或第五步的搜索点为止;或者搜索模板完全超出搜索窗范围,也结束第三步的搜索;
第四步:以目前最优点为中心,使用六边形模板进行搜索,直至最优点位于六边形中心为止;
第五步:对很满意区域的子块进行搜索,以目前最优点为中心,使用菱形模板进行搜索,直至最优点在菱形模板中心为止;
(iii)最小二乘法获得摄像机六参数模型
选取步骤(i)中获取到的当前帧K-1及当前帧K+1中两侧子块作为特征块,将经过(i)(ii)步骤获得的运动矢量代入摄像机六参数模型(如下式)后,采用最小二乘法估计参数m0、m1、m2、n0、n1、n2;6参数仿射变换模型:可以对平移、旋转、缩放运动进行建模,其定义如下:
其中m0和n0分别表示像素点在x和y方向的平移幅度,m1、n1、m2、n2四个参数描述了缩放和旋转转动。
4.根据权利要求1所述的方法,其特征在于所述步骤(3)的通过运动补偿分别获得当前帧K-1、K+1的重建帧K-1'、K+1',其具体内容如下:
对于当前帧k-1帧、k+1帧中的每一个点根据上述获取的摄像机模型,计算其分别在参考帧K中的对应位置并对其进行赋值,从而实现对于K-1帧、k+1帧的全局运动补偿,使补偿后的重建帧k-1'、k+1'与参考帧k的背景对齐,从而实现下述结合边缘信息、自适应最大方差阈值的基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频分割方法。
5.根据权利要求1所述的方法,其特征在于所述步骤(4)的采用Roberts算子提取边缘信息,并分别与参考帧K边缘进行差分,并采用最大方差阈值进行二值化,其具体步骤如下:
(i)Roberts算子提取边缘信息,并与参考帧K边缘进行差分;
边缘检测算子种类很多,这里选择Roberts边缘检测算子对于重建帧k-1'、k+1'及k帧进行边缘特征提取;
令f(x,y)为输入图像,g(x,y)为输出图像,则Roberts边缘梯度可以由下式求出:
写成模板形式如下所示:
应用Roberts算子对于重建帧k-1'、k+1'及k帧分别提取边缘的结果为:fk-1'(x,y)、fk+1'(x,y)及fk(x,y);
对重建帧k-1'与k帧的边缘,重建帧k+1'与k帧的边缘进行图像差分运算,求得帧差d1与d2,其中:
帧差d1=|fk-1'(x,y)-fk(x,y)|,帧差d2=|fk+1'(x,y)-fk(x,y)|;
(ii)采用最大方差阈值进行二值化
最大方差阈值是一种自适应的阈值确定方法,它以最佳限将图像的直方图分成两组,当两组间的方差为最大时,决定阈值;所以本部分采用这种方法来实现边缘图像差分结果的二值化;
设一幅图像的灰度值为0~m-1级,灰度值i的像素数为ni,则总的像素点数:
各值的概率为:
设最佳阈值为T,用阈值T将像素分成两组:C0={0~T-1}和C1={T~m-1},C0和C1产生的概率及平均值有以下公式得出:
C0产生的概率
C1产生的概率
C0的平均值
C1的平均值
其中:
则全部采样的灰度平均值为:μ=w0μ0+w1μ1
两组间的方差:
在1~m-1之间求上式为最大值时的T,即为最佳阈值;
根据所得到的最佳阈值T对边缘检测结果进行二值化。

说明书全文

基于六边形搜索及三背景对齐的动背景视频对象提取

技术领域:

[0001] 本发明涉及一种视频分割中的处理方法,特别涉及一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法。背景技术:
[0002] 对于动态视频序列中运动对象的提取,由于摄像机产生的全局运动使得在静背景下的分割方法,如:帧差或者背景差分等方法不适用于动背景下的分割,即不能够准确地将运动对象提取出来,因此针对动背景下的分割问题必须首先消除摄像机运动所造成的全局运动的影响,通过全局运动估计和补偿技术,将问题转化成静背景下的分割问题,进而应用静背景下广泛的分割方法实现动背景下的准确、有效分割。
[0003] 全局运动估计是指估计由摄像机运动引起的序列背景区域的运动规律,求解出相应数学运动模型中的多个参数。全局运动补偿是在根据运动估计所得到的全局运动参数,在当前帧和前一帧之间作一个相应的背景对齐的映射变换。这样在准确的补偿之后就可以采用帧差或背景差等方法消除背景区域,突出感兴趣的具有局部运动的前景区域(参见杨文明.时空融合的视频对象分割[D].浙江:浙江大学,2006)。
[0004] 对于动背景下的运动对象分割问题,目前国际上已有相当多的学者做了大量的研究工作。如利用改进的分算法将运动补偿后的视频帧分割成不同的灰度区域,通过光流计算得到序列的运动信息,最后,将运动信息和分割的区域按一定的准则综合得到对象模板,达到对视频对象的准确定位(参见张庆利.一种基于运动背景的视频对象分割算法.上海大学学报(自然科学版),2005,11(2):111-115.)。如建立四参数运动放射模型来描述全局运动,采用匹配方法进行参数估计,结合Horn-Schunck算法检测出运动目标并应用卡尔曼滤波对运动目标的质心位置等信息进行跟踪,实现了动态场景中运动对象的检测与跟踪。(参见施家栋.动态场景中运动目标检测与跟踪.北京理工大学学报,2009,29(10):858-876.)。另一种采用非参数核密度估计的方法,首先采用匹配加权的全局运动估计补偿算法消除动态场景下背景运动的影响,然后估计各像素属于前景与背景的概率密度并结合形态学等算法进行处理,实现了动背景下运动对象的准确、有效分割。(参见志强.一种动态场景下运动对象分割新算法.计算机工程与科学,2012,34(4):43-46.)。
[0005] 为了解决动背景下的分割问题,本发明方法实现了一种采用宏块预判断、块匹配、摄像机六参数仿射模型、最小二乘法等全局运动估计及补偿方法,并通过三帧背景对齐结合边缘信息等实现动背景分割。实验证明,该方法实现了动背景视频序列中视频对象的提取,并且提取精度得到明显提高。发明内容:
[0006] 本发明要解决的技术问题是:如何减少块匹配的运算时间,如何实现动背景下视频对象的准确提取。
[0007] 本发明解决其技术问题所采用的技术方案是:一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法,包括以下步骤:
[0008] (1)将参考帧K帧,K-1帧,K+1帧分成8×8宏块,根据纹理信息对K-1帧、K+1帧中所有宏块进行预判断、筛选;
[0009] (2)对上述筛选后的宏块采用SAD准则、基于六边形网格整像素搜索策略进行块匹配,以K-1帧作为当前帧、K帧作为参考帧,得到K-1帧相对于K帧的运动矢量场;以K+1帧作为当前帧、K帧作为参考帧,得到K+1帧相对于K帧的运动矢量场,并通过最小二乘法计算全局运动参数,获得摄像机六参数模型;
[0010] (3)对第K-1帧进行运动补偿,使第K-1帧与第K帧背景对齐,得到重建帧K-1',对第K+1帧进行运动补偿,使第K+1帧与第K帧背景对齐,得到重建帧K+1';
[0011] (4)分别采用Roberts算子提取边缘信息,分别计算其相对于参考帧K边缘的帧差,并采用最大方差阈值进行二值化;
[0012] (5)采用与运算及形态学、中值滤波等进行后处理,实现动背景下视频对象的快速有效分割。
[0013] 所述步骤(1)中对于当前帧K-1帧、K+1帧中分成的8×8宏块进行预判断及筛选,具体步骤如下:
[0014] 由于在下述步骤中应用最小二乘法计算全局运动参数的时候,很多误差大的宏块被直接删除,如果能够在最小二乘法运算之前将误差大的宏块剔除,将显著的提高运算速度,并降低运算量。而决定宏块误差大小、影响计算准确性的重要因素便是宏块的纹理信息,也就是梯度信息。本部分提出的宏块预判断及筛选的方法正是从宏块的梯度信息出发,根据设定的阈值对于宏块进行筛选抑或保留,当宏块的信息量小于该阈值时,对该宏块进行筛选,不作为下述步骤中参与块匹配的宏块;当信息量大于该阈值时,则对宏块进行保留,作为有效特征块参与进行下述的运动估计等运算。
[0015] 其主要步骤如下:
[0016] 第一步:将每一帧分成8×8子块,经试验证明,若采用分成16×16子块的形式则计算量过大,若分成4×4子块则块匹配等方法不够精确,故采用8×8子块的形式;
[0017] 第二步:采用Sobel算子得到每一帧的梯度图,将梯度信息作为宏块剔除的判断依据;
[0018]
[0019] 其中 表示该点的梯度信息,Gx、Gy分别表示偏导数。
[0020] 第三步:计算每一个宏块的梯度量;以8×8子块为例,其梯度信息量为:
[0021]
[0022] 第四步:确定宏块预断的阈值,一般保留所有宏块的40%,根据这个确定的值,对所有宏块的梯度量进行排序,确定保留40%下宏块筛选的最佳阈值T;
[0023] 第五步:完成对于宏块的筛选,若其梯度信息量>T,则对宏块进行保留,作为有效特征块参与进行下述的运动估计等运算;若其梯度信息量
[0024] 所述步骤(2)中的分别以K-1帧、K+1帧作为当前帧,以K帧作为参考帧,对筛选后的宏块采用SAD准则、六边形网格整像素搜索策略进行块匹配,并将块匹配求得的运动矢量场利用最小二乘法获得摄像机六参数模型,其具体步骤如下:
[0025] (i)块匹配准则SAD
[0026] 本部分采用SAD块匹配准则,该准则不仅能够找到最佳匹配点,并且计算量小、耗时短。
[0027]
[0028] 其中(i,j)为位移量,fk和fk-1分别为当前帧和上一帧的灰度值,M×N为宏块的大小,若在某一点处SAD(i,j)达到最小,则该点为要找的最优匹配点。
[0029] (ii)六边形网格整像素搜索策略
[0030] 六边形网格整像素搜索策略的基本思想是采用多种模板进行宏块匹配,同时利用时空相关性进行运动矢量场的预测,搜索时针对不同的运动类型采用了大范围粗搜索混合模板、细搜索六边形模板和精细搜索菱形模板完成搜索。
[0031] 方法示意图如图2所示,各步骤如下:
[0032] 第一步:起始点预测。使用如下5种预测模式预测运动矢量MV,分别是:
[0033] 1.中值预测:利用空间相关性,令当前子块的左、上、右邻块的运动矢量的中间值为预测运动矢量(如图3所示);
[0034] 2.原点预测:令运动矢量为(0,0);
[0035] 3.Uplayer预测:利用H.264运动估计可变宏块划分的特点,从模式1(16×16)到模式7(4×4)的分级搜索顺序,取已求出的同位置上一级、大一倍块的运动矢量(如图4所示);
[0036] 4.对应块预测:利用时间相关性,取前一帧同位置块的运动矢量作为预测结果(如图5所示);
[0037] 5.相邻参考帧预测:利用时间相关性,令前一参考帧中对应位置块的MV按比例进行预测(如图6所示)。
[0038] 第二步:对以上MV所指向的点使用非对称十字模板搜索,获得当前的最佳预测起点。随后根据不同起始点的率失真结果使用阈值进行判断,分为非满意区域、满意区域和很满意区域,分别转入第三步,第四步和第五步。
[0039] 第三步:对于不满意的块使用如下方式进行搜索。
[0040] 6.以目前最优点为中心,在(-2,2)的方形区域中进行逐点搜索;获得当前最优点,判断此处是否属于满意或很满意区,跳到相应的第四步或第五步;或继续搜索;
[0041] 7.用不断扩大一倍直径的大六边形模板进行搜索,直至搜索到能符合相应阈值而进入第四步或第五步的搜索点为止;或者搜索模板完全超出搜索窗范围,也结束第三步的搜索。
[0042] 第四步:以目前最优点为中心,使用六边形模板进行搜索,直至最优点位于六边形中心为止。
[0043] 第五步:对很满意区域的子块进行搜索。以目前最优点为中心,使用菱形模板进行搜索,直至最优点在菱形模板中心为止。
[0044] (iii)最小二乘法获得摄像机六参数模型
[0045] 选取步骤(i)中获取到的当前帧K-1及当前帧K+1中两侧子块作为特征块,将经过(i)(ii)步骤获得的运动矢量代入摄像机六参数模型(如下式)后,采用最小二乘法估计参数m0、m1、m2、n0、n1、n2。6参数仿射变换模型:可以对平移、旋转、缩放运动进行建模,其定义如下:
[0046]
[0047] 其中m0和n0分别表示像素点在x和y方向的平移幅度,m1、n1、m2、n2四个参数描述了缩放和旋转转动。
[0048] 所述步骤(3)中的通过运动补偿分别获得当前帧K-1、K+1的重建帧K-1'、K+1',其具体内容如下:
[0049] 对于当前帧k-1帧、k+1帧中的每一个点根据上述获取的摄像机模型,计算其分别在参考帧K中的对应位置并对其进行赋值,从而实现对于K-1帧、k+1帧的全局运动补偿,使补偿后的重建帧k-1'、k+1'与参考帧k的背景对齐,从而实现下述结合边缘信息、自适应最大方差阈值的基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频分割方法。
[0050] 所述步骤(4)中的采用Roberts算子提取边缘信息,并分别与参考帧K边缘进行差分,并采用最大方差阈值进行二值化,其具体步骤如下:
[0051] (i)Roberts算子提取边缘信息,并与参考帧K边缘进行差分
[0052] 边缘检测算子种类很多,这里选择Roberts边缘检测算子对于重建帧k-1'、k+1'及k帧进行边缘特征提取。
[0053] 令f(x,y)为输入图像,g(x,y)为输出图像,则Roberts边缘梯度可以由下式求出:
[0054]
[0055] 写成模板形式如下所示:
[0056]
[0057] 应用Roberts算子对于重建帧k-1'、k+1'及k帧分别提取边缘的结果为:fk-1'(x,y)、fk+1′(x,y)及fk(x,y)。
[0058] 对重建帧k-1'与k帧的边缘,重建帧k+1'与k帧的边缘进行图像差分运算,求得帧差d1与d2,其中:
[0059] 帧差d1=|fk-1'(x,y)-fk(x,y)|,帧差d2=|fk+1'(x,y)-fk(x,y)|
[0060] (ii)采用最大方差阈值进行二值化
[0061] 最大方差阈值是一种自适应的阈值确定方法,它以最佳限将图像的直方图分成两组,当两组间的方差为最大时,决定阈值。所以本部分采用这种方法来实现边缘图像差分结果的二值化。
[0062] 设一幅图像的灰度值为0~m-1级,灰度值i的像素数为ni,则总的像素点数:各值的概率为:
[0063] 设最佳阈值为T,用阈值T将像素分成两组:C0={0~T-1}和C1={T~m-1},C0和C1产生的概率及平均值由以下公式得出:
[0064] C0产生的概率
[0065] C1产生的概率
[0066] C0的平均值
[0067] C1的平均值
[0068] 其中:
[0069] 则全部采样的灰度平均值为:μ=w0μ0+w1μ1两组间的方差:
[0070]
[0071] 在1~m-1之间求上式为最大值时的T,即为最佳阈值。
[0072] 根据所得到的最佳阈值T对边缘检测结果进行二值化。
[0073] 本发明与现有技术相比所具有的优点在于:本方法通过在块匹配方法前进行宏块的预先判断能够有效减少块匹配的时间,通过将连续三帧视频序列通过运动估计、运动补偿进行背景对齐及后续对三帧图像的处理,能够准确的将动背景下的视频对象分割出来。附图说明:
[0074] 图1为本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法流程图
[0075] 图2为本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法中六边形网格整像素搜索路线示意图;
[0076] 图3为本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法中运动矢量中值预测示意图;
[0077] 图4为本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法中上层块模式运动矢量预测示意图;
[0078] 图5为本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法中前帧对应块运动矢量预测示意图;
[0079] 图6为本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法中邻近参考帧运动矢量预测示意图;
[0080] 图7为本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法中Coastguard视频序列的第139帧采用本发明方法补偿后的视频对象提取结果;其中(a)表示Coastguard视频序列的第138帧;(b)表示Coastguard视频序列的第139帧;(c)表示Coastguard视频序列的第140帧;(d)表示Coastguard视频序列的第138帧预处理的结果;(e)表示Coastguard视频序列的第139帧预处理的结果;(f)表示Coastguard视频序列的第140帧预处理的结果;(g)表示Coastguard视频序列的第138帧的重建帧经过Roberts边缘检测的处理结果;(h)表示Coastguard视频序列的第
139帧经过Roberts边缘检测的处理结果;(i)表示Coastguard视频序列的第140帧的重建帧经过Roberts边缘检测的处理结果;(j)表示Coastguard视频序列的第139帧采用本发明方法经过运动估计、补偿的三帧背景对齐方法后提取的二值视频对象平面;(k)表示Coastguard视频序列的第139帧采用本发明方法经过运动估计、补偿的三帧背景对齐方法后提取的视频对象平面;
具体实施方式:
[0081] 下面结合附图及具体实施方式进一步详细介绍本发明。
[0082] 本发明一种基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频对象提取方法,包括以下步骤(如图1所示):
[0083] 步骤1.灰度变换及形态学预处理。
[0084] 首先将YUV格式的视频序列做灰度变换,由于Y分量包含灰度信息,因此将Y分量从视频序列中提取出来。由于视频中不可避免的会出现噪声的干扰,因此对每帧图像进行形态学开闭重建,消除噪声,平滑掉一些细小的边缘以简化图像。预处理的结果可参见图7(d)(e)(f)。
[0085] 步骤2.将参考帧K帧,K-1帧,K+1帧分成8×8宏块,根据纹理信息对K-1帧、K+1帧中所有宏块进行预判断、筛选。
[0086] 由于在下述步骤中应用最小二乘法计算全局运动参数的时候,很多误差大的宏块被直接删除,如果能够在最小二乘法运算之前将误差大的宏块剔除,将显著的提高运算速度,并降低运算量。而决定宏块误差大小、影响计算准确性的重要因素便是宏块的纹理信息,也就是梯度信息。本部分提出的宏块预判断及筛选的方法正是从宏块的梯度信息出发,根据设定的阈值对于宏块进行筛选抑或保留,当宏块的信息量小于该阈值时,对该宏块进行筛选,不作为下述步骤中参与块匹配的宏块;当信息量大于该阈值时,则对宏块进行保留,作为有效特征块参与进行下述的运动估计等运算。
[0087] 其主要步骤如下:
[0088] 第一步:将每一帧分成8×8子块,经试验证明,若采用分成16×16子块的形式则计算量过大,若分成4×4子块则块匹配等方法不够精确,故采用8×8子块的形式;
[0089] 第二步:采用Sobel算子得到每一帧的梯度图,将梯度信息作为宏块剔除的判断依据;
[0090]
[0091] 其中 表示该点的梯度信息,Gx、Gy分别表示偏导数。
[0092] 第三步:计算每一个宏块的梯度量;以8×8子块为例,其梯度信息量为:
[0093]
[0094] 第四步:确定宏块预断的阈值,一般保留所有宏块的40%,根据这个确定的值,对所有宏块的梯度量进行排序,确定保留40%下宏块筛选的最佳阈值T;
[0095] 第五步:完成对于宏块的筛选,若其梯度信息量>T,则对宏块进行保留,作为有效特征块参与进行下述的运动估计等运算;若其梯度信息量
[0096] 步骤3.对上述筛选后的宏块采用SAD准则、六边形网格整像素搜索策略进行块匹配,以K-1帧作为当前帧、K帧作为参考帧,得到K-1帧相对于K帧的运动矢量场;以K+1帧作为当前帧、K帧作为参考帧,得到K+1帧相对于K帧的运动矢量场,并通过最小二乘法计算全局运动参数,获得摄像机六参数模型。
[0097] 目前常用的块匹配准则有:平均绝对误差MAD(Mean Absolute Difference)、最小均方误差MSE(Mean Square Error)、最小绝对差SAD(Sum of Absolute)。
[0098] 本部分采用SAD块匹配准则,该准则不仅能够找到最佳匹配点,并且计算量小、耗时短。
[0099]
[0100] 其中(i,j)为位移量,fk和fk-1分别为当前帧和上一帧的灰度值,M×N为宏块的大小,若在某一点处SAD(i,j)达到最小,则该点为要找的最优匹配点。
[0101] 六边形网格整像素搜索策略的基本思想是采用多种模板进行宏块匹配,同时利用时空相关性进行运动矢量场的预测,搜索时针对不同的运动类型采用了大范围粗搜索混合模板、细搜索六边形模板和精细搜索菱形模板完成搜索。
[0102] 方法示意图如图2所示,各步骤如下:
[0103] 第一步:起始点预测。使用如下5种预测模式预测运动矢量MV,分别是:
[0104] 1.中值预测:利用空间相关性,令当前子块的左、上、右邻块的运动矢量的中间值为预测运动矢量(如图3所示);
[0105] 2.原点预测:令运动矢量为(0,0);
[0106] 3.Uplayer预测:利用H.264运动估计可变宏块划分的特点,从模式1(16×16)到模式7(4×4)的分级搜索顺序,取已求出的同位置上一级、大一倍块的运动矢量(如图4所示);
[0107] 4.对应块预测:利用时间相关性,取前一帧同位置块的运动矢量作为预测结果(如图5所示);
[0108] 5.相邻参考帧预测:利用时间相关性,令前一参考帧中对应位置块的MV按比例进行预测(如图6所示)。
[0109] 第二步:对以上MV所指向的点使用非对称十字模板搜索,获得当前的最佳预测起点。随后根据不同起始点的率失真结果使用阈值进行判断,分为非满意区域、满意区域和很满意区域,分别转入第三步,第四步和第五步。
[0110] 第三步:对于不满意的块使用如下方式进行搜索。
[0111] 6.以目前最优点为中心,在(-2,2)的方形区域中进行逐点搜索;获得当前最优点,判断此处是否属于满意或很满意区,跳到相应的第四步或第五步;或继续搜索;
[0112] 7.用不断扩大一倍直径的大六边形模板进行搜索,直至搜索到能符合相应阈值而进入第四步或第五步的搜索点为止;或者搜索模板完全超出搜索窗范围,也结束第三步的搜索。
[0113] 第四步:以目前最优点为中心,使用六边形模板进行搜索,直至最优点位于六边形中心为止。
[0114] 第五步:对很满意区域的子块进行搜索。以目前最优点为中心,使用菱形模板进行搜索,直至最优点在菱形模板中心为止。
[0115] 分别将K-1帧、K+1帧中筛选后的宏块和参考帧K按照上述SAD准则及基于六边形网格整像素搜索策略进行块匹配,获得当前帧K-1相对于参考帧K的运动矢量场,以及当前帧K+1相对于参考帧K的运动矢量场。
[0116] 步骤4.根据最小二乘法求摄像机运动参数。
[0117] 选取步骤2中获取到的当前帧K-1及当前帧K+1中两侧子块作为特征块,将经过块匹配、运动估计获得的运动矢量代入摄像机六参数模型(如下式)后,采用最小二乘法估计参数m0、m1、m2、n0、n1、n2。6参数仿射变换模型:可以对平移、旋转、缩放运动进行建模,其定义如下:
[0118]
[0119] 其中m0和n0分别表示像素点在x和y方向的平移幅度,m1、n1、m2、n2四个参数描述了缩放和旋转转动。
[0120] 步骤5.通过运动补偿分别获得当前帧K-1、K+1的重建帧K-1'、K+1'。
[0121] 对于当前帧k-1帧、k+1帧中的每一个点根据上述获取的摄像机模型,计算其分别在参考帧K中的对应位置并对其进行赋值,从而实现对于K-1帧、k+1帧的全局运动补偿,使补偿后的重建帧k-1'、k+1'与参考帧k的背景对齐,从而实现下述结合边缘信息、自适应阈值的基于六边形网格整像素运动估计及三帧背景对齐的动背景下视频分割方法。
[0122] 步骤6.采用Roberts算子提取边缘信息,分别与参考帧K边缘进行差分,并采用最大方差阈值进行二值化。
[0123] (i)Roberts算子提取边缘信息,并与参考帧K边缘进行差分
[0124] 边缘检测算子种类很多,这里选择Roberts边缘检测算子对于重建帧k-1'、k+1'及k帧进行边缘特征提取。
[0125] 令f(x,y)为输入图像,g(x,y)为输出图像,则Roberts边缘梯度可以由下式求出:
[0126]
[0127] 写成模板形式如下所示:
[0128]
[0129] 应用Roberts算子对于重建帧k-1'、k+1'及k帧分别提取边缘的结果为:fk-1′(x,y)、fk+1′(x,y)及fk(x,y)。结果可参见图7(g)(h)(i)。
[0130] 对重建帧k-1'与k帧的边缘,重建帧k+1'与k帧的边缘进行图像差分运算,求得帧差d1与d2,其中:
[0131] 帧差d1=|fk-1'(x,y)-fk(x,y)|,帧差d2=|fk+1'(x,y)-fk(x,y)|
[0132] 最大方差阈值是一种自适应的阈值确定方法,它以最佳门限将图像的直方图分成两组,当两组间的方差为最大时,决定阈值。所以本部分采用这种方法来实现边缘图像差分结果的二值化。
[0133] 设一幅图像的灰度值为0~m-1级,灰度值i的像素数为ni,则总的像素点数:
[0134]
[0135] 各值的概率为:
[0136] 设最佳阈值为T,用阈值T将像素分成两组:C0={0~T-1}和C1={T~m-1},C0和C1产生的概率及平均值由以下公式得出:
[0137] C0产生的概率
[0138] C1产生的概率
[0139] C0的平均值
[0140] C1的平均值
[0141] 其中:
[0142] 则全部采样的灰度平均值为:μ=w0μ0+w1μ1两组间的方差:
[0143]
[0144] 在1~m-1之间求上式为最大值时的T,即为最佳阈值。
[0145] 根据所得到的最佳阈值T对帧差d1,帧差d2分别进行二值化,二值化的结果分别为OtusBuf1及OtusBuf2。
[0146] 步骤7.与运算及后处理。
[0147] 对上述二值化的结果进行与运算,与运算的结果如下:
[0148]
[0149] 其中:DifferBuf(i)表示与运算的结果,OtusBuf1(i)与OtusBuf2(i)表示对帧差d1、d2分别进行二值化的结果。
[0150] 由于视频序列中不可避免的会有噪声的干扰,因此在与运算后还要进行一些后处理工作,以去除孤立的小区域、小间隙,后处理的结果见图7(j)。为此,本部分首先采用中值滤波的方法去掉一些干扰的噪声,再采用图像形态学方法,主要包括腐蚀及膨胀运算,不但可以去除噪声并且可以起到平滑图像的作用。腐蚀运算主要消除边界点,使边界向内部收缩,而膨胀运算则将与物体接触的所有背景点合并到该物体中,使边界向外扩张。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈