本发明的目的是为了克服上述技术
缺陷,为了提高视频运动对象的分割速度,提高 分割的准确度,克服基于运动估计的区域分类易受不规则运动和光照的影响,从而提 供一种视频运动对象分割方法。
为了解决上述技术问题,本发明提供一种视频运动对象分割方法,包括以下步 骤:
a)对相邻的
视频帧进行全局运动估计和补偿;
b)对相邻帧的帧差进行二值化;
c)计算运动对象多帧间的连续差分获得准确的初始区域;
d)初始区域内的彩色梯度计算,得出彩色梯度信息,彩色梯度是在YCbCr颜色空 间计算的,通过对标准化后的Y、Cb、Cr的梯度求取加权最大获得;
e)根据彩色梯度信息,在初始区域上进行快速分
水岭分割,按照相邻区域的相似 度合并小区域以消除图像的过度分割;
f)根据区域的空间、时序和邻域相似度,对区域的分类分别加以空间约束、时序 约束和邻域约束,并使用MRF模型将这三类约束结合,通过求解MRF的最大后验概率, 即后验
能量函数的最小,将各区域分类为前景或背景,从而获得准确的区域分类;
g)将所有的前景区域合并,分割出运动对象。
在上述方案中,所述后验能量为空间约束能量、时序约束能量和邻域约束能量之和。
在上述方案中,所述后验能量函数表示后验能量为空间约束能量、时序约束能量和 邻域约束能量的加权和。
在上述方案中,所述空间约束是根据割域与周围背景的相似度,判断割域为背景的 可能性,空间相似度比
阈值越大,割域为背景的可能性越高。
在上述方案中,所述时序约束是根据割域与前一帧分割结果的相似度,判断割域为 背景的可能性,时序相似度比阈值越大,割域为前景的可能性越大。
在上述方案中,所述邻域约束是根据相邻割域的相似度,判断割域的分类。
在上述方案中,所述相邻割域越相似,它们的分类就越可能相同。
由上可知,为了提高分割速度,本发明在对图像进行空间分割之前,先进行时序 分割,将包含运动对象的初始区域和背景分离,随后的空间分割以及对区域的分类、合 并都仅在初始区域上进行,从而大大减少了计算开销;为了克服基于运动估计的区域分 类的缺点,本发明根据区域与背景、前一帧分割结果及其相邻区域的相似度在MRF模型 中分别加入空间、时序和邻域约束,通过求解MRF的最大后验概率获得准确的区域分类, 最终准确地分割出运动对象。
附图说明
图1是本发明一种视频运动对象分割方法的
流程图。
本发明首先对图像进行时序分割,它在完成全局运动估计和补偿、帧差二值化后, 通过计算多帧间的连续差分准确地将包含运动对象的初始区域和背景分离;接着,用基 于彩色梯度的分水岭算法将初始区域分割成若干空间属性一致的区域;最后对区域进行 分类和合并,它通过求解结合空间、时序和邻域约束的MRF的最大后验概率对区域进行 分类和合并实现准确的对象分割。
下面结合附图详细说明本发明的技术方案。
如图1所示的视频运动对象分割方法,包括以下步骤:
步骤100,对相邻的视频帧进行全局运动估计和补偿;在步骤100中,若背景 存在运动(主要是由摄像机的平移、旋转和缩放等运动造成),则必须在求取帧差 前进行全局运动估计和补偿,以消除背景运动对帧差的影响。全局运动可用6参数 仿射变换模型表示:
设(x,y)为某
像素点在当前帧中的
位置,(x′,y′)为该点在相邻帧中的位置, (a,b,e,c,d,f)为全局运动参数。全局运动估计可用Gauss-Newton(GN)方法
迭代求 解。为提高效率,GN方法在三层金字塔上计算, 金字塔用[1/4,1/2,1/4]
滤波器 产生。完成全局运动估计后,通过全局
运动补偿就可将运动背景问题转化为静止背 景问题。
步骤110,对相邻帧的帧差进行二值化;在步骤110中,用dt,t′表示相邻两帧It 和It′的帧差,dt,t′(p)=W×It(p)-W×It′(p′),W为平滑滤波的窗口函数。二值差分模 板Dt,t′为:
其中阈值T的选取与摄像机噪声的大小相关,可根据具体的视频应用场合在 5~10之间选取。
求得Dt,t′后,对其进行连通成份分析,消除由摄像机噪声造成的小面积、孤立 噪声区域,并填充前景区域中的空缺。然后,用闭操作和开操作平滑前景区域的边 缘。
步骤120,计算运动对象多帧间的连续差分获得准确的初始区域;在步骤120 中,在Dt,t′中通常会包含一部分背景。为了获得更为精确的初始区域,我们用当前 帧It的前一帧It-1和后一帧It+1计算连续差分:令Dt,t-1,Dt,t+1分别为It和It-1、It和It+1 的二值化差分模板,求Dt,t-1和Dt,t+1的交集获得细化的初始区域模板Dt:
Dt=Dt,t-1IDt,t+1
通过连续差分我们可以获得更为精确的初始区域IFt和当前背景IBt,在IFt中 只留下了很少的背景区域。
上述步骤100、步骤110和步骤120完成了对运动对象的时序分割,获得了运 动对象准确的初始区域,从而使得包含运动对象的初始区域与背景分离。
步骤130,初始区域内的彩色梯度计算;在步骤130中,计算初始区域IFt在 YCbCr颜色空间的彩色梯度,Y是指灰度,Cb、Cr是指两个
色度,用Canny算子计 算图像在Y、Cb和Cr分量上的梯度图GY、GCb和GCr,由于这三个梯度图的取值范 围并不一致,先将它们标准化至[0,255]区间得到GY′、GCb′和GCr′,再计算彩色梯度 Gcol:
其中,ωY,ωCb,ωCr分别为三个分量的权值。求得Gcol后,可使用Fast Immersion Simulation方法实现快速
分水岭分割,然后按照相邻区域的相似度合并小区域以消 除图像的过度分割。
步骤140,在初始区域上进行快速分水岭分割, 按照相邻区域的相似度合并小 区域以消除图像的过度分割。
在步骤140中,求得Gcol后,可使用Fast Immersion Simulation(快速浸入 模拟法)方法实现快速分水岭分割。
通过对初始区域进行基于彩色梯度的分水岭分割,可将初始区域分割成了若干 空间属性一致的区域,同时也大大减少了后继分类处理中所需计算的区域数量。为 了表述方便,用
表示空间分割所获得的区域集合,Ni为Rt i内的像素 数,Nor(Rt i)为Rt i的邻居集合。E为所有的邻接关系集合,即
且i≠j}。对象初始区域
当前背景IBt=It-IFt。用IOt-1 表示从前一帧It-1中分割出的运动对象,即
L(Rt-1 i)表示区域Rt-1 i的 分类(
F为前景,B为背景)。
上述步骤130和步骤140完成了运动对象初始区域上的空间分割,产生了不同 的运动对象区域分类。
步骤150,根据区域的空间、时序和邻域相似度,即区域与背景、前一帧分割 结果及其相邻区域的相似度,对区域的分类分别加以空间约束、时序约束和邻域约 束,并使用MRF模型将这三类约束结合,通过求解MRF的最大后验概率(即后验能 量函数的最小)将各区域分类为前景或背景,从而获得准确的区域分类。后验概率 是指各个区域设定为不同的分类时,MRF有不同的后验概率。而与MRF的最大后验 概率相对应的各区域的分类才是最终的解。若所有的区域本身都是背景,而对他们 的分类也都是背景时,MRF的后验概率为1,若对他们的分类都是前景时,MRF的 后验概率为0;若所有的区域本身都是前景,而对他们的分类也都是前景时,MRF 的后验概率为1,若对他们的分类都是背景时,MRF的后验概率为0。
在步骤150中,后验能量为空间约束能量、时序约束能量和邻域约束能量之和。
在本发明中,对空间约束、时序约束和邻域约束定义如下:
A.空间约束:根据割域与周围背景的相似度SD(Rt i), 判断割域是为背景的可 能性。
且
B.时序约束:根据割域与前一帧分割结果的相似度TD(Rt i),判断割域是为背 景的可能性。
C.邻域约束:根据相邻割域的相似度RD(Rt i,Rt j),判断割域的分类。若相邻割 域越相似,它们的分类就越有可能相同。
令X={X1,L XK}为一组离散随机变量,Xt表示区域Rt i的分类的随机变量,即 Xt∈{F,B}。O={O1,L,OK}为各个区域的观察集合。根据Hammersley-Cliffod理 论]和Bayes规则,可将复杂的MRF最大后验概率(MAP)转化为简单的后验能量最 小问题:
其中,P(X|O)为MRF的后验概率,Up(X|O)为后验能量。 使得P(X|O)最 大,它是所要求取的各个区域的分类。后验能量的最小化可使用HCF(High Confidence First)算法快速求解。
定义MRF的后验能量函数Up(X|O):
其中,Vi S(X,O)、Vi T(X,O)、Vij R(X,O)分别为表示空间约束、时序约束和邻域 约束的能量函数,α、β、γ分别表示空间约束能量、时序约束能量和邻域约束能 量的权重。
A.空间约束能量Vi S(X,O)
其中,
SD(Rt i)为Rt i与IBt匹配的空间相似 度:
且
It 1(p),It 2(p),It 3(p)分别为Y、Cb和Cr分量在位置p上的值,ω1,ω2,ω3分别为三 个分量的权值,v为Rt i的匹
配向量,可在w×w的匹配窗口内取值,Nb为与Rt i匹配 的
背景像素的数量。函数f(d,T,dh,dl)为分段量化函数,它将d量化至[0,1]区间:
Vi S(X,O)根据区域Rt i的空间相似度与阈值Ts的大小关系描述它为背景或前景的 可能性。由于IFt中只有一小部分区域不属于运动对象,并且它们与周围IBt中的 区域很相似,因此可以根据区域与背景的相似度,计算它为背景的可能性,这样不 仅克服了基于运动估计的区域分类易受不规则运动和光照影响的缺陷,同时也解决 了
覆盖背景和显露背景的分类问题。空间相似度比Ts越大,它为背景的可能性就越 高。
B.时序约束能量Vl T(X,O)
其中,
TD(Rt i)为Rt i与IOt-1的匹配的时序相 似度:
Vi T(X,O)根据区域Rt i的时序相似度和阈值Tt的大小关系描述它归类为背景或前 景的可能性,时序相似度比Tt越大,它为前景的可能性就越高,区域Rt i与前一帧已 分割出的对象IOt-1越相似,就越有可能被归类为前景。通过引入时序约束能量,我 们可以防止将与背景相似的前景区域错误分类。
C.邻域约束能量Vij R(X,O):
其中,
RD(Rt i,Rt j)为邻域相似度:
Vij R(X,O)表示若相邻割域Rt l和Rt j越相似,它们的分类就越有可能相同。
计算各割域在各种不同分类(即前景或背景)下的总体后验能量,取最小后验能量 所对应的各割域的分类为最后的解。这种方法计算复杂度很大。可使用HCF算法求得 后验能量函数Up(X|O)的最小,从而获得使MRF的后验概率最大的各个区域的分 类。HCF(High Confidence First)-高可信度优先算法是一种确定性迭代算法,它可在 近线性的计算复杂度下求解Up(X|O)的最小,它是由P.B.Chou等在文献“The theory and practice of Bayesian image labeling”中提出的。
步骤160,将所有的前景区域合并,分割出运动对象。