首页 / 专利库 / 人工智能 / 三维形变模型 / 基于运动预测和三维约束的序列图像分割方法

基于运动预测和三维约束的序列图像分割方法

阅读:729发布:2021-02-11

专利汇可以提供基于运动预测和三维约束的序列图像分割方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于运动预测和偏三维约束并结合主动轮廓模型的 图像序列 分割方法,属于 图像处理 技术领域。以主动轮廓模型上的控制点作为 预测模型 形变的着手点,把物体变化的平滑性和一致性,表示为控制点 位置 变化的一致性,以控制点的变化趋势,预测在序列中下一 帧 图像中相应控制点的位置,然后以预测位置作为匹配的初始搜索位置采用MPEG-4所使用的是菱形搜索 算法 。本发明引入了偏三维约束的概念,作为主动轮廓模型的 能量 之一。这样又尽量避免了错误匹配造成的影响。达到了在简单、计算量小的条件下的较好的预测效果。,下面是基于运动预测和三维约束的序列图像分割方法专利的具体信息内容。

1.一种基于运动预测和三维约束的序列图像分割方法,其特征在于该方法包括 如下步骤:
1)对数字图像初始化;
11)在第一数字图像轮廓线转向的地方,交互式设置手动控制点,相邻的 两个手动控制点之间均等生成控制点的初始位置
12)对第一帧数字图像进行迭代收敛,收敛到第一帧数字图像中物体轮廓的 边沿;
13)对第一帧数字图像不进行控制点位置预测计算,以第一帧数字图像主动 轮廓模型的收敛位置作为控制点的预测位置,
按合公式Esnake=Eint+Eimage+Econstrain计算出的合力为零来作为图 像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制点的运动, Eint为内部能量,Eimage为外部能量;
14)匹配初始搜索点的选择,以预测的下一帧的控制点的位置作为初始 搜索点,和直接采用参考图像对应位置相比,2个图像块比较,相应的像素点两 两求差的绝对值,它们的平均值是最小绝对差匹配准则所求的值,公式中的M,N 是图像块的长和宽,fk(m,n)是指在k帧数字图像中(m,n)处像素点的像素值,
MAD ( Δp , Δq ) = ( 1 / MN ) Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f k - 1 ( m + Δp , n + Δq ) |
其中Δp,Δq为偏移量,fk为当前帧图像的灰度值,fk-1为上一帧图像的 灰度值,图像块大小为M和N的乘积值,MAD(Δp,Δq)为最小值是最优匹配点,
采用9个检测点的大模板和5个检测点的小模板,对匹配得到的平均绝对差 设定限值,当最终搜索到最优匹配点小于门限值时,把匹配到的点作为控制点 的初始位置;反之,直接把预测位置作为控制点的初始位置;
2)循环:
21)设置数字图像帧层数记数器,用于判断是否超过最底数字图像帧层,若 数字图像帧层数没有超过最底数字图像帧层则执行步骤22),否则结束循环;
22)以前两层收敛的控制点的坐标预测下一层的控制点的位置:
预测下一帧数字图像的控制点位置,xi,j表示第j帧数字图像中的第i个控制 点的位置,控制点位置的变化用Vi,j表示为:Vi,j=xi,j-xi,j-1,得到预测的 j+1帧数字图像中的相应控制点的位置: x ~ i , j + 1 = x i , j + k 1 × V i , j , k1为预测系数,当 k1为0时,直接用上一帧数字图像的分割结果作为初始值;
23)以步骤22)中所预测控制点的位置为起点作为初始搜索点,和直接采 用参考图像对应位置相比,2个图像块比较,相应的像素点两两求差的绝对值, 它们的平均值是最小绝对差匹配准则所求的值,公式中的M,N是图像块的长和 宽,fk(m,n)是指在k帧数字图像中(m,n)处像素点的像素值,
MAD ( Δp , Δq ) = ( 1 / MN ) Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f k - 1 ( m + Δp , n + Δq ) |
其中Δp,Δq为偏移量,fk为当前帧图像的灰度值,fk-1为上一帧图像 的灰度值,图像块大小为M和N的乘积值,MAD(Δp,Δq)为最小值是最优匹配点,
采用9个检测点的大模板和5个检测点的小模板,对匹配得到的平均绝对差 设定门限值,当最终搜索到最优匹配点小于门限值时,把匹配到的点作为控制点 的初始位置;反之,直接把预测位置作为控制点的初始位置;
24)对数字图像采用偏三维约束迭代收敛;
25)数字图像帧层数记数器进行帧层数累加;
26)判断步骤25)中的数字图像帧层数是否超过最底数字图像帧层,若数字 图像帧层数没有超过最底数字图像帧层则执行步骤22),否则结束循环。
2.如权利要求1所述的基于运动预测和三维约束的序列图像分割方法,其 特征在于该方法步骤12)包括如下步骤:
121)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距,
122)由蛇的控制点的初始位置出发,以梯度矢量流场替代原图像计算梯度 值并作为外力,
123)计算第一层内能公式为Eint=(xi+1,j+xi-1,j-2xi,j),xi,j表示第j幅图 像中的第i个控制点的位置,Eint为内部能量,
124)计算合力公式Esnake=Eint+Eimage+Econstrain,计算出的合力为零 来作为图像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制 点的运动,Eint为内部能量,Eimage为外部能量,
125)根据公式 x i , j = x i , j + E snake i , j 计算出来的合力移动控制点,xi,j表示第j幅图 像中的第i个控制点的位置,Esnake i,j表示第j幅图像中的第i个控制点的位置的能 量函数,
126)对图像收敛的处理过程:
利用公式:
avd=sum(abs(Esnake))/length(Esnake)来判断图像收敛条件,sum(abs(Esnake))表示 为所有控制点合力的绝对值之和,length(Esnake)为控制点的个数,avd为合力的平 均值,
如果合力的平均值小于0.08时再收敛15次,目的是在合力较小的情况下进 一步接近轮廓,
当avd<0.08后且又迭代15次时,迭代结束,得到最终收敛结果,
否则,回到步骤121),迭代继续进行;
3.如权利要求1所述的基于运动预测和三维约束的序列图像分割方法,其 特征在于该方法步骤24)包括如下步骤:
241)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距,
242)由步骤22)中所预测控制点的位置出发,以梯度矢量流场替代原图 像计算梯度值并作为外力,
243)计算偏三维约束的内力公式为
Eint′=k1(xi+1,j+xi-1,j-2xi,j)+(1-k1)(xi,j+1+k1(xi,j+1-xi,j+2)-xi,j), xi,j表示第j幅图像中的第i个控制点的位置,Eint′为偏三维约束内部能量,k1 为预测系数,
244)合力公式为Esnake=Eint+Eimage+Econstrain,计算出的合力为零来 作为图像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制点 的运动,Eint内部能量和Eimage外部能量;
245)合力移动控制点, x i , j = x i , j + E snake i , j , xi,j表示第j幅图像中的第i个控制 点的位置,Esnake i,j表示第j幅图像中的第i个控制点的位置的能量函数,
246)判断是否到达收敛,
利用公式:
avd=sum(abs(Esnake))/length(Esnake)作为判断图像收敛条件,sum(abs(Esnake))表 示为所有控制点合力的绝对值之和,length(Esnake)为控制点的个数,avd为合力的 平均值,
如果合力的平均值小于0.08时再收敛15次,目的是在合力较小的情况下进 一步接近轮廓,
当avd<0.08后且又迭代15次时,迭代结束,得到最终收敛结果,
否则,回到步骤241),迭代继续进行;
4.如权利要求1所述的基于运动预测和三维约束的序列图像分割方法,其 特征在于该方法步骤14)和步骤23)中的门限值为10到20之间。
5.如权利要求2所述的基于运动预测和三维约束的序列图像分割方法,其 特征在于该方法步骤121)中的两个控制点的间距保持在3个像素到7个像素之 间。
6.如权利要求3所述的基于运动预测和三维约束的序列图像分割方法,其 特征在于该方法步骤241)中的两个控制点的间距保持在3个像素到7个像素之 间,步骤243)中的k1的预测系数取值为0到1之间。

说明书全文

技术领域

发明属于图像处理技术领域,具体涉及一种基于运动预测和偏三维约束, 并结合主动轮廓模型的图像序列分割方法。

背景技术

三维图像分割是图像处理和计算机视觉中的一个重要研究领域,广泛应用于 计算机辅助三维重建、运动物体跟踪以及医学中细胞运动和形变的分析等应用领 域。三维图像或图像序列与一般图像的不同之处在于:序列图像是针对同一目标, 切片是由间隔相同的距离或时间连续采样而得到的,因此对三维图像的分割既与 一般的图像分割有相同之处,又有特殊之处。
传统的主动轮廓模型都要求模型初始化在目标轮廓的附近,否则将可能收敛 到错误的结果。而在三维图像分割中对每一幅切片图进行手工初始化是一种费时 而繁琐的工作,需要找到一种自动化的三维分割方法。
现有的基于主动轮廓模型的分割方法主要有:
1、预测法,预测法简单易行,利用物体的轮廓一般都是平滑变化这一常识, 用前面数个轮廓的位置,对初始位置的设置进行改进,在自动分割中,如何更精 确的自动设定主动轮廓的初始位置非常重要,初始位置距离实际边缘越接近,收 敛到正确位置的可能性就越大。这种方法有一定效果,但没有利用图像本身的信 息,有进一步改进的空间。
2、光流法,光流法利用光流场的方法迭代获得图像中物体运动的趋势,这 种趋势以一个新的外的形式影响收敛的结果,有较好的效果。但缺点是方法复 杂,运算量比较大。而且没有改善初始化位置,迭代次数也会比较多,会增加收 敛的时间。
3、三维形变模型法,常规的三维形变模型法是把物体整体建立三维轮廓模 型,虽然利用了相邻图像相关性信息但是模型复杂,计算量大,初始位置设置困 难。如果能在二维轮廓模型中引入三维约束,则可以在二维模型的优点中加入三 维模型的三维平滑的特点,更符合物体的实际特性。

发明内容

技术问题:本发明基于三维图像序列的相似性,采用在视频压缩中常见的运 动估计方法,并与偏三维约束相结合,提出了一种新的适用于三维图像分割的方 法。基于三维图像具有三维平滑、连续变化等特性,本发明提出了一种新的图像 序列分割方法。该方法在计算过程中只需手动设置第一幅图中主动形变模型的关 键点位置。在其他图像中,首先采用预测和视频运动估计中常用的匹配法优化, 在MPEG-4和H.26x中采用的都是这种块匹配法,然后采用偏三维约束和梯度矢 量流(GVF),从初始化位置开始在图像中进一步迭代收敛得到每幅图像中的最 终轮廓位置,在一般的二维平滑基础上,达到三维平滑,三维分割的作用。本发 明方法可以显著提高分割的准确性以及速度。
技术方案:本发明公开了一种基于运动预测和三维约束的序列图像分割方 法,该方法包括如下步骤:
1)对数字图像初始化:
11)在第一数字图像轮廓线转向的地方,交互式设置手动控制点,相邻的 两个手动控制点之间均等生成控制点的初始位置;
12)迭代收敛,收敛到第一幅图像中物体轮廓的边沿,其过程如下:
121)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距,
122)由蛇的控制点的初始位置出发,以梯度矢量流场替代原图像计算梯度 值并作为外力,
123)计算第一层内能公式为Eint=(xi+1,j+xi-1,j-2xi,j),xi,j表示第j幅图 像中的第i个控制点的位置,Eint为内部能量
124)计算合力公式Esnake=Eint+Eimage+Econstrain,计算出的合力为零 来作为图像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制 点的运动,Eint为内部能量,Eimage为外部能量,
125)根据公式 x i , j = x i , j + E snake i , j 计算出来的合力移动控制点,xi,j表示第j幅图 像中的第i个控制点的位置,Esnake i,j表示第j幅图像中的第i个控制点的位置的能 量函数,
126)对图像收敛的处理过程:
利用公式:
avd=sum(abs(Esnake))/length(Esnake)来判断图像收敛条件,sum(abs(Esnake))表示 为所有控制点合力的绝对值之和,length(Esnake)为控制点的个数,avd为合力的平 均值,
如果合力的平均值小于0.08时再收敛15次,目的是在合力较小的情况下进 一步接近轮廓,
当avd<0.08后且又迭代15次时,迭代结束,得到最终收敛结果,
否则,回到步骤121),迭代继续进行;
13)对第一帧数字图像不进行控制点位置预测计算,以第一帧数字图像主动 轮廓模型的收敛位置作为控制点的预测位置,
按合力公式Esnake=Eint+Eimage+Econstrain计算出的合力为零来作为图 像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制点的运动, Eint为内部能量,Eimage为外部能量;
14)块匹配初始搜索点的选择,以预测的下一帧的控制点的位置作为初始 搜索点,和直接采用参考图像对应位置相比,2个图像块比较,相应的像素点两 两求差的绝对值,它们的平均值是最小绝对差匹配准则所求的值,公式中的M,N 是图像块的长和宽,fk(m,n)是指在k帧数字图像中(m,n)处像素点的像素值,
MAD ( Δp , Δq ) = ( 1 / MN ) Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f k - 1 ( m + Δp , n + Δq ) |
其中(Δp,Δq)为位移矢量,fk为当前帧图像的灰度值,fk-1为上一帧图 像的灰度值,图像块大小为M*N,MAD(Δp,Δq)为最小值是最优匹配点,
搜索策略为菱形搜索算法,采用9个检测点的大模板和5个检测点的小模板, 对匹配得到的平均绝对差设定限值,当最终搜索到最优匹配点小于门限值时, 把匹配到的点作为控制点的初始位置;反之,直接把预测位置作为控制点的初始 位置;
2)循环:
21)设置数字图像帧层数记数器,用于判断是否超过最底数字图像帧层,若 数字图像帧层数没有超过最底数字图像帧层则执行步骤22),否则结束循环;
22)以前两层收敛的控制点的坐标预测下一层的控制点的位置
预测下一帧数字图像的控制点位置,xi,j表示第j帧数字图像中的第i个控制 点的位置,控制点位置的变化用Vi,j表示为:Vi,j=xi,j-xi,j-1,得到预测的 j+1帧数字图像中的相应控制点的位置: x ~ i , j + 1 = x i , j + k 1 × V i , j , k1为预测系数,当 k1为0时,直接用上一帧数字图像的分割结果作为初始值;
23)以步骤22)中所预测控制点的位置为起点作为初始搜索点,和直接采 用参考图像对应位置相比,2个图像块比较,相应的像素点两两求差的绝对值, 它们的平均值是最小绝对差匹配准则所求的值,公式中的M,N是图像块的长和 宽,fk(m,n)是指在k帧数字图像中(m,n)处像素点的像素值,
MAD ( Δp , Δq ) = ( 1 / MN ) Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f k - 1 ( m + Δp , n + Δq ) |
其中(Δp,Δq)为位移矢量,fk为当前帧图像的灰度值,fk-1为上一帧图 像的灰度值,图像块大小为M*N,MAD(Δp,Δq)为最小值是最优匹配点,
搜索策略为菱形搜索算法,采用9个检测点的大模板和5个检测点的小模板, 对匹配得到的平均绝对差设定门限值,当最终搜索到最优匹配点小于门限值时, 把匹配到的点作为控制点的初始位置;反之,直接把预测位置作为控制点的初始 位置;
24)偏三维约束的迭代收敛,过程如下:
241)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距,
242)由步骤22)中所预测控制点的位置出发,以梯度矢量流场替代原图像 计算梯度值并作为外力,
243)计算偏三维约束的内力公式为
Eint′=k(xi+1,j+xi-1,j-2xi,j)+(1-k)(xi,j+1+k1(xi,j+1-xi,j+2)-xi,j),
xi,j表示第j幅图像中的第i个控制点的位置,Eint为偏三维约束内部能量, k为预测系数,
244)合力公式为Esnake=Eint+Eimage+Econstrain,计算出的合力为零来 作为图像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制点 的运动,Eint内部能量和Eimage外部能量;
245)合力移动控制点, x i , j = x i , j + E snake i , j , xi,j表示第j幅图像中的第i个控制 点的位置,Esnake i,j表示第j幅图像中的第i个控制点的位置的能量函数,
246)判断是否到达收敛,
利用公式:
avd=sum(abs(Esnake))/length(Esnake)作为判断图像收敛条件,sum(abs(Esnake))表 示为所有控制点合力的绝对值之和,length(Esnake)为控制点的个数,avd为合力的 平均值,
如果合力的平均值小于0.08时再收敛15次,目的是在合力较小的情况下进 一步接近轮廓,
当avd<0.08后且又迭代15次时,迭代结束,得到最终收敛结果,
否则,回到步骤241),迭代继续进行;
25)数字图像帧层数记数器进行帧层数累加;
26)判断步骤25)中的数字图像帧层数是否超过最底数字图像帧层,若数字 图像帧层数没有超过最底数字图像帧层则执行步骤22),否则结束循环。
上述基于运动预测和三维约束的序列图像分割方法,该方法步骤14)和步 骤23)中的门限值为10到20之间,步骤121)和步骤241)中的两个控制点的 间距保持在3个像素到7个像素之间,步骤243)中的k1的预测系数取值为0 到1之间。
本发明首先采用预测与匹配相结合初始位置设置方法。以主动轮廓模型上的 控制点作为预测模型形变的着手点,避免了有的预测法中关于质心的概念。对质 心的应用中要求轮廓为比较饱满的形状,否则若质心太过接近于轮廓边缘,会使 判断的法线方向有较大的偏差,影响有效性。我们把物体变化的平滑性和一致性, 表示为控制点位置变化的一致性。
由于我们是以控制点构成的网格表示物体的轮廓,物体表现出来的平滑性和 一致性要体现在控制点网格上以控制点的变化趋势,预测在序列中下一帧图像中 相应控制点的位置,然后以预测位置作为匹配的初始搜索位置采用MPEG-4所 使用的是菱形搜索算法。对于匹配结果,由于控制点是位于物体的边缘部分,这 个区域图像灰度值变化大,有利于匹配到正确的结果。并进一步设定一个恰当门 限,图像变化以及噪声剧烈的,门限就要高一点,变化及噪声平稳的就小一点。 当最终搜索到最优匹配点的平均绝对差(MAD)小于门限时,就认为结果为正 确匹配点,把匹配到的点作为控制点的初始位置;反之则认为结果为错误的匹配 点,忽略匹配结果,直接把预测位置作为控制点的初始位置。这样又尽量避免了 错误匹配造成的影响。达到了在简单,计算量小的条件下的较好的效果。
在传统的主动轮廓模型基础上,本发明引入了偏三维约束的概念,作为主动 轮廓模型的能量之一。对于本发明的三维自动分割方法,是从第一层图像开始, 逐层向下。在任何时候,我们只知道上一层图像中的控制点的位置,而不知道下 一层图像中的控制点位置,所以并不能直接采用4点约束式的三维约束模型。这 个种情况下,本发明基于上层控制点和预测,提出了偏三维约束。
对于横向内能,目的是使轮廓在平方向上平滑,由同层相邻的两个控制点 决定,和三维模型没有区别。而纵向内能,由于本文序列分割的特性,是由二维 模拟三维,不能轻易得出,因为纵向相邻的2个控制点只知道一个。对此,本发 明采用预测的方法来进行模拟。由于物体的平滑性,物体在每层图像上投影的变 化具有连续性,即由上两层图像控制点预测得到的位置与上下两层控制点的中点 的位置在大多数情况下近似,并且同样能反映物体平滑的特性。
通过手动设置第一幅图中主动形变模型的关键点位置后,在其他图像中,采 用预测和块匹配法相结合的方法自动地设置后续图像的主动轮廓模型初始化位 置,并采用偏三维约束和梯度矢量流相结合的方法,从初始位置开始,自动化地 进一步迭代收敛得到每幅图像中的最终轮廓位置。
采用预测与匹配相结合初始位置设置方法。以主动轮廓模型上的控制点作为 预测模型形变的着手点,把物体变化的平滑性和一致性,表示为控制点位置变化 的一致性,以控制点的变化趋势,预测在序列中下一帧图像中相应控制点的位置, 然后以预测位置作为匹配的初始搜索位置采用MPEG-4所使用的是菱形搜索算 法。对于匹配结果,由于控制点是位于物体的边缘部分,这个区域图像灰度值变 化大,有利于匹配到正确的结果。并进一步设定一个恰当门限。当最终搜索到最 优匹配点的MAD小于门限时,就认为结果为正确匹配点,把匹配到的点作为控 制点的初始位置;反之则认为结果为错误的匹配点,忽略匹配结果,直接把预测 位置作为控制点的初始位置。这样又尽量避免了错误匹配造成的影响。达到了在 简单、计算量小的条件下的较好的预测效果。
在传统的主动轮廓模型基础上,本发明引入了偏三维约束的概念,作为主动 轮廓模型的能量之一。对于本发明的三维自动分割方法,是从第一层图像开始, 逐层向下。对于横向内能,由同层相邻的两个控制点决定,和三维模型没有区别。 而纵向内能则以上层图像中的控制点的位置采用偏三维约束,以预测的方法来进 行模拟。
有益效果:本发明中联合匹配预测用于序列图像分割,优化了初始主动轮廓 的设置,使得初始轮廓更接近与实际边缘,有利于得到准确的分割结果。在二维 轮廓模型中引入三维约束,则可以在二维模型的优点中加入三维模型的三维平滑 的特点,更符合物体的实际特性,并可以同时实现重建的作用,以低计算成本达 到较好的效果。该方法在三维序列图像分割中非常有效,可以显著提高分割的准 确性以及速度。
附图说明
图1为本发明总体流程图
图2为偏三维约束迭代收敛过程的流程图。
图3为预测法对人体肝脏CT图像序列进行分割的成像结果。
图4为匹配法对人体肝脏CT图像序列进行分割的成像结果。
图5为光流法对人体肝脏CT图像序列进行分割的成像结果。
图6为本发明方法对人体肝脏CT图像序列进行分割的成像结果。

具体实施方式

下面是本发明的具体实施例来进一步描述:
本发明的运行环境是WinXP操作系统;闪龙2500+CPU;算法采用仿真计算 平台Matlab 7.0版本进行编制。该方法总体过程如图1所示包括如下步骤:
1)对数字图像初始化:
11)在第一帧数字图像轮廓线转向的地方,交互式设置手动控制点,相邻的 两个手动控制点之间均等生成控制点的初始位置;
12)迭代收敛,收敛到第一幅图像中物体轮廓的边沿,包括如下步骤:
121)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距保 持在5个像素,
122)由蛇的控制点的初始位置出发,以梯度矢量流场替代原图像计算梯度 值并作为外力,
123)计算第一层内能公式为Eint=(xi+1,j+xi-1,j-2xi,j),xi,j表示第j幅图 像中的第i个控制点的位置,Eint为内部能量,
124)计算合力公式Esnake=Eint+Eimage+Econstrain,计算出的合力为零 来作为图像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制 点的运动,Eint为内部能量,Eimage为外部能量,
125)根据公式 x i , j = x i , j + E snake i , j 计算出来的合力移动控制点,xi,j表示第j幅图 像中的第i个控制点的位置,Esnake i,j表示第j幅图像中的第i个控制点的位置的能 量函数,
126)对图像收敛的处理过程:
利用公式:
avd=sum(abs(Esnake))/length(Esnake)来判断图像收敛条件,sum(abs(Esnake))表示 为所有控制点合力的绝对值之和,length(Esnake)为控制点的个数,avd为合力的平 均值,
如果合力的平均值小于0.08时再收敛15次,目的是在合力较小的情况下进 一步接近轮廓,
当avd<0.08后且又迭代15次时,迭代结束,得到最终收敛结果,
否则,回到步骤121),迭代继续进行;
13)对第一帧数字图像不进行控制点位置预测计算,以第一帧数字图像主动 轮廓模型的收敛位置作为控制点的预测位置,
按合力公式Esnake=Eint+Eimage+Econstrain计算出的合力为零来作为图 像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制点的运动, Eint为内部能量,Eimage为外部能量;
14)块匹配初始搜索点的选择,以预测的下一帧的控制点的位置作为初始 搜索点,和直接采用参考图像对应位置相比,2个图像块比较,相应的像素点两 两求差的绝对值,它们的平均值是最小绝对差匹配准则所求的值,公式中的M,N 是图像块的长和宽,fk(m,n)是指在k帧数字图像中(m,n)处像素点的像素值,
MAD ( Δp , Δq ) = ( 1 / MN ) Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f k - 1 ( m + Δp , n + Δq ) |
其中(Δp,Δq)为位移矢量,fk为当前帧图像的灰度值,fk-1为上一帧图 像的灰度值,图像块大小为M*N,MAD(Δp,Δq)为最小值是最优匹配点,
搜索策略为菱形搜索算法,采用9个检测点的大模板和5个检测点的小模板, 对匹配得到的平均绝对差设定门限值为15,当最终搜索到最优匹配点小于门限 值时,把匹配到的点作为控制点的初始位置;反之,直接把预测位置作为控制点 的初始位置;
2)循环:
21)设置数字图像帧层数记数器,用于判断是否超过最底数字图像帧层,若 数字图像帧层数没有超过最底数字图像帧层则执行步骤22),否则结束循环;
22)以前两层收敛的控制点的坐标预测下一层的控制点的位置
预测下一帧数字图像的控制点位置,xi,j表示第j帧数字图像中的第i个控 制点的位置,控制点位置的变化用Vi,j表示为:Vi,j=xi,j-xi,j-1,得到预测的 j+1帧数字图像中的相应控制点的位置: x ~ i , j + 1 = x i , j + k 1 × V i , j , k1为预测系数,当 k1为0时,直接用上一帧数字图像的分割结果作为初始值;
23)以步骤22)中所预测控制点的位置为起点作为初始搜索点,和直接采 用参考图像对应位置相比,2个图像块比较,相应的像素点两两求差的绝对值, 它们的平均值是最小绝对差匹配准则所求的值,公式中的M,N是图像块的长和 宽,fk(m,n)是指在k帧数字图像中(m,n)处像素点的像素值,
MAD ( Δp , Δq ) = ( 1 / MN ) Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f k - 1 ( m + Δp , n + Δq ) |
其中(Δp,Δq)为位移矢量,fk为当前帧图像的灰度值,fk-1为上一帧图 像的灰度值,图像块大小为M*N,MAD(Δp,Δq)为最小值是最优匹配点,
搜索策略为菱形搜索算法,采用9个检测点的大模板和5个检测点的小模板, 对匹配得到的平均绝对差设定门限值,当最终搜索到最优匹配点小于门限值时, 把匹配到的点作为控制点的初始位置;反之,直接把预测位置作为控制点的初始 位置;
24)偏三维约束的迭代收敛,其过程如图2所示包括如下步骤:
241)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距,
242)由步骤22)中所预测控制点的位置出发,以梯度矢量流场替代原图像 计算梯度值并作为外力,
243)计算偏三维约束的内力公式为
Eint′=k(xi+1,j+xi-1,j-2xi,j)+(1-k)(xi,j+1+k1(xi,j+1-xi,j+2)-xi,j),
xi,j表示第j幅图像中的第i个控制点的位置,Eint为偏三维约束内部能量, k1为预测系数取0.5,
244)合力公式为Esnake=Eint+Eimage+Econstrain,计算出的合力为零来 作为图像收敛的条件,其中Esnake为能量函数,Econstrain为约束能量来限制控制点 的运动,Eint内部能量和Eimage外部能量;
245)合力移动控制点, x i , j = x i , j + E snake i , j , xi,j表示第j幅图像中的第i个控制 点的位置,Esnake i,j表示第j幅图像中的第i个控制点的位置的能量函数,
246)判断是否到达收敛,
利用公式:
avd=sum(abs(Esnake))/length(Esnake)作为判断图像收敛条件,sum(abs(Esnake))表 示为所有控制点合力的绝对值之和,length(Esnake)为控制点的个数,avd为合力的 平均值,
如果合力的平均值小于0.08时再收敛15次,目的是在合力较小的情况下进 一步接近轮廓,
当avd<0.08后且又迭代15次时,迭代结束,得到最终收敛结果,
否则,回到步骤241),迭代继续进行;
25)数字图像帧层数记数器进行帧层数累加;
26)判断步骤25)中的数字图像帧层数是否超过最底数字图像帧层,若数字 图像帧层数没有超过最底数字图像帧层则执行步骤22),否则结束循环。
在第一幅序列图像上,沿着所需的图像,手动设置是以鼠标点击的方式直 接在图像边缘附近点击设定若干点,标识轮廓位置,根据手动设置的点,自动等 间距的生成控制点手动设置少数的接近轮廓的点,这些点主要位于轮廓线转向的 地方,在手动设置的相邻的两个点之间也许距离会比较远,而控制点的间距要求 比较均匀,间距较小,根据这个原则等距的均匀地加入控制点。控制点的位置作 为主动轮廓模型的初始位置。
轮廓的迭代收敛,由主动轮廓的初始位置,采用改进外力的Snake模型, GVF Snake模型收敛主动轮廓。采用公式(1)计算各个控制点的能量,以合力推 动控制点的移动。公式中的变量代码能量就是指下面公式中计算出来的数值,分 为x轴方向和y轴方向,这计算出来的值越大,控制点的移动也就越大。这个能 量分为下面公式中的3个部分,这3个能量的和作为推动控制点移动的合力。
Esnake=Eint+Eimage+Econstrain    (1)
其中外部能量Eimage采用梯度矢量流场。
离散计算公式为
u ( n + 1 ) ( p , q ) = u ( n ) ( p , q ) + L 2 u ( n ) ( p , q ) - [ u ( n ) ( p , q ) - f x ( p , q ) ] [ f x ( p , q ) 2 + f y ( p , q ) 2 ] v ( n + 1 ) ( p , q ) = v ( n ) ( p , q ) + L 2 v ( n ) ( p , q ) - [ v ( n ) ( p , q ) - f y ( p , q ) ] [ f x ( p , q ) 2 + f y ( p , q ) 2 ]
(2)
计算出梯度矢量流场,其中:
2u(n)(p,q)=u(n)(p+1,q)+u(n)(p-1,q)+u(n)(p,q+1)+u(n)(p,q-1)+4u(n)(p,q)
2v(n)(p,q)=v(n)(p+1,q)+v(n)(p-1,q)+v(n)(p,q+1)+v(n)(p,q-1)+4v(n)(p,q)
(3)
u(n)(p,q),v(n)(p,q)是计算GVF场时,第n次迭代的的迭代值,第一次迭代时,它 的值就是图像本身的像素值。fx(p,q),fy(p,q)是x,y方向上的图像梯度值。
在三维图像中,内部能量与周围4个控制点相关,受4个控制点的共同影响, 周围的4个控制点决定内部能量的大小。本发明采用预测的方法来进行模拟,采 用预测位置作为纵向平滑约束,提出了偏三维约束。公式表示为:
Eint′=k(xi+1,j+xi-1,j-2xi,j)+(1-k)(xi,j+1+k1(xi,j+1-xi,j+2)-xi,j)
(4)
其中,xi,j表示第j幅图像中的第i个控制点的位置,k控制横向约束的和纵向 预测之间的权衡,k1为预测系数(0≤k1≤1)。由于预测的准确性低于实际的纵 向内能且上层中的控制点位置固定不变,物体的轮廓是控制点的网格,每个控制 点相邻的都有4个控制点,水平方向上2个作为横向约束,产生横向能量,垂直方 向上2个作为纵向约束,产生纵向内能,这是传统的三维模型计算法,本文方法 在横向上是和它一致的,而在纵向上使用预测的方法产生纵向能量。约束过强是 指由于预测的结果还是有一定的不准确性,为了避免这种不准确性导致错误,横 向约束应强于纵向约束(0.5<k<1),使轮廓有更大的自由度,避免约束过强造成 的误差。在实验中,k取0.6-0.7,k1取0.5。
在传统的三维模型中,内力的公式表示为:
Eint=(xi+1,j+xi-1,j-2xi,j)+(xi,j+1+xi,j-1-2xi,j)
区别在于,控制点周围的4个控制点都是已知的,使用这4个控制点约束中间 控制点。
在本算法中,第一层的约束是普通的二维收敛,采用的内能也是二维的,表 现为只有横向约束,没有三维的纵向约束,公式为:
Eint=(xi+1,j+xi-1,j-2xi,j)
采用下述约束能量限制控制点的运动,防止跳变的产生控制点一次变化过大 可能会落入无法回归的图像区域而而产生错误
C = 1 m Σ i = 1 m ( E int i + E image i )
(5)
σ = 1 m Σ i = 1 m ( E int i + E image i - C ) 2
(6)
Esnake=Econstrain(Eint+Eimage)
(7)
E constrain i = min { 1, 3 σ E int i + E image i - C }
(8)
内部能量和外部能量的合力在约束能量的约束之下控制控制点的移动。
反复计算,经过多次迭代最终收敛到所需的图像边沿处。
预测下一层的控制点位置
分两种情况处理。当为第一幅图像时,就以主动轮廓模型的收敛位置作为预 测位置,不再进行预测计算。
对其它的下层图像,则进行如下的预测处理。
控制点位置的变化Vi,j可以表示为:
Vi,j=xi,j-xi,j-1
(9)
xi,j表示第j幅图像中的第i个控制点的位置,可以得到预测的n+1幅图中的相 应控制点的位置:
x ~ i , j + 1 = x i , j + k 1 × V i , j
(10)
当k1为0时,就是直接使用上一幅图的分割结果作为初始值。
匹配。利用预测的结果进一步采用匹配的方法获得更为接近与图像中物体边 缘的位置。本发明采用实现简单且被MPEG-x和H.26x等广泛应用的基于块匹配 的运动估计算法块匹配是指2个相同大小的图像进行比较,差异越小匹配度越高。 匹配点是指块匹配图像块的中心点,这个点可以匹配块的位置,块匹配成功实际 上相应的匹配点匹配成功,块匹配技术主要包括以下3点:
第一,初始搜索点的选择。本发明中采用预测的下一帧的控制点的位置作 为初始搜索点作为初始搜索点,和直接采用上一帧的控制点收敛位置作为初始搜 索点相比,可以有效减少匹配的次数和时间。
第二,块匹配准则。本发明方法中采用常用的最小绝对差匹配准则2个图像 块比较,相应的像素点两两求差的绝对值,它们的平均值就是最小绝对差匹配准 则所求的值。公式如下:
MAD ( Δp , Δq ) = ( 1 / MN ) Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f k - 1 ( m + Δp , n + Δq ) |
(11)
M,N是图像块的长和宽,fk(m,n)是指在k帧中(m,n)处像素点的像素值, 其中(Δp,Δq)为位移矢量;MAD(Δp,Δq)的最小值是最优匹配点。
第三,搜索策略。使用的是菱形搜索算法(Diamond Search,DS)。采用了两 种模板,即9个检测点的大模板LDSP(Large Diamond Search Pattern)和5个检测点 的小模板SDSP(Small Diamond Search Pattern)。首先,搜索时先采用大模板对搜 索中心点周围的9个点进行匹配运算,就是把以这9个点为中心的9个图像块分别 和上一帧相应控制点为中心的图像块计算MAD(Δp,Δq),当最小块误差点即为中心 点时,则自动转换为小模板搜索策略,对中心点周围其他5个点进行匹配运算,5 点中的最优匹配点即为所求点。如果在采用大模板搜索时,最优点不在中心点时, 那么就以该最优点为中心点重新采用大模板进行搜索,直到最优匹配点为中心点 时,再转换为小模板搜索,最终找到最优匹配点。
对于匹配结果,由于控制点是位于物体的边缘部分,这个区域图像灰度值变 化大,有利于匹配到正确的结果。并进一步对匹配得到的平均绝对差设定一个门 限。当最终搜索到最优匹配点的MAD小于门限时,就认为结果为正确匹配点, 把匹配到的点作为控制点的初始位置;反之则认为结果为错误的匹配点,忽略匹 配结果,直接把预测位置作为控制点的初始位置。这样既避免了错误匹配造成的 影响,又达到了在简单、计算量小条件下较好的预测效果。门限要根据匹配块大 小,以及实际图像情况进行调整,图像变化以及噪声剧烈的,门限就要高一点, 变化及噪声平稳的就小一点。通常取值为10-20。通过使用本发明方法可以达到 图6所示的效果并可以与图3、图4、图5进行比较。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈