基于运动预测和三维约束的序列图像分割方法专利检索-三维形变模型人工智能专利检索查询-专利查询网

基于运动预测和三维约束的序列图像分割方法

阅读：729发布：2021-02-11

专利汇可以提供基于运动预测和三维约束的序列图像分割方法专利检索，专利查询，专利分析的服务。并且本发明公开了一种基于运动预测和偏三维约束并结合主动轮廓模型的图像序列分割方法，属于图像处理技术领域。以主动轮廓模型上的控制点作为预测模型形变的着手点，把物体变化的平滑性和一致性，表示为控制点位置变化的一致性，以控制点的变化趋势，预测在序列中下一帧图像中相应控制点的位置，然后以预测位置作为匹配的初始搜索位置采用MPEG－4所使用的是菱形搜索算法。本发明引入了偏三维约束的概念，作为主动轮廓模型的能量之一。这样又尽量避免了错误匹配造成的影响。达到了在简单、计算量小的条件下的较好的预测效果。，下面是基于运动预测和三维约束的序列图像分割方法专利的具体信息内容。

权利要求

1.一种基于运动预测和三维约束的序列图像分割方法，其特征在于该方法包括如下步骤：
1)对数字图像初始化；
11)在第一帧数字图像轮廓线转向的地方，交互式设置手动控制点，相邻的两个手动控制点之间均等生成控制点的初始位置；
12)对第一帧数字图像进行迭代收敛，收敛到第一帧数字图像中物体轮廓的边沿；
13)对第一帧数字图像不进行控制点位置预测计算，以第一帧数字图像主动轮廓模型的收敛位置作为控制点的预测位置，
按合力公式Esnake＝Eint+Eimage+Econstrain计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动， Eint为内部能量，Eimage为外部能量；
14)块匹配初始搜索点的选择，以预测的下一帧的控制点的位置作为初始搜索点，和直接采用参考图像对应位置相比，2个图像块比较，相应的像素点两两求差的绝对值，它们的平均值是最小绝对差匹配准则所求的值，公式中的M，N 是图像块的长和宽，fk(m，n)是指在k帧数字图像中(m，n)处像素点的像素值，
${MAD}_{(Δp, Δq)} = (1 / MN) Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + Δp, n + Δq) |$
其中Δp，Δq为偏移量，fk为当前帧图像的灰度值，fk-1为上一帧图像的灰度值，图像块大小为M和N的乘积值，MAD(Δp，Δq)为最小值是最优匹配点，
采用9个检测点的大模板和5个检测点的小模板，对匹配得到的平均绝对差设定门限值，当最终搜索到最优匹配点小于门限值时，把匹配到的点作为控制点的初始位置；反之，直接把预测位置作为控制点的初始位置；
2)循环：
21)设置数字图像帧层数记数器，用于判断是否超过最底数字图像帧层，若数字图像帧层数没有超过最底数字图像帧层则执行步骤22)，否则结束循环；
22)以前两层收敛的控制点的坐标预测下一层的控制点的位置：
预测下一帧数字图像的控制点位置，xi，j表示第j帧数字图像中的第i个控制点的位置，控制点位置的变化用Vi，j表示为：Vi，j＝xi，j-xi，j-1，得到预测的 j+1帧数字图像中的相应控制点的位置： ${\tilde{x}}_{i, j + 1} = x_{i, j} + k_{1} \times V_{i, j},$ k1为预测系数，当 k1为0时，直接用上一帧数字图像的分割结果作为初始值；
23)以步骤22)中所预测控制点的位置为起点作为初始搜索点，和直接采用参考图像对应位置相比，2个图像块比较，相应的像素点两两求差的绝对值，它们的平均值是最小绝对差匹配准则所求的值，公式中的M，N是图像块的长和宽，fk(m，n)是指在k帧数字图像中(m，n)处像素点的像素值，
${MAD}_{(Δp, Δq)} = (1 / MN) Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + Δp, n + Δq) |$
其中Δp，Δq为偏移量，fk为当前帧图像的灰度值，fk-1为上一帧图像的灰度值，图像块大小为M和N的乘积值，MAD(Δp，Δq)为最小值是最优匹配点，
采用9个检测点的大模板和5个检测点的小模板，对匹配得到的平均绝对差设定门限值，当最终搜索到最优匹配点小于门限值时，把匹配到的点作为控制点的初始位置；反之，直接把预测位置作为控制点的初始位置；
24)对数字图像采用偏三维约束迭代收敛；
25)数字图像帧层数记数器进行帧层数累加；
26)判断步骤25)中的数字图像帧层数是否超过最底数字图像帧层，若数字图像帧层数没有超过最底数字图像帧层则执行步骤22)，否则结束循环。
2.如权利要求1所述的基于运动预测和三维约束的序列图像分割方法，其特征在于该方法步骤12)包括如下步骤：
121)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距，
122)由蛇的控制点的初始位置出发，以梯度矢量流场替代原图像计算梯度值并作为外力，
123)计算第一层内能公式为Eint＝(xi+1，j+xi-1，j-2xi，j)，xi，j表示第j幅图像中的第i个控制点的位置，Eint为内部能量，
124)计算合力公式Esnake＝Eint+Eimage+Econstrain，计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动，Eint为内部能量，Eimage为外部能量，
125)根据公式 $x_{i, j} = x_{i, j} + E_{snake}^{i, j}$ 计算出来的合力移动控制点，xi，j表示第j幅图像中的第i个控制点的位置，Esnake i，j表示第j幅图像中的第i个控制点的位置的能量函数，
126)对图像收敛的处理过程：
利用公式：
avd＝sum(abs(Esnake))/length(Esnake)来判断图像收敛条件，sum(abs(Esnake))表示为所有控制点合力的绝对值之和，length(Esnake)为控制点的个数，avd为合力的平均值，
如果合力的平均值小于0.08时再收敛15次，目的是在合力较小的情况下进一步接近轮廓，
当avd＜0.08后且又迭代15次时，迭代结束，得到最终收敛结果，
否则，回到步骤121)，迭代继续进行；
3.如权利要求1所述的基于运动预测和三维约束的序列图像分割方法，其特征在于该方法步骤24)包括如下步骤：
241)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距，
242)由步骤22)中所预测控制点的位置出发，以梯度矢量流场替代原图像计算梯度值并作为外力，
243)计算偏三维约束的内力公式为
Eint′＝k1(xi+1，j+xi-1，j-2xi，j)+(1-k1)(xi，j+1+k1(xi，j+1-xi，j+2)-xi，j)， xi，j表示第j幅图像中的第i个控制点的位置，Eint′为偏三维约束内部能量，k1 为预测系数，
244)合力公式为Esnake＝Eint+Eimage+Econstrain，计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动，Eint内部能量和Eimage外部能量；
245)合力移动控制点， $x_{i, j} = x_{i, j} + E_{snake}^{i, j},$ xi，j表示第j幅图像中的第i个控制点的位置，Esnake i，j表示第j幅图像中的第i个控制点的位置的能量函数，
246)判断是否到达收敛，
利用公式：
avd＝sum(abs(Esnake))/length(Esnake)作为判断图像收敛条件，sum(abs(Esnake))表示为所有控制点合力的绝对值之和，length(Esnake)为控制点的个数，avd为合力的平均值，
如果合力的平均值小于0.08时再收敛15次，目的是在合力较小的情况下进一步接近轮廓，
当avd＜0.08后且又迭代15次时，迭代结束，得到最终收敛结果，
否则，回到步骤241)，迭代继续进行；
4.如权利要求1所述的基于运动预测和三维约束的序列图像分割方法，其特征在于该方法步骤14)和步骤23)中的门限值为10到20之间。
5.如权利要求2所述的基于运动预测和三维约束的序列图像分割方法，其特征在于该方法步骤121)中的两个控制点的间距保持在3个像素到7个像素之间。
6.如权利要求3所述的基于运动预测和三维约束的序列图像分割方法，其特征在于该方法步骤241)中的两个控制点的间距保持在3个像素到7个像素之间，步骤243)中的k1的预测系数取值为0到1之间。

说明书全文

技术领域

本发明属于图像处理技术领域，具体涉及一种基于运动预测和偏三维约束，并结合主动轮廓模型的图像序列分割方法。

背景技术

三维图像分割是图像处理和计算机视觉中的一个重要研究领域，广泛应用于计算机辅助三维重建、运动物体跟踪以及医学中细胞运动和形变的分析等应用领域。三维图像或图像序列与一般图像的不同之处在于：序列图像是针对同一目标，切片是由间隔相同的距离或时间连续采样而得到的，因此对三维图像的分割既与一般的图像分割有相同之处，又有特殊之处。
传统的主动轮廓模型都要求模型初始化在目标轮廓的附近，否则将可能收敛到错误的结果。而在三维图像分割中对每一幅切片图进行手工初始化是一种费时而繁琐的工作，需要找到一种自动化的三维分割方法。
现有的基于主动轮廓模型的分割方法主要有：
1、预测法，预测法简单易行，利用物体的轮廓一般都是平滑变化这一常识，用前面数个轮廓的位置，对初始位置的设置进行改进，在自动分割中，如何更精确的自动设定主动轮廓的初始位置非常重要，初始位置距离实际边缘越接近，收敛到正确位置的可能性就越大。这种方法有一定效果，但没有利用图像本身的信息，有进一步改进的空间。
2、光流法，光流法利用光流场的方法迭代获得图像中物体运动的趋势，这种趋势以一个新的外力的形式影响收敛的结果，有较好的效果。但缺点是方法复杂，运算量比较大。而且没有改善初始化位置，迭代次数也会比较多，会增加收敛的时间。
3、三维形变模型法，常规的三维形变模型法是把物体整体建立三维轮廓模型，虽然利用了相邻图像相关性信息但是模型复杂，计算量大，初始位置设置困难。如果能在二维轮廓模型中引入三维约束，则可以在二维模型的优点中加入三维模型的三维平滑的特点，更符合物体的实际特性。

发明内容

技术问题：本发明基于三维图像序列的相似性，采用在视频压缩中常见的运动估计方法，并与偏三维约束相结合，提出了一种新的适用于三维图像分割的方法。基于三维图像具有三维平滑、连续变化等特性，本发明提出了一种新的图像序列分割方法。该方法在计算过程中只需手动设置第一幅图中主动形变模型的关键点位置。在其他图像中，首先采用预测和视频运动估计中常用的块匹配法优化，在MPEG-4和H.26x中采用的都是这种块匹配法，然后采用偏三维约束和梯度矢量流(GVF)，从初始化位置开始在图像中进一步迭代收敛得到每幅图像中的最终轮廓位置，在一般的二维平滑基础上，达到三维平滑，三维分割的作用。本发明方法可以显著提高分割的准确性以及速度。
技术方案：本发明公开了一种基于运动预测和三维约束的序列图像分割方法，该方法包括如下步骤：
1)对数字图像初始化：
11)在第一帧数字图像轮廓线转向的地方，交互式设置手动控制点，相邻的两个手动控制点之间均等生成控制点的初始位置；
12)迭代收敛，收敛到第一幅图像中物体轮廓的边沿，其过程如下：
121)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距，
122)由蛇的控制点的初始位置出发，以梯度矢量流场替代原图像计算梯度值并作为外力，
123)计算第一层内能公式为Eint＝(xi+1，j+xi-1，j-2xi，j)，xi，j表示第j幅图像中的第i个控制点的位置，Eint为内部能量，
124)计算合力公式Esnake＝Eint+Eimage+Econstrain，计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动，Eint为内部能量，Eimage为外部能量，
125)根据公式

x_{i, j} = x_{i, j} + E_{snake}^{i, j}

计算出来的合力移动控制点，xi，j表示第j幅图像中的第i个控制点的位置，Esnake i，j表示第j幅图像中的第i个控制点的位置的能量函数，
126)对图像收敛的处理过程：
利用公式：
avd＝sum(abs(Esnake))/length(Esnake)来判断图像收敛条件，sum(abs(Esnake))表示为所有控制点合力的绝对值之和，length(Esnake)为控制点的个数，avd为合力的平均值，
如果合力的平均值小于0.08时再收敛15次，目的是在合力较小的情况下进一步接近轮廓，
当avd＜0.08后且又迭代15次时，迭代结束，得到最终收敛结果，
否则，回到步骤121)，迭代继续进行；
13)对第一帧数字图像不进行控制点位置预测计算，以第一帧数字图像主动轮廓模型的收敛位置作为控制点的预测位置，
按合力公式Esnake＝Eint+Eimage+Econstrain计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动， Eint为内部能量，Eimage为外部能量；
14)块匹配初始搜索点的选择，以预测的下一帧的控制点的位置作为初始搜索点，和直接采用参考图像对应位置相比，2个图像块比较，相应的像素点两两求差的绝对值，它们的平均值是最小绝对差匹配准则所求的值，公式中的M，N 是图像块的长和宽，fk(m，n)是指在k帧数字图像中(m，n)处像素点的像素值，

{MAD}_{(Δp, Δq)} = (1 / MN) Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + Δp, n + Δq) |

其中(Δp，Δq)为位移矢量，fk为当前帧图像的灰度值，fk-1为上一帧图像的灰度值，图像块大小为M*N，MAD(Δp，Δq)为最小值是最优匹配点，
搜索策略为菱形搜索算法，采用9个检测点的大模板和5个检测点的小模板，对匹配得到的平均绝对差设定门限值，当最终搜索到最优匹配点小于门限值时，把匹配到的点作为控制点的初始位置；反之，直接把预测位置作为控制点的初始位置；
2)循环：
21)设置数字图像帧层数记数器，用于判断是否超过最底数字图像帧层，若数字图像帧层数没有超过最底数字图像帧层则执行步骤22)，否则结束循环；
22)以前两层收敛的控制点的坐标预测下一层的控制点的位置
预测下一帧数字图像的控制点位置，xi，j表示第j帧数字图像中的第i个控制点的位置，控制点位置的变化用Vi，j表示为：Vi，j＝xi，j-xi，j-1，得到预测的 j+1帧数字图像中的相应控制点的位置：

{\tilde{x}}_{i, j + 1} = x_{i, j} + k_{1} \times V_{i, j},

k1为预测系数，当 k1为0时，直接用上一帧数字图像的分割结果作为初始值；
23)以步骤22)中所预测控制点的位置为起点作为初始搜索点，和直接采用参考图像对应位置相比，2个图像块比较，相应的像素点两两求差的绝对值，它们的平均值是最小绝对差匹配准则所求的值，公式中的M，N是图像块的长和宽，fk(m，n)是指在k帧数字图像中(m，n)处像素点的像素值，

{MAD}_{(Δp, Δq)} = (1 / MN) Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + Δp, n + Δq) |

其中(Δp，Δq)为位移矢量，fk为当前帧图像的灰度值，fk-1为上一帧图像的灰度值，图像块大小为M*N，MAD(Δp，Δq)为最小值是最优匹配点，
搜索策略为菱形搜索算法，采用9个检测点的大模板和5个检测点的小模板，对匹配得到的平均绝对差设定门限值，当最终搜索到最优匹配点小于门限值时，把匹配到的点作为控制点的初始位置；反之，直接把预测位置作为控制点的初始位置；
24)偏三维约束的迭代收敛，过程如下：
241)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距，
242)由步骤22)中所预测控制点的位置出发，以梯度矢量流场替代原图像计算梯度值并作为外力，
243)计算偏三维约束的内力公式为
Eint′＝k(xi+1，j+xi-1，j-2xi，j)+(1-k)(xi，j+1+k1(xi，j+1-xi，j+2)-xi，j)，
xi，j表示第j幅图像中的第i个控制点的位置，Eint为偏三维约束内部能量， k为预测系数，
244)合力公式为Esnake＝Eint+Eimage+Econstrain，计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动，Eint内部能量和Eimage外部能量；
245)合力移动控制点，

x_{i, j} = x_{i, j} + E_{snake}^{i, j},

xi，j表示第j幅图像中的第i个控制点的位置，Esnake i，j表示第j幅图像中的第i个控制点的位置的能量函数，
246)判断是否到达收敛，
利用公式：
avd＝sum(abs(Esnake))/length(Esnake)作为判断图像收敛条件，sum(abs(Esnake))表示为所有控制点合力的绝对值之和，length(Esnake)为控制点的个数，avd为合力的平均值，
如果合力的平均值小于0.08时再收敛15次，目的是在合力较小的情况下进一步接近轮廓，
当avd＜0.08后且又迭代15次时，迭代结束，得到最终收敛结果，
否则，回到步骤241)，迭代继续进行；
25)数字图像帧层数记数器进行帧层数累加；
26)判断步骤25)中的数字图像帧层数是否超过最底数字图像帧层，若数字图像帧层数没有超过最底数字图像帧层则执行步骤22)，否则结束循环。
上述基于运动预测和三维约束的序列图像分割方法，该方法步骤14)和步骤23)中的门限值为10到20之间，步骤121)和步骤241)中的两个控制点的间距保持在3个像素到7个像素之间，步骤243)中的k1的预测系数取值为0 到1之间。
本发明首先采用预测与匹配相结合初始位置设置方法。以主动轮廓模型上的控制点作为预测模型形变的着手点，避免了有的预测法中关于质心的概念。对质心的应用中要求轮廓为比较饱满的形状，否则若质心太过接近于轮廓边缘，会使判断的法线方向有较大的偏差，影响有效性。我们把物体变化的平滑性和一致性，表示为控制点位置变化的一致性。
由于我们是以控制点构成的网格表示物体的轮廓，物体表现出来的平滑性和一致性要体现在控制点网格上以控制点的变化趋势，预测在序列中下一帧图像中相应控制点的位置，然后以预测位置作为匹配的初始搜索位置采用MPEG-4所使用的是菱形搜索算法。对于匹配结果，由于控制点是位于物体的边缘部分，这个区域图像灰度值变化大，有利于匹配到正确的结果。并进一步设定一个恰当门限，图像变化以及噪声剧烈的，门限就要高一点，变化及噪声平稳的就小一点。当最终搜索到最优匹配点的平均绝对差(MAD)小于门限时，就认为结果为正确匹配点，把匹配到的点作为控制点的初始位置；反之则认为结果为错误的匹配点，忽略匹配结果，直接把预测位置作为控制点的初始位置。这样又尽量避免了错误匹配造成的影响。达到了在简单，计算量小的条件下的较好的效果。
在传统的主动轮廓模型基础上，本发明引入了偏三维约束的概念，作为主动轮廓模型的能量之一。对于本发明的三维自动分割方法，是从第一层图像开始，逐层向下。在任何时候，我们只知道上一层图像中的控制点的位置，而不知道下一层图像中的控制点位置，所以并不能直接采用4点约束式的三维约束模型。这个种情况下，本发明基于上层控制点和预测，提出了偏三维约束。
对于横向内能，目的是使轮廓在水平方向上平滑，由同层相邻的两个控制点决定，和三维模型没有区别。而纵向内能，由于本文序列分割的特性，是由二维模拟三维，不能轻易得出，因为纵向相邻的2个控制点只知道一个。对此，本发明采用预测的方法来进行模拟。由于物体的平滑性，物体在每层图像上投影的变化具有连续性，即由上两层图像控制点预测得到的位置与上下两层控制点的中点的位置在大多数情况下近似，并且同样能反映物体平滑的特性。
通过手动设置第一幅图中主动形变模型的关键点位置后，在其他图像中，采用预测和块匹配法相结合的方法自动地设置后续图像的主动轮廓模型初始化位置，并采用偏三维约束和梯度矢量流相结合的方法，从初始位置开始，自动化地进一步迭代收敛得到每幅图像中的最终轮廓位置。
采用预测与匹配相结合初始位置设置方法。以主动轮廓模型上的控制点作为预测模型形变的着手点，把物体变化的平滑性和一致性，表示为控制点位置变化的一致性，以控制点的变化趋势，预测在序列中下一帧图像中相应控制点的位置，然后以预测位置作为匹配的初始搜索位置采用MPEG-4所使用的是菱形搜索算法。对于匹配结果，由于控制点是位于物体的边缘部分，这个区域图像灰度值变化大，有利于匹配到正确的结果。并进一步设定一个恰当门限。当最终搜索到最优匹配点的MAD小于门限时，就认为结果为正确匹配点，把匹配到的点作为控制点的初始位置；反之则认为结果为错误的匹配点，忽略匹配结果，直接把预测位置作为控制点的初始位置。这样又尽量避免了错误匹配造成的影响。达到了在简单、计算量小的条件下的较好的预测效果。
在传统的主动轮廓模型基础上，本发明引入了偏三维约束的概念，作为主动轮廓模型的能量之一。对于本发明的三维自动分割方法，是从第一层图像开始，逐层向下。对于横向内能，由同层相邻的两个控制点决定，和三维模型没有区别。而纵向内能则以上层图像中的控制点的位置采用偏三维约束，以预测的方法来进行模拟。
有益效果：本发明中联合匹配预测用于序列图像分割，优化了初始主动轮廓的设置，使得初始轮廓更接近与实际边缘，有利于得到准确的分割结果。在二维轮廓模型中引入三维约束，则可以在二维模型的优点中加入三维模型的三维平滑的特点，更符合物体的实际特性，并可以同时实现重建的作用，以低计算成本达到较好的效果。该方法在三维序列图像分割中非常有效，可以显著提高分割的准确性以及速度。
附图说明
图1为本发明总体流程图。
图2为偏三维约束迭代收敛过程的流程图。
图3为预测法对人体肝脏CT图像序列进行分割的成像结果。
图4为匹配法对人体肝脏CT图像序列进行分割的成像结果。
图5为光流法对人体肝脏CT图像序列进行分割的成像结果。
图6为本发明方法对人体肝脏CT图像序列进行分割的成像结果。

具体实施方式

下面是本发明的具体实施例来进一步描述：
本发明的运行环境是WinXP 操作系统；闪龙2500+CPU；算法采用仿真计算平台Matlab 7.0版本进行编制。该方法总体过程如图1所示包括如下步骤：
1)对数字图像初始化：
11)在第一帧数字图像轮廓线转向的地方，交互式设置手动控制点，相邻的两个手动控制点之间均等生成控制点的初始位置；
12)迭代收敛，收敛到第一幅图像中物体轮廓的边沿，包括如下步骤：
121)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距保持在5个像素，
122)由蛇的控制点的初始位置出发，以梯度矢量流场替代原图像计算梯度值并作为外力，
123)计算第一层内能公式为Eint＝(xi+1，j+xi-1，j-2xi，j)，xi，j表示第j幅图像中的第i个控制点的位置，Eint为内部能量，
124)计算合力公式Esnake＝Eint+Eimage+Econstrain，计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动，Eint为内部能量，Eimage为外部能量，
125)根据公式

x_{i, j} = x_{i, j} + E_{snake}^{i, j}

{MAD}_{(Δp, Δq)} = (1 / MN) Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + Δp, n + Δq) |

其中(Δp，Δq)为位移矢量，fk为当前帧图像的灰度值，fk-1为上一帧图像的灰度值，图像块大小为M*N，MAD(Δp，Δq)为最小值是最优匹配点，
搜索策略为菱形搜索算法，采用9个检测点的大模板和5个检测点的小模板，对匹配得到的平均绝对差设定门限值为15，当最终搜索到最优匹配点小于门限值时，把匹配到的点作为控制点的初始位置；反之，直接把预测位置作为控制点的初始位置；
2)循环：
21)设置数字图像帧层数记数器，用于判断是否超过最底数字图像帧层，若数字图像帧层数没有超过最底数字图像帧层则执行步骤22)，否则结束循环；
22)以前两层收敛的控制点的坐标预测下一层的控制点的位置
预测下一帧数字图像的控制点位置，xi，j表示第j帧数字图像中的第i个控制点的位置，控制点位置的变化用Vi，j表示为：Vi，j＝xi，j-xi，j-1，得到预测的 j+1帧数字图像中的相应控制点的位置：

{\tilde{x}}_{i, j + 1} = x_{i, j} + k_{1} \times V_{i, j},

{MAD}_{(Δp, Δq)} = (1 / MN) Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + Δp, n + Δq) |

其中(Δp，Δq)为位移矢量，fk为当前帧图像的灰度值，fk-1为上一帧图像的灰度值，图像块大小为M*N，MAD(Δp，Δq)为最小值是最优匹配点，
搜索策略为菱形搜索算法，采用9个检测点的大模板和5个检测点的小模板，对匹配得到的平均绝对差设定门限值，当最终搜索到最优匹配点小于门限值时，把匹配到的点作为控制点的初始位置；反之，直接把预测位置作为控制点的初始位置；
24)偏三维约束的迭代收敛，其过程如图2所示包括如下步骤：
241)采取加入控制点或合并控制点的方式来调节相邻两个控制点的间距，
242)由步骤22)中所预测控制点的位置出发，以梯度矢量流场替代原图像计算梯度值并作为外力，
243)计算偏三维约束的内力公式为
Eint′＝k(xi+1，j+xi-1，j-2xi，j)+(1-k)(xi，j+1+k1(xi，j+1-xi，j+2)-xi，j)，
xi，j表示第j幅图像中的第i个控制点的位置，Eint为偏三维约束内部能量， k1为预测系数取0.5，
244)合力公式为Esnake＝Eint+Eimage+Econstrain，计算出的合力为零来作为图像收敛的条件，其中Esnake为能量函数，Econstrain为约束能量来限制控制点的运动，Eint内部能量和Eimage外部能量；
245)合力移动控制点，

x_{i, j} = x_{i, j} + E_{snake}^{i, j},

\{\begin{matrix} u^{(n + 1)} (p, q) = u^{(n)} (p, q) + L ▿^{2} u^{(n)} (p, q) - [u^{(n)} (p, q) - f_{x} (p, q)] [f_{x} {(p, q)}^{2} + f_{y} {(p, q)}^{2}] \\ v^{(n + 1)} (p, q) = v^{(n)} (p, q) + L ▿^{2} v^{(n)} (p, q) - [v^{(n)} (p, q) - f_{y} (p, q)] [f_{x} {(p, q)}^{2} {+ f}_{y} {(p, q)}^{2}] \end{matrix}

(2)
计算出梯度矢量流场，其中：
2u(n)(p，q)＝u(n)(p+1，q)+u(n)(p-1，q)+u(n)(p，q+1)+u(n)(p，q-1)+4u(n)(p，q)
2v(n)(p，q)＝v(n)(p+1，q)+v(n)(p-1，q)+v(n)(p，q+1)+v(n)(p，q-1)+4v(n)(p，q)
(3)
u(n)(p，q)，v(n)(p，q)是计算GVF场时，第n次迭代的的迭代值，第一次迭代时，它的值就是图像本身的像素值。fx(p，q)，fy(p，q)是x，y方向上的图像梯度值。
在三维图像中，内部能量与周围4个控制点相关，受4个控制点的共同影响，周围的4个控制点决定内部能量的大小。本发明采用预测的方法来进行模拟，采用预测位置作为纵向平滑约束，提出了偏三维约束。公式表示为：
Eint′＝k(xi+1，j+xi-1，j-2xi，j)+(1-k)(xi，j+1+k1(xi，j+1-xi，j+2)-xi，j)
(4)
其中，xi，j表示第j幅图像中的第i个控制点的位置，k控制横向约束的和纵向预测之间的权衡，k1为预测系数(0≤k1≤1)。由于预测的准确性低于实际的纵向内能且上层中的控制点位置固定不变，物体的轮廓是控制点的网格，每个控制点相邻的都有4个控制点，水平方向上2个作为横向约束，产生横向能量，垂直方向上2个作为纵向约束，产生纵向内能，这是传统的三维模型计算法，本文方法在横向上是和它一致的，而在纵向上使用预测的方法产生纵向能量。约束过强是指由于预测的结果还是有一定的不准确性，为了避免这种不准确性导致错误，横向约束应强于纵向约束(0.5＜k＜1)，使轮廓有更大的自由度，避免约束过强造成的误差。在实验中，k取0.6-0.7，k1取0.5。
在传统的三维模型中，内力的公式表示为：
Eint＝(xi+1，j+xi-1，j-2xi，j)+(xi，j+1+xi，j-1-2xi，j)
区别在于，控制点周围的4个控制点都是已知的，使用这4个控制点约束中间控制点。
在本算法中，第一层的约束是普通的二维收敛，采用的内能也是二维的，表现为只有横向约束，没有三维的纵向约束，公式为：
Eint＝(xi+1，j+xi-1，j-2xi，j)
采用下述约束能量限制控制点的运动，防止跳变的产生控制点一次变化过大可能会落入无法回归的图像区域而而产生错误

\overline{C} = \frac{1}{m} Σ_{i = 1}^{m} (E_{int}^{i} + E_{image}^{i})

(5)

σ = \sqrt{\frac{1}{m} Σ_{i = 1}^{m} {(E_{int}^{i} + E_{image}^{i} - \overline{C})}^{2}}

(6)
Esnake＝Econstrain(Eint+Eimage)
(7)

E_{constrain}^{i} = \min {1, \frac{3 σ}{E_{int}^{i} + E_{image}^{i} - \overline{C}}}

(8)
内部能量和外部能量的合力在约束能量的约束之下控制控制点的移动。
反复计算，经过多次迭代最终收敛到所需的图像边沿处。
预测下一层的控制点位置
分两种情况处理。当为第一幅图像时，就以主动轮廓模型的收敛位置作为预测位置，不再进行预测计算。
对其它的下层图像，则进行如下的预测处理。
控制点位置的变化Vi，j可以表示为：
Vi，j＝xi，j-xi，j-1
(9)
xi，j表示第j幅图像中的第i个控制点的位置，可以得到预测的n+1幅图中的相应控制点的位置：

{\tilde{x}}_{i, j + 1} = x_{i, j} + k_{1} \times V_{i, j}

(10)
当k1为0时，就是直接使用上一幅图的分割结果作为初始值。
匹配。利用预测的结果进一步采用匹配的方法获得更为接近与图像中物体边缘的位置。本发明采用实现简单且被MPEG-x和H.26x等广泛应用的基于块匹配的运动估计算法块匹配是指2个相同大小的图像进行比较，差异越小匹配度越高。匹配点是指块匹配图像块的中心点，这个点可以匹配块的位置，块匹配成功实际上相应的匹配点匹配成功，块匹配技术主要包括以下3点：
第一，初始搜索点的选择。本发明中采用预测的下一帧的控制点的位置作为初始搜索点作为初始搜索点，和直接采用上一帧的控制点收敛位置作为初始搜索点相比，可以有效减少匹配的次数和时间。
第二，块匹配准则。本发明方法中采用常用的最小绝对差匹配准则2个图像块比较，相应的像素点两两求差的绝对值，它们的平均值就是最小绝对差匹配准则所求的值。公式如下：

{MAD}_{(Δp, Δq)} = (1 / MN) Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + Δp, n + Δq) |

(11)
M，N是图像块的长和宽，fk(m，n)是指在k帧中(m，n)处像素点的像素值，其中(Δp，Δq)为位移矢量；MAD(Δp，Δq)的最小值是最优匹配点。
第三，搜索策略。使用的是菱形搜索算法(Diamond Search，DS)。采用了两种模板，即9个检测点的大模板LDSP(Large Diamond Search Pattern)和5个检测点的小模板SDSP(Small Diamond Search Pattern)。首先，搜索时先采用大模板对搜索中心点周围的9个点进行匹配运算，就是把以这9个点为中心的9个图像块分别和上一帧相应控制点为中心的图像块计算MAD(Δp，Δq)，当最小块误差点即为中心点时，则自动转换为小模板搜索策略，对中心点周围其他5个点进行匹配运算，5 点中的最优匹配点即为所求点。如果在采用大模板搜索时，最优点不在中心点时，那么就以该最优点为中心点重新采用大模板进行搜索，直到最优匹配点为中心点时，再转换为小模板搜索，最终找到最优匹配点。
对于匹配结果，由于控制点是位于物体的边缘部分，这个区域图像灰度值变化大，有利于匹配到正确的结果。并进一步对匹配得到的平均绝对差设定一个门限。当最终搜索到最优匹配点的MAD小于门限时，就认为结果为正确匹配点，把匹配到的点作为控制点的初始位置；反之则认为结果为错误的匹配点，忽略匹配结果，直接把预测位置作为控制点的初始位置。这样既避免了错误匹配造成的影响，又达到了在简单、计算量小条件下较好的预测效果。门限要根据匹配块大小，以及实际图像情况进行调整，图像变化以及噪声剧烈的，门限就要高一点，变化及噪声平稳的就小一点。通常取值为10-20。通过使用本发明方法可以达到图6所示的效果并可以与图3、图4、图5进行比较。

标题	发布/更新时间	阅读量
一种基于形变特征预测电池碰撞后SoH的方法	2020-05-08	245
人体三维建模数据处理方法及装置	2020-05-11	839
基于3D深度摄像头和柔性力敏传感器的跑步机自适应系统	2020-05-16	135
图像篡改取证方法及装置	2020-05-17	583
一种基于光外同轴送粉的变宽度薄壁件激光熔覆成形方法	2020-05-18	631
一种基于渐进式外接球结构的碰撞检测算法	2020-05-08	769
一种基于面部运动单元的三维非真实感表情生成方法	2020-05-11	349
一种形变物体的三维位姿估计方法及定位抓取系统	2020-05-12	600
一种基于手势识别的全息投影装置的工作方法	2020-05-13	725
一种基于升降轨时序InSAR的煤矿区地表形变监测方法	2020-05-16	273

基于运动预测和三维约束的序列图像分割方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：