首页 / 专利库 / 人工智能 / 进化算法 / 一种基于视觉的水下场景三维点云重建方法及其系统

一种基于视觉的下场景三维点重建方法及其系统

阅读:829发布:2020-05-14

专利汇可以提供一种基于视觉的下场景三维点重建方法及其系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于视觉的 水 下场景三维点 云 重建方法及其系统。该方法包括以下步骤:首先,架设基于视觉的水下场景三维点云重建系统;其次,采集图像数据并进行预处理;再次,确定旋转四元数适应度计算方法;然后,采用改进差分进化 算法 计算最佳旋转四元数;最后,进行场景重建和优化。本发明基于视觉的水下场景三维点云重建系统主要包括两个水下 照相机 、水下LED 光源 、电源线和数据线、 计算机系统 构成、固定装置等部分。本发明提出的基于视觉的水下 三维重建 方法和系统无需在水下设置任何辅助标定部件,与已有基于外部定标物的水下三维重建系统相比操作更加便捷,与已有不采用外部定标物的方法相比具有速度快、收敛性好的优势。,下面是一种基于视觉的下场景三维点重建方法及其系统专利的具体信息内容。

1.一种基于视觉的下场景三维点重建方法,其特征在于,包括以下步骤:
S1、构建基于视觉的水下场景三维点云重建系统;
基于视觉的水下场景三维点云重建系统,包括至于水中的待重建物体、两个水下照相机、水下LED光源计算机系统以及固定装置构成,所述两个水下照相的内部参数均已知,两个水下照相机均由固定装置固定支撑且两个水下照相机均朝向待重建物体安装以确保两个水下照相机能够同时拍摄到待重建物体,两个水下照相机的主光轴之间的夹介于0°~
30°之间,所述待重建物体的外侧设置有用于改善水下场景的光照条件、提高图像的亮度的水下LED光源,两个水下照相机与计算机系统连接,计算机系统用于控制两个水下照相机同步对待重建物体拍摄,完成图像数据同步采集、图像重建和重建结果展示;其中,水下照相机由一个内部参数已知的照相机以及一个防水外壳构成,照相机通过其相机基座固定在防水外壳内部空间的底端,防水外壳的前端面上安装有平面透明玻璃窗口,照相机主光轴方向与平面透明玻璃窗口所在平面垂直,照相机透过平面透明玻璃窗口对待重建物体拍摄;
S2、图像数据采集和预处理
S2.1采用S1中构建的基于视觉的水下场景三维点云重建系统拍摄获取包括待重建物体的水下场景的两幅图像;
S2.2已知两水下照相机的内部参数,根据水下照相机的内部参数对S2.1中获取的两幅图像进行变形矫正移除图像径向变形,记径向矫正后的图像为I1、I2;
S2.3利用仿射不变性图像局部特征提取和匹配方法计算I1和I2的特征点匹配结果,然后根据距离比测试值按照由小到大的顺序对匹配结果排序,选取排名靠前N位的图像特征点匹配对 其中,u1(j)=(u1(j),v1(j))T为图像I1中的特征点坐
2(j) 2(j) 2(j) T 1(j)
标,u =(u ,v ) 为图像I2中与u 对应的特征点坐标,N为不小于64的整数,N越大后续标定过程耗时越长、标定结果也越精确;
S2.4构建水下图像采集系统标定参数集合S={{P1},{P2},{n1},{n2},{D1},{D2}};其中,P1=K1[I|0]为第一个水下照相机的3×4维投影矩阵,P2=K2[R|(t;1)]为第二个水下照相机的3×4维投影矩阵;n1=(0;0;1)为第一个水下照相机的平面透明玻璃窗口所在平面的法向量,n2=R-1(0;0;1)为第二个水下照相机的平面透明玻璃窗口所在平面的法向量,两个水下照相机其平面透明玻璃窗口所在平面的点法式平面方程分别为n1U+D1=0和n2U+D2=0,其中:U表示三维空间点坐标;R为两个相机的3×3维相对旋转矩阵,t为第二个相机与第一个相机的3维相对平移列向量,K1和K2分别为第一个相机和第二个相机的3×3维内部标定矩阵,D1和D2为平面方程中的参数,由平面与原点之间的距离以及平面的法向量共同确定;
S3、确定旋转四元数适应度计算方法
对于任意给定的单位四元数q=(w,x,y,z)T且||q||2=1,按照如下步骤计算其适应度:
S3.1根据单位四元数与旋转矩阵的转换关系,计算q对应的旋转矩阵Rm(q);计算公式如下:
S3.2构建如下全局优化问题Q:
其中,P1=K1[I|0],P2=K2[Rm(q)|(t;1)],n1=(0;0;1), Uj和 均
为3维未知列向量, 指的是三维点 在相机投影矩阵为Pi的相机中的投影的齐次坐标的第三个分量,εj为松弛变量,[Pi]3表示相机投影矩阵Pi的第三行行向量;符号“·”表示向量点积,常系数λ的取值范围是1.5~3.0;ri(j)中j={1,2,…,N},ri(j)的定义如下:
其中,κ为水的折射系数,且
d(P,U,u)的定义如下:
其中:符号[·]k表示矩阵的第k行向量;d(P,U,u)是三个自变量的函数,P,U,u分别为三个自变量的类型,即第一个自变量为相机矩阵,第二个自变量为三维点坐标,第三个自变量为二维图像点坐标,Pi, ui(j)为三个自变量取值;
采用凸优化算法求解上述优化问题计算未知向量
的最优解;
S3.3构建如下局部非线性优化问题:
其中,d′(Pi,ni,Di,Uj,ui(j))取值按如下方式确定:如果εj>0,则d′(Pi,ni,Di,Uj,ui(j))=λ;否则,根据折射相机模型中的前向投影计算方法计算前向投影误差d′(Pi,ni,Di,Uj,ui(j)
);然后,根据S3.2中凸优化问题Q的解X对参数集合Y={S,{U1},{U2},…,{UN}}进行初始化,并采用LM算法求解上述局部非线性优化问题对Y进行优化求精;记优化后的成像系统标定参数集合 并输出单位四元数q的适应度值f(q)=
min E;
S4采用改进的差分进化算法计算最佳旋转四元数,算法中各参数的设置准则如下:种群个数Np不小于30,最大进化代数Gmax不小于50;每个个体的变量个数为4,对应于1个单位四元数;变异尺度FW∈[0,1],交叉率CR∈[0,1];进化终止条件为达到最大进化代数或者最佳适应度收敛;
S4.1初始化;每个个体对应的四元数q=(w,x,y,z)T进行随机初始化;
S4.2变异操作
给定三个被选中的个体编号r0,r1,r2,其中r0≠r1≠r2且1≤r0,r1,r2≤Np,Np为种群个体数量,变异单位四元数按如下公式计算:
其中, 表示 的共轭四元数,FW为变异尺
度,η根据等式 确定,“*”表示四元数乘法;
S4.3交叉操作
为了确保个体对应的4个变量构成单位四元数,对交叉后的试验向量即四元数进行归一化处理;
S4.4适应度计算
采用S3.3中的局部非线性优化方法获得邻域范围内所有单位四元数的最佳适应度值,适应度值越小表示适应度更优,最佳适应度值指的是当前群体中所有个体适应度的最小值;
算法执行完毕后,记最优个体对应的旋转四元数为q*,最终成像系统标定参数集合为S5场景重建及其优化
S5.1利用图像稠密匹配方法计算图像I1与图像I2之间的像素对应关系;
S5.2对于每个像素对应 其中u为图像I1中的图像点,v为图像I2中的图像点,利用折射相机的后向投影计算方法,结合成像系统标定参数集合S*分别计算u和v对应的三维场景光线;然后,计算上述两条光线的公共垂直线段的中点,并将该中点的三维坐标作为对应的场景点三维坐标初始值U;
S5.3对于每个场景点三维坐标初始值U,利用局部非线性优化方法对其初始三维坐标求精,优化过程的目标函数为:
其中,h(I1,I2,U,m)表示图像I1中以U在该图像上的投影为中心、大小为m×m个像素的图像窗口,与图像I2中以U在该图像上的投影为中心、大小为m×m个像素的图像窗口的归一化互相关系数;其中,m的取值范围是5~10个像素,U在各图像上的投影点的计算基于前向投影方法,其中成像系统标定参数集合为S*;
S5.4将所有经过优化的三维点融合为三维点云,并利用点云处理工具过滤孤立点和剔除细小点云片段,获得最终稠密三维重建结果。
2.根据权利要求1所述的基于视觉的水下场景三维点云重建方法,其特征在于,S4.1T
中,每个个体对应的四元数q=(w,x,y,z) 均按照如下方式初始化:
其中,参数α、β、γ为取值范围介于0~2π之间的随机数。
3.根据权利要求1所述的基于视觉的水下场景三维点云重建方法,其特征在于,基于视觉的水下场景三维点云重建系统中,水下LED光源有两个以上,其中至少有两个水下LED光源分布在待重建物体的左右两侧。

说明书全文

一种基于视觉的下场景三维点重建方法及其系统

技术领域

[0001] 本发明属于电子信息学科学领域,特指一种基于视觉的水下场景三维点云重建方法及其系统。

背景技术

[0002] 水下可见光成像和三维重建生物观察、机器人导航、海底可视化等领域具有广泛的应用。典型的水下成像系统中相机通常被放置在具有透明平面玻璃窗口的防水外壳中。由于光线在不同介质中的传播速度不同,因此水下成像过程中光线会在玻璃窗口上发生折射弯曲现象,导致水下图像产生明显的折射变形。研究表明水下折射变形呈现高度非线性且变形大小依赖于场景点的深度,因此水下图像成像过程不能采用传统的透视相机模型来描述。
[0003] 早期的水下三维重建方法直接忽略折射变形,或者采用焦距调节、镜头径向畸变近似方法来补偿折射变形。这类方法本质上采用透视相机模型模型来描述水下成像过程,T.Treibitz等在其论文(T.Treibitz,Y.Y.Schechner,H.Singh,Flat refractive geometry,in:CVPR,2008)中指出这种单视点(single viewpoint,SVP)相机模型会导致较大的相机标定误差。为了更好的补偿折射变形,近年来学者提出采用折射相机模型对折射现象进行显式建模,目前折射相机模型标定和基于折射相机的三维重建方法仍然备受关注,基于图像的三维重建中的许多关键方法仍然并不成熟。
[0004] 大多数已有基于折射相机模型的三维重建方法的局限性在于,这些方法需要采用标定板或者需要辅助硬件设备实现水下成像系统标定。比如:A.Agrawal等在其论文(A.Agrawal,S.Ramalingam,Y.Taguchi,V.Chari,A theory of multi-layer flat refractive geometry,in:CVPR,2012)中提出的水下标定方法需要借助维度已知的平面棋盘格水下标定板实现相机和折射交界面的估计。Y.Chang等在其论文(Y.Chang,T.Chen,Multi-view 3d reconstruction for scenes under the refractive plane with known vertical direction,in:ICCV,2011)中提出的水下相机标定方法需要借助惯性测量单元(inertial measurement unit,IMU)提供相机的旋转数据。T.Yau等提出的方法(T.Yau,M.Gong,Y.-H.Yang,Underwater camera  calibration  using wavelength 
triangulation,in:CVPR,2013)则需要采用一种包含122个LED灯的特殊定制标定设备实现水下相机标定。
[0005] 另一类更加灵活的基于折射相机模型的水下三维标定和重建方法是不需要附加标定物的方法。比如:A.Sedlazeck等在其论文(A.Sedlazeck,R.Koch,Calibration of housing parameters for underwater stereo-camera rigs,in:BMVC,2011)中提出的方法采用集束优化标定包含两个相机的水下成像系统,该方法的局限性在于其运行效率较低,运行时间通常需要达到小时级别。康来等提出的方法(L.Kang,L.Wu,Y.-H.Yang,Two-view underwater structure and motion for cameras under flat refractive interfaces,in:ECCV,2012)采用全局优化方法实现水下相机标定,其缺点在于需要手动选取稀疏匹配特征点集,因此降低了方法执行的自动化程度。
[0006] 综上所述,已有基于视觉的水下三维重建方法分为三类。第一类是简单的忽略折射变形或采用近似模型进行补偿,这类方法容易导致较大的标定误差;第二类是需要借助水下标定板或特殊标定设备实现水下相机标定,这类方法增加人工操作难度;第三类方法依靠集束优化或全局优化实现标定,其缺点在于运行效率低或自动化程度低。发明内容:
[0007] 针对上述现有技术存在的问题,本发明提出一种基于视觉的水下场景三维点云重建方法及其系统。本发明方法基于简化的折射相机模型,采用局部优化和全局优化相结合的方式实现自动化相机标定和水下场景三维点云重建,且本发明方法无需水下标定板和其他标定设备。
[0008] 为解决上述技术问题,本发明的技术方案是:
[0009] 本发明提供了一种基于视觉的水下场景三维点云重建系统,包括至于水中的待重建物体、两个水下照相机、水下LED光源计算机系统以及固定装置构成,所述两个水下照相的内部参数均已知,两个水下照相机均由固定装置固定支撑且两个水下照相机均朝向待重建物体安装以确保两个水下照相机能够同时拍摄到待重建物体,两个水下照相机的主光轴之间的夹角介于0°~30°之间,所述待重建物体的外侧设置有用于改善水下场景的光照条件、提高图像的亮度的水下LED光源,两个水下照相机与计算机系统连接,计算机系统用于控制两个水下照相机同步对待重建物体拍摄,完成图像数据同步采集、图像重建和重建结果展示。
[0010] 本发明所采用的水下照相机由一个内部参数已知的照相机以及一个防水外壳构成,照相机设置在防水外壳内部。具体地,照相机通过其相机基座固定在防水外壳内部空间的底端,防水外壳的前端面上安装有平面透明玻璃窗口,照相机主光轴方向与平面透明玻璃窗口所在平面垂直,照相机透过平面透明玻璃窗口对待重建物体拍摄。
[0011] 本发明中所采用的水下LED光源有两个以上,其中至少有两个水下LED光源分布在待重建物体的左右两侧。
[0012] 本发明还提供了一种基于视觉的水下场景三维点云重建方法,包括以下步骤:
[0013] S1、构建基于视觉的水下场景三维点云重建系统;
[0014] 基于视觉的水下场景三维点云重建系统,包括至于水中的待重建物体、两个水下照相机、水下LED光源、计算机系统以及固定装置构成。所述两个水下照相的内部参数均已知,两个水下照相机均由固定装置固定支撑且两个水下照相机均朝向待重建物体安装以确保两个水下照相机能够同时拍摄到待重建物体。两个水下照相机的主光轴之间的夹角介于0°~30°之间。所述待重建物体的外侧设置有用于改善水下场景的光照条件、提高图像的亮度的水下LED光源。两个水下照相机与计算机系统连接,计算机系统用于控制两个水下照相机同步对待重建物体拍摄,完成图像数据同步采集、图像重建和重建结果展示。其中,水下照相机由一个内部参数已知的照相机以及一个防水外壳构成,照相机通过其相机基座固定在防水外壳内部空间的底端,防水外壳的前端面上安装有平面透明玻璃窗口,照相机主光轴方向与平面透明玻璃窗口所在平面垂直,照相机透过平面透明玻璃窗口对待重建物体拍摄。
[0015] S2、图像数据采集和预处理
[0016] S2.1采用S1中构建的基于视觉的水下场景三维点云重建系统拍摄获取包括待重建物体的水下场景的两幅图像。
[0017] S2.2已知两水下照相机的内部参数,根据水下照相机的内部参数对S2.1中获取的两幅图像进行变形矫正移除图像径向变形,记径向矫正后的图像为
[0018] S2.3利用仿射不变性图像局部特征提取和匹配方法(该方法可以参见文献David G.Lowe,″Distinctive image features from scale-invariant keypoints,″International Journal of Computer Vision,60,2(2004),pp.91-110.)计算 和 的特征点匹配结果,然后根据距离比测试值按照由小到大的顺序对匹配结果排序,选取排名靠前N位的图像特征点匹配对 (j={1,2,…,N})。其中,u1(j)=(u1(j),v1(j))T为图像中的特征点坐标,u2(j)=(u2(j),v2(j))T为图像 中与u1(j)对应的特征点坐标,N为不小于64的整数,N越大后续标定过程耗时越长、标定结果也越精确。
[0019] S2.4构建水下图像采集系统标定参数集合
[0020] S={{P1},{P2},{n1},{n2},{D1},{D2}}。其中,P1=K1[I|0]为第一个水下照相机的3×4维投影矩阵,P2=K2[R|(t;1)]为第二个水下照相机的3×4维投影矩阵;n1=(0;0;1)为第一个水下照相机的平面透明玻璃窗口所在平面的法向量,n2=R-1(0;0;1)为第二个水下照相机的平面透明玻璃窗口所在平面的法向量,两个水下照相机其平面透明玻璃窗口所在平面的点法式平面方程分别为n1U+D1=0和n2U+D2=0,其中:U表示三维空间点坐标;R为两个相机的3×3维相对旋转矩阵,t为第二个相机与第一个相机的3维相对平移列向量,K1和K2分别为第一个相机和第二个相机的3×3维内部标定矩阵,D1和D2为平面方程中的参数,由平面与原点之间的距离以及平面的法向量共同确定。
[0021] S3、确定旋转四元数适应度计算方法
[0022] 对于任意给定的单位四元数q=(w,x,y,z)T且||q||2=1,按照如下步骤计算其适应度:
[0023] S3.1根据单位四元数与旋转矩阵的转换关系,计算q对应的旋转矩阵Rm(q);计算公式如下:
[0024]
[0025] S3.2构建如下全局优化问题Q:
[0026]
[0027]
[0028]
[0029]
[0030]
[0031]
[0032] 其中,P1=K1[I|0],P2=K2[Rm(q)|(t;1)],n1=(0;0;1), Uj和均为3维未知列向量, 指的是三维点 在相机投影矩阵为Pi的相机中的
投影的齐次坐标的第三个分量,εj为松弛变量,[Pi]3表示相机投影矩阵Pi的第三行行向量;
符号“·”表示向量点积,常系数λ的取值范围是1.5~3.0。ri(j)中j={1,2,…,N},ri(j)的定义如下:
[0033]
[0034] 其中,κ为水的折射系数,且
[0035]
[0036] d(P,U,u)的定义如下:
[0037]
[0038] 其中:符号[·]k表示矩阵的第k行向量;d(P,U,u)是三个自变量的函数,P,U,u分别为三个自变量的类型,即第一个自变量为相机矩阵,第二个自变量为三维点坐标,第三个自变量为二维图像点坐标,Pi, ui(j)为三个自变量取值。采用凸优化算法(convex optimization)求解上述优化问题计算未知向量
[0039] 的最优解。
[0040] S3.3构建如下局部非线性优化问题:
[0041]
[0042] 其中,E为目标函数的代号,
[0043] d′(Pi,ni,Di,Uj,ui(j))取值按如下方式确定:如果εj>0,则d′(Pi,ni,Di,Uj,ui(j))=λ。否则,根据现有折射相机模型中的前向投影计算方法(参见文献:A.Agrawal,S.Ramalingam,Y.Taguchi,V.Chari,A theory of multi-layer flat refractive 
geometry,in:CVPR,2012)计算前向投影误差d′(Pi,ni,Di,Uj,ui(j))。然后,根据S3.2中凸优化问题Q的解X对参数集合Y={S,{U1},{U2},…,{UN}}进行初始化,并采用LM算法求解上述局部非线性优化问题对Y进行优化求精;记优化后的成像系统标定参数集合
并输出单位四元数q的适应度值f(q)=minE。
[0044] S4采用改进的差分进化算法计算最佳旋转四元数,算法中各参数的设置准则如下:种群个数Np不小于30,最大进化代数Gmax不小于50。每个个体的变量个数为4,对应于1个单位四元数。变异尺度FW∈[0,1],交叉率CR∈[0,1];进化终止条件为达到最大进化代数或者最佳适应度收敛。
[0045] 本发明采用的差分进化算法中,每个个体对应一个单位四元数。个体的适应度值采用步骤三中所述方法计算,适应度值越小表示适应度更优。
[0046] S4.1初始化;每个个体对应的四元数q=(w,x,y,z)T进行随机初始化。
[0047] S4.2变异操作
[0048] 给定三个被选中的个体编号r0,r1,r2,其中r0≠r1≠r2且1≤r0,r1,r2≤Np,Np为种群个体数量,变异单位四元数按如下公式计算:
[0049]
[0050] 其中, 表示 的共轭四元数,FW为变异尺度,η根据等式 确定,“*”表示四元数乘法。
[0051] S4.3交叉操作
[0052] 为了确保个体对应的4个变量构成单位四元数,对交叉后的试验向量即四元数进行归一化处理(即将四元数的每个分量都乘以一个相同的尺度因子,确保各分量的平方和为1)。
[0053] S4.4适应度计算
[0054] 采用S3.3中的局部非线性优化方法获得邻域范围内所有单位四元数的最佳适应度值,适应度值越小表示适应度更优,最佳适应度值指的是当前群体中所有个体适应度的最小值。
[0055] 算法执行完毕后,记最优个体对应的旋转四元数为q*,最终成像系统标定参数集合为
[0056] S5场景重建及其优化
[0057] S5.1利用已有的图像稠密匹配方法(参见文献C.Liu.Beyond Pixels:Exploring New Representations and Applications for Motion Analysis.Doctoral Thesis.Massachusetts Institute of Technology.May 2009.)计算图像 与图像 之间的像素对应关系。
[0058] S5.2对于每个像素对应 其中u为图像 中的图像点,v为图像 中的图像点,利用折射相机的后向投影计算方法(参见文献:Chang,Y.,Chen,T.:Multi-view 3d reconstruction for scenes under the refractive plane with known vertical 
direction.In:ICCV(2011)),结合成像系统标定参数集合S*分别计算u和v对应的三维场景光线;然后,计算上述两条光线的公共垂直线段的中点,并将该中点的三维坐标作为
对应的场景点三维坐标初始值U。
[0059] S5.3对于每个场景点三维坐标初始值U,利用局部非线性优化方法对其初始三维坐标求精,优化过程的目标函数为:
[0060]
[0061] 其中, 表示图像 中以U在该图像上的投影为中心、大小为m×m个像素的图像窗口,与图像 中以U在该图像上的投影为中心、大小为m×m个像素的图像窗口的归一化互相关系数;其中,m的取值范围是5~10个像素,U在各图像上的投影点的计算基于前向投影方法(参见文献Chang,Y.,Chen,T.:Multi-view 3d reconstruction for scenes under the refractive plane with known vertical direction.In:ICCV(2011)),其中成像系统标定参数集合为S*。
[0062] S5.4将所有经过优化的三维点融合为三维点云,并利用点云处理工具过滤孤立点和剔除细小点云片段,获得最终稠密三维重建结果。
[0063] 已有水下场景三维重建方法要么需要借助水下标定板、方向感知设备或者特殊标定装置,要么需要通过耗时的局部优化实现水下相机和防水外壳玻璃窗口的标定,要么需要手动挑选图像稀疏特征点匹配集进行全局优化。
[0064] 本发明提出的基于视觉的水下三维重建方法和系统采用局部优化和全局优化相结合的方式实现水下成像系统标定。本发明基于简化的折射相机模型,在无需任何附加水下标识物或特殊标定设备的条件下,利用计算机视觉方法根据两幅水下图像对水下照相机及其防水外壳的玻璃窗口自动进行标定,显式的补偿光线折射对图像三维重建的不利影响,在此基础上计算水下场景的三维点云结构。与已有基于外部定标物的水下三维重建系统相比操作更加便捷,与已有不采用外部定标物的方法相比具有速度快、收敛性好的优势。附图说明:
[0065] 图1是本发明一种基于视觉的水下场景三维点云重建方法的流程图
[0066] 图2是本发明一种基于视觉的水下场景三维点云重建系统的结构示意图;
[0067] 图3是本发明一种水下照相机的结构示意图;
[0068] 图4是本发明三维点云重建系统成像原理示意图;
[0069] 图5是本发明采用非线性局部优化方法搜索最佳旋转四元数的过程图;
[0070] 图6是本发明采用非线性局部优化方法搜索最佳旋转四元数的收敛图
[0071] 图7是本发明实施例部分测试水下图像样张。其中图7(a)对应的照相机主光轴方向与玻璃窗口所在平面近似垂直,图7(b)对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为20°,图7(c)为图7(a)和图7(b)叠加的结果。
[0072] 图8为采用不同方法的水下点云重建结果示例;其中图8(a)、8(b)、8(c)、8(d)为不进行折射补偿的重建模型从不同角度观察的结果,图8(e)、8(f)、8(g)、8(h)为本发明方法的测试结果。
[0073] 图9为采用本发明方法在不同测试数据上的测试结果示例。其中,图9(a)、9(b)采用的水下图像对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为5°,图9(c)、9(d)采用的水下图像对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为10°,图9(e)、9(f)采用的水下图像对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为
20°。
具体实施方式:
[0074] 结合附图对本发明做进一步详细说明。
[0075] 本发明提供了一种基于视觉的水下场景三维点云重建方法及其系统。
[0076] 如图1所示,本发明一种基于视觉的水下场景三维点云重建方法包含如下五个步骤:架设基于视觉的水下场景三维点云重建系统;采集图像数据并进行预处理;确定旋转四元数适应度计算方法;采用改进差分进化算法计算最佳旋转四元数;以及场景重建和优化。
[0077] 第一步,架设基于视觉的水下场景三维点云重建系统。
[0078] 本发明基于视觉的水下场景三维点云重建系统结构示意图如图2所示。系统由两个水下照相机(即1#水下照相机1和2#水下照相机2)、两个水下LED光源(1#水下LED光源3和2#水下LED光源4)、计算机系统(包括计算机5和显示器6)、固定装置7构成。水下照相机(1和
2)和待重建物体8均置于水面9以下。所述两个水下照相的内部参数均已知,两个水下照相机均由固定装置7固定支撑且两个水下照相机均朝向待重建物体8安装以确保两个水下照相机能够同时拍摄到待重建物体8,两个水下照相机的主光轴之间的夹角介于0°~30°之间。所述待重建物体8的外侧设置有用于改善水下场景的光照条件、提高图像的亮度的水下LED光源,本实施例中两个水下LED光源分布在待重建物体的左右两侧。两个水下照相机与计算机系统连接,计算机系统用于控制两个水下照相机同步对待重建物体拍摄,完成图像数据同步采集、图像重建和重建结果展示。
[0079] 参照图3,本实施例中的水下照相机由一个内部参数已知的照相机10以及一个防水外壳12构成,照相机10通过其相机基座13固定在防水外壳12内部空间的底端,防水外壳12的前端面上安装有平面透明玻璃窗口11,照相机主光轴方向与平面透明玻璃窗口11所在平面垂直,照相机10透过平面透明玻璃窗口11对待重建物体拍摄。平面透明玻璃窗口在确保防水外壳在水下不至破损的条件下尽可能减少其玻璃厚度。两个水下照相机均朝向待重建水下场景安装,两个相机的主光轴之间的夹角介于0°~30°。
[0080] 第二步,图像数据采集和预处理
[0081] 1)数据采集需要采用上述系统拍摄获取待重建水下场景两幅图像,然后进行后续的数据预处理操作。
[0082] 2)已知两水下照相机的内部参数,根据相机的内部参数对获取的两幅图像进行变形矫正移除图像径向变形,记径向矫正后的图像为 图像径向变形矫正采用Hartley R和Zisserman A(参考文献:Hartley R,Zisserman A.Multiple view geometry in 
computer vision[M].2nd ed.Cambridge University Press,2004:189-193)提出的方法;
[0083] 3)利用仿射不变性图像局部特征提取和匹配方法(该方法可以参见文献David G.Lowe,″Distinctive image features from scale-invariant keypoints,″
International Journal of Computer Vision,60,2(2004),pp.91-110.)计算 和 的特征点匹配结果,然后根据距离比测试值按照由小到大的顺序对匹配结果排序,选取排名靠前N位的图像特征点匹配对 (j={1,2,…,N})。其中,u1(j)=(u1(j),v1(j))T为图像
2(j) 2(j) 2(j) T l(j)
中的特征点坐标,u =(u ,v )为图像 中与u 对应的特征点坐标。N为不小于64
的整数,N越大后续标定过程耗时越长、标定结果也越精确。本实施例中,N取64。
[0084] 4)构建水下图像采集系统标定参数集合S={{P1},{P2},{n1},{n2},{D1},{D2}}。其中,其中,P1=K1[I|0]为第一个相机的3×4维投影矩阵,P2=K2[R|(t;1)]为第二个相机的3×4维投影矩阵;n1=(0;0;1)为第一个水下相机玻璃窗口所在平面的法向量,n2=R-1(0;0;1)为第二个水下相机玻璃窗口所在平面的法向量,两个水下相机玻璃窗口所在平面的点法式平面方程分别为n1U+D1=0和n2U+D2=0(U表示三维空间点坐标);R为两个相机的3×3维相对旋转矩阵,t为第二个相机与第一个相机的3维相对平移列向量,K1和K2分别为第一个相机和第二个相机的3×3维内部标定矩阵。水下图像采集系统成像过程几何模型示意图如图
4所示。
[0085] 第三步,确定旋转四元数适应度计算方法
[0086] 对于任意给定单位四元数q=(w,x,y,z)T(||q||2=1),适应度值的计算方法包含如下四步:
[0087] 1)根据单位四元数与旋转矩阵的转换关系,按照如下公式计算q对应的旋转矩阵:
[0088]
[0089] 2)构建如下全局优化问题Q:
[0090]
[0091]
[0092]
[0093]
[0094]
[0095]
[0096] 其中,P1=K1[I|0],P2=K2[Rm(q)|(t;1)],n1=(0;0;1), Uj和均为3维未知列向量。符号“·”表示向量点积,常系数λ的取值范围是1.5~3.0。ri(j)(j={1,2,…,N})的定义如下:
[0097]
[0098] 其中,κ为水(或者其他透明液体)的折射系数,且
[0099]
[0100] d(P,U,u)的定义如下:
[0101]
[0102] 符号[·]k表示矩阵的第k行向量。采用凸优化(convex optimization)算法求解上述优化问题计算未知向量
[0103] 的最优解。
[0104] 3)构建如下局部非线性优化问题:
[0105]
[0106] 其中,d′(Pi,ni,Di,Uj,ui(j))取值按如下方式确定:如果εj>0,则d′(Pi,ni,Di,Uj,ui(j))=λ;否则,根据现有折射相机模型中的前向投影(forward projection)计算方法(参见A.Agrawal,S.Ramalingam,Y.Taguchi,V.Chari,A theory of multi-layer flat 
refractive geometry,in:CVPR,2012)计算前向投影误差d′(Pi,ni,Di,Uj,ui(j))。然后,根据凸优化问题Q的解X对参数集合Y={S,{U1},{U2},…,{UN}}进行初始化,并采用LM算法求解上述局部非线性优化问题对Y进行优化求精。记优化后的成像系统标定参数集合
并输出单位四元数q的适应度值f(q)=min E。
[0107] 第四步,采用改进差分进化算法计算最佳旋转四元数
[0108] 本发明采用的差分进化算法中,每个个体对应一个单位四元数。个体的适应度值采用步骤三中所述方法计算,适应度值越小表示适应度更优。
[0109] 1)初始化。每个个体对应的四元数q=(w,x,y,z)T均按照如下方式初始化:
[0110]
[0111] 其中,参数α、β、γ为取值范围介于0~2π之间的随机数;
[0112] 2)变异操作。给定三个被选中的个体编号r0,r1,r2(r0≠r1≠r2且1≤r0,r1,r2≤Np,Np为种群个体数量),变异单位四元数按如下公式计算:
[0113]
[0114] 其中, 表示 的共轭四元数,FW为变异尺度,η根据等式 确定,“*”表示四元数乘法;
[0115] 3)交叉操作。为了确保个体对应的4个变量构成单位四元数,对交叉后的试验向量进行归一化处理;
[0116] 4)适应度计算。采用S3.3中的局部非线性优化方法获得邻域范围内所有单位四元数的最佳适应度值。适应度值越小表示适应度更优,最佳适应度值指的是当前群体中所有个体适应度的最小值。
[0117] 上述改进差分进化算法各参数的设置准则如下:种群个数Np取30,最大进化代数Gmax取40,每个个体的变量个数为4,对应于1个单位四元数。变异尺度FW∈[0,1],交叉率CR∈[0,1]。进化终止条件为达到最大进化代数或者最佳适应度收敛。
[0118] 改进差分进化算法执行完毕后,记最优个体对应的旋转四元数为q*,最终成像系统标定参数集合为
[0119] 根据上述改进进化优化方法搜索最佳旋转四元数的一个示例过程如图5所示,该图对适应度值与四元数y、w切面的关系进行了可视化。从图中可以看出,上述搜索过程通过结合非线性局部数值优化和全局进化迭代优化,将最佳四元数搜索问题转换为了在离散极值点之间的比较和搜索过程。图6为本发明改进化优化方法搜索最佳旋转四元数的收敛图示例,统计数据基于50次独立运行,所有运行实例均在20次迭代左右开始逐渐收敛。
[0120] 第五步,场景重建及其优化
[0121] 场景三维稠密点云重建和优化包含如下四个步骤。
[0122] 1)利用已有图像稠密匹配方法计算图像 与图像 之间的像素对应关系;
[0123] 2)对于每个像素对应 (其中u为 中的图像点,v为 中的图像点),利用折射相机的后向投影(back projection)计算方法(参见Chang,Y.,Chen.T.:Multi-view 3d reconstruction for scenes under the refractive plane with known vertical 
direction.In:ICCV(2011)),结合成像系统标定参数集合S*分别计算u和v对应的三维场景光线。然后,计算上述两条光线的公共垂直线段的中点,并将该点的三维坐标作为 对应的场景点三维坐标初始值U;
[0124] 3)对于每个场景点三维坐标初始值U,利用局部非线性优化方法对其初始三维坐标求精,优化过程的目标函数为:
[0125]
[0126] 其中, 表示图像 中以U在该图像上的投影为中心、大小为m×m个像素的图像窗口,与图像 中以U在该图像上的投影为中心、大小为m×m个像素的图像窗口的归一化互相关系数(normalized cross correlation,NCC)。其中,m的取值范围是5~10个像素,U在各图像上的投影点的计算基于前向投影(forward projection)方法(参见
A.Agrawal,S.Ramalingam,Y.Taguchi,V.Chari,A theory of multi-layer flat 
refractive geometry,in:CVPR,2012),其中成像系统标定参数集合为S*;
[0127] 4)将所有经过优化的三维点融合为三维点云,并利用MeshLab等点云处理工具过滤孤立点和剔除细小点云片段,获得最终稠密三维重建结果。
[0128] 图7展示了部分测试水下图像样张。其中图7(a)对应的照相机主光轴方向与玻璃窗口所在平面近似垂直,图7(b)对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为20°,图7(c)为图7(a)和图7(b)叠加的结果。从图中可以清楚的观察到折射变形现象。
[0129] 图8为采用不同方法的水下点云重建结果示例。该示例采用的水下图像对应的照相机主光轴方向与玻璃窗口所在平面近似垂直。其中,图8(a)、8(b)、8(c)、8(d)为不进行折射补偿的重建模型从不同角度观察的结果,图8(e)、8(f)、8(g)、8(h)为本发明方法的测试结果。通过将重建模型与参考模型对齐比较可以看出,若不进行折射补偿折射变形,基于图像的三维重建会产生明显变形,而本发明方法能有效提升水下三维重建质量
[0130] 图9为采用本发明方法在不同测试数据上的测试结果示例。其中,图9(a)、9(b)采用的水下图像对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为5°,图9(c)、9(d)采用的水下图像对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为10°,图9(e)、9(f)采用的水下图像对应的照相机主光轴方向与玻璃窗口所在平面法向量夹角约为
20°。从图中可以看出(比如:线框标识的部位),随着主光轴与玻璃窗口所在平面法向量夹角增加,本发明重建质量略有下降。因此,实际使用过程中,应尽量相机主光轴与玻璃窗口所在平面应尽可能保持垂直。
[0131] 以上实施例仅起到解释本发明技术方案的作用,本发明所要求的保护范围并不局限于上述实施例所述的实现系统和具体实施步骤。因此,仅对上述实施例中具体的公式及算法进行简单替换,但其实质内容仍与本发明所述方法相一致的技术方案,均应属于本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈