首页 / 专利库 / 工业自动化和数控机床 / 坐标系 / 一种智能视频监控的三维重建方法

一种智能视频监控的三维重建方法

阅读:613发布:2023-01-30

专利汇可以提供一种智能视频监控的三维重建方法专利检索,专利查询,专利分析的服务。并且一种智能视频监控的 三维重建 方法,包括以下步骤:摄像头标定,采用直接线性法进行深度摄像头标定,获取变换矩阵M;依据透视矩阵M,计算出摄像点的 位置 坐标;依据立体几何中的等比三 角 形理论,生成三维轮廓高程图,构建一个世界 坐标系 中的三维点集。本 发明 提高了智能 监控系统 的性能,能够准确的获取监控范围内的三维高程信息,而且计算速度快。,下面是一种智能视频监控的三维重建方法专利的具体信息内容。

1.一种智能视频监控的三维重建方法,其特征在于,包括以下步骤:
(1):摄像头标定,采用直接线性法进行深度摄像头标定,获取变换矩阵M;
(2):依据透视矩阵M,以及图像坐标系中的坐标u,v,计算u,v方向视线与平面的交点,如下:
整理得到如下二元一次方程:
给出了u,v,zw=0,就通过上述方程的求解,得到世界坐标系中的xw,yw;
(3):遍历所有u,v,计算出xw,yw后形成两个矩阵Xu,v,Yu,v,并计算出Xu,v,Yu,v,0距离
2 2 2
摄像机的距离distance(u,v)=sqrt((xu,v-xc)+(yu,v-yc)+(Hc)),其中xc,yc,Hc表示摄像机的位置坐标;
(4):依据立体几何中的等比三形理论,计算深度图像中图像点u,v对应真实世界中的坐标,通过深度摄像机采集得到像素点u,v的深度信息depth(u,v),设深度信息与同一像素点地面投影点距离之间的比值为 那么实际上该图像点所对
应的点在三维空间中的坐标由立体几何可计算为:
xw=(xu,v-xc).ratio(u,v)+xc;
yw=(yu,v-yc).ratio(u,v)+yc
Hw=(1-ratio(u,v)).Hc
(5):生成三维轮廓高程图,首先初始化一幅高程图IL×W=0,大小为房间的长度L和宽度W;对深度图像的u,v点依据第四步计算xw,yw,zw,在轮廓高程图中将位置为xw,yw处进行更新赋值,I(xw,yw)=max(I(xw,yw),zw),然后逐点遍历深度图像,即可生成整个监控场景中的依逐点将深度图像中各点都做步骤四的变换,就可以构建一个世界坐标系中的三维点集。

说明书全文

一种智能视频监控的三维重建方法

技术领域

[0001] 本发明涉及一种基于一种智能视频监控的三维重建方法。

背景技术

[0002] 三维重建的定义利用计算机对三维物体进行虚拟表示,并进一步分析各种性能或者特性的关键。粗略可以分为两类,第一类是人工通过计算机软件进行三维几何建模,比如借助于CAD、3DMAX等计算机图形软件进行实现。另一种则是利用获取的低维信号,经过处理表示成具有一定三维空间位置信息的图形或者图像,借助于各种深度回复算法,比如双目视觉,多目视觉等重建三位空间信息。本发明针对的是第二种三维重建方法。
[0003] 传统的成像的过程中,都是将三维空间中的信息映射到二维空间中,因而丢失了距离深度信息,如果需要从二位空间恢复出三维空间的信息,必须要在得到二维的方位信息的同时得到距离信息,才能够准确的回复三维信息。双目立体视觉(binocular stereo vision)是当前采用最多的一种三维重建方法,主要利用摄像头在不同位置处对同一个场景中物体进行观测时产生的视差进行深度信息的恢复,但是双目立体视觉也还存在着许多问题,例如同名点的查找与匹配是整个双目视觉的关键,也是难点,另外双目视觉还面临着计算速度和精度之间的问题,需要专硬件进行加速计算。
[0004] 本发明提出一种依据深度摄像头的三维重建方法,深度摄像头包括但不限于PS公司所设计开发的一系列基于机构光编码技术的深度摄像头。该技术能够准确的获取监控范围内的三维高程信息,而且计算速度快。

发明内容

[0005] 本发明所解决的技术问题在于提供一种基于一种智能视频监控的三维重建方法,以解决上述背景技术中的缺点。
[0006] 一种智能视频监控的三维重建方法,包括以下步骤:
[0007] 本发明基于深度摄像头获取的深度图像,利用计算机进行处理得到监控场景中的三维轮廓的高程图,为了详细的介绍本发明的内容,下面对一些概念进行阐述或者定义:
[0008] 定义一:摄像头标定;摄像头的标定是为了获取摄像头图像坐标u,v与世界坐标系中XwYwZw的映射关系,经过标定的摄像头含有更多关于场景以及图像的信息,能够有助于后续进行三维轮廓的重建。
[0009] 定义二:透视成像模型;三维空间物体到像平面的投影关系,即为透视成像模型。理想的透视成像模型是小孔成像模型,英文为pin-hole image model。将理想情况下三维空间往二维空间中的映射看作是如下的一个透视线性变换:
[0010]
[0011] 其中xw,yw,zw为世界坐标系中的坐标,u,v为图像坐标,mij是透视矩阵的元素,Zc为摄像机坐标系中的Z坐标。
[0012] 定义三:透视成像变换矩阵;即透视成像模型中的转换矩阵M,记为
[0013]
[0014] 定义四:直接线性变换摄像头标定法;直接线性变换法(DLT)求解三维标定的过程最早由Abdel-Azizh和Karara于1971年提出,依据透视成像模型,要求得图像坐标系中的u,v需要消去Zc,每个点都可以得到两个方程:
[0015] m11Xw+m12Xw+m13Xw+m14-uXwm31-uYwm32-uZwm33=um34
[0016] m21Xw+m22Xw+m23Xw+m24-vXwm31-vYwm32-vZwm33=vm34 (0.2)
[0017] 利用多个点可以得到如下线性方程组
[0018]
[0019] 要求解的矩阵一共有12个未知数,不失一般性,首先设m34=1,通过选取六个点,建立12个方程可以求出透视矩阵的11个参数[m′11 m′12 m′13 m′14 m′21 m′22 m′23 m′24 m′31 m′32 m′33],变为:
[0020] 但是实际计算中由于选取点的位置有些许误差,可以采用选取多余六个点的方式,构建超定方程,将最小二乘解作为透视矩阵的变换系数,另外由于实际透视举证中第三行中的元素需要满足那么需要将矩阵进行一下变换 然后将m34
乘以M′可以得到M矩阵。
[0021] 直接线性法的优点是无需迭代,速度较快,缺点是没有考虑摄像头的系统误差,不能够进行系统误差的纠正,另外它也不能够消除镜头的相差,因而标定精度一般。
[0022] 定义五:深度图像,深度图像是指由深度摄像头获取并携带有场景与摄像头距离信息的图像,包括但不限于结构光编码技术等主动测量手段得到的深度图像。
[0023] 定义六:高程图,是本发明经过信号处理步骤得到的,反映的物理属性是监控场景内每个位置处最高点处的高度值,图像坐标表示的是真实世界中的位置,图像值是位置处的高度值。
[0024] 基于一种智能视频监控的三维重建方法包括如下步骤:
[0025] 第一步:摄像头标定,采用直接线性法进行深度摄像头标定,获取变换矩阵M;
[0026] 第二步:依据透视矩阵M,以及图像坐标系中的坐标u,v,计算u,v方向视线与平面的交点,如下:
[0027]
[0028] 整理得到如下二元一次方程:
[0029]
[0030] 给出了u,v,zw=0,就通过上述方程的求解,得到世界坐标系中的xw,yw;
[0031] 第三步:遍历所有u,v,计算出xw,yw后形成两个矩阵Xu,v,Yu,v,并计算出Xu,v,Yu,v,0距离摄像机的距离distance(u,v)=sqrt((xu,v-xc)2+(yu,v-yc)2+(Hc)2),其中xc,yc,Hc表示摄像机的位置坐标;
[0032] 第四步:依据立体几何中的等比三形理论,计算深度图像中图像点u,v对应真实世界中的坐标,通过深度摄像机采集得到像素点u,v的深度信息depth(u,v),设深度信息与同一像素点地面投影点距离之间的比值为 那么实际上该图像点所对应的点在三维空间中的坐标由立体几何可计算为:
[0033] xw=(xu,v-xc).ratio(u,v)+xc;
[0034] yw=(yu,v-yc).ratio(u,v)+yc
[0035] Hw=(1-ratio(u,v)).Hc
[0036] 第五步:生成三维轮廓高程图,首先初始化一幅高程图IL×W=0,大小为房间的长度L和宽度W;对深度图像的u,v点依据第四步计算xw,yw,zw,在轮廓高程图中将位置为xw,yw处进行更新赋值,I(xw,yw)=max(I(xw,yw),zw),然后逐点遍历深度图像,即可生成整个监控场景中的依逐点将深度图像中各点都做步骤四的变换,就可以构建一个世界坐标系中的三维点集。
[0037] 有益效果:
[0038] 本发明提高了智能监控系统的性能,能够准确的获取监控范围内的三维高程信息,而且计算速度快。附图说明
[0039] 图1为本发明的三维轮廓重建的流程;
[0040] 图2为三维坐标回复示意图

具体实施方式

[0041] 为了使本发明的技术手段、创作特征、工作流程、使用方法达成目的与功效易于明白了解,下面结合具体实施例,进一步阐述本发明。
[0042] 定义一:摄像头标定;
[0043] 定义二:透视成像模型,将理想情况下三维空间往二维空间中的映射看作是如下的一个透视线性变换:
[0044]
[0045] 定义三:透视成像变换矩阵;即透视成像模型中的转换矩阵M,记为
[0046]
[0047] 定义四:直接线性变换摄像头标定法,依据透视成像模型,要求得图像坐标系中的u,v需要消去Zc,每个点都可以得到两个方程:
[0048] m11Xw+m12Xw+m13Xw+m14-uXwm31-uYwm32-uZwm33=um34
[0049] m21Xw+m22Xw+m23Xw+m24-vXwm31-vYwm32-vZwm33=vm34利用多个点可以得到如下线性方程组:
[0050]
[0051] 要求解的矩阵一共有12个未知数,不失一般性,首先设m34=1,通过选取六个点,建立12个方程可以求出透视矩阵的11个参数[m′11 m′12 m′13 m′14 m′21 m′22 m′23 m′24 m′31 m′32 m′33],变为:
[0052] 实 际 计 算中由于选取点的位置有些许误差,可以采用选取多余六个点的方式,构建超定方程,将最小二乘解作为透视矩阵的变换系数,另外由于实际透视举证中第三行中的元素需要满足那么需要将矩阵进行一下变换 然后将
m34乘以M′可以得到M矩阵;
[0053] 基于一种智能视频监控的三维重建方法包括如下步骤:
[0054] 第一步:摄像头标定,采用直接线性法进行深度摄像头标定,获取变换矩阵M;
[0055] 第二步:依据透视矩阵M,以及图像坐标系中的坐标u,v,计算u,v方向视线与水平面的交点,如下:
[0056]
[0057] 整理得到如下二元一次方程:
[0058]
[0059] 给出了u,v,zw=0,就通过上述方程的求解,得到世界坐标系中的xw,yw;
[0060] 第三步:遍历所有u,v,计算出xw,yw后形成两个矩阵Xu,v,Yu,v,并计算出Xu,v,Yu,v,2 2 2
0距离摄像机的距离distance(u,v)=sqrt((xu,v-xc)+(yu,v-yc)+(Hc)),其中xc,yc,Hc表示摄像机的位置坐标;
[0061] 第四步:依据立体几何中的等比三角形理论,计算深度图像中图像点u,v对应真实世界中的坐标,通过深度摄像机采集得到像素点u,v的深度信息depth(u,v),设深度信息与同一像素点地面投影点距离之间的比值为 那么实际上该图像点所对应的点在三维空间中的坐标由立体几何可计算为:
[0062] xw=(xu,v-xc).ratio(u,v)+xc;
[0063] yw=(yu,v-yc).ratio(u,v)+yc
[0064] Hw=(1-ratio(u,v)).Hc
[0065] 第五步:生成三维轮廓高程图,首先初始化一幅高程图IL×W=0,大小为房间的长度L和宽度W;对深度图像的u,v点依据第四步计算xw,yw,zw,在轮廓高程图中将位置为xw,yw处进行更新赋值,I(xw,yw)=max(I(xw,yw),zw),然后逐点遍历深度图像,即可生成整个监控场景中的依逐点将深度图像中各点都做步骤四的变换,就可以构建一个世界坐标系中的三维点集。
[0066] 以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈