专利汇可以提供一种基于深度学习的单帧图像三维重建装置及方法专利检索,专利查询,专利分析的服务。并且基于 深度学习 的单 帧 图像 三维重建 装置和方法,包括上位机、 支撑 框架 及其顶部的高清相机,围绕高清相机等高设置三个呈120度的平行光LED面 光源 。方法包括拍摄训练样本,将红绿蓝灯同时照射下的图像作为训练模型所需的输入数据,将白光依次照射下的三张图像取灰度值,转变为单通道图像作为训练模型用的真值,利用深度学习方法和输入的数据,构建用于单帧图像三维重建的逐 像素 的全连接网络模型,训练模型,利用反向传播 算法 不断调整优化网络参数,预测目标表面三维信息,将用网络预测的结果采用光度立体算法三维重建,得到物体表面三维信息。本 发明 通过改进网络的结构,构建适合单帧图像三维重建的网络模型,较多帧图像三维重建增加了应用场景。,下面是一种基于深度学习的单帧图像三维重建装置及方法专利的具体信息内容。
1.基于深度学习的单帧图像三维重建装置,包括上位机,其特征在于还包括一个支撑框架(1),支撑框架顶部设有一个高清相机(2),围绕高清相机(2)设有三个平行光LED面光源(3),高清相机(2)与各个平行光LED面光源(3)位于同一水平面,三个平行光LED面光源(3)至高清相机(2)的距离相等,每个平行光LED面光源(3)与高清相机(2)及其邻近的平行光LED面光源(3)呈120度夹角,三个平行光LED面光源(3)分别为白红、白绿、白蓝光源;所述高清相机(2)与所述上位机相连。
2.如权利要求1所述的基于深度学习的单帧图像三维重建装置,其特征在于所述支撑框架(1)为一个圆柱体形框架,其顶部中心固定一个高清相机(2),在圆柱框架顶部每隔120度装有一个平行光LED面光源(3)。
3.基于深度学习的单帧图像三维重建方法,其特征在于包括以下步骤:
1)将待拍摄物体放置在高清相机正下方,在与高清相机同一水平面上,围绕高清相机设置三个平行光LED面光源,每个平行光LED面光源至高清相机的距离相等,每个平行光LED面光源与高清相机及其邻近的平行光LED面光源呈120度夹角,三个平行光LED面光源分别为白红、白绿、白蓝光源;
2)利用高清相机和平行光LED面光源拍摄n组训练样本,对于每一组训练样本,都包含一张红绿蓝灯同时照射下的物体图像和三个白灯依次开启的状态下拍摄的三张物体图像;
拍摄时,保持物体静止,每拍摄一组训练样本,将物体旋转1-10度再进行下一组训练样本的拍摄,待第一种待拍摄物体旋转完一圈后,更换一下一种物体;n为不低于100的自然数;
3)对所拍摄图像进行预处理:对于上步获得得每组训练样本,取其中心m×m像素大小的图像块;将截取后的白光依次照射下的三张图像取灰度值,转变为单通道图像;所述m取值100-600;
对以上处理后的图像进行归一化操作,将红绿蓝光同时照射下得图像的每一通道像素值范围由0到255归一化至0到1,成为m×m×3大小的矩阵;将白光依次照射下的三张单通道灰度图像的像素值由0到255归一化至0到1,将归一化后三张白光依次照射下的图像数据在第三维上拼接,成为m×m×3大小的矩阵;将以上两个矩阵数据重塑成两个m2×3大小的矩阵Y和W;
对所有训练样本做同样处理操作,并将所有样本处理后所得的Y和W在第一维上拼接,如果有n个训练样本组,那么拼接后得到的矩阵Yz和Wz的大小为(nm2)×3,Yz作为训练模型所需的输入数据Wz作为训练模型所需的真值;
4)利用深度学习的方法,根据输入的数据,构建一个适用于单帧图像三维重建的逐像素的全连接网络模型:
全连接网络的结构模型由11个层组成,包括输入层,输出层,和9个隐藏层,每一层都囊括需要训练的权值参数;输入层为矩阵Yz一行的3个值,输出层为矩阵Wz中对应行的3个值,输入层中的输出节点数量为2048;隐藏层1的输入节点数量为2048,输出节点数量为2045;
隐藏层2至隐藏层8的输入节点数量均为2045,输出节点数量为2048;隐藏层9的输入节点数量为2048,输出节点数量为3;输出层的输入节点数量为3;在隐藏层2至隐藏层8中,重复加入了与输入层相同的数据,以减少输出层数据的过度融合并防止训练时的退化和梯度消失;
5)训练模型,初始化网络参数,利用反向传播算法不断调整优化网络参数:
通过计算相对偏差REL作为损失函数,利用损失量最小化来控制训练过程,并使其在恰当的时刻停止训练,以达到最优效果,选择当相对偏差REL小于2%时,即认为训练已经达到最有效果;
上述损失函数的计算公式为:
其中,n表示每次训练批量(batchsize)的大小,表示为一个batchsize中第i个数据的网络输出预测值,yi表示为一个batchsize中第i个数据的真值;本方法中,一个batchsize的大小为1600;为了计算各个隐藏层中的误差,使用反向传播算法来计算得到;
6)预测目标表面三维信息:将训练好的模型参数保存,并输入预测样本组数据,预测样本同样由步骤1、2的方式进行拍摄,使用同样的图像预处理步骤,将一张红绿蓝灯同时照射下的物体图像处理为m2×3的矩阵数据;经过训练好的网络的预测,输出同样m2×3大小的矩阵数据;
通过Matlab软件,将预测的m2×3的矩阵数据reshape为m×m×3大小的矩阵数据,并在第三维上拆分为预测好的三张白色灯光照射下的归一化灰度图像;
7)将三张归一化的灰度图像通过光度立体方法,求得目标表面法向,再依据积分算法得出目标表面三维信息,从而完成基于深度学习的单帧图像三维重建。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种烟叶等级自动识别分拣方法 | 2020-05-11 | 550 |
一种基于视觉信息的环境语义感知方法 | 2020-05-08 | 818 |
一种玉米对靶变量施肥方法、装置及应用 | 2020-05-11 | 844 |
一种基于多传感器的多移动机器人调度系统设计方法 | 2020-05-08 | 740 |
基于深度卷积神经网络的水稻穗瘟检测方法及系统 | 2020-05-11 | 29 |
深度获取方法、深度获取装置及电子设备 | 2020-05-08 | 663 |
一种自动调节空调制冷量、制热量的方法及空调 | 2020-05-11 | 72 |
一种基于图像修复的三维目标检测方法和系统 | 2020-05-11 | 407 |
基于深度学习的无监督端到端的驾驶环境感知方法 | 2020-05-08 | 508 |
一种行李标签自动识别装置 | 2020-05-08 | 849 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。