专利汇可以提供基于元学习的室内场景重建方法专利检索,专利查询,专利分析的服务。并且本 发明 属于 计算机视觉 技术领域,提供了一种基于元学习的室内场景重建方法。本方法利用元学习的meta-critic多任务联合学习的思想,从多个相关联的源任务中学习二维到三维的内在知识,作为目标任务的先验知识,以此为监督,训练目标任务的网络模型,达到更快更好地学习到从视频中重建出三维点 云 模型的方式方法;本方法的技术 框架 主要由两部分构成,分别为(1)源任务的多任务联合训练模型和(2)由预训练meta-critic模型为监督的目标任务模型。本发明使用的Meta-Critic思想也使源任务的训练中规避了不同任务需要使用不同的损失函数的劣势,该网络可以在学习模拟损失函数的同时共享不同任务之间的知识信息。,下面是基于元学习的室内场景重建方法专利的具体信息内容。
1.一种基于元学习的室内场景重建方法,其特征在于,步骤如下:
建模框架的目标任务的输入为视频,即连续序列的RGB图片,通过meta-critic网络输出三维点云模型;源任务为元学习的多任务学习模式,包含相机位姿预测及深度图预测两个源任务,两个源任务的输入均为彩色视频序列,输出分别为相机位姿序列及深度图序列;
本方法利用元学习的meta-critic多任务联合学习的思想,从多个相关联的源任务中学习二维到三维的内在知识,作为目标任务的先验知识,以此为监督,训练目标任务的网络模型,达到更快更好地学习到从视频中重建出三维点云模型的方式方法;本方法的技术框架主要由两部分构成,分别为(1)源任务的多任务联合训练模型和(2)由预训练meta-critic模型为监督的目标任务模型;具体描述如下:
(1)多任务联合训练模型
源任务包括两个任务网络模型:一个是相机位姿预测网络,命名为CameraActor,另一个为深度图预测网络,命名为DepthActor;
深度图预测网络由带有跳连接的多尺度预测输出的编码器和解码器组成,编码器和解码器分别包含7层卷积或反卷积层,编码器卷积层的前两层卷积核分别为7×7,5×5,其余卷积层卷积核均为3×3,每个卷积后带有一个ReLU激活层,输出深度图尺寸与输入视频序列尺寸相同;
相机位姿预测网络由7个步长为2的卷积组成,每个卷积后带有一个1×1的卷积,输出通道为6:3个平移角和3个旋转角,用来表示相机位姿,最后应用一个平均池化层聚合在所有空间位置上的相机位姿预测值;
多任务联合训练模型通过一个Meta-Critic网络实现;Meta-Critic网络包含两个模块,分别为Meta-Value Net模块和Task-Actor Encoder模块;TAEN的输入为DepthActor和CameraActor的输入序列、预测的相机位姿及深度图序列、预测序列与真值之间的差值,其作用为将这些有效的信息编码为一个特征向量z;具体来说,将TAEN定义为一个LSTM的循环神经网络,最后带有一个全连接层,将LSTM最后一个时序的分布式特征映射为特征向量z;
MVN的输入为DepthActor和CameraActor的输入序列、预测的相机位姿及深度图序列、TAEN的特征向量z,其作用为判定预测器Actor的准确度,并以此为监督通过神经网络学习的方式在训练过程中不断调整两个源任务的Actor以及Meta-Critic网络的参数,提高Meta-Critic网络的学习能力;
Meta-Critic网格的优化目标表示为:
其中,x为输入值,为预测值,z为TAEN编码的特征向量,r为输入与真值的差值,θ、和ω分别为任务预测器、MVN、TAEN的网络参数,由公式1和公式2看出,对每一个任务M,任务预测器Actor会在训练过程中学会学习最大化价值函数,使得预测结果更精确;
(2)目标任务模型
目标任务是从视频中对三维场景进行点云模型重建;目标任务模型包含点云预测模块及Meta-Critic模块两部分,Meta-Critic模块与多任务联合训练模型相同;点云预测模块输入为连续的彩色视频序列,输出为三维点云,网络构建基于标准LSTM和GRU模块,利用GRU模块保留上一个序列的有效特征,用于微调基于之前序列的特征而重建的场景点云,使场景点云包含更多的局部及全局细节特征;场景点云重建模型采用VGG结构,使用全卷积网络,卷积层均采用3×3卷积,带有ReLU非线性激活层,通过不断的下采样回归出三维的点云模型;
(3)数据集采集
多任务联合训练模型中,数据集采用开源数据集7Scenes,包含不同场景的彩色视频序列;
目标任务模型,即场景点云重建模型任务中,在SUNCG数据集提供的大型场景模型中,人工选取不同视角、不同的室内场景进行了数据采集,共计275组视频序列,每个视频序列包含20-25帧,每帧包含彩色图、深度图及其相机位姿的真值;
(4)实验过程
实验过程共分为三个阶段,多任务联合训练阶段、目标任务训练阶段以及目标任务测试阶段;多任务联合训练阶段在7Scenes数据集上进行训练,每次训练过程中送入多张连续图片作为多任务的预测器Actor的采样输入,输出预测的深度图及相机位姿结果与原输入一起送入Meta-Critic网络中进行监督训练,在不断的迭代训练中优化网络参数模型,直至模型收敛;目标任务训练阶段对7Scene数据集和从SUNCG中采集的数据集结合进行训练,在这一阶段,由多任务联合训练的模型的Meta-Critic网络的参数保持不变,对场景点云重建模型预测器Actor进行训练,优化场景点云重建模型;在目标任务测试阶段,仅使用在目标任务训练阶段优化的场景点云重建模型,输入连续视频序列,输出三维场景点云。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
LED箱体及LED显示屏 | 2020-05-08 | 348 |
耳罩结构 | 2020-05-08 | 212 |
演示大屏定制方法、装置、计算机设备和可读存储介质 | 2020-05-08 | 5 |
一种轻小型相控阵天线 | 2020-05-08 | 202 |
一种高效控制信令方法及系统 | 2020-05-08 | 741 |
框架馈入器 | 2020-05-08 | 806 |
用于免疫治疗癌症的尺寸可调的微生物模拟物 | 2020-05-08 | 343 |
一种耐高温阻尼间隔棒 | 2020-05-08 | 369 |
轴向涡轮机的组件,相关的轴向涡轮机,组装方法和密封接头 | 2020-05-08 | 358 |
一种非接触模块封装智能卡及其制备方法 | 2020-05-11 | 149 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。