首页 / 专利库 / 人工智能 / 误差反向传播算法 / 基于非均匀投影的三维模型检索

基于非均匀投影的三维模型检索

阅读:174发布:2020-05-15

专利汇可以提供基于非均匀投影的三维模型检索专利检索,专利查询,专利分析的服务。并且本 发明 提出一种基于非均匀投影的三维模型检索方法,该方法通过描述三维模型表面信息量,刻画三维模型的不同 位置 所包含的信息量差异,同时给出基于信息量差异的视图拍摄方法。对于信息量稀疏的区域产生少量投影,对于信息量密集的区域产生较多的投影。采用非均匀的投影方法在保证模型描述 精度 的前提下,减少冗余信息,然后再利用三维模型提取出全景视图,将投影视图与全景图作为特征视图集。其次将特征视图集作为卷积神经网(Convolutional Neural Network,CNN)的输入,提取出视图集的深度特征并进行 降维 处理,将处理后的描述符作为模型检索的特征。最后计算该特征的欧式距离作为检索结果。此方法不仅利用全景图解决了非均匀投影视图缺少三维模型关联信息的问题,同时还采用非均匀投影视图解决了全景视图缺少三维模型完成信息的缺点。并且利用CNN对模型进行先分类再检索,有效提高了模型的检索速度与效率。,下面是基于非均匀投影的三维模型检索专利的具体信息内容。

1.基于非均匀投影的三维模型检索方法,包括以下几个步骤:
(1)读取三维模型off格式文件,若三维模型面包片数大于一万,则说明所述维模型为复杂模型,信息量密集,此时设置12个虚拟摄像机对三维模型进行投影,否则说明所述三维模型为简单模型,信息量稀疏,设置6个虚拟摄像机对三维模型进行投影;
(2)再将所述三维模型沿质心轴线垂直放置,对于复杂模型,计算z轴正负半轴面包片数,若正负半轴面包片数均大于五千,此时正负半轴均设置6个虚拟摄像机;若正半轴面包片数大于五千,负半轴面包片数小于五千,则正半轴设置9个虚拟摄像机,负半轴设置3个虚拟摄像机;若负半轴面包片数大于五千,正半轴面包片数小于五千,则负半轴设置9个虚拟摄像机,正半轴设置3个虚拟摄像机;对于简单模型,直接在z轴正半轴设置6个虚拟摄像机,z轴正半轴摄像机离平夹正30度,并根据摄像机个数均匀放置,z轴负半轴摄像机离水平夹角负30度,并根据摄像机个数均匀放置;
(3)构建与三维模型质心轴线平行的圆柱体,用所述圆柱体包围三维模型,将三维模型投影到圆柱体侧面,得到全景视图,全景视图与步骤(1)投影所得二维图构成特征视图集;
(4)在卷积神经网络VGG-M模型的第一个全连接层上添加一层视图池化层,对特征视图集进行分类训练,最终得到训练完成的分类器和三维模型特征集合,并采用PCA对三维模型特征降维
(5)模型检索时,以三维模型作为输入,首先提取所述模型的特征视图集,然后输入到分类器中进行分类,与同一类别中的模型进行欧式距离计算,最终将距离最小的八个模型作为检索结果输出到检索列表。
2.根据权利要求1所述的基于非均匀投影的三维模型检索方法,其特征在于:所述步骤(1)、(2)渲染方法将三维模型沿质心轴线垂直放置,根据三维模型的信息量稀疏情况,设置位置与数量不同的虚拟相机并对准三维模型质心方向,拍摄得到渲染视图。
3.根据权利要求1所述的基于非均匀投影的三维模型检索方法,其特征在于:所属步骤(3)提取全景视图,构建平行于三维模型主轴的圆柱体,用圆柱体包围三维模型,将圆柱体表面离散化成点集 ,其中p代表点集总量;对于点集中每一点的m值,在
与m等高的三维模型主轴上都能找到一个对应点n,m与n相连,如果与三维模型有交点,则表明交点值不为0,将m放入全景图数据集中;最后,展开圆柱体的侧面得到全景图,经过展开后若全景视图大小小于所需视图集224*224大小,需进行像素扩张,大于视图集224*224大小,需进行像素裁剪。
4.根据权利要求1所述的基于非均匀投影的三维模型检索方法,其特征在于:所属步骤(4)构建CNN模型时,所诉网络由五个卷积层、三个池化层和一个视图池化层、两个全连接层、一个softmax层组成;卷积核的取值为7*7,5*5,3*3,3*3,3*3,激活函数为relu;池化层采用最大池化,可以有效减少过拟合的现象;在全连接层的设定上,视图集经过卷积层后根据特征视图集中视图的数量生成同数量的特征向量,需要经过视图池化层整合成一个特征;在训练整个网络时使用反向传播算法,对实际输出与理想输出的误差做出比较,并用随机梯度下降对误差进行最小化。
5.根据权利要求1所述的基于非均匀投影的三维模型检索方法,其特征在于:
所属步骤(5)模型检索步骤方法如下:
三维模型作为输入,首先对三维模型非均匀投影与全景视图生成,生成视图集,在经过分类器时提取所述模型唯一特征,并进行分类;同一类别中的模型进行加权欧式距离计算计算特征 , 间的距离,计算公式如下:
的设定方便用户自己调整权值,选取欧式距离最小的八个模型作为检索结果,输出到界面上。

说明书全文

基于非均匀投影的三维模型检索

技术领域

[0001] 本发明属于计算机图形学领域,尤其涉及了一种基于非均匀投影的三维模型检索方法。

背景技术

[0002] 随着计算机图形处理能三维建模技术的日益增强,三维模型在工业设计、医学诊断等诸多领域得到了广泛应用,三维模型的数量也随之产生了几何式的增长,海量的数据为三维模型检索技术的发展带来了新的机遇与挑战。
[0003] 三维模型检索的前提是有效提取模型的特征描述符,基于投影的特征提取方法采用多个不同视对模型进行投影,然后提取和汇总各投影的全局图像特征作为原三维模型的内容表征,如何更精确、更全面表示三维模型是一个需要研究的问题。
[0004] 目前方法的拍摄位置均匀分布在模型周围,所产生的海量投影数据代表性差,因此需要研究合理的拍摄方法去除冗余数据,产生少量且具有代表性的二维视图。本发明研究描述三维模型表面信息量的方法,刻画三维模型的不同位置所包含的信息量差异,同时给出基于信息量差异的视图拍摄方法。对于信息量稀疏的区域产生少量投影,对于信息量密集的区域产生较多的投影。采用非均匀的模型投影方法不仅减少了冗余信息,还提高了模型的描述精度,有利于提高三维模型的检索速度和精度。
[0005] 本发明将投影视图与全景视图结合,解决了投影视图只考虑了所有视图的特征数据,没考虑到视图之间的关联信息,全景视图只考虑了视图间的关联信息。对模型的特征描述不够全面等问题。

发明内容

[0006] 本发明针对现有技术的不足之处,提供一种基于非均匀投影的三维模型检索方法,该方法首先根据三维模型信息量的复杂程度确定投影视点的位置与个数,提取出来三维模型的二维视图集,然后再利用三维模型提取出全景视图,构成特征视图集。
[0007] 其次将视图集作为卷积神经网络的输入,从而提取出视图集的深度特征并进行降维处理,处理后的整合描述符作为模型检索的特征。
[0008] 最后利用计算该特征的欧式距离作为检索结果。此方法不仅利用全景图解决了非均匀投影视图缺少三维模型关联信息的问题,同时还采用非均匀投影视图解决了全景视图缺少三维模型完成信息的缺点,并且利用卷积神经网络对模型进行先分类再检索,有效提高了模型的检索速度与效率。
[0009] 本发明是通过以下技术完成上述目的:基于非均匀投影的三维模型检索,包括以下几步。
[0010] (1)读取三维模型off格式文件,若三维模型面包片数大于一万,则说明此三维模型为复杂模型,信息量密集,此时设置12个虚拟摄像机对三维模型进行投影,否则说明该三维模型为简单模型,信息量稀疏,设置6个虚拟摄像机对三维模型进行投影。
[0011] (2)再将此三维模型沿质心轴线垂直放置,对于复杂模型,计算z轴正负半轴面包片数,若正负半轴面包片数均大于五千,此时正负半轴均设置6个虚拟摄像机;若正半轴面包片数大于五千,负半轴面包片数小于五千,则正半轴设置9个虚拟摄像机,负半轴设置3个虚拟摄像机;若负半轴面包片数大于五千,正半轴面包片数小于五千,则负半轴设置9个虚拟摄像机,正半轴设置3个虚拟摄像机;对于简单模型,直接在z轴正半轴设置6个虚拟摄像机,z轴正半轴摄像机离平夹角正30度,并根据摄像机个数均匀放置,z轴负半轴摄像机离水平夹角负30度,并根据摄像机个数均匀放置。
[0012] (3)构建与三维模型质心轴线平行的圆柱体,用该圆柱体包围三维模型,将三维模型投影到圆柱体侧面,得到全景视图,全景视图与步骤(1)投影所得多视图构成特征视图集。
[0013] (4)在卷积神经网络VGG-M模型的第一个全连接层上添加一层视图池化层,对特征视图集进行分类训练,最终得到训练完成的分类器和三维模型特征集合,并采用PCA对三维模型特征降维。
[0014] (5)模型检索时,以三维模型作为输入,首先提取该模型的特征视图集,然后输入到分类器中进行分类,与同一类别中的模型进行欧式距离计算,最终将距离最小的八个模型作为检索结果输出到检索列表。
[0015] 所述步骤(1)、(2)渲染方法将三维模型沿质心轴线垂直放置,根据三维模型的信息量稀疏情况,设置位置与数量不同的虚拟相机并对准三维模型质心方向,拍摄得到渲染视图。
[0016] 上述步骤(3)提取全景视图,构建平行于三维模型主轴的圆柱体,用圆柱体包围三维模型,将圆柱体表面离散化成点集 ,其中p代表点集总量。对于点集中每一点的m值,在与m等高的三维模型主轴上都能找到一个对应点n,m与n相连,如果与三维模型有交点,则表明该值不为0,将m放入全景图数据集中。最后,展开圆柱体的侧面得到全景图,经过展开后若全景视图大小小于所需视图集224*224大小,需进行像素扩张,大于视图集224*224大小,需进行像素裁剪。
[0017] 上述步骤(4)构建CNN模型时,该网络由五个卷积层、三个池化层和一个视图池化层、两个全连接层、一个softmax层组成。卷积核的取值为7*7,5*5,3*3,3*3,3*3,激活函数为relu。池化层采用最大池化,可以有效减少过拟合的现象。在全连接层的设定上,视图集经过卷积层后根据特征视图集中视图的数量生成同数量的特征向量,需要经过视图池化层整合成一个特征。在训练整个网络时使用反向传播算法,对实际输出与理想输出的误差做出比较,并用随机梯度下降对误差进行最小化。
[0018] 上述步骤(5)模型检索步骤方法如下。
[0019] 1.三维模型作为输入,首先对三维模型非均匀投影与提取全景视图,生成视图集,在经过分类器时提取该模型特征,并进行分类。
[0020] 2.同一类别中的模型进行加权欧式距离计算计算特征 ,间的距离,计算公式如下。
[0021]的设定方便用户自己调整权值,选取欧式距离最小的八个模型作为检索结果,输出到界面上。
附图说明
[0022] 图1是本发明的总体流程示意图。
[0023] 图2是本发明的三维模型的二维渲染过程。
[0024] 图3是本发明的三维模型的二维渲染图。
[0025] 图4是本发明的卷积神经网络结构图。
[0026] 图5是本发明的检索示例图1。
[0027] 图6是本发明的检索示例图2。

具体实施方式

[0028] 以下结合附图对本发明作进一步说明,但本发明的保护范围并不仅限于此。
[0029] 如图1所示,基于非均匀投影的三维模型检索方法,包括离线预处理阶段和在线检索阶段,离线预处理阶段步骤如下。
[0030] 步骤一,对ImagNet-10数据集中共5005个三维模型进行渲染,如图2所示,该模型总面包片数为6509,说明此三维模型为简单模型,z轴正半轴面包片数为5233,z轴负半轴面包片为1276,则对渲染后的三维模型选择6个虚拟摄像机进行投影,每个虚拟照相机与水平夹角成正30度,每隔60度放置一个虚拟相机,虚拟摄像机对准模型质心,该三维模型产生六张视图作为三维模型的特征图。
[0031] 利用平行于三维模型主轴的圆柱体包围三维模型,将圆柱体的侧面离散化成点集,其中p代表点集总量。对于点集中每一点的m值,在与m等高的三维模型主轴上都能找到一个对应点n,m与n相连,如果与三维模型有交点,则表明该值不为0,将m放入全景图数据集中。最后,展开圆柱体的侧面得到全景图,经过展开后若全景视图大小小于所需视图集224*224大小,需进行像素扩张,大于视图集224*224大小,需进行像素裁剪。
[0032] 如图3所示,此13张视图为复杂三维模型的特征视图集,包括非均匀投影的12张视图和全景视图,此视图集既包括三维模型整体信息,又能反映出视图间的关联信息。
[0033] 步骤二,在ImagNet-10数据集中,选取3991个模型作为训练集,即共29892张视图作为CNN的输入,每张视图大小为224*224,如图4所示,本网络在VGG-M的全连接层Fc6后加了一层视图池化层,该池化层为最大池化层,保证视图集经过卷积神经网络后得到一个强有力的描述符。
[0034] 构建CNN模型时,该网络由五个卷积层、三个池化层和一个视图池化层、两个全连接层、一个softmax层组成。卷积核的取值为7*7,5*5,3*3,3*3,3*3,激活函数为relu。池化层采用最大池化,可以有效减少过拟合的现象。在全连接层的设定上,视图集经过卷积层后生成7个特征向量,需要经过视图池化层整合成一个特征。在训练整个网络时使用反向传播算法,对实际输出与理想输出的误差做出比较,并用随机梯度下降对误差进行最小化。
[0035] 在全连接层采用1024维特征可以有效的表达模型特征,但是在检索时,高维的特征对时间的消耗较为严重,因此,本发明采用PCA将维度降低至128维,提高检索速度。
[0036] 最终得到效果良好的分类器,并将所有分好类的模型存入模型库。
[0037] 在线预处理阶段步骤如下。
[0038] 步骤一,将欲检索三维模型渲染,按非均匀投影与全景图生成的方法生成特征视图集,将特征视图集作为CNN分类器的输入,此过程有以下两个目的。
[0039] 一、模型先分类在检索,只需在同一类别的模型中检索即可,在时间的成本上有极大的提高,节约时间成本计算为。
[0040]其中n为模型总的类别数,T为检索所有模型消耗的时间,t为节省时间。
[0041] 二、提取对应三维模型特征,用作三维模型检索。
[0042] 步骤二,对特征 , 使用加权欧式距离求预检索模型与同类模型进行相似度计算。
[0043]的设定方便用户自己调整权值以键值对的形式,记录相似度与对应三维模型,将相似度距离大小从小到大排列,选取前八位作为检索结果。
[0044] 如图5、图6所示为三维模型检索结果。
[0045] 以上所述为本发明的操作过程及技术原理分析,本领域的技术人员可在所附权利要求的范围内依本发明的设想做出的修改、改进,这些修改和改进也被认为包括在本发明的保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈