专利汇可以提供一种基于混合特征感知神经网络进行3D目标检测的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于混合特征 感知 神经网络进行3D目标检测的方法,对于3D目标检测物,首先通过MCG 算法 对RGB图进行预处理得到目标检测物的2D候选区,将2D候选区初始化得到3D候选区,然后将初始化3D候选区后的 颜色 图和 深度图 送入由分类任务损失函数和 位置 比例损失函数组成的双通道混合特征感知的特征提取模 块 分别获取物体表面特征和几何特征信息,最后将两者信息融合完成3D目检测任务,采用了混合特征感知的策略,在不同的维度上提取感兴趣物体的特征,使提取出的特征包含的维度更多也更具分辨性,能够得到准确的目标检测物的3D真实位置。,下面是一种基于混合特征感知神经网络进行3D目标检测的方法专利的具体信息内容。
1.一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,包括以下步骤:
步骤1)、获取目标检测物的RGB图和RGB图相对应的深度图;
步骤2)、采用MCG算法对RGB图进行预处理,得到目标检测物的2D候选区;
步骤3)、从RGB图中的目标检测物的2D候选区初始化得到一个目标检测物的3D候选区,根据2D候选区域对应的类别联合与RGB图对应的深度图初始化3D候选区的中心点的位置和目标检测物的尺寸大小;
步骤4)、建立分类任务损失函数和位置比例损失函数的神经网络模型,将初始化3D候选区后的RGB图和RGB图相对应的深度图输入到神经网络模型中,神经网络模型输出结果即为目标检测物的真实位置。
2.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,步骤3)中,目标检测物在世界坐标系中的坐标为 其
中,[xcam,ycam,zcam]是目标检测物在相机坐标系下的中心,[l,w,h]是目标检测物在倾斜坐标系下的3D尺寸,是目标检测物在倾斜坐标系中方向向量与z轴的夹角;倾斜坐标系是通过将相机坐标系中点云的方向与重力方向一致转换得来的,倾斜坐标系没有对相机坐标系做任何的y轴旋转。
3.根据权利要求2所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,相机坐标系与倾斜坐标系之间的转换关系如公式(1)所示,倾斜坐标系与世界坐标系之间的转换矩阵由公式(2)得到:
XYZtilt=Rtilt*XYZcam (1)
Rtilt=Rx*Rz (2)
其中,Rtilt是倾斜坐标系与世界坐标系之间的转换矩阵,Rx和Rz分别是x轴和z轴的旋转矩阵。
4.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,根据2D候选区域对应的类别联合与RGB图对应的深度图初始化3D候选区域的中心点的位置和尺寸大小,对于每一个3D的候选区域的尺寸大小,通过与尺寸大小相对应类别的平均尺寸初始化。
5.根据权利要求4所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,对于目标检测物在3D候选区的中心点位置进行初始化得到初始化坐标(xinit,yinit,zinit),其中zinit通过zmed初始化得到,xinit和yinit通过公式(3)计算得到;对于3D候选区域,初始化 为0;
其中,zmed对应的是2D候选区映射到3D候选区的中值深度;f是获取RGB图相机的焦距,(cx,cy)是2D候选区的中心坐标,(ox,oy)是获取RGB图相机的中心点坐标。
6.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,步骤4)中,将RGB图输入神经网络模型理前,通过卷积和池化对输入的RGB图进行降维和特征预处理。
7.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,利用混合感知模块对降维和特征预处理后的RGB图提取特征,其中混合感知模块是一个相同尺度大小的多层特征感知器;每一层特征感知器都是卷积、池化和激活函数的一个组合。
8.根据权利要求7所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,建立目标检测物的神经网络模型,神经网络模型的整体损失函数为:
其中,Lcls是分类任务损失函数,即交叉熵损失函数,用于对目标检测物进行分类:
Lreg为位置比例损失函数,用于目标检测物的位置检测,λ为平衡分类损失和位置损失的一个超参数。
9.根据权利要求8所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,位置比例损失函数具体如公式(4)所示:
c i
其中,1={0,1};当3D候选区域不是目标检测物的真实区域时,取0;反之,取1;β是第i个输出变量的权重;SL1是smoothL1函数,Δbi为网络预测的偏差, 为真实偏差。
10.根据权利要求8所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,神经网络的超参数包括学习率、正则化参数、神经网络的层数、每一层的神经元个数、学习的回合数、小批量数据的大小、输出神经元的编码方式、代价函数的选择、权重的初始化方法、神经元的激活函数和参加训练模型数据的规模。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
用于叠加的笔迹的识别技术的系统和方法 | 2020-05-16 | 57 |
一种基于特征选择和集成学习的软件缺陷个数预测方法 | 2020-05-18 | 45 |
一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 | 2020-05-12 | 676 |
一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法 | 2020-05-13 | 202 |
一种基于自适应连接神经网络的图像处理方法及装置 | 2020-05-08 | 308 |
用于监测车辆盲区的方法和装置 | 2020-05-12 | 125 |
目标问题的确定方法、装置、服务器和客服机器人 | 2020-05-11 | 585 |
基于多挑战感知学习模型的训练、跟踪方法 | 2020-05-14 | 407 |
异常样本检测装置及其训练装置和训练方法 | 2020-05-16 | 535 |
一种具有杀菌功能的灯条 | 2020-05-11 | 195 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。