专利汇可以提供一种基于卷积神经网络的自动驾驶汽车前方物体检测方法专利检索,专利查询,专利分析的服务。并且本 发明 属于 计算机视觉 中利用神经网络对图像中物体进行检测的领域,具体的说是一种基于 卷积神经网络 的自动驾驶 汽车 前方物体检测方法。本发明利用 深度学习 中的卷积神经网络(Faster RCNN)对摄像头拍摄出的图像进行目标物体提取、分类等工作,较好地提高了对自动驾驶车辆前方目标物的识别准确率。同时,本发明中改进了Faster RCNN模型的结构,将传统的卷积层、 池化 层堆叠的结构改成了CBLP 块 结构,并加入dropout层有效地避免了过拟合现象。卷积神经网络是仿造 生物 的视知觉机制构建的, 图像处理 属于半 监督学习 范围,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对 像素 进行学习且有稳定的效果。,下面是一种基于卷积神经网络的自动驾驶汽车前方物体检测方法专利的具体信息内容。
1.一种基于卷积神经网络的自动驾驶汽车前方物体检测方法,其特征在于,该检测方法包括以下步骤:
步骤一、获取训练集样本和测试集样本并且对数据进行标记;
从公开数据集KITTI上收集某城市道路上拍摄到的图片,取其中的60%作为训练集样本和40%作为测试集样本,利用MATLAB图像处理与计算机视觉工具箱中的Image Labeler标注工具对图片中的汽车这一目标物进行标记,标记好的图片数据保存在.mat文件中;
步骤二、在MATLAB平台搭建改进的Faster RCNN卷积神经网络;
在MATLAB平台搭建Faster RCNN卷积神经网络模型,将传统的Faster RCNN卷积层、池化层堆叠的结构改为如下的块结构,改进后的特征提取部分的网络结构为:一个图片输入层和5个CBLP块结构,其中每个块结构包含一个卷积层、一个批量标准化层、一个激活函数层和一个池化层;上述块结构提取出输入特征图的R、G、B各个色彩分量的像素特征后,特征图继续输入到全连接层中将上述各层提取出来的特征整合到一起;改进后的网络结构在全连接层之后加入一个dropout层;最终输出的特征图继续输入到softmax分类器实现对特征图中的目标物进行分类,并最终输出带有检测框和准确率的检测图;
步骤三:设置每层网络中的具体参数;
该网络结构的具体参数包括:卷积层、池化层数量,激活函数,卷积核大小,卷积核滑动步长,每一层中卷积核数量,学习率数值,权重更新方法以及权重初始值;
步骤四、训练上述搭建好的卷积神经网络模型;
首先,将标记好的训练集图片输入到上述搭建好的卷积神经网络模型中,设置训练过程中的批次minibatch和训练轮数;其次,在MATLAB平台上编写代码,通过不断调整训练的轮数以及上述学习率、卷积核大小、卷积核数量参数的值,不断重复训练该网络,直到得到了一个鲁棒性较好的且训练好卷积核中的权重和各个超参数的带有CBLP块结构的Faster RCNN卷积神经网络模型;最后,保存该模型,以便于后续将测试集图片输入到该神经网络模型中进行目标物检测;
步骤五、利用训练好的网络对测试集图片进行检测;
将测试集中待检测的图片输入到上述训练完成的卷积神经网络模型中,输出带有检测框和检测置信度的检测图;
步骤六、计算测试集平均检测准确率并且绘制测试集Precision-Recall曲线;
将测试集图片生成的检测框与提前标记好的框进行比较,计算测试集所有检测图片的检测准确率,绘制Precision-Recall即查准率-查全率曲线,统计得到测试集平均检测准确率。
2.根据权利要求1所述一种基于卷积神经网络的自动驾驶汽车前方物体检测方法,其特征在于,所述步骤三中各层中基本参数的具体设置为:
(1)五个卷积层:各层中卷积核大小均为3*3,卷积核数量分别为第一层32个,第二层64个,第三层128个,第四层256个,第五层512个;卷积核每次滑动一个步长,且采用零补位方法即在原始图像数据的基础上加上一层零数据,使卷积层输出的特征图尺寸与输入时相同;
(2)五个激活函数层:均采用relu激活函数,与传统的sigmoid函数相比,relu激活函数避免了训练过程中由于权重梯度消失导致的损失函数陷入局部极小值的问题;输入的数据x经过relu激活函数后输出的表达式为:
f(x)=max(0,x);
(3)五个正则化层:均采用Batch Normalization方法,对每个卷积层输出的数据xi按如下方式进行处理,以提高网络的稳定性;
yi=γxi+β
其中,μ为输入数据的均值,σ2为数据的方差,γ为需要学习的数据的标准差,β为需要学习的数据的均值,m为数据总数,xi为每一个输入的数据,ε为一个常数小值常取1e-7,为经过归一化变换后的数据值,yi为经过正则化变换之后输出的数据值;
(4)五个池化层:其中卷积核大小均为2*2,滑动步长均为2;池化层的作用在于对输入的图像进行降采样处理同时减少网络中的参数量;池化层采用的方法为最大值池化,每经过一次池化层,图像尺寸缩减为原来的一半;
(5)卷积核中的权重值初始化方法为随机选取一组符合高斯分布的数据作为权重初始值,同时每次训练时都随机选取一个小批量minibatch的图像数量,所有图像共输入到网络中重复训练4个批次;
(6)权重更新方法为SGD+Momentum即SGDM方法,即在传统随机梯度下降法加急SGD的基础上加上权重更新速度对权重更新的影响,可以有效避免训练过程中当某一点权重梯度为零时,权重值无法更新陷入局部极小值的问题;当采用SGDM权重更新方法时,即加入了权重更新速度对权重更新的影响时,在梯度消失时速度值仍很大,因此可以越过loss局部极小值,找到损失函数真正的最小值;权重更新方法为:
ω′=ω-αvt+1
其中,vt为上一时刻权重更新速率,vt+1为下一时刻权重更新速率, 为权重梯度,α为权重更新的步长即学习率,ρ为速率因子,取0.9,ω'为权重更新后的值,ω为之前的权重值;
(7)权重更新步长即学习率α初始值设置为1e-3,训练网络时保证学习率为一个定值
1e-3,记录测试集平均检测准确率;若学习率过小,则损失函数loss收敛速度过慢,网络训练时间过长;若学习率过大,则损失函数收敛速度过快,会导致在loss最小值之前提前收敛,网络训练得不够;
(8)dropout层超参数设置:由于输入的图片数量有限易出现过拟合现象,因此在网络搭建时设置dropout以防止出现过拟合现象;设置一个神经元抑制因子为0.3,即在网络训练中使30%的神经元处于抑制状态时,测试集检测准确率达到最高值。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
适用于物流行业的智能单证结构化提取方法 | 2020-05-08 | 1276 |
基于流形正则和范数正则的领域迁移极限学习机方法 | 2020-05-11 | 423 |
一种基于ACGAN图像半监督分类算法 | 2020-05-15 | 38 |
一种基于半监督学习深度对抗网络的故障诊断方法 | 2020-05-12 | 671 |
视网膜光学相干层析体数据自动识别方法及装置 | 2020-05-14 | 830 |
一种基于半监督学习模型的虚假评论检测方法及系统 | 2020-05-16 | 132 |
一种基于商用WiFi的位置自适应动作识别方法 | 2020-05-08 | 1596 |
神经网络的标注系统 | 2020-05-11 | 34 |
一种获取临床数据预测模型的方法、装置、可读介质及电子设备 | 2020-05-15 | 546 |
一种图形化编程的深度学习神经网络搭建方法 | 2020-05-18 | 737 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。