专利汇可以提供基于改进YOLOv3的快速车辆检测方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于改进YOLOv3的快速车辆检测方法。实时目标检测 算法 YOLOv3的检测速度较快且 精度 良好,但存在边界框 定位 不够精确、难以区分重叠物体等不足。本发明提出了Attention-YOLOv3算法,该算法借鉴了基于项的注意 力 机制,将通道注意力及空间注意力机制加入特征提取网络之中,使用经过筛选加权的 特征向量 来替换原有的特征向量进行残差融合,该算法有效降低了边界框的定位误差并提升了检测精度。同时本发明对于YOLO v3的anchor选取进行优化,对视频车辆图像数据集的目标候选框进行维度 聚类分析 ,选择最优anchor个数。本发明在保证车辆检测实时性的前提下提高了车辆检测的准确性。,下面是基于改进YOLOv3的快速车辆检测方法专利的具体信息内容。
1.一种基于改进YOLOv3的快速车辆检测方法,其特征在于,包括以下步骤:
步骤一)通过视频流获取若干包含车辆的图片,并对每张图片进行人工标注,标注每张图片所包含的车辆类型以及将图片中的车辆用目标包围框框出,按所有已完成标准的图片按照比例划分为检测模型的训练集和验证集,并对训练集进行数据扩增;
步骤二)构建基于改进的YOLOv3目标检测网络,在改进的YOLOv3目标检测网络中,对车辆候选框进行聚类分析选取目标候选框个数和宽高比维度,重新确定YOLOv3目标检测网络的anchor个数和宽高维度;同时,改进的YOLOv3目标检测网络为引入注意力机制的Attention-YOLOv3算法,在YOLOv3目标检测网络的Darknet-53特征提取网络加入通道注意力机制及空间注意力机制,并在通道注意力机制及空间注意力机制中分别加入全局最大池化操作,两种全局最大池化操作完成后进行合并送入MLP进行通道信息筛选,接着,沿着通道维度进行平均池化和最大池化,将平均池化和最大池化的输出合并后得到特征描述子,最后,使用卷积操作来进行编码,得到空间注意力图;
步骤三)在目标检测网络上使用训练集进行模型训练,并选出验证集表现最优的模型;
步骤四)基于最优的模型,在GPU服务器上进行预测,实现对视频流进行目标车辆检测。
2.如权利要求1所述的一种基于改进YOLOv3的快速车辆检测方法,其特征在于,步骤一)中,拍摄以道路为背景的车辆视频,并对车辆视频进行逐帧提取获得所述视频流;
进行人工标注所使用的标注工具为LabelImg,标注完成生成xml格式的标记信息文件,在标记信息文件中,记录图片中每个目标车辆的坐标,包含左上角坐标x,左上角坐标y,宽度w和高度h,同时删掉模糊图片或者难以标注的图片,同时利用CCPD、KITTI及UA-DETRAC公开数据集作为补充数据集,将补充数据集及标记信息文件中的述数据按照等比例混合,按照9:1的比例划分为检测模型的所述训练集和所述验证集,训练集用于模型训练,验证集不参与模型训练,用于验证模型的训练效果。
3.如权利要求1所述的一种基于改进YOLOv3的快速车辆检测方法,其特征在于,步骤二)中,使用K-means聚类方法对车辆训练集以预测框和真实框的交并比作为相似度标准进行聚类,选取先验框数量和规格,然后对BBox的坐标、高和宽使用平方误差的总和做损失计算进行回归,并采用交叉熵损失计算的优化方法训练,进行多标签分类,通过随机梯度下降法优化求解模型,其中,BBox的坐标、高和宽的平方误差总和损失Lreg为:
其中,N是先验框中与真实框
的IOU值大于设置的阈值的个数;xi,yi,wi,hi为第i个预测框的中心点坐标、宽和高;
为与第i个预测框匹配的真实框的中心点坐标、宽和高。
4.如权利要求1所述的一种基于改进YOLOv3的快速车辆检测方法,其特征在于,步骤二)中,设输入注意力机制的卷积集为X,保留作为残差分支的输入之一,且 其中H、W、C表示的是特征图的长度、宽度和通道数,随后将卷积集X分别送入两个独立的分支进行全局平均池化及全局最大池化操作,设全局平均池化过程为Favg,全局最大池化过程为Fmax,令Favg和Fmax的输出分别为Attavg及Attmax,且 则一维的
权重序列Attavg可以很好地筛选出目标物体的全局背景信息,同时Attmax可以很好地突出目标物体的显著特征;
令X=[x1,x2,…,xc],其中xc表示的是第c个卷积核的参数,则:
式中,xc(i,j)表示的是在大小为H×W的特征图上横纵坐标分别为i和j的点的第c个卷积核的参数。
令 和 为两个全连接层,训练时两条分支的输入共享全连接层的参
数,其中r为全连接层的降维比例,设通道注意力模块部分的输出outputch为:
outputch=outputavg+outputmax
其中两条分支的输出outputavg、outputmax分别是:
outputavg=Sigmoid(FC4×ReLU(FC3×Attavg))
outputmax=Sigmoid(FC4×ReLU(FC3×Attmax))
接着通过矩阵乘法完成特征加权操作:
W=(xc,outputch)=xc×outputch,式中,xc表示表示的是第c个卷积核的参数,得到筛选过的通道特征W=[w1,w2,…,wc];
通道特征筛选完成后,将W输入至新的空间注意力机制模块中,包括以下步骤:首先,输入的特征向量将分别经过Attavg以及Attmax,再沿着通道维度进行特征叠加,得到为了能得到二维的特征权重信息,进行卷积操作来降维,令F3×3表示的是输入通道数为2,输出通道数为1,卷积核大小为3×3的卷积操作,则最后特征加权后的输出向量为outputchsp=F3×3(Ccon)×W,最终,整个通道和空间注意力机制模块的输出为outputchsp+X。
5.如权利要求1所述的一种基于改进YOLOv3的快速车辆检测方法,其特征在于,步骤三)中,选出验证集表现最优的模型包括以下步骤:
在训练过程,每经过1轮存储一次模型,并将该模型在验证集上测试,根据车辆检测的精度mAP选择最优的模型。
6.如权利要求1所述的一种基于改进YOLOv3的快速车辆检测方法,其特征在于,步骤四)具体包括以下步骤:
按适当帧率从摄像头得到照片,用传统图像处理方法降噪、锐化后上传到GPU显存;逐级在其上计算改进的YOLO模型的每一层,获得输出;筛选合适的边界框,最终输出置信值足够高的目标的位置、大小、种类。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于渲染组件元素获取计算资源的方法、系统和存储介质 | 2020-05-08 | 287 |
多模融合无线定位系统及其定位方法 | 2020-05-08 | 108 |
一种定位服务权限变更方法、装置及系统 | 2020-05-08 | 665 |
用于运行至少两个自动化车辆的方法和设备 | 2020-05-08 | 236 |
一种电力物联网场景中基于协同内容缓存的卸载方法 | 2020-05-08 | 267 |
虚拟礼物赠送方法、装置、系统、计算机设备和存储介质 | 2020-05-11 | 155 |
基于时间实现多设备同步显示的方法 | 2020-05-11 | 476 |
基站指纹库数据源补充方法、装置、服务器及存储介质 | 2020-05-08 | 548 |
直播服务系统及直播连接的建立方法 | 2020-05-11 | 932 |
管理基于区块链的中心化账本系统 | 2020-05-08 | 1016 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。