首页 / 专利库 / 人工智能 / 人工神经网络 / 一种基于深度学习的车辆类型判别方法

一种基于深度学习的车辆类型判别方法

阅读:1060发布:2020-05-24

专利汇可以提供一种基于深度学习的车辆类型判别方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于 深度学习 的车辆类型判别方法,包括:构建一yolo 框架 的 人工神经网络 模型,并且随机初始化权重系数;从网上收集和在当前应用环境中抓拍车辆照片,车辆照片包括在有遮挡、昏暗光线、车辆 正面 的情况下的车辆照片,对车辆进行标注,并将车辆照片输入人工神经网络模型;使用人工神经网络模型和车辆照片来进行训练;停止训练,得到适用于所述当前应用环境的权重文件;将需要识别的图片输入人工神经网络模型,判别车辆类型并返回结果。本发明的车辆类型判别方法采用的车辆照片包括有遮挡样本、昏暗光线样本以及 角 度较差的情况下的车辆照片,因此能够降低识别车辆类型时对降低对有无遮挡、光线和拍摄角度的要求。,下面是一种基于深度学习的车辆类型判别方法专利的具体信息内容。

1.一种基于深度学习的车辆类型判别方法,其特征在于,包括:
步骤S1:构建一个用于一当前应用环境中的yolo框架人工神经网络模型,并且初始化所述人工神经网络模型的所有神经元连接的权重系数;
步骤S2:将大量的车辆照片输入所述人工神经网络模型,包括:
步骤S21:从网上收集和在当前应用环境中抓拍大量的车辆照片,所述车辆照片包括在有遮挡的情况下、昏暗光线的情况下以及车辆正面的情况下的车辆照片;
步骤S22:将车辆照片分为训练集与测试集;
步骤S23:在车辆照片上对车辆进行标注,得到带有标注数据集的车辆照片,并将训练集中的车辆照片输入所述人工神经网络模型;
步骤S3:使用所述人工神经网络模型和所述步骤S2中的训练集中的车辆照片来进行训练;
步骤S4:停止训练,得到适用于所述当前应用环境的权重文件,该权重文件包含所述人工神经网络模型的权重系数和结构参数;
步骤S5:将需要识别的图片输入所述人工神经网络模型,判别车辆类型并返回结果。
2.根据权利要求1所述的基于深度学习的车辆类型判别方法,其特征在于,所述当前应用环境包括道路卡口和工厂口。
3.根据权利要求1所述的基于深度学习的车辆类型判别方法,其特征在于,在所述步骤S1中,所述人工神经网络模型为基于darknet网络的yolo_v3网络。
4.根据权利要求1所述的基于深度学习的车辆类型判别方法,其特征在于,在所述步骤S22中,所述车辆照片按照7:3的比例分为训练集与测试集。
5.根据权利要求1所述的基于深度学习的车辆类型判别方法,其特征在于,在所述步骤S23中,在对车辆进行标注时,若车辆照片中所包含的车辆数目超过一个,则选取最中间的车辆进行标注。
6.根据权利要求1所述的基于深度学习的车辆类型判别方法,其特征在于,在所述步骤S23中,所述对车辆进行标注,包括:框出车辆所在位置,每个车辆分别画一个样本框,并将该车辆的分类信息写在标注数据集中,得到带有标注数据集的车辆照片。
7.根据权利要求6所述的基于深度学习的车辆类型判别方法,其特征在于,在所述步骤S23中,所述分类信息包括轿车、越野车、牵引车、自卸汽车、专用汽车下箱式汽车和专用汽车下罐式汽车。
8.根据权利要求1所述的基于深度学习的车辆类型判别方法,其特征在于,在所述步骤S3中,所述进行训练,包括:设定一个损失函数及其阈值,通过反复计算损失函数,以调整所述人工神经网络模型向着损失函数减小的方向演进。
9.根据权利要求8所述的基于深度学习的车辆类型判别方法,其特征在于,在所述步骤S4中,在所述损失函数达到损失函数的阈值时,停止训练。
10.根据权利要求1所述的基于深度学习的车辆类型判别方法,其特征在于,所述步骤S5包括:
步骤S51:将需要识别的车辆照片传入服务器内,利用所述人工神经网络模型和所述步骤S4得到的权重文件来对该车辆照片进行车辆精准定位和车辆类型的识别,并将识别结果返回给客户;
步骤S52:判断识别结果是否错误,将识别结果错误的照片传入所述人工神经网络模型中并重新进行训练。

说明书全文

一种基于深度学习的车辆类型判别方法

技术领域

[0001] 本发明属于智能交通和智能安防领域、具体涉及一种车辆类型判别方法。

背景技术

[0002] 人工神经网络(artificial neural network,缩写ANN),简称神经网络(neural network,缩写NN)或类神经网络,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具。典型的神经网络具有以下三个部分:
[0003] 1、结构(Architecture)结构指定了网络中的变量和它们的拓扑关系。例如,神经网络中的变量可以是神经元连接的权重(weights)和神经元的激励值(activities of the neurons)。
[0004] 2、激励函数(Activity Rule)大部分神经网络模型具有一个短时间尺度的动学规则,来定义神经元如何根据其他神经元的活动来改变自己的激励值。一般激励函数依赖于网络中的权重(即该网络的参数)。
[0005] 3、学习规则(Learning Rule)学习规则指定了网络中的权重如何随着时间推进而调整。这一般被看做是一种长时间尺度的动力学规则。一般情况下,学习规则依赖于神经元的激励值。它也可能依赖于监督者提供的目标值和当前权重的值。
[0006] 深度学习是人工神经网络的拓展,其思想与人工神经网络思想是一致的。总的来说,神经网络是一种机器学习架构,所有的个体单元以权重的方式连接在一起,且这些权重是通过网络来训练的,那么它就可以称之为神经网络算法。人工神经网络算法的思想来源于模仿人类大脑思考的方式。人类大脑是通过神经系统得到输入信号再作出相应反映的,而接受外部刺激的方式是用神经元接受神经末梢转换的电信号。那么,我们希望通过人造神经元的方式模拟大脑的思考,这就产生了人工神经网络了。人工神经元组成了人工神经网络的计算单元,而人工神经网络结构描述了这些神经元的连接方式。我们可以采用层的方式组织神经元,层与层之间可以互相连接。以前受制于很多因素,我们无法添加很多层,而现在随着算法的更新、数据量的增加以及GPU的发展,我们可以用很多的层来开发神经网络,这就产生了深度神经网络。而深度学习其实就是深度神经网络的一个代名词。
[0007] 公开号为CN 109359666A的专利文件公开了一种基于多特征融合神经网络的车型识别方法及处理终端,其基于多特征融合神经网络的车型识别方法包括:步骤1:对预设的神经网络采用训练算法进行训练,获得神经网络的参数,从而确定训练后的神经网络;步骤2:获取包括车辆车型特征的原始图像,对原始图像进行预处理,得到与预设像素尺寸一致的第一图像,并对原始图像采用目标检测算法提取局部特征,得到包括局部特征的第二图像;步骤3:将第一图像作为网络数据层data、第二图像作为网络感兴趣区域层rois输入至所述经过训练后的神经网络进行特征提取,获得融合特征,并利用分类算法对融合特征进行分类,得到车型的分类结果和对应车型的概率。本发明能有效地解决相似车型识别的问题,提高车型识别的准确率。然而,由于该方法的训练过程较为繁琐,具体需要分为三步实施,其中步骤2需要调整原始图像的尺寸,步骤3中需分别对其三个子网络进行训练,再将三个子网络进行整合,整个过程较为繁琐,且每个子网络只有五层网络层,特征学习能力不够强,有可能会造成欠拟合和训练时间过长的弊端,影响识别准确度。此外,该方法对拍摄度有较高要求,对光线要求较苛刻,且对于遮挡问题不能很好地解决。
[0008] YOLO算法在darknet网络上的卷积层模型是根据GoogLeNet的思想建立的,是一种可实时检测图片中目标的深度学习框架。YOLO的思想是将图片分割为S*S个等大的方,通过训练目标在每个方块中出现的概率和该方块中目标的大小来实现精确定位。通过残差网络等技术的应用,使YOLO能够在较少网络层数的前提下,实现高速和高准确度的目标检测。由于深度神经网络往往需要大量的样本数据进行训练,加上市场上车型种类繁多,直接对每一种车型进行训练成本太大,因此目前尚未有人采用YOLO算法来解决车辆类型识别的问题。

发明内容

[0009] 本发明所要解决的技术问题在于提供一种基于深度学习的车辆类型判别方法,以对车辆照片进行车辆精准定位和车辆类型的识别,并降低识别车辆类型时对有无遮挡、光线和拍摄角度的要求。
[0010] 为了实现上述目的,本发明提供了一种基于深度学习的车辆类型判别方法,其特征在于,包括:
[0011] S1:构建一个用于一当前应用环境中的yolo框架的人工神经网络模型,并且初始化所述人工神经网络模型的所有神经元连接的权重系数;
[0012] S2:将大量的车辆照片输入所述人工神经网络模型,包括:
[0013] S21:从网上收集和在当前应用环境中抓拍大量的车辆照片,所述车辆照片包括在有遮挡的情况下、昏暗光线的情况下以及车辆正面的情况下的车辆照片;
[0014] S22:将车辆照片分为训练集与测试集;
[0015] S23:在车辆照片上对车辆进行标注,得到带有标注数据集的车辆照片,并将训练集中的车辆照片输入所述人工神经网络模型;
[0016] S3:使用所述人工神经网络模型和所述步骤S2中的训练集中的车辆照片来进行训练;
[0017] S4:停止训练,得到适用于所述当前应用环境的权重文件,该权重文件包含所述人工神经网络模型的权重系数和结构参数;
[0018] S5:将需要识别的图片输入所述人工神经网络模型,判别车辆类型并返回结果。
[0019] 所述当前应用环境包括道路卡口和工厂口。
[0020] 在所述步骤S1中,所述人工神经网络模型为基于darknet网络的yolo_v3网络。
[0021] 在所述步骤S22中,所述车辆照片按照7:3的比例分为训练集与测试集;
[0022] 在所述步骤S23中,在对车辆进行标注时,若车辆照片中所包含的车辆数目超过一个,则选取最中间的车辆进行标注。
[0023] 在所述步骤S23中,所述对车辆进行标注,包括:框出车辆所在位置,每个车辆分别画一个样本框,并将该车辆的分类信息写在标注数据集中,得到带有标注数据集的车辆照片。
[0024] 在所述步骤S23中,所述分类信息包括轿车、越野车、牵引车、自卸汽车、专用汽车下箱式汽车和专用汽车下罐式汽车。
[0025] 在所述步骤S3中,所述进行训练,包括:设定一个损失函数及其阈值,通过反复计算损失函数,以调整所述人工神经网络模型向着损失函数减小的方向演进。
[0026] 在所述步骤S4中,在所述损失函数达到损失函数的阈值时,停止训练。
[0027] 所述步骤S5包括:
[0028] S51:将需要识别的车辆照片传入服务器内,利用所述人工神经网络模型和所述步骤S4得到的权重文件来对该车辆照片进行车辆精准定位和车辆类型的识别,并将识别结果返回给客户;
[0029] S52:判断识别结果是否错误,将识别结果错误的照片传入所述人工神经网络模型中并重新进行训练。
[0030] 本发明的车辆类型判别方法所采用的车辆照片包括有遮挡样本、昏暗光线样本以及角度较差的情况下的网上获取的车型图片样本和实际应用场合情况下的车辆照片,因此能够降低识别车辆类型时对降低对有无遮挡、光线和拍摄角度的要求,能够正确识别遮挡不超过30%的、昏暗光线下和平拍摄角度不小于45度(车头正面为0度)的车辆类型。此外,本发明的车辆类型判别方法根据国家规定的几类车型进行汇总,通过人工将车辆的分类信息标注为轿车、越野车、牵引车、自卸汽车、专用汽车下箱式汽车和专用汽车下罐式汽车,通过车型种类识别系统可以识别多种车辆类型。此外,本发明的车辆类型判别方法所训练得到的人工神经网络模型一经训练后基本无需更改,可以一直使用,同时,模型可调性可以保障对应用环境的调整的需求。附图说明
[0031] 图1A-图1C为本发明的基于深度学习的车辆类型判别方法所采用的人工神经网络模型的原理图。
[0032] 图2为本发明的基于深度学习的车辆类型判别方法在判别车型并返回结果时的流程示意图。

具体实施方式

[0033] 以下结合具体实施例,对本发明做进一步说明。应理解,以下实施例仅用于说明本发明而非用于限制本发明的范围。
[0034] 不同型号的车辆有着截然不同的特征,例如小轿车较短较矮,相对而言SUV更高,且尾部较短,像这样的特点都被称为特征值,人类分辨物体是使用特征值来匹配已有的知识作出判决,而本发明的机器学习算法也采用同样的思想,事先通过卷积神经网络(CNN)学习到不同车型的特征,然后实际使用时,检测到图像中的车辆,最后探寻其特征并在知识库里匹配到最相似的车型。
[0035] 然而车辆型号之间的不同特征值太多,选取特征值是很复杂的,需要大量的统计学知识积累,通过人工选定特定的几种特征值是不现实的,而本专利采用的深度学习不需要人工选择特征,这是其一大优势,深度学习能够自动反复学习探寻不同车型的特征值,学习到成千上万的特征值得以保证极高的识别率。
[0036] 基于上述原理,本发明提供了一种基于深度学习的车辆类型判别方法,用以获取和匹配特征值,其包括:
[0037] 步骤S1:构建一个用于一当前应用环境中的yolo框架的人工神经网络模型,并且随机初始化所述人工神经网络模型的所有神经元连接的权重系数。
[0038] 其中,所述当前应用环境包括但不限于道路卡口、工厂门口等,所述权重系数将在后续过程中进行不断地更新优化以适配当前应用环境。
[0039] 其中,该yolo框架的人工神经网络模型优选为基于darknet网络(即来自于https://pjreddie.com/darknet/yolo/上)的yolo_v3网络,其结构如图1A-图1C所示,yolo_v3网络是一个106层的全卷积神经网络,如图1A-图1B所示,其大量使用残差结构Res n的跳层连接,其中,n=1,2,4或8,n表示残差结构中含有多少个残差单元。在这个yolo框架的人工神经网络模型中,如图1C所示,用来进行降采样的卷积操作DBL(即DarknetConv2D_BN_Leaky)均采用步长为2的卷积层,包括1个2维卷积(Conv2D)层Conv、1个批标准化(Batch Normalization)层BN以及一个1个LeakyReLU层LeakyRelu,斜率是0.1,该Leaky ReLU层是修正线性单元ReLU的变换。同时,该yolo_v3网络中还使用了上采样、路由操作route,还在一个人工神经网络模型中进行了3次检测,这3次检测,每次对应的感受野不同,采用多尺度对不同尺寸的目标进行检测,能够加快模型收敛,其中,图中Y1、Y2、Y3分别代表了不同的感受野,Y1为32倍降采样,Y2为16倍降采样,Y3为8倍降采样。32倍降采样的感受野最大,适合检测大的目标,所以在输入为416*416时,每个cell的三个anchor box为(116,90);(156,198);(373,326)。16倍降采样适合一般大小的目标,anchor box为(30,61);(62,45);(59,
119)。8倍降采样的感受野最小,适合检测小目标,因此anchor box为(10,13);(16,30);
(33,23)。所以当输入为416*416时,实际总共有(52*52+26*26+13*13)*3=10647个proposal box。由此可测量不同大小的目标。
[0040] 其中,使用残差结构Res n(n=1,2,4或8)的好处在于:
[0041] (1)深度模型一个关键的点就是能否正常收敛,残差这种结构能保证网络结构在很深的情况下,仍能收敛,模型能训练下去。
[0042] (2)网络越深,表达的特征越好,分类+检测的效果都会提升。
[0043] (3)残差中的1*1卷积,使用network in network的想法,大量的减少了每次卷积的channel,一方面减少了参数量(参数量越大,保存的模型越大),另一方面在一定程度上减少了计算量。
[0044] 步骤S2:将大量的车辆照片输入所述人工神经网络模型。其中,所输入的照片数据越多,学习效果越好。
[0045] 所述步骤S2具体包括:
[0046] 步骤S21:采集数据。从网上收集和在当前应用环境中抓拍大量的车辆照片;
[0047] 本发明收集了网上的车辆照片进行训练,还采集了实际的当前应用环境中的车辆照片,以实现特殊情况下的车型识别。所述车辆照片包括在有遮挡的情况下、昏暗光线的情况下以及角度较差(即车辆正面)的情况下的车辆照片,以增加识别准确率。
[0048] 步骤S22:为了使数据集符合训练规范,将车辆照片按照7:3的比例分为训练集与测试集;
[0049] 步骤S23:采用一图片标注工具在车辆照片上对车辆进行标注,得到带有标注数据集的车辆照片,并将训练集中的车辆照片输入所述人工神经网络模型。
[0050] 其中,在对车辆进行标注时,若车辆照片中所包含的车辆数目超过一个,则仿照注意力模型(AM),选取最中间的车辆进行标注,忽略周围其他车辆,以此来加强对视野中心的车辆关注度。
[0051] 其中,所述对车辆进行标注,具体包括:框出车辆所在位置,每个车辆分别画一个样本框,并将该车辆的分类信息写在标注数据集中,得到带有标注数据集的车辆照片。其中,所述分类信息根据《汽车分类国家标准(gb9417-89)》,包括轿车、越野车、牵引车、自卸汽车、专用汽车下箱式汽车和专用汽车下罐式汽车。由此,本发明通过人工将车辆的分类信息标注为轿车、越野车、牵引车、自卸汽车、专用汽车下箱式汽车和专用汽车下罐式汽车,可以识别包括但不限于以下几种车辆类型:轿车、越野车、牵引车、自卸汽车、专用汽车下箱式汽车和专用汽车下罐式汽车。
[0052] 步骤S3:使用所述人工神经网络模型和所述步骤S2中的训练集中的车辆照片来进行训练;
[0053] 其中,在所述步骤S3中,在进行训练之前,包括:获取车辆照片的标注数据集的格式(如xml文件)。依据标注数据集更改所述人工神经网络模型的YOLO参数,将类别数目改为车辆的分类信息的种类数,在本实施例中,该类别数目为6。
[0054] 所述进行训练,具体包括:设定一个损失函数及其阈值,该损失函数的物理意义为网络接收输入时给出的预测值与真实值的差距,是关于n维权重系数的函数,该损失函数越小,则预测越准确,通过反复计算损失函数,以调整所述人工神经网络模型向着损失函数减小的方向演进。其中,所述人工神经网络模型的调整具体包括:由导数定义可知,当损失函数的导数小于零时,损失函数递减。求解损失函数对权重系数的每一维系数的偏导数,就可以算出这一维系数对于整个损失函数变化的影响程度,影响程度大权重的系数,我们进行较大的调整,较小的权重系数,进行较小的调整,这样就能使得损失函数快速趋近于一个最小值,也就是达到了训练的目标。
[0055] 另外,所述步骤S3可以采用CPU进行,也可以采用GPU来进行。通过采用GPU代替CPU的方式,利用GPU加速损失函数的收敛计算,可以得到更好更迅速的训练效果。
[0056] 步骤S4:在足够多次数的学习之后,在所述损失函数达到损失函数的阈值时,达到分类性能要求,停止训练,得到适用于当前应用环境的权重文件,该权重文件包含所述人工神经网络模型的权重系数和结构参数。
[0057] 此外,所述步骤S4还包括:使用测试集以提高模型的准确度,具体包括:在每次训练后通过测试集对不同迭代计算次数的权重文件进行测试,选取结果较好的权重文件当作最终的权重文件,同时对于训练前的参数设置与调整也有指导意义。
[0058] 步骤S5:如图2所示,将需要识别的图片输入所述人工神经网络模型,判别车辆类型并返回结果。此时人工神经网络模型中包含所述步骤S4得到的权重文件,因此适用于当前应用环境。
[0059] 其中,所述步骤S5包括:
[0060] 步骤S51:车型识别,具体包括:将需要识别的车辆照片传入服务器内,利用所述人工神经网络模型和所述步骤S4得到的权重文件来对该车辆照片进行车辆精准定位和车辆类型的识别,并将识别结果返回给客户;
[0061] 步骤S52:错误纠正,具体包括:判断识别结果是否错误,将识别结果错误的照片继续传入所述人工神经网络模型中并重新进行训练,以更新所述权重文件,以此降低错误率直到完全识别正确为止。
[0062] 以上所述的,仅为本发明的较佳实施例,并非用以限定本发明的范围,本发明的上述实施例还可以做出各种变化。凡是依据本发明申请权利要求书及说明书内容所作的简单、等效变化与修饰,皆落入本发明专利的权利要求保护范围。本发明未详尽描述的均为常规技术内容。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈