首页 / 专利库 / 数学与统计 / 优化算法 / 梯度下降法 / 一种增强和识别交通标志的方法

一种增强和识别交通标志的方法

阅读:2发布:2020-12-22

专利汇可以提供一种增强和识别交通标志的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种增强和识别交通标志的方法,首先输入交通标志图像,然后对原始图像进行区域裁剪、图像灰度化、尺寸归一化等预处理,突出图像的细节信息,提高图像数据的 质量 ;接着,采用基于灰度梯度直方图的图像 对比度 自适应增强 算法 对图像做进一步的处理,改善交通标志收集过程中存在的 运动模糊 、对比度低等造成图像特征不明显的 缺陷 ,在一定程度上减少噪声和光照等因素的影响,提高数据图像的质量,进而提高系统识别 精度 ;然后使用 卷积神经网络 提取图像特征信息,进行卷积操作、 池化 操作、线性修正单元激活函数、局部优化;最后使用改进的LeNet-5网络模型训练图像,输出结果。,下面是一种增强和识别交通标志的方法专利的具体信息内容。

1.一种增强和识别交通标志的方法,其特征在于:包括以下步骤:
(1)获取原始图像;
(2)对所获得的原始图像进行预处理,包括区域裁剪、图像灰度化和尺寸归一化;
(3)对预处理后的图像使用基于灰度梯度直方图的图像对比度自适应增强算法增强交通标志图像;
(4)使用基于深度学习卷积神经网络对已处理的图像提取特征信息;
(5)使用改进的LeNet-5网络模型对图像进行训练,最后输出结果。
2.根据权利要求1所述的检测和识别交通标志的方法,其特征在于:所述步骤(2)的详细内容为:
(2.1)区域裁剪:按照交通标志图像的尺寸大小进行对应比例的裁剪;
(2.2)图像灰度化:使用加权法将彩色的交通标志图像转化为单通道的灰度图像,用固定的系数对彩色图像中R、G、B三个颜色通道的分量只进行加权求和运算,结果即使灰度图像的灰度值,公式如下:
O(x,y)=aR(x,y)+bG(x,y)+cB(x,y)
其中R(x,y),G(x,y)和B(x,y)分别代表彩色交通标志图像的红、绿、蓝三个通道的分量值;a,b,c分别表示三通道分量和加权系数,取值分别为:0.3、0.6和0.12,O(x,y)表示与彩色图像(x,y)处像素点相对应灰度图像的灰度值;
(2.3)图像尺寸归一化:使用双三次插值算法对经过灰度化和区域裁剪处理后的交通标志图像数据进行尺寸归一化。
3.根据权利要求1所述的检测和识别交通标志的方法,其特征在于:所述步骤(3)的具体过程为:先采用如下灰度梯度直方图形状处理公式如下:
GIHf(k)=GIH(k)p
其中,k表示灰度的级数,GIHf(k)是修正后的灰度梯度直方图,p是灰度梯度直方图的调节参数;
如果p=0,则基于修正的灰度梯度直方图均衡化类似于线性增强;
如果p=1,则修正的灰度梯度直方图均衡化过程就是灰度梯度直方图均衡化;
然后采用如下方法对灰度梯度直方图进行归一化处理:
计算累积分布函数F(x)如下式所示:
映射函数为:
yf(k)=[F(k)(yu-yd)+yd]
其中,yf是最终增强的图像,yu和yd是 的最大值和最小值;
上述过程中, p的取值范围为[0,1];
B是图像位数, 是 的均值,g为梯度算子。
4.根据权利要求1所述的检测和识别交通标志的方法,其特征在于:所述步骤4中采用卷积神经网络提取图像特征信息的具体过程包括卷积操作、池化操作、引入修正线性单元ReLU作为神经网络的激活函数和避免局部最优;
其中,避免局部最优时在权值学习过程中加入动量因子,公式如下:
式中,α是动量因子,且0≤α≤1,当α=0时,即为传统的BP算法, 代表第n步迭代时误差对wji的偏导数。
5.根据权利要求1所述的检测和识别交通标志的方法,其特征在于:所述步骤(5)在图像进行训练输出时,在LeNet-5网络模型中增加卷积层和池化层,即共设置6个卷积层、3个池化层、2个Inception结构层、2个全连接层、一个输入层和一个输出层;具体包括以下步骤:
(5.1)数据训练中,在LeNet-5网络模型的全连接层的第二层引入Dropout防止过拟合策略,每训练一批样本,就以一定的概率随机屏蔽全连接层中部分隐含层结点,在训练时随机保留80%隐含结点,而在测试和应用是则保留全部结点;
(5.2)采用批量梯度下降算法调整网络结构的学习参数,每次只计算一个批次的训练样本的损失函数,公式如下:
式中,batch表示批次的大小,batch值设置为100。

说明书全文

一种增强和识别交通标志的方法

技术领域

[0001] 本发明属于计算机视觉深度学习技术,具体涉及一种增强和识别交通标志的方法。

背景技术

[0002] 随着科学技术的进步和经济的快速发展,人们的生活平得到了很大的提高,尤其是在交通基础设施日趋完善的今天,汽车也逐渐地成为人们日常出行的交通工具。交通标志图像中包含很多重要的指示信息,如限制驾驶行为、限制车速、指示路线和救助等,高效地交通标志图像设别系统能够为驾驶员安全驾驶提供极大的帮助,有利于驾驶员根据提示信息作出合适的驾驶行为调整,进而避免交通事故的发生。
[0003] 交通标志识别系统主要包含两个部分:信息定位检测和识别。信息定位检测分割技术目前已十分成熟,而交通标志图像的识别精度将直接影响整个系统地实用性。
[0004] 现有的智能交通系统对交通标志的检测并不完善,国内外学者对交通标志检测的研究已有初步成效,但仍然存在着对交通标志灰度化处理中过度增强的缺陷,这一缺陷很大程度上影响了系统后续对交通标志的识别。

发明内容

[0005] 发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种增强和识别交通标志的方法,因此,为了突出数据图像的细节信息,提高数据图像的质量,本发明会首先对交通标志图像采取区域裁剪、灰度化、尺寸归一化和对比度增强等一系列操作进行预处理,其中对图像的对比度增强,利用的是基于灰度梯度直方图的图像对比度自适应算法,然后利用深度学习理论中的卷积神经网络提取交通标志图像的多尺度特征信息,最后使用改进后的LeNet-5网络模型输出结果。
[0006] 技术方案:本发明利用一种增强和识别交通标志的方法,包括以下步骤:
[0007] (1)获取原始图像;
[0008] (2)对所获得的原始图像进行预处理,包括区域裁剪、图像灰度化和尺寸归一化;
[0009] (3)对预处理后的图像使用基于灰度梯度直方图的图像对比度自适应增强算法增强交通标志图像;
[0010] (4)使用基于深度学习的卷积神经网络对已处理的图像提取特征信息;
[0011] (5)使用改进的LeNet-5网络模型对图像进行训练,最后输出结果。
[0012] 进一步的,所述步骤(2)的详细内容为:
[0013] (2.1)区域裁剪:按照交通标志图像的尺寸大小进行对应比例的裁剪,只保留交通标志图像的主要信息部分,减少图像背景信息的干扰,突出目标区域的重要特征;
[0014] (2.2)图像灰度化:使用加权法将彩色的交通标志图像转化为单通道的灰度图像,用固定的系数对彩色图像中R、G、B三个颜色通道的分量只进行加权求和运算,结果即使灰度图像的灰度值,公式如下:
[0015] O(x,y)=aR(x,y)+bG(x,y)+cB(x,y)
[0016] 其中R(x,y),G(x,y)和B(x,y)分别代表彩色交通标志图像的红、绿、蓝三个通道的分量值;a,b,c分别表示三通道分量和加权系数,取值分别为:0.3、0.6和0.12。O(x,y)表示与彩色图像(x,y)处像素点相对应灰度图像的灰度值;
[0017] (2.3)图像尺寸归一化:使用双三次插值算法对经过灰度化和区域裁剪处理后的交通标志图像数据进行尺寸归一化。
[0018] 进一步的,所述步骤(3)的具体过程为:先采用如下灰度梯度直方图形状处理公式如下:
[0019] GIHf(k)=GIH(k)p
[0020] 其中,k表示灰度的级数,GIHf(k)是修正后的灰度梯度直方图,p是灰度梯度直方图的调节参数;p的取值范围为[0,1];
[0021] 如果p=0,基于修正的灰度梯度直方图均衡化类似于线性增强;
[0022] 如果p=1,则修正的灰度梯度直方图均衡化过程就是灰度梯度直方图均衡化;
[0023] 然后采用如下方法对灰度梯度直方图进行归一化处理:
[0024]
[0025] 计算累积分布函数F(x)如下式所示:
[0026]
[0027] 映射函数为:
[0028] yf(k)=[F(k)(yu-yd)+yd]
[0029] 其中,yf是最终增强的图像,yu和yd是 的最大值和最小值;
[0030] 上述过程中,
[0031] B是图像位数, 是 的均值。
[0032] 进一步的,所述步骤4中采用卷积神经网络提取图像特征信息的具体过程包括卷积操作、池化操作、引入修正线性单元ReLU作为神经网络的激活函数和避免局部最优;
[0033] 其中,避免局部最优主要是通过在权值学习过程中加入动量因子,公式如下:
[0034]
[0035] 式中,α是动量因子,且0≤α≤1,当α=0时,即为传统的BP算法;
[0036] 由上式可知,加入动量因子后,权值的调整与上次的梯度也有联系,使权值在调整过程中跳出局部最优点。
[0037] 进一步的,所述步骤(5)在图像进行训练输出时,在LeNet-5网络模型中增加卷积层和池化层,即共设置6个卷积层、3个池化层、2个Inception结构层、2个全连接层、一个输入层和一个输出层;具体包括以下步骤:
[0038] (5.1)数据训练中,在LeNet-5网络模型的全连接层的第二层引入Dropout防止过拟合策略,每训练一批样本,就以一定的概率随机屏蔽全连接层中部分隐含层结点,在训练时随机保留80%隐含结点,而在测试和应用是则保留全部结点,防止训练过程中产生过拟合的现象;
[0039] (5.2)采用批量梯度下降算法调整网络结构的学习参数,每次只计算一个批次的训练样本的损失函数,公式如下:
[0040]
[0041] 式中,batch表示批次的大小,例如batch值设置为100;通过矩阵运算,随着计算机性能的提高,每次利用一个batch训练数据的损失函数优化神经网络的权值参数并不会影响网络的学习效率。此外,每次使用一个batch的训练数据可减少网络模型收敛所需要的迭代次数,同时也可使网络模型收敛的结果更加接近采用梯度下降算法计算的结果。
[0042] 此处,采用Dropout防止过拟合策略防止训练过程中产生过拟合的现象;采用批量梯度下降算法调整网络结构的学习参数,每次只计算一个批次的训练样本的损失函数。
[0043] 有益效果:本发明克服传统图像增强算法过度增强的问题,有效提高数据图像的质量;改进的LeNet-5网络模型是基于Inception并联卷积层结构改进的网络模型,在该模型中引入Dropout防止过拟合策略和批量梯度优化算法,克服LeNet-5网络模型提取图像特征信息方式单一的缺陷,提高网络模型提取图像特征信息的能和识别精度。附图说明
[0044] 图1为本发明的整体处理流程示意图。
[0045] 图2为实施例的处理过程和效果示意图。

具体实施方式

[0046] 下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
[0047] 如图1所示,本实施例的一种增强和识别交通标志的方法,包括以下步骤:
[0048] 步骤1:获取原始的交通标志图像;
[0049] 步骤2:对步骤一获取的原始图像进行区域裁剪、图像灰度化、尺寸归一化等预处理。具体包括以下步骤:
[0050] 步骤201:区域裁剪。按照交通标志图像的尺寸大小进行一定比例的裁剪,只保留交通标志图像的主要信息部分,减少图像背景信息的干扰,突出目标区域的重要特征。
[0051] 步骤202:图像灰度化。使用加权法将彩色的交通标志图像转化为单通道的灰度图像,用固定的系数对彩色图像中R、G、B三个颜色通道的分量只进行加权求和运算,结果即使灰度图像的灰度值,公式如下:
[0052] O(x,y)=aR(x,y)+bG(x,y)+cB(x,y)
[0053] 其中R(x,y),G(x,y)和B(x,y)分别代表彩色交通标志图像的红、绿、蓝三个通道的分量值;a,b,c分别表示三通道分量和加权系数,取值分别为:0.3、0.6和0.12。O(x,y)表示与彩色图像(x,y)处像素点相对应灰度图像的灰度值。
[0054] 步骤203:图像尺寸归一化。使用双三次插值算法对经过灰度化和区域裁剪处理后的交通标志图像数据进行尺寸归一化。插值基函数数学表达式为:
[0055]
[0056] 双三次插值公式如下:
[0057] f(i+u,j+v)=ABC
[0058] 其中,A,B,C均为矩阵,形式如下:
[0059] A=[S(1+u)S(u)S(1-u)S(2-u)]
[0060]
[0061] C=[S(1+v)S(v)S(1-v)S(2-v)]T
[0062] 其中,f(i,j)为原图像在(i,j)处的灰度值。
[0063] 步骤3:在完成步骤2的基础上,对已预处理的图像使用基于灰度梯度直方图的图像对比度自适应增强算法进行对比度增强。灰度梯度直方图公式如下:
[0064]
[0065] 式中,k表示灰度的级数,G是梯度图像计算梯度算子,G(k)是灰度级为k的梯度值之和,sum(G)表示所有灰度级的梯度总和。
[0066] 灰度梯度直方图均衡化的对比度增强程度与其直方图的高度成正比。为了减弱过增强现象,本实施例使用一种改变灰度梯度直方图形状的方法,公式如下:
[0067] GIHf(k)=GIH(k)p
[0068] 其中,GIHf(k)是修正后的灰度梯度直方图,p是灰度梯度直方图的调节参数。p的取值范围为[0,1],如果p=0,基于修正的灰度梯度直方图均衡化类似于线性增强;如果p=1,则修正的灰度梯度直方图均衡化过程就是灰度梯度直方图均衡化。然后采用如下方法对灰度梯度直方图进行归一化处理:
[0069]
[0070] 计算累积分布函数F(x)如下式所示:
[0071]
[0072] 映射函数为:
[0073] yf(k)=[F(k)(yu-yd)+yd]
[0074] 其中,yf是最终增强的图像,yu和yd是 的最大值和最小值。
[0075] 随着p值的增加,图像增强的程度越强。获得合适图像增强效果的关键在于选择适当的p值,本发明根据灰度梯度直方图的标准差使用自适应参数p,如下式所示:
[0076]
[0077] 式中,stdh为:
[0078]
[0079] 其中,B是图像位数, 是 的均值。自适应参数p与灰度梯度直方图的标准偏差成反比,且自适应参数p的值越大,图像增强的强度就越高。
[0080] 步骤4:使用基于深度学习的卷积神经网络提取步骤3中已预处理的图像特征信息。
[0081] 步骤401:卷积操作。使用多卷积核来提取图像的特征信息;
[0082] 步骤402:池化操作。为了对图像中相邻的像素进行融合去冗余,采用最大值池化方法,通过一个3×3的窗口在原始图像上滑动,每次只保留窗口中的最大值;
[0083] 步骤403:引入修正线性单元ReLU作为神经网络的激活函数,ReLU函数如下所示:
[0084] y=max(0,z)
[0085] 当z≤0时,输出结果为0,当z>0时,输出结果是一条斜率为1的直线。ReLU函数咋反向传播过程中可以很好的传递梯度,经过多层的反向传播后,梯度依旧不会大幅减小,因此克服了梯度弥散的问题;
[0086] 步骤404:避免局部最优。在权值学习过程中加入动量因子,在一定程度上避免权值在学习过程中陷入局部最优。公式如下:
[0087]
[0088] 式中,α是动量因子,且0≤α≤1,当α=0时,即为传统的BP算法。由上式可知,加入动量因子后,权值的调整与上次的梯度也有联系,使权值在调整过程中跳出局部最优点。
[0089] 步骤5:使用改进后的LeNet-5网络模型对图像进行训练输出。
[0090] 改进的LeNet-5网络模型是在LeNet-5网络模型的基础上,引入Inception并联卷积层结构,调整其网络结构布局,增加相应的卷积层和池化层。改进的LeNet-5网络模型共有15层,其中包含6个卷积层、3个池化层、2个Inception结构层、2个全连接层、一个输入层和一个输出层。该网络结构可以同时提取图像不同维度的特征信息,克服了提取图像特征信息方式单一的问题,提高了网络提取图像特征信息的能力。
[0091] 步骤501:使用Dropout防止过拟合策略。数据训练中,在网络模型全连接层的第二层引入Dropout防止过拟合策略,每训练一批样本,就以一定的概率随机屏蔽全连接层中部分隐含层结点,在训练时随机保留80%隐含结点,而在测试和应用是则保留全部结点,防止训练过程中产生过拟合的现象。
[0092] 步骤502:采用批量梯度下降算法调整网络结构的学习参数,每次只计算一个批次的训练样本的损失函数。公式如下:
[0093]
[0094] 式中,batch表示批次的大小,batch值设置为100;通过矩阵运算,随着计算机性能的提高,每次利用一个batch训练数据的损失函数优化神经网络的权值参数并不会影响网络的学习效率。此外,每次使用一个batch的训练数据可以减少网络模型收敛所需要的迭代次数,同时也可以使网络模型收敛的结果更加接近采用梯度下降算法计算的结果。
[0095] 实施例:
[0096] 如图2所示,本实施以施工标志为例,首先对图像预处理,然后使用本发明来增强图像对比度,得到处理后的施工标志;接着使用深度学习卷积神经网络提取处理后的图像特征,使用改进的LeNet-5网络模型训练测试,最终得出图像的置信度
[0097] 由实施例和图2可知,本发明对交通标志的增强和识别过程比传统方法更加高效和智能,更加能够弥补现有技术对交通标志灰度化处理中过度增强等缺陷。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈