首页 / 专利库 / 数学与统计 / 扩散张量 / 一种基于卷积神经网络的钢板表面缺陷的检测方法

一种基于卷积神经网络板表面缺陷的检测方法

阅读:292发布:2020-10-07

专利汇可以提供一种基于卷积神经网络板表面缺陷的检测方法专利检索,专利查询,专利分析的服务。并且一种 钢 板表面 缺陷 的检测分类方法,通过视觉设备获取钢板的图片,然后建立相应的CNN模型,利用稀疏自动 编码器 初始化权重,对CNN相关的 算法 的设计及优化,训练CNN模型,通过训练好的CNN判断钢板是否存在缺陷。该方法将 卷积神经网络 应用于钢板缺陷的 图像处理 ,这样图像中的特征提取和各种缺陷的分类同时进行,而且卷积神经网络中的权值共享可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强,鲁棒性更好。,下面是一种基于卷积神经网络板表面缺陷的检测方法专利的具体信息内容。

1.一种板表面缺陷的检测分类方法,包括如下步骤:
步骤一,通过视觉设备获取钢板的图片;
步骤二,建立卷积神经网络模型;
卷积神经网络模型是一个7层的结构;给出40×40的灰度图像输入到第一层卷积层,其中第一层卷积层Conv有20个5×5像素内核;然后得到20个36×36像素的传递到第一个最大池化层Max-pooling,池化层采用2×2的采样窗口,步长为2.输出是一组18×18的20个特征图;然后是第二个卷积层,1000个5×5像素的滤波器内核,得到的14×14的50个特征图然后被传递到第二个最大池化层,采用2×2的采样窗口,步长为2,输出是一组7×7的50个特征图;它们之后是具有20,000个4×4像素的过滤器内核的第三个卷积层;所得到的4×4的
400个特征图然后被连接成一个6400×1的1D特征向量;然后将该特征向量馈送到产生1D×
1D输出向量的分类层输出分类结果;
2.1输入层直接使用图像的原始像素;
2.2卷积层实现了先前特征图的二维卷积运算;输出特征图的激活通过对通过像素方式的激活函数传递的一个或多个卷积响应相加来获得;每个卷积层都有许多滤波器内核生成一些不同的输出特征图,不同的滤波器内核可以提取不同的特征表示;激活函数有S形,双曲正切和整流线性单位ReLU,.ReLU只受其最小值零的限制,可表示任何非负实数值;同时,ReLUs具有良好的稀疏性,因为具有零激活值,以及限制训练过程中输出的饱和度和渐变的扩散;与传统的CNN不同,我们的模型中采用ReLU激活函数;逻辑单元的导数大大降低计算复杂度;
2.3最大池化层即子采样层实现了“汇集”操作,其是降维和非线性的一种形式;特征池使功能映射的激活对图像的像素的确切位置和模型的特定结构不那么敏感;特征池允许更高层的特征表示,以保留最关键的特征信息并减少计算负担,而不会丢失太多的信息;子采样层的输出特征图由非重叠或重叠的正方形区域的一定的激活给出;
2.4分类层采用softmax回归;它在输出类别上产生概率分布,并确保每个输出可以被解释为属于某一类的特定输入的概率;对于给定的未标记输入图像,对其进行分类,判断其是钢板缺陷中裂纹、划痕、黑斑、针孔、表面夹杂、擦伤和孔洞的哪一类或者是没有缺陷;
步骤三稀疏自动编码器的权重初始化趋向于将模型设置为比随机初始化更好的初始状态,导致分类性能的惊人增益;CNN的训练是一个高度非凸优化问题,权重的初始化很大程度上影响了训练的准确性和收敛速度;使用三层的稀疏自动编码器来学习大量的滤波器内核;通过从钢板表面缺陷的图像中随机抽取5×5图像补丁生成训练集,总共采集24,000个补丁;正如我们预期的那样,学习的滤波器内核主要保留在不同位置和方向上的边缘或落;这与以前的工作一致;自动编码器中的稀疏正则化对于学习这些边缘或角落是必要的;为了不局限于局部最小化并加速收敛,卷积神经网络模型中的卷积层的滤波器内核由这些学习的滤波器内核初始化;
步骤四CNN中的算法
4.1在正向传播过程中,对于单个训练样本,正向传播步骤由以下等式(1),(2),(3)和(4)给出:
其中,f(·)表示单位的激活函数, 和 分别表示层l中的单元j和层l+1中的单位k
的偏差, 和 表示连接权重, 和 表示单元的输出值;
4.2为了更好地利用矩阵运算中的并行性,采用向量化;对于N个训练样本,矢量化形式由以下等式(5)和(6)给出:
A(l)=f(W(l)A(l-1)+B(l))   (5)
A(l+1)=exp(W(l+1)A(l)+B(l+1))/V   (6)
其中,A(l-1),A(l),A(l+1),W(l),W(l+1),B(l)和B(l+1)分别是nl-1×N,nl×N,nl+1×N,nl×nl-1,nl+1×nl,nl×N,nl+1×N的矩阵;每列偏置矩阵B(l)和B(l+1)相等,exp(W(l+1)A(l)+B(l+1))/V表示两个矩阵的分割元素;
4.3在反向传播过程中,数据矩阵X通过连接每个训练样本x(m)来形成X的列,包含整个训练数据集,因此X是d×N矩阵,X的第m列对应于第m训练样本;假设损失函数为softmax回归,N个训练样本的总体损失函数由式(7)给出:
其中,运算符⊙表示Hadamard方程,||·||F表示Frobenius-norm,第一项是误差项,第二项是减小权重大小的正则化项,有助于防止模型的过度拟合,λ是在优化过程中平衡这两个项的相对重要性的权重衰减参数;模型参数Θ在减小损失函数值的方向上改变;在训练过程中,将模型的实际输出与目标输出进行比较,通过整个网络中的差异来训练Θ;假设标签矩阵G是c×N矩阵,第m列gm=[0,···,1,···,0]T∈RC对应于第m个训练样本的目标输出向量,每列只有一个非零元素1,位置1表示其类标号;J的优化通常是非凸的,需要从数千或数百万个样本中进行培训;因此,J的最小化通常使用随机梯度下降的变量,这被称为小批次随机梯度下降;
4.4对于每层中的每个单元,要计算灵敏度,单位的灵敏度由以下等式(8),(9)和(10)给出:
Δ(l)=(W(l+1))TΔ(l+1)f'(Z(l))   (9)
Δ(l-1)=(W(l))TΔ(l)f'(Z(l-1))   (10)
4.5权重的偏导数由以下等式(11)和(12)给出:
ΔW(l+1)=Δ(l+1)(A(l))T+λW(l+1)   (11)
ΔW(l)=Δ(l)(A(l-1))T+λW(l)   (12)
其中,Δ(l+1),Δ(l),Δ(l-1),ΔW(l+1)和ΔW(l)分别是nl+1×N,nl×N,nl-1×N,nl+1×nl,nl×nl-1的矩阵;
因此,权重更新规则由以下等式(13)和(14)给出:
4.6对先前的特征图 通过滤波器内核 在激活函数f(·)作用下的计算公式如等
式(15)所示:
其中 和 表示第l层的第j个特征图和第l-1层的第j个特征图, 表示第l层的第
j个特征图的基础;假设 的大小为W×H, 的大小为F×F,步幅为F,则 的大小为(W-F+S)/S×(W-F+S)/S;假设输入特征图I是H×W×m的三维张量,其中H,W和m分别是输入特征图的高度,宽度和数量;卷积内核K是F×F×m×n的四维张量,其中F是卷积核的大小,n是输出特征图的数量;我们假设卷积没有填充零,步幅等于1.然后,卷积层O的输出特征图由下列等式(16)给出:
4.7令 表示l+1层的第k个特征图,大小为W×H,R的大小为r×r,步幅为S,输出特征图由公式(17)给出:
其中运算符down(·)表示下采样操作,Mk表示输入特征图集, 是l+1层的第k个特征图的基础;因此, 的大小为(W-r+S)/S×(W-r+S)/S;
4.8计算梯度
假设l-1层是子采样层,层l是卷积层,层l+1是子采样层,δi(l-1), 和 分别表示第l-1层的第i个特征图,第l层的第j个特征图,第l+1层的第k个特征图;
其中,运算符 表示二维相关运算,运算符up(·)表示上采样运算,Mi表示连接第l-1层的第i个特征图和第l层的一些特征图, 表示第l-1层的第i个特征图与第l-1层的第j个特征图之间的滤波核;
计算 后,过滤器内核 将通过梯度下降进行更新,如下所示:
其中η表示学习率;
步骤五对卷积神经网络进行实验训练,使用不同数量的训练样本,不同尺寸的图像,不同的批量大小,不同的时期图像来训练CNN模型;为了评估对图像缺陷检测的鲁棒性,将图像中的加法高斯噪声加到图像中,模拟图像的故障行为,为了处理随机影响,进行多次试验;第一个卷积层的滤波器内核通过稀疏自动编码器用学习的滤波器内核初始化,其他滤波器内核都通过从标准正态分布采样进行初始化,并将特征图的偏差全部初始化为零;该模型在整个训练数据集上使用小批次随机梯度下降进行了优化学习率初始化为0.001;
步骤六通过训练好的CNN判断钢板是否存在缺陷,如果钢板的图像被判断出属于裂纹、划痕、黑斑、针孔、表面夹杂、擦伤和孔洞七种中的一种即此钢板属于缺陷,如果属于另外一个种则是完好的产品。

说明书全文

一种基于卷积神经网络板表面缺陷的检测方法

技术领域

[0001] 本发明涉及深度学习领域,尤其涉及到基于卷积神经网络的钢板表面的缺陷检测和分类方法。

背景技术

[0002] 钢板在工业制造中被广泛应用,其主要用于制造桥梁船舶、车辆、锅炉、高压容器、输油输气管道、大型钢结构等。经济的快速发展促进了钢需求不断加大,钢铁的质量成为人们的首要关注问题。原材料、生产环境、生产工艺等各个方面的原因容易造成钢板在生产的过程中出现裂纹、划痕、黑斑、针孔、表面夹杂、擦伤和孔洞等多种缺陷,如果这些有质量问题的产品不能及时检测出来加以停止,会导致带有缺陷的产品批量生产,会产生不可估量的损失。另外,这些有缺陷的钢板在耐磨和防腐蚀性方面都会相对较弱,这样其生产的产品就会在使用性能方面存在一定的问题。因此,在钢板生产过程中,如果能及时的把有缺陷的产品检测出来,就会大大的提高钢板生产的质量。
[0003] 随着工业自动化,常应用于钢板生产中的自动无损检测方法有涡流检测法和红外检测法。自动无损检测方法能检测钢坯表面的缺陷,部分还可以检测出钢坯内部的缺陷,但是,可检测的缺陷种类较少,不能将钢坯缺陷完全检测出来。随着计算机视觉机器学习的发展,钢铁表面缺陷的机器视觉检测系统在钢铁工业中越来越普遍。机器视觉检测方法主要有激光扫描检测和CCD检测法。主要包括三阶段:1)定位表面缺陷位置(检测)。2)计算大量表面缺陷的特征表征。3)通过优化特征向量训练分类器,然后通过训练分类器(Classification)预测新模式。但是手工设计的功能取决于强大的专家知识和复杂的设计方法,而且特征的设计与分类器的设计分开完成会因任务而异,因此设计的特征可能不是分类器的最佳选择。
[0004] 卷积神经网络(CNN)是这几年来发展迅速并引起广泛重视的一种高效深度学习识别算法,其已经成为当前语音分析和图像处理领域的研究热点。使用卷积神经网络能将图像中的特征提取和各种缺陷的分类同时进行,而且卷积神经网络中的权值共享可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强,鲁棒性更好。

发明内容

[0005] 本发明要克服现有技术的上述缺点,提供一种基于卷积神经网络的钢板表面缺陷的检测方法,采用卷积神经网络对钢板表面缺陷进行分类,通过监督学习,可以直接从标记的表面缺陷图像中学到更好的代表性特征。
[0006] 为实现上述目的,本发明采用以下技术方案:
[0007] 一种钢板表面缺陷的检测分类方法,包括如下步骤:
[0008] 步骤一,通过视觉设备获取钢板的图片;
[0009] 步骤二,建立CNN模型;
[0010] 步骤三,利用稀疏自动编码器初始化权重;
[0011] 步骤四,CNN相关的算法的设计及优化;
[0012] 步骤五,对CNN进行训练;
[0013] 步骤六,通过训练好的CNN判断钢板是否存在缺陷。
[0014] 本发明将卷积神经网络应用于钢板缺陷的图像处理,这样图像中的特征提取和各种缺陷的分类同时进行,而且卷积神经网络中的权值共享可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强,鲁棒性更好。
[0015] 本发明的原理是:
[0016] 在获取目标图像之后,利用已经训练好的卷积神经网络进行钢板的缺陷识别和分类。卷积神经网络中构建了特征提取器和分类器的组合的可训练架构,并且可以直接对二维图像的原始像素进行操作。每层卷积层都使用ReLU激活函数,可大大降低计算的复杂度。分类层采用softmax回归,在输出类别上产生概率分布,并确保未标记的输入图像输出时对应其类。
[0017] 本发明具有以下技术效果:
[0018] 该发明方法可以准确的识别钢板缺陷并进行分类。
[0019] 本发明的优点:不需要对获取的图像进行预处理即可以通过训练好的卷积神经网络进行缺陷别,而且卷积神经网络的算法分类精度高,复杂度小,具有很好的鲁棒性。附图说明
[0020] 图1为本发明的算法流程框图
[0021] 图2为本发明的工作流程框图。

具体实施方式

[0022] 下面结合附图,进一步说明本发明的技术方案。
[0023] 本发明的一种钢板表面缺陷的检测分类方法,包括如下步骤:
[0024] 步骤一,通过视觉设备获取钢板的图片;
[0025] 步骤二,建立卷积神经网络模型;
[0026] 卷积神经网络模型是一个7层的结构。给出40×40的灰度图像输入到第一层卷积层,其中第一层卷积层Conv有20个5×5像素的内核。然后得到20个36×36像素的传递到第一个最大池化层Max-pooling,池化层采用2×2的采样窗口,步长为2.输出是一组18×18的20个特征图。然后是第二个卷积层,1000个5×5像素的滤波器内核,得到的14×14的50个特征图然后被传递到第二个最大池化层,采用2×2的采样窗口,步长为2,输出是一组7×7的
50个特征图。它们之后是具有20,000个4×4像素的过滤器内核的第三个卷积层。所得到的4×4的400个特征图然后被连接成一个6400×1的1D特征向量。然后将该特征向量馈送到产生1D×1D输出向量的分类层输出分类结果。
[0027] 2.1输入层直接使用图像的原始像素;
[0028] 2.2卷积层实现了先前特征图的二维卷积运算。输出特征图的激活通过对通过像素方式的激活函数传递的一个或多个卷积响应相加来获得。每个卷积层都有许多滤波器内核生成一些不同的输出特征图,不同的滤波器内核可以提取不同的特征表示,如边缘,交叉点和拐。如图2所示,激活函数有许多种,如S形,双曲正切和整流线性单位(ReLU).ReLU只受其最小值零的限制,可表示任何非负实数值。同时,ReLUs具有良好的稀疏性,因为具有零激活值,以及限制训练过程中输出的饱和度和渐变的扩散。与传统的CNN不同,我们的模型中采用ReLU激活函数。逻辑单元的导数可以大大降低计算复杂度;
[0029] 2.3最大池化层即子采样层实现了“汇集”操作,其是降维和非线性的一种形式。特征池使功能映射的激活对图像的像素的确切位置和模型的特定结构不那么敏感。特征池允许更高层的特征表示,以保留最关键的特征信息并减少计算负担,而不会丢失太多的信息。子采样层的输出特征图由非重叠或重叠的正方形区域的一定的激活给出;
[0030] 2.4分类层采用softmax回归。它在输出类别上产生概率分布,并确保每个输出可以被解释为属于某一类的特定输入的概率。对于给定的未标记输入图像,对其进行分类,判断其是钢板缺陷中裂纹、划痕、黑斑、针孔、表面夹杂、擦伤和孔洞的哪一类或者是没有缺陷;
[0031] 步骤三稀疏自动编码器的权重初始化趋向于将模型设置为比随机初始化更好的初始状态,导致分类性能的惊人增益。CNN的训练是一个高度非凸优化问题,权重的初始化很大程度上影响了训练的准确性和收敛速度。使用三层的稀疏自动编码器来学习大量的滤波器内核。通过从钢板表面缺陷的图像中随机抽取5×5图像补丁生成训练集,总共采集24,000个补丁。正如我们预期的那样,学习的滤波器内核主要保留在不同位置和方向上的边缘或角落;这与以前的工作一致。自动编码器中的稀疏正则化对于学习这些边缘或角落是必要的。为了不局限于局部最小化并加速收敛,我们的模型中的卷积层的滤波器内核由这些学习的滤波器内核初始化;
[0032] 步骤四CNN中的算法
[0033] 4.1在正向传播过程中,对于单个训练样本,正向传播步骤由以下等式(1),(2),(3)和(4)给出:
[0034]
[0035]
[0036]
[0037]
[0038] 其中,f(·)表示单位的激活函数, 和 分别表示层l中的单元j和层l+1中的单位k的偏差, 和 表示连接权重, 和 表示单元的输出值。
[0039] 4.2为了更好地利用矩阵运算中的并行性,采用向量化。对于N个训练样本,矢量化形式由以下等式(5)和(6)给出:
[0040] A(l)=f(W(l)A(l-1)+B(l))   (5)
[0041] A(l+1)=exp(W(l+1)A(l)+B(l+1))/V   (6)
[0042] 其中,A(l-1),A(l),A(l+1),W(l),W(l+1),B(l)和B(l+1)分别是nl-1×N,nl×N,nl+1×N,nl×nl-1,nl+1×nl,nl×N,nl+1×N的矩阵。每列偏置矩阵B(l)和B(l+1)相等,exp(W(l+1)A(l)+B(l+1))/V表示两个矩阵的分割元素。
[0043] 4.3在反向传播过程中,数据矩阵X通过连接每个训练样本x(m)来形成X的列,包含整个训练数据集,因此X是d×N矩阵,X的第m列对应于第m训练样本。假设损失函数为softmax回归,N个训练样本的总体损失函数由式(7)给出:
[0044]
[0045] 其中,运算符⊙表示Hadamard方程(分量乘法),||·||F表示Frobenius-norm,第一项是误差项,第二项是减小权重大小的正则化项,有助于防止模型的过度拟合,λ是在优化过程中平衡这两个项的相对重要性的权重衰减(稀疏正则化)参数。模型参数Θ(权重和偏差)在减小损失函数值的方向上改变。在训练过程中,将模型的实际输出与目标输出进行比较,通过整个网络中的差异来训练Θ。假设标签矩阵G是c×N矩阵,第m列gm=[0,···,1,···,0]T∈RC对应于第m个训练样本的目标输出向量(标签向量),每列只有一个非零元素1,位置1表示其类标号。J的优化通常是非凸的,需要从数千或数百万个样本中进行培训。
因此,J的最小化通常使用随机梯度下降的变量,这被称为小批次随机梯度下降。
[0046] 4.4对于每层中的每个单元,我们要计算灵敏度,单位的灵敏度由以下等式(8),(9)和(10)给出:
[0047]
[0048] Δ(l)=(W(l+1))TΔ(l+1)f'(Z(l))   (9)
[0049] Δ(l-1)=(W(l))TΔ(l)f'(Z(l-1))   (10)
[0050] 4.5权重的偏导数由以下等式(11)和(12)给出:
[0051] ΔW(l+1)=Δ(l+1)(A(l))T+λW(l+1)   (11)
[0052] ΔW(l)=Δ(l)(A(l-1))T+λW(l)   (12)
[0053] 其中,Δ(l+1),Δ(l),Δ(l-1),ΔW(l+1)和ΔW(l)分别是nl+1×N,nl×N,nl-1×N,nl+1×nl,nl×nl-1的矩阵。
[0054] 因此,权重更新规则由以下等式(13)和(14)给出:
[0055]
[0056]
[0057] 4.6对先前的特征图 通过滤波器内核 在激活函数f(·)作用下的计算公式如等式(15)所示:
[0058]
[0059] 其中 和 表示第l层的第j个特征图和第l-1层的第j个特征图, 表示第l层的第j个特征图的基础。假设 的大小为W×H, 的大小为F×F,步幅为F,则 的大小为(W-F+S)/S×(W-F+S)/S。假设输入特征图I是H×W×m的三维张量,其中H,W和m分别是输入特征图的高度,宽度和数量。卷积内核K是F×F×m×n的四维张量,其中F是卷积核的大小,n是输出特征图的数量。我们假设卷积没有填充零,步幅等于1.然后,卷积层O的输出特征图由下列等式(16)给出:
[0060]
[0061] 4.7令 表示l+1层的第k个特征图,大小为W×H,R的大小为r×r,步幅为S,输出特征图由公式(17)给出:
[0062]
[0063] 其中运算符down(·)表示下采样操作,Mk表示输入特征图集, 是l+1层的第k个特征图的基础。因此, 的大小为(W-r+S)/S×(W-r+S)/S。
[0064] 4.8计算梯度
[0065] 假设l-1层是子采样层,层l是卷积层,层1+1是子采样层, 和 分别表示第l-1层的第i个特征图,第l层的第j个特征图,第l+1层的第k个特征图。
[0066]
[0067]
[0068]
[0069] 其中,运算符 表示二维相关运算,运算符up(·)表示上采样运算,Mi表示连接第l-1层的第i个特征图和第l层的一些特征图, 表示第l-1层的第i个特征图与第l-1层的第j个特征图之间的滤波核。
[0070] 计算 后,过滤器内核 将通过梯度下降进行更新,如下所示:
[0071]
[0072] 其中η表示学习率。
[0073] 步骤五对卷积神经网络进行实验训练,使用不同数量的训练样本,不同尺寸的图像,不同的批量大小,不同的时期图像来训练CNN模型。为了评估对图像缺陷检测的鲁棒性,将图像中的加法高斯噪声加到图像中,模拟图像的故障行为,为了处理随机影响,进行多次试验。第一个卷积层的滤波器内核通过稀疏自动编码器用学习的滤波器内核初始化,其他滤波器内核都通过从标准正态分布采样进行初始化,并将特征图的偏差全部初始化为零。该模型在整个训练数据集上使用小批次随机梯度下降进行了优化学习率初始化为0.001。
[0074] 步骤六通过训练好的CNN判断钢板是否存在缺陷,如果钢板的图像被判断出属于裂纹、划痕、黑斑、针孔、表面夹杂、擦伤和孔洞七种中的一种即此钢板属于缺陷并对缺陷进行分类,如果属于另外一种则是完好的产品。
[0075] 本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈