首页 / 专利库 / 信号处理 / 尺度图 / 一种小样本人脸识别方法

一种小样本人脸识别方法

阅读:1021发布:2020-10-18

专利汇可以提供一种小样本人脸识别方法专利检索,专利查询,专利分析的服务。并且本 发明 一种小样本 人脸识别 方法,涉及应用 电子 设备进行人脸识别的方法,是一种利用 单层 多尺度 卷积神经网络 结构进行多特征融合和分类的人脸识别方法,步骤是:人脸图像预处理;人脸图像多特征图的提取:包括提取一层DWT低频子带图、提取Sobel边缘特征图和提取LBP纹理特征图;利用单层多尺度卷积神经网络结构进行多特征融合;用Softmax分类器预测分类结果,实现人脸识别。本发明克服了 现有技术 在解决小样本人脸识别问题中,受分类方法的限制,分类识别率不高的 缺陷 。,下面是一种小样本人脸识别方法专利的具体信息内容。

1.一种小样本人脸识别方法,其特征在于:是一种利用单层多尺度卷积神经网络结构进行多特征融合和分类的人脸识别方法,具体步骤如下:
第一步,人脸图像预处理:
对从计算机USB接口采集的人脸图像首先由RGB空间转化到灰度空间,得到灰度图像Igray,采用的公式(1)如下:
Igray=0.299R+0.587G+0.114B  (1),
其中R、G、B分别是RGB图像的红色、绿色和蓝色通道,然后对得到的灰度图像Igray进行尺寸归一化到N×N个像素并为该人脸图像设置类别标签f,得到尺寸归一化灰度图像I和类别标签f;
第二步,人脸图像多特征图的提取:
(2.1)提取一层DWT低频子带图:
将上述第一步得到的尺寸归一化灰度图像I经过一层DWT算法变换,分解为4个大小为原来尺寸1/4的子带图,即大小为N/2×N/2像素,分别为DWT低频子带图LL、平高频子带图LH、垂直高频子带图HL和对高频子带图HH,提取其中的一层DWT低频子带图ILL;
(2.2)提取Sobel边缘特征图:
对上述第一步得到的尺寸归一化灰度图像I中每一个像素点(x,y)通过Sobel边缘算法的Sobel梯度算子来提取梯度信息S(x,y),像素点(x,y)的灰度值为I(x,y),即以该图像像素点(x,y)为中心计算其3×3邻域的x方向偏导数Sx和y方向的偏导数Sy,如以下公式(2)、(3):
得到梯度信息S(x,y)为:
根据上述公式(4)求出尺寸归一化灰度图像I的每个像素的梯度值,得到梯度特征图,将得到的特征图进行2×2的平均采样,得到Sobel边缘特征图ISobel,其大小为N/2×N/2像素;
(2.3)提取LBP纹理特征图:
对上述第一步得到的尺寸归一化灰度图像I利用LBP算法提取纹理特征图,将尺寸归一化灰度图像I中每一个像素点(x,y)置于3×3窗口W的中心像素wc,并以该中心像素wc的灰度值作为阈值,将相邻的8个像素w0、w1、w2、w3、w4、w5、w6、w7的灰度值与其进行比较,若邻域像素的阈值大于中心像素的阈值,则该邻域像素点的位置被标记为1,否则为0,3×3邻域内的8个点经比较产生8位二进制数码,采用公式(5)转换为十进制数得到该窗口W的中心像素wc的LBP值:
其中,
窗口 P=8,sgn为符号函数,定义如下:
遍历尺寸归一化灰度图像I的各个像素点,得到LBP特征图,为了保证在维度上与上述(2.1)步DWT低频子带图LL相同,将得到的LBP特征图进行2×2的平均采样,提取得LBP纹理特征图ILBP,其大小为N/2×N/2像素;
第三步,利用单层多尺度卷积神经网络结构进行多特征融合:
将上述第二步中提取的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图输入到单层多尺度卷积神经网络结构中进行训练,该结构包含一个输入层、采样层I和采样层II两个采样层、一个多尺度卷积层以及全连接层I和全连接层II两个全连接层;
(3.1)向输入层输入第二步中提取的大小为N/2×N/2像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图与人脸图像的类别标签f;
(3.2)采样层I连接输入层,采样层I采用2×2的Max采样方式,用采样层I采样上述
(3.1)步中的大小为N/2×N/2像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图后得到大小为N/4×N/4像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图;
(3.3)在采样层I后为多尺度卷积层,该层采用四种不同尺度卷积核,分别为2×2、3×
3、4×4和5×5,每种尺度包含30种不同参数的卷积核,经卷积后,每种尺度卷积核则对应得到30个不同特征图,共得到120个特征图,将上述(3.2)步得到的大小为N/4×N/4像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图的采样结果作为多尺度卷积层的输入,令lj与ui分别表示第j幅输出特征图与第i幅输入特征图,kij为第i个输入特征图与第j个输出特征图的卷积核,bj为第j个输出特征图的偏置,则卷积操作表示为lj=max(0,bj+∑ikij*ui)  (7),
(3.4)在多尺度卷积层后为采样层II,经(3.3)步卷积后的特征图通过采样层II进行降维,采样层II采用3×3的Max采样方式,上述(3.3)步得到的120个特征图经过采样层II后被串联成一个特征向量
(3.5)在采样层II后为全连接层,将上述(3.3)步采样层II所串联成的一个特征向量输入全连接层I和全连接层II两个相邻的全连接层,假设分类问题有C个类别,全连接层I的神经元个数设置为4×C,全连接层II的神经元个数设置为2×C,由此全连接层同时实现对特征图的有效降维,经过全连接层得到的的特征向量标记为e;
至此完成利用单层多尺度卷积神经网络结构进行的多特征融合;
第四步,用Softmax分类器预测分类结果,实现人脸识别:
(4.1)将经过上述(3.5)步得到的全连接层的特征向量e输入至C维的Softmax分类器,根据输入的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图所对应的类别标签f对Softmax分类器进行有监督的反向传播算法训练,得到Softmax分类器映射关系R=g(e),其中R为类别输出,g(﹒)为Softmax分类器建立的从输入到输出的映射;
(4.2)特征图依次经过上述第三步的各层后,计算误差函数,然后利用梯度下降法计算最小化误差,从而获得最优的网络权值与偏置,得到最终训练好的单层多尺度卷积神经网络模型;
(4.3)在人脸识别过程中,按照上述第一步和第二步方法处理待识别的人脸图像,然后将第二步中提取的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP输入上述训练好的单层多尺度卷积神经网络模型中,进行多特征融合,再利用Softmax分类器预测分类结果,实现人脸识别。
2.根据权利要求1所述一种小样本人脸识别方法,其特征在于:所述N×N个像素、N/2×N/2像素和N/4×N/4像素中的N=64。

说明书全文

一种小样本人脸识别方法

技术领域

[0001] 本发明的技术方案涉及应用电子设备进行人脸识别的方法,具体地说是一种小样本人脸识别方法。

背景技术

[0002] 人脸识别技术作为生物特征识别重要分支经过了几十年的发展,如今已经被广泛应用到人们生活中的各个领域,但是,在实际应用中,不同场景和度带来的人脸的光照、姿态、表情和遮挡等问题是人脸识别技术一直以来面临的巨大挑战;除此之外,许多人脸识别算法在实际应用中往往需要庞大的网络结构与海量的训练数据,人脸样本采集困难导致的训练样本不足,使得这些人脸识别算法在实际应用中并未得到其理想的识别效果。
[0003] 为了克服海量人脸样本采集的困难,现有技术开始研发小样本情况下的人脸识别方法。然而,在训练样本远小于数据维度的情形下很多人脸识别方法都会遇到困难,尤其是在基于神经网络的方法中表现最为突出。针对这一问题常用的解决方法分为两类:基于扩充虚拟样本的方法与基于数据降维的方法。基于虚拟样本扩充的方法是对图像进行几何变换,变换后的样本与初始样本共同构成训练集,研究者通过二维图像建立三维人脸模型,利用三维模型的投影生成不同姿态的人脸图像,但其计算量较大,且效果依赖于三维模型的精度,目前三维模型的精度仍待提高以满足期望的精度;基于数据降维的方法是通过去掉图像中的冗余信息,保留能够表征图像的最重要信息的方式来解决小样本问题,常用的降维方法有PCA、LDA和LPP。CN104268593A公开了一种小样本情况下的人脸识别方法,该方法同时采用了上述基于扩充虚拟样本与基于数据降维的方法来解决小样本问题,首先,采用镜像变换方式构造虚拟样本,然后通过KPCA、KDA和KLLP三种特征降维算法对人脸图像进行降维并构造稀疏表示模型,特征降维虽然能够解决小样本问题,但是该方法仅通过模型间的误差进行分类,很难达到较高的识别率。
[0004] 现有技术在解决小样本人脸识别问题中,受分类方法的限制,分类识别率不高,因此迫切需要一种能够在保证识别率的前提下有效解决小样本人脸识别问题的方法。

发明内容

[0005] 本发明所要解决的技术问题是:提供一种小样本人脸识别方法,是一种利用单层多尺度卷积神经网络结构进行多特征融合和分类的人脸识别方法,通过提取包含DWT低频特征、LBP纹理特征、Sobel边缘特征三种特征,并利用单层多尺度卷积神经网络进行多特征融合与人脸识别,其中DWT低频特征能够过滤掉冗余信息与噪声,提高对表情与光照的鲁棒性,LBP纹理特征与Sobel边缘特征能够保证细节与轮廓的完整性,多尺度卷积网络从不同尺度上对多个特征进行自适应融合,融合后的特征具有姿态鲁棒性强及对遮挡不敏感的特性,采用单层多尺度卷积且动态调整全连接层神经元个数,大大减少了训练权值的个数,克服了现有技术在解决小样本人脸识别问题中受分类方法的限制,分类识别率不高的缺陷
[0006] 单层多尺度卷积神经网络的英文缩写为smCNN,全称为single-level multi-scale Convolutional Neural Networks。
[0007] 本发明解决该技术问题所采用的技术方案是:一种小样本人脸识别方法,是一种利用单层多尺度卷积神经网络结构进行多特征融合和分类的人脸识别方法,具体步骤如下:
[0008] 第一步,人脸图像预处理:
[0009] 对从计算机USB接口采集的人脸图像首先由RGB空间转化到灰度空间,得到灰度图像Igray,采用的公式(1)如下:
[0010] Igray=0.299R+0.587G+0.114B  (1),
[0011] 其中R、G、B分别是RGB图像的红色、绿色和蓝色通道,然后对得到的灰度图像Igray进行尺寸归一化到N×N个像素并为该人脸图像设置类别标签f,得到尺寸归一化灰度图像I和类别标签f;
[0012] 第二步,人脸图像多特征图的提取:
[0013] (2.1)提取一层DWT低频子带图:
[0014] 将上述第一步得到的尺寸归一化灰度图像I经过一层DWT算法变换,分解为4个大小为原来尺寸1/4的子带图,即大小为N/2×N/2像素,分别为DWT低频子带图LL、平高频子带图LH、垂直高频子带图HL和对角高频子带图HH,提取其中的一层DWT低频子带图ILL;
[0015] (2.2)提取Sobel边缘特征图:
[0016] 对上述第一步得到的尺寸归一化灰度图像I中每一个像素点(x,y)通过Sobel边缘算法的Sobel梯度算子来提取梯度信息S(x,y),像素点(x,y)的灰度值为I(x,y),即以该图像像素点(x,y)为中心计算其3×3邻域的x方向偏导数Sx和y方向的偏导数Sy,如以下公式(2)、(3):
[0017]
[0018]
[0019] 得到梯度信息S(x,y)为:
[0020]
[0021] 根据上述公式(4)求出尺寸归一化灰度图像I的每个像素的梯度值,得到梯度特征图,将得到的特征图进行2×2的平均采样,得到Sobel边缘特征图ISobel,其大小为N/2×N/2像素;
[0022] (2.3)提取LBP纹理特征图:
[0023] 对上述第一步得到的尺寸归一化灰度图像I利用LBP算法提取纹理特征图,将尺寸归一化灰度图像I中每一个像素点(x,y)置于3×3窗口W的中心像素wc,并以该中心像素wc的灰度值作为阈值,将相邻的8个像素w0、w1、w2、w3、w4、w5、w6、w7的灰度值与其进行比较,若邻域像素的阈值大于中心像素的阈值,则该邻域像素点的位置被标记为1,否则为0,3×3邻域内的8个点经比较产生8位二进制数码,采用公式(5)转换为十进制数得到该窗口W的中心像素wc的LBP值:
[0024]
[0025] 其中,
[0026] 窗口 P=8,sgn为符号函数,定义如下:
[0027]
[0028] 遍历尺寸归一化灰度图像I的各个像素点,得到LBP特征图,为了保证在维度上与上述(2.1)步DWT低频子带图LL相同,将得到的LBP特征图进行2×2的平均采样,提取得LBP纹理特征图ILBP,其大小为N/2×N/2像素;
[0029] 第三步,利用单层多尺度卷积神经网络结构进行多特征融合:
[0030] 将上述第二步中提取的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图输入到单层多尺度卷积神经网络结构中进行训练,该结构包含一个输入层、采样层I和采样层II两个采样层、一个多尺度卷积层以及全连接层I和全连接层II两个全连接层;
[0031] (3.1)向输入层输入第二步中提取的大小为N/2×N/2像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图与人脸图像的类别标签f;
[0032] (3.2)采样层I连接输入层,采样层I采用2×2的Max采样方式,用采样层I采样上述(3.1)步中的大小为N/2×N/2像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图后得到大小为N/4×N/4像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图;
[0033] (3.3)在采样层I后为多尺度卷积层,该层采用四种不同尺度卷积核,分别为2×2、3×3、4×4和5×5,每种尺度包含30种不同参数的卷积核,经卷积后,每种尺度卷积核则对应得到30个不同特征图,共得到120个特征图,将上述(3.2)步得到的大小为N/4×N/4像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图的采样结果作为多尺度卷积层的输入,令lj与ui分别表示第j幅输出特征图与第i幅输入特征图,kij为第i个输入特征图与第j个输出特征图的卷积核,bj为第j个输出特征图的偏置,则卷积操作表示为
[0034] lj=max(0,bj+∑ikij*ui)  (7),
[0035] (3.4)在多尺度卷积层后为采样层II,经(3.3)步卷积后的特征图通过采样层II进行降维,采样层II采用3×3的Max采样方式,上述(3.3)步得到的120个特征图经过采样层II后被串联成一个特征向量
[0036] (3.5)在采样层II后为全连接层,将上述(3.3)步采样层II所串联成的一个特征向量输入全连接层I和全连接层II两个相邻的全连接层,假设分类问题有C个类别,全连接层I的神经元个数设置为4×C,全连接层II的神经元个数设置为2×C,由此全连接层同时实现对特征图的有效降维,经过全连接层得到的的特征向量标记为e;
[0037] 至此完成利用单层多尺度卷积神经网络结构进行的多特征融合;
[0038] 第四步,用Softmax分类器预测分类结果,实现人脸识别:
[0039] (4.1)将经过上述(3.5)步得到的全连接层的特征向量e输入至C维的Softmax分类器,根据输入的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图所对应的类别标签f对Softmax分类器进行有监督的反向传播算法训练,得到Softmax分类器映射关系R=g(e),其中R为类别输出,g(﹒)为Softmax分类器建立的从输入到输出的映射;
[0040] (4.2)特征图依次经过上述第三步的各层后,计算误差函数,然后利用梯度下降法计算最小化误差,从而获得最优的网络权值与偏置,得到最终训练好的单层多尺度卷积神经网络模型;
[0041] (4.3)在人脸识别过程中,按照上述第一步和第二步方法处理待识别的人脸图像,然后将第二步中提取的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP输入上述训练好的单层多尺度卷积神经网络模型中,进行多特征融合,再利用Softmax分类器预测分类结果,实现人脸识别。
[0042] 上述一种小样本人脸识别方法,所述N×N个像素、N/2×N/2像素和N/4×N/4像素中的N=64。
[0043] 上述一种小样本人脸识别方法,其中采用的DWT算法、LBP算法、Sobel边缘算法和Softmax分类器都是本技术领域公知的。
[0044] 本发明的有益效果是:与现有技术相比,本发明的突出的实质性特点和显著进步如下:
[0045] (1)本发明是一种利用单层多尺度卷积神经网络结构进行多特征融合和分类的人脸识别方法,通过提取包含DWT低频特征、LBP纹理特征、Sobel边缘特征三种特征,并利用单层多尺度卷积神经网络进行多特征融合与人脸识别,其中DWT低频特征能够过滤掉冗余信息与噪声,提高对表情与光照的鲁棒性,LBP纹理特征与Sobel边缘特征能够保证细节与轮廓的完整性,多尺度卷积网络从不同尺度上对多个特征进行自适应融合,融合后的特征具有姿态鲁棒性强及对遮挡不敏感的特性,采用单层多尺度卷积且动态调整全连接层神经元个数,大大减少了训练权值的个数,克服了现有技术在解决小样本人脸识别问题中,受分类方法的限制,分类识别率不高的缺陷。
[0046] (2)本发明的特征提取方法结合了DWT、LBP、Sobel三种不同算法,在降噪的同时保证了特征的完整性,并且利用了平均采样的形变不变性的优势,具有突出的实质性特点。
[0047] (3)本发明提出的单层多尺度卷积神经网络模型借鉴了GoogleNet中的多尺度设计,在同一个卷积层采用4种不同尺度的卷积核,能够有效地从多个尺度对DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三种特征图进行自适应融合。该融合方式相比传统的融合方式,保证了识别目标的尺度不变性,并且能够通过训练得到最优的权值分配,从而使融合后的特征分类更加准确。
[0048] (4)本发明构造的单层多尺度卷积神经网络模型,解决了由于网络层数过少带来的分类能降低的问题,在保证分类能力的同时将卷积层减少到一层,从而减少了训练参数个数,提高了模型训练速度。
[0049] (5)本发明方法将传统的特征提取与卷积神经网络相结合,利用各自的优点,使得该方法不但对人脸姿态、光照、遮挡和表情等有着较强的鲁棒性,而且该方法从数据降维和减少训练权值个数两个不同角度进行设计,从而有效地解决了小样本人脸识别的问题。附图说明
[0050] 下面结合附图和实施例对本发明进一步说明。
[0051] 图1是本发明一种小样本人脸识别方法的流程示意框图
[0052] 图2是本发明特征提取的整体过程及中间结果示意图:
[0053] 图2(a)归一化后的图像;
[0054] 图2(b)从上到下分别为DWT变换图、Sobel边缘特征图、LBP纹理特征图;
[0055] 图2(c)从上到下为DWT变换后的低频子图、平均采样后的Sobel边缘特征图、平均采样后的LBP纹理特征图;
[0056] 图2(d)为特征提取后的结果。
[0057] 图3为本发明在AR数据库与ORL数据库中部分实验的样本示例。
[0058] 图4为AR数据库中应用DWT、DWT+LBP、DWT+LBP+Sobel三种不同特征提取方法的效果图:
[0059] 图4(a)为应用DWT特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、垂直高频子带图HL。
[0060] 图4(b)为应用DWT+LBP特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、LBP纹理特征图。
[0061] 图4(c)为应用DWT+LBP+Sobel特征提取方法的效果图,从左到右分别为低频子带图LL、Sobel边缘特征图、LBP纹理特征图。
[0062] 图5为ORL数据库中应用DWT、DWT+LBP、DWT+LBP+Sobel三种不同特征提取方法的效果图:
[0063] 图5(a)为应用DWT特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、垂直高频子带图HL。
[0064] 图5(b)为应用DWT+LBP特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、LBP纹理特征图。
[0065] 图5(c)为应用DWT+LBP+Sobel特征提取方法的效果图,从左到右分别为低频子带图LL、Sobel边缘特征图、LBP纹理特征图。

具体实施方式

[0066] 图1所示实施例表明,本发明一种小样本人脸识别方法的流程是:人脸图像预处理人脸图像多特征图的提取 提取一层DWT低频子带图;提取Sobel边缘特征图;提取LBP纹理特征图 利用单层多尺度卷积神经网络结构进行多特征融合 用Softmax分类器预测分类结果,实现人脸识别。
[0067] 图2所示实施例从整体上显示了本发明人脸图像多特征图的提取过程及效果。其中图2(a)为归一化后的人脸图像;然后对归一化的人脸图像分别进行一次DWT变换、Sobel边缘检测和LBP纹理特征提取,得到如图2(b)中的从上到下分别为DWT变换图、Sobel边缘特征图和LBP纹理特征图;提取DWT变换后的低频子带图LL、对Sobel边缘特征图进行大小为2×2的平均采样、对LBP纹理特征图进行大小为2×2的平均采样等操作后得到2(c)中的从上到下分别为DWT变换后的低频子图、平均采样后的Sobel边缘特征图、平均采样后的LBP纹理特征图,这三个特征图融合构成为特征提取后的结果,如图2(d)所示,即作为单层多尺度卷积神经网络的输入。
[0068] 图3所示实施例显示了本发明在AR数据库与ORL数据库中部分实验的样本,图中第一行为AR数据库归一化后的样本示例,第二行为ORL数据库归一化后的样本示例。本实施例在Windows7环境下的Microsoft visual studio 2013平台下运行完成;在AR数据库中选取了50名男性和50名女性,每人26幅图像分别包括八幅中立表情、六幅表情、六幅围遮挡巾、六幅太阳镜遮挡。将选取的100个分类,2600幅图像进行训练集与测试集划分,每类训练样本的数量用q表示,q=13,剩余26-q幅图像用于测试。
[0069] 图4所示实施例显示了本发明在AR数据库中应用DWT、DWT+LBP、DWT+LBP+Sobel三种不同特征提取方法的效果。
[0070] 其中,4(a)显示了应用DWT特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、垂直高频子带图HL。4(b)显示了应用DWT+LBP特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、LBP纹理特征图即原图像经过LBP特征提取后进行2×2平均采样后结果。4(c)显示了应用DWT+LBP+Sobel特征提取方法的效果图,从左到右分别为一层DWT变换后的低频子带图LL、2×2平均采样后的Sobel边缘特征图、2×2平均采样后的LBP纹理特征图。
[0071] 图5所示实施例显示了本发明在ORL数据库中应用DWT、DWT+LBP、DWT+LBP+Sobel三种不同特征提取方法的效果。
[0072] 其中,5(a)显示了应用DWT特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、垂直高频子带图HL。5(b)显示了应用DWT+LBP特征提取方法的效果图,从左到右分别为低频子带图LL、水平高频子带图LH、LBP纹理特征图即原图像经过LBP特征提取后进行2×2平均采样后结果。5(c)显示了应用DWT+LBP+Sobel特征提取方法的效果图,从左到右分别为一层DWT变换后的低频子带图LL、2×2平均采样后的Sobel边缘特征图、2×2平均采样后的LBP纹理特征图。
[0073] 实施例1
[0074] 本实施例的一种小样本人脸识别方法,是一种利用单层多尺度卷积神经网络结构进行多特征融合和分类的人脸识别方法,具体步骤如下:
[0075] 第一步,人脸图像预处理:
[0076] 对从计算机USB接口采集的人脸图像首先由RGB空间转化到灰度空间,得到灰度图像Igray,采用的公式(1)如下:
[0077] Igray=0.299R+0.587G+0.114B  (1),
[0078] 其中R、G、B分别是RGB图像的红色、绿色和蓝色通道,然后对得到的灰度图像Igray进行尺寸归一化到N×N个像素并为该人脸图像设置类别标签f,N=64(下同),得到尺寸归一化灰度图像I和类别标签f,f与训练和测试的人的个数有关,本实施例中对于AR数据库f的值为[1,100],ORL数据库f的值为[1,40];
[0079] 第二步,人脸图像多特征图的提取:
[0080] (2.1)提取一层DWT低频子带图:
[0081] 将上述第一步得到的尺寸归一化灰度图像I经过一层DWT算法变换,分解为4个大小为原来尺寸1/4的子带图,即大小为N/2×N/2像素,分别为DWT低频子带图LL、水平高频子带图LH、垂直高频子带图HL和对角高频子带图HH,提取其中的一层DWT低频子带图ILL;
[0082] (2.2)提取Sobel边缘特征图:
[0083] 对上述第一步得到的尺寸归一化灰度图像I中每一个像素点(x,y)通过Sobel边缘算法的Sobel梯度算子来提取梯度信息S(x,y),像素点(x,y)的灰度值为I(x,y),即以该图像像素点(x,y)为中心计算其3×3邻域的x方向偏导数Sx和y方向的偏导数Sy,如以下公式(2)、(3):
[0084]
[0085]
[0086] 得到梯度信息S(x,y)为:
[0087]
[0088] 根据上述公式(4)求出尺寸归一化灰度图像I的每个像素的梯度值,得到梯度特征图,将得到的特征图进行2×2的平均采样,得到Sobel边缘特征图ISobel,其大小为N/2×N/2像素;
[0089] (2.3)提取LBP纹理特征图:
[0090] 对上述第一步得到的尺寸归一化灰度图像I利用LBP算法提取纹理特征图,将尺寸归一化灰度图像I中每一个像素点(x,y)置于3×3窗口W的中心像素wc,并以该中心像素wc的灰度值作为阈值,将相邻的8个像素w0、w1、w2、w3、w4、w5、w6、w7的灰度值与其进行比较,若邻域像素的阈值大于中心像素的阈值,则该邻域像素点的位置被标记为1,否则为0,3×3邻域内的8个点经比较产生8位二进制数码,采用公式(5)转换为十进制数得到该窗口W的中心像素wc的LBP值:
[0091]
[0092] 其中,
[0093] 窗口 P=8,sgn为符号函数,定义如下:
[0094]
[0095] 遍历尺寸归一化灰度图像I的各个像素点,得到LBP特征图,为了保证在维度上与上述(2.1)步DWT低频子带图LL相同,将得到的LBP特征图进行2×2的平均采样,提取得LBP纹理特征图ILBP,其大小为N/2×N/2像素;
[0096] 第三步,利用单层多尺度卷积神经网络结构进行多特征融合:
[0097] 将上述第二步中提取的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图输入到单层多尺度卷积神经网络结构中进行训练,该结构包含一个输入层、采样层I和采样层II两个采样层、一个多尺度卷积层以及全连接层I和全连接层II两个全连接层;
[0098] (3.1)向输入层输入第二步中提取的大小为N/2×N/2像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图与人脸图像的类别标签f;
[0099] (3.2)采样层I连接输入层,采样层I采用2×2的Max采样方式,用采样层I采样上述(3.1)步中的大小为N/2×N/2像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图后得到大小为N/4×N/4像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图;
[0100] (3.3)在采样层I后为多尺度卷积层,该层采用四种不同尺度卷积核,分别为2×2、3×3、4×4和5×5,每种尺度包含30种不同参数的卷积核,经卷积后,每种尺度卷积核则对应得到30个不同特征图,共得到120个特征图,将上述(3.2)步得到的大小为N/4×N/4像素的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图的采样结果作为多尺度卷积层的输入,令lj与ui分别表示第j幅输出特征图与第i幅输入特征图,kij为第i个输入特征图与第j个输出特征图的卷积核,bj为第j个输出特征图的偏置,则卷积操作表示为
[0101] lj=max(0,bj+∑ikij*ui)  (7),
[0102] (3.4)在多尺度卷积层后为采样层II,经(3.3)步卷积后的特征图通过采样层II进行降维,采样层II采用3×3的Max采样方式,上述(3.3)步得到的120个特征图经过采样层II后被串联成一个特征向量;
[0103] (3.5)在采样层II后为全连接层,将上述(3.3)步采样层II所串联成的一个特征向量输入全连接层I和全连接层II两个相邻的全连接层,假设分类问题有C个类别,全连接层I的神经元个数设置为4×C,全连接层II的神经元个数设置为2×C,由此全连接层同时实现对特征图的有效降维,经过全连接层得到的的特征向量标记为e;
[0104] 至此完成利用单层多尺度卷积神经网络结构进行的多特征融合;
[0105] 第四步,用Softmax分类器预测分类结果,实现人脸识别:
[0106] (4.1)将经过上述(3.5)步得到的全连接层的特征向量e输入至C维的Softmax分类器,根据输入的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP三个特征图所对应的人脸图像的类别标签f对Softmax分类器进行有监督的反向传播算法训练,得到Softmax分类器映射关系R=g(e),其中R为类别输出,g(﹒)为Softmax分类器建立的从输入到输出的映射;
[0107] (4.2)特征图依次经过上述第三步的各层后,计算误差函数,然后利用梯度下降法计算最小化误差,从而获得最优的网络权值与偏置,得到最终训练好的单层多尺度卷积神经网络模型;
[0108] (4.3)在人脸识别过程中,按照上述第一步和第二步方法处理待识别的人脸图像,然后将第二步中提取的DWT低频子带图ILL、Sobel边缘特征图ISobel和LBP纹理特征图ILBP输入上述训练好的单层多尺度卷积神经网络模型中,进行多特征融合,再利用Softmax分类器预测分类结果,实现人脸识别。
[0109] 实施例2
[0110] 本实施例是对本发明的特征提取方法和单层多尺度卷积神经网络结构相结合进行实验验证。
[0111] A.在AR数据库中选取所有100个人(50男50女),每个人26幅图像,一共2600幅人脸面部图像进行实验,由于AR数据库中图片包含人脸遮挡、表情变化、关照变化等多种因素,因此选择该数据库对本发明的特征提取方法和单层多尺度卷积神经网络结构相结合进行实验验证:
[0112] 在AR数据库中应用DWT、DWT+LBP、DWT+LBP+Sobel三种不同特征提取方法,对本发明的特征提取方法和单层多尺度卷积神经网络结构相结合进行实验,训练集划分q=13,选取方式为随机选取,其余26-q幅图像用于测试,实验结果如表1所示。
[0113] 表1.AR数据库中q=13测试结果
[0114]
[0115] 由表1所列实验结果可知,与只用DWT特征提取方法和DWT结合LBP的方法相比,本发明的DWT+LBP+Sobel特征提取方法在识别率上有明显的优势,平均识别率达到99.45%,表中的平均识别率为重复10次实验的平均值。
[0116] B.在ORL数据库对本发明的特征提取方法和单层多尺度卷积神经网络结构相结合进行实验验证:
[0117] 在ORL数据库中选取所有40个人的一共400幅人脸面部图像进行实验,其中每人10幅不同姿态的图像,训练集划分q=5,选取方式为随机选取,其余10-q幅图像用作测试,实验结果如表2所示。
[0118] 表2.ORL数据库中q=5测试结果对比
[0119]
[0120] 表2表明,本发明的方法在识别率上明显优于LBP、PCA+BP、PCA+RBF、L21FLDA等方法,平均识别率达到了98.25%,表中平均识别率为重复10次实验的平均值。
[0121] 上述实施例中采用的DWT算法、LBP算法、Sobel边缘算法和Softmax分类器都是本技术领域公知的。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈