首页 / 专利库 / 人工智能 / 特征向量 / 人脸认证的方法和装置

人脸认证的方法和装置

阅读:0发布:2023-01-28

专利汇可以提供人脸认证的方法和装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种人脸认证的方法和装置,属于 生物 识别领域,所述方法包括:对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的 特征向量 ;将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量;将统一维度特征向量 串联 成联合特征向量;将联合特征向量通过线性 降维 映射矩阵进行降维映射得到综合特征向量;通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量的进行比对认证。与 现有技术 相比,本发明的人脸认证的方法抗干扰能强,可扩展性好,认证准确率高。,下面是人脸认证的方法和装置专利的具体信息内容。

1.一种人脸认证的方法,其特征在于,包括:
对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的特征向量
将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量;
将统一维度特征向量串联成联合特征向量;
将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量进行比对认证;
所述绝对值归一化余弦值的定义如下:
所述通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量进行比对认证包括:
以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行余弦相似度操作,得到余弦相似度;
以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行绝对值归一化余弦操作,得到绝对值归一化余弦值;
对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量进行求模操作,得到第一模长与第二模长;
将所述余弦相似度、绝对值归一化余弦值、第一模长与第二模长组成一个四维的差异向量;
使用差异向量映射矩阵将所述差异向量映射,得到一维向量,作为比对分值;
将比对分值与比对阈值进行比对,若比对分值大于比对阈值,则人脸认证通过。
2.根据权利要求1所述的人脸认证的方法,其特征在于,所述对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的特征向量之前还包括:
对待认证人脸图像和人脸图像模板进行预处理,所述预处理包括特征点定位、图像校正和归一化处理。
3.根据权利要求1所述的人脸认证的方法,其特征在于,每个层级的特征向量通过如下步骤计算得到:
使用卷积核对待认证人脸图像和人脸图像模板进行卷积操作,得到卷积特征图,所述卷积操作为same卷积操作;
使用激活函数对所述卷积特征图进行激活操作,得到激活特征图,所述激活函数为ReLU激活函数;
使用采样函数对所述激活特征图进行下采样操作,得到采样特征图,所述下采样操作为最大值采样;
对得到的采样特征图重复上述卷积操作、激活操作和下采样操作,得到新的采样特征图,并如此重复执行若干次;
将得到的所有采样特征图进行向量化,得到每个层级的特征向量。
4.根据权利要求1-3中任一所述的人脸认证的方法,其特征在于,所述多层级深度卷积网络通过softmax分类网络联合训练得到,训练步骤包括:
对人脸图像样本使用初始化的多层级深度卷积网络依次提取出多个层级的特征向量;
将多个层级的特征向量依次通过统一维度线性映射矩阵映射为相同维数的统一维度特征向量;
在softmax分类网络中使用线性映射矩阵分别对统一维度特征向量进行映射,得到映射向量;
使用softmax函数对映射向量进行激活,得到网络输出值向量;
以网络输出值向量和人脸图像样本的标签数据为输入量,通过交叉熵损失函数计算出网络误差;
将各个统一维度特征向量串联成一个联合特征向量;
将所述联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
为所述网络误差分配权重,并计算所述线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度;
利用所述线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度对所述线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核进行迭代更新;
判断网络误差和迭代次数是否符合要求,若是,结束,否则,转至所述对人脸图像样本使用初始化的多层级深度卷积网络依次提取出多个层级的特征向量。
5.一种人脸认证的装置,其特征在于,包括:
第一提取模,用于对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的特征向量;
第一映射模块,用于将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量;
第一串联模块,用于将统一维度特征向量串联成联合特征向量;
第二映射模块,用于将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
第一比对模块,用于通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量进行比对认证;
所述绝对值归一化余弦值的定义如下:
所述第一比对模块包括:
第一计算单元,用于以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行余弦相似度操作,得到余弦相似度;
第二计算单元,用于以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行绝对值归一化余弦操作,得到绝对值归一化余弦值;
第三计算单元,用于对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量进行求模操作,得到第一模长与第二模长;
第二向量化单元,用于将所述余弦相似度、绝对值归一化余弦值、第一模长与第二模长组成一个四维的差异向量;
映射单元,用于使用差异向量映射矩阵将所述差异向量映射,得到一维向量,作为比对分值;
比对单元,用于将比对分值与比对阈值进行比对,若比对分值大于比对阈值,则人脸认证通过。
6.根据权利要求5所述的人脸认证的装置,其特征在于,所述第一提取模块之前还包括:
预处理模块,用于对待认证人脸图像和人脸图像模板进行预处理,所述预处理包括特征点定位、图像校正和归一化处理。
7.根据权利要求5所述的人脸认证的装置,其特征在于,每个层级的特征向量通过如下单元计算得到:
卷积单元,用于使用卷积核对待认证人脸图像和人脸图像模板进行卷积操作,得到卷积特征图,所述卷积操作为same卷积操作;
激活单元,用于使用激活函数对所述卷积特征图进行激活操作,得到激活特征图,所述激活函数为ReLU激活函数;
采样单元,用于使用采样函数对所述激活特征图进行下采样操作,得到采样特征图,所述下采样操作为最大值采样;
循环单元,用于对得到的采样特征图重复上述卷积操作、激活操作和下采样操作,得到新的采样特征图,并如此重复执行若干次;
第一向量化单元,用于将得到的所有采样特征图进行向量化,得到每个层级的特征向量。
8.根据权利要求5-7中任一所述的人脸认证的装置,其特征在于,所述多层级深度卷积网络通过softmax分类网络联合训练得到,包括:
第二提取模块,用于对人脸图像样本使用初始化的多层级深度卷积网络依次提取出多个层级的特征向量;
第三映射模块,用于将多个层级的特征向量依次通过统一维度线性映射矩阵映射为相同维数的统一维度特征向量;
第四映射模块,用于在softmax分类网络中使用线性映射矩阵分别对统一维度特征向量进行映射,得到映射向量;
激活模块,用于使用softmax函数对映射向量进行激活,得到网络输出值向量;
第一计算模块,用于以网络输出值向量和人脸图像样本的标签数据为输入量,通过交叉熵损失函数计算出网络误差;
第二串联模块,用于将各个统一维度特征向量串联成一个联合特征向量;
第五映射模块,用于将所述联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
第二计算模块,用于为所述网络误差分配权重,并计算所述线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度;
更新模块,用于利用所述线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度对所述线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核进行迭代更新;
判断模块,用于判断网络误差和迭代次数是否符合要求,若是,结束,否则,转至所述第二提取模块。

说明书全文

人脸认证的方法和装置

技术领域

[0001] 本发明涉及生物识别领域,特别是指一种人脸认证的方法和装置。

背景技术

[0002] 人脸认证是生物识别的一种形式,通过有效的表征人脸,得到两幅人脸图片的特征,利用分类算法来判定这两张照片是否是同一个人。一般在人脸识别装置中预先存储有一幅人脸图像,作为人脸图像模板;在认证时,拍摄一幅人脸图像,作为待认证人脸图像,提取两幅图像的特征,利用分类算法来判定这两张照片是否是同一个人。
[0003] 提取特征的方法为:人工设计出一个特征向量,通过各种算法取出规定的特征向量,如基于几何特征的人脸认证方法、基于子空间的人脸认证方法、基于信号处理的人脸认证方法等,但是这种方法极容易受到光照、表情等因素对结果的影响,抗干扰能差,并且人工设计出的特征向量多是基于特定的情况下的,可扩展性差。
[0004] 基于深度网络的人脸识别与认证技术可以自动学习并提取特征,但是一般的深度网络存在着梯度弥散问题,并且对各层级特征处理和理解不充分,仅利用高层特征不足以充分描述图像。

发明内容

[0005] 本发明提供一种人脸认证的方法和装置,该方法抗干扰能力强,可扩展性好,认证准确率高。
[0006] 为解决上述技术问题,本发明提供技术方案如下:
[0007] 一种人脸认证的方法,包括:
[0008] 对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的特征向量;
[0009] 将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量;
[0010] 将统一维度特征向量串联成联合特征向量;
[0011] 将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
[0012] 通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量的进行比对认证。
[0013] 一种人脸认证的装置,包括:
[0014] 第一提取模,用于对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的特征向量;
[0015] 第一映射模块,用于将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量;
[0016] 第一串联模块,用于将统一维度特征向量串联成联合特征向量;
[0017] 第二映射模块,用于将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
[0018] 第一比对模块,用于通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量的进行比对认证。
[0019] 本发明具有以下有益效果:
[0020] 本发明的人脸认证的方法中,首先使用预先经过多层分类网络联合训练的多层级深度卷积网络提取待认证人脸图像和人脸图像模板的多个层级的特征向量,然后将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量,再将统一维度特征向量串联成联合特征向量,并将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量,最后通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量的进行比对认证。
[0021] 与现有技术相比,本发明通过多层级深度卷积网络自动学习并提取特征,与现有技术中人工设计出一个特征向量相比,抗干扰能强,可扩展性好,认证准确率高。
[0022] 本发明的多层级深度卷积网络通过多层分类网络进行联合训练得到,避免了梯度弥散问题,认证准确率高。
[0023] 并且将多个层级的特征向量融合,增加图像特征丰富度,弥补了一般的深度网络对各层级特征处理不充分、仅利用高层特征不足以充分描述图像的缺陷;进一步提高了认证准确率。
[0024] 发明人还发现,传统的比对认证方法,尤其是余弦相似度方法,忽略了向量的模长差异,从而造成差异描述不全面,降低了比对认证的准确率;本发明采用线性判别分析,对包括绝对值归一化余弦值在内的多个差异特征进行比对分析,进一步的提高了认证准确率。
[0025] 故本发明的人脸认证的方法抗干扰能力强,可扩展性好,认证准确率高,并且避免了梯度弥散问题,弥补利用高层特征不足以充分描述图像的缺陷。附图说明
[0026] 图1为本发明的人脸认证的方法的流程图
[0027] 图2为本发明的人脸认证的装置的示意图;
[0028] 图3为本发明中图像预处理的示意图;
[0029] 图4为本发明中对多层级深度卷积网络以及分类网络进行训练的示意图;
[0030] 图5为本发明中的基本卷积网络的结构示意图;
[0031] 图6为本发明中的多层级深度卷积网络示意图;
[0032] 图7为本发明中的分类网络示意图;
[0033] 图8为本发明中的下采样操作示意图。

具体实施方式

[0034] 为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0035] 一方面,本发明一种人脸认证的方法,如图1所示,包括:
[0036] 步骤S101:对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的特征向量;
[0037] 多层级深度卷积网络包括2个以上的卷积网络,每个卷积网络包括卷积、激活和下采样操作,这些操作的顺序以及数量不固定,根据实际情况决定;本发明的每个卷积网络均提取出一个特征向量,可以记为fea1,fea2, fea3,…(这里只列出1组多个层级的特征向量,即待认证人脸图像或人脸图像模板的多个层级的特征向量,后文的公式也只写出一个图像的公式),第一个卷积网络的输入为待认证人脸图像或人脸图像模板,后一个卷积网络的输入为前一个卷积网络操作后的特征图;
[0038] 一般的深度网络存在着梯度弥散问题,本发明的多层级深度卷积网络通过多层分类网络进行联合训练得到,避免了上述问题。
[0039] 步骤S102:将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量;统一维度线性映射矩阵是经过预先训练得到的,可以记为W1,W2,W3,…,统一维度特征向量可以记为f1,f2,f3,…。
[0040] 步骤S103:将统一维度特征向量串联成联合特征向量;可以记为 featuremerge。
[0041] 步骤S104:将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;线性降维映射矩阵是经过预先训练得到的,可以记为 WT,综合特征向量可以记为fT。
[0042] 步骤S105:通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量的进行比对认证。
[0043] 本发明的人脸认证的方法中,首先使用预先经过多层分类网络联合训练的多层级深度卷积网络提取待认证人脸图像和人脸图像模板的多个层级的特征向量,然后将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量,再将统一维度特征向量串联成联合特征向量,并将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量,最后通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量的进行比对认证。
[0044] 与现有技术相比,本发明通过多层级深度卷积网络自动学习并提取特征,与现有技术中人工设计出一个特征向量相比,抗干扰能强,可扩展性好,认证准确率高。
[0045] 本发明的多层级深度卷积网络通过多层分类网络进行联合训练得到,避免了梯度弥散问题,认证准确率高。
[0046] 并且将多个层级的特征向量融合,增加图像特征丰富度,弥补了一般的深度网络对各层级特征处理不充分、仅利用高层特征不足以充分描述图像的缺陷;进一步提高了认证准确率。
[0047] 发明人还发现,传统的比对认证方法,尤其是余弦相似度方法,忽略了向量的模长差异,从而造成差异描述不全面,降低了比对认证的准确率;本发明采用线性判别分析,对包括绝对值归一化余弦值在内的多个差异特征进行比对分析,进一步的提高了认证准确率。
[0048] 故本发明的人脸认证的方法抗干扰能力强,可扩展性好,认证准确率高,并且避免了梯度弥散问题,弥补利用高层特征不足以充分描述图像的缺陷。
[0049] 作为本发明的人脸认证的方法的一种改进,步骤S101之前还包括:
[0050] 步骤S100:对待认证人脸图像和人脸图像模板进行预处理,预处理包括特征点定位、图像校正和归一化处理。事实上,人脸图像模板可能经事先过了预处理,可以不进行此步骤。
[0051] 本发明采用基于级联Adaboost的人脸检测算法对图像进行人脸检测,然后利用基于SDM的人脸特征点定位算法对检测出来的人脸进行特征点定位,并通过图像缩放、旋转与平移对人脸进行矫正和归一化对齐,如图 3所示。
[0052] 本发明采用简单的灰度归一化预处理,灰度归一化的主要目的是便于网络处理连续数据而避免处理较大的离散灰度值,从而避免出现异常情况。
[0053] 本发明对人脸图像进行预处理可以方便后续的认证过程,并且避免了异常像素点对认证结果的影响。
[0054] 作为本发明的人脸认证的方法的另一种改进,每个卷积网络包括卷积操作、激活操作以及下采样操作,每个层级的特征向量通过如下步骤计算得到:
[0055] 步骤S1011:使用卷积核对待认证人脸图像和人脸图像模板进行卷积操作,得到卷积特征图,卷积操作为same卷积操作;
[0056] 本发明采用same形式的卷积操作,操作时对输入图像进行零填充。 same形式的卷积操作所得到的特征图与输入图像原尺寸相同。
[0057] 步骤S1012:使用激活函数对卷积特征图进行激活操作,得到激活特征图,激活函数为ReLU激活函数。
[0058] 步骤S1013:使用采样函数对激活特征图进行下采样操作,得到采样特征图,下采样操作为最大值采样;
[0059] 本发明采用最大值采样,最大值采样将采样块内元素值的最大值作为采样块的特征,在图像处理中,最大值采样能够提取图像的纹理信息,并且在一定程度上维持图像的某种不变性,如旋转、平移、缩放等;另外,根据统计学实验,相较平均采样而言,最大值采样对数据分布变化不敏感,特征提取相对稳定。
[0060] 步骤S1014:对得到的采样特征图重复上述步骤,得到新的采样特征图,并如此重复执行若干次;
[0061] 步骤S1015:将得到的所有采样特征图进行向量化,得到每个层级的特征向量,将每个步骤得到的所有采样特征图组成一个向量。
[0062] 本发明能够提取出特征丰富并且稳定的的特征向量,能够充分的描述人脸图像,增加了认证准确率。
[0063] 作为本发明的人脸认证的方法的再一种改进,多层级深度卷积网络通过softmax分类网络联合训练得到,包括:
[0064] 训练时,首先要有人脸图像样本库,然后对人脸图像样本使用初始化的多层级深度卷积网络依次提取出多个层级的特征向量;与前述的步骤 S101是一样的,只不过上面是认证过程,这里是训练过程,此时的多层级深度卷积网络中的各个参数取初值;
[0065] 将多个层级的特征向量依次通过统一维度线性映射矩阵映射为相同维数的统一维度特征向量;
[0066] 在softmax分类网络中使用线性映射矩阵分别对统一维度特征向量进行映射,得到映射向量;此时的线性映射矩阵取初值;
[0067] 使用softmax函数对映射向量进行激活,得到网络输出值向量;
[0068] 以网络输出值向量和人脸图像样本的标签数据为输入量,通过交叉熵损失函数计算出网络误差;
[0069] 将各个统一维度特征向量串联成一个联合特征向量;
[0070] 将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
[0071] 为网络误差分配权重,并计算线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度;
[0072] 利用线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度对线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核进行迭代更新;
[0073] 判断网络误差和迭代次数是否符合要求,若是,结束,否则,转至对人脸图像样本使用初始化的多层级深度卷积网络依次提取出多个层级的特征向量。
[0074] 网络误差符合要求是指网络误差取值最小(或者小到一定程度),此时多层级深度卷积网络和softmax分类网络的各个参数(线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核)为训练后的多层级深度卷积网络和softmax分类网络;迭代次数符合要求是指迭代次数达到设定值。
[0075] 本发明通过softmax分类网络进行联合训练,进一步避免了梯度弥散问题,并且可以进一步通过对分类网络误差加权增加网络学习的灵活度。
[0076] 作为本发明的人脸认证的方法的再一种改进,步骤S105包括:
[0077] 步骤S1051:以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行余弦相似度操作,得到余弦相似度;
[0078] 步骤S1052:以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行绝对值归一化余弦操作,得到绝对值归一化余弦值;
[0079] 步骤S1053:对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量进行求模操作,得到第一模长与第二模长;
[0080] 步骤S1054:将余弦相似度、绝对值归一化余弦值、第一模长与第二模长组成一个四维的差异向量;
[0081] 步骤S1055:使用差异向量映射矩阵将差异向量映射,得到一维向量,作为比对分值;
[0082] 步骤S1056:将比对分值与比对阈值进行比对,若比对分值大于比对阈值,则人脸认证通过。
[0083] 发明人发现,传统的比对认证方法,尤其是余弦相似度方法,忽略了向量的模长差异,从而造成差异描述不全面,降低了比对认证的准确率;绝对值归一化余弦值对比对向量的模长差异敏感,能够弥补余弦相似度忽略向量的模长差异而造成的差异描述不全面的问题。
[0084] 故本发明将比对特征的余弦相似度、绝对值归一化余弦值以及两个特征模长组合为一个四维差异向量,进行线性判别分析,进一步的提高了认证准确率。
[0085] 另一方面,本发明提供一种人脸认证的装置,如右图2所示,包括:
[0086] 第一提取模块11,用于对待认证人脸图像和人脸图像模板使用预先经过多层分类网络联合训练的多层级深度卷积网络依次提取出多个层级的特征向量;
[0087] 第一映射模块12,用于将多个层级的特征向量依次通过统一维度线性映射矩阵映射为统一维度特征向量;
[0088] 第一串联模块13,用于将统一维度特征向量串联成联合特征向量;
[0089] 第二映射模块14,用于将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
[0090] 第一比对模块15,用于通过线性判别分析,利用绝对值归一化余弦值,对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量的进行比对认证。
[0091] 本发明的人脸认证的装置抗干扰能力强,可扩展性好,认证准确率高,并且避免了梯度弥散问题,弥补利用高层特征不足以充分描述图像的缺陷。
[0092] 作为本发明的人脸认证的装置的一种改进,第一提取模块之前还包括:
[0093] 预处理模块,用于对待认证人脸图像和人脸图像模板进行预处理,预处理包括特征点定位、图像校正和归一化处理。
[0094] 本发明对人脸图像进行预处理可以方便后续的认证过程,并且避免了异常像素点对认证结果的影响。
[0095] 作为本发明的人脸认证的装置的另一种改进,每个层级的特征向量通过如下单元计算得到:
[0096] 卷积单元,用于使用卷积核对待认证人脸图像和人脸图像模板进行卷积操作,得到卷积特征图,卷积操作为same卷积操作;
[0097] 激活单元,用于使用激活函数对卷积特征图进行激活操作,得到激活特征图,激活函数为ReLU激活函数;
[0098] 采样单元,用于使用采样函数对激活特征图进行下采样操作,得到采样特征图,下采样操作为最大值采样;
[0099] 循环单元,用于对得到的采样特征图重复上述步骤,得到新的采样特征图,并如此重复执行若干次;
[0100] 第一向量化单元,用于将得到的所有采样特征图进行向量化,得到每个层级的特征向量。
[0101] 本发明能够提取出特征丰富并且稳定的的特征向量,能够充分的描述人脸图像,增加了认证准确率。
[0102] 作为本发明的人脸认证的装置的再一种改进,多层级深度卷积网络通过softmax分类网络联合训练得到,包括:
[0103] 第二提取模块,用于对人脸图像样本使用初始化的多层级深度卷积网络依次提取出多个层级的特征向量;
[0104] 第三映射模块,用于将多个层级的特征向量依次通过统一维度线性映射矩阵映射为相同维数的统一维度特征向量;
[0105] 第四映射模块,用于在softmax分类网络中使用线性映射矩阵分别对统一维度特征向量进行映射,得到映射向量;
[0106] 激活模块,用于使用softmax函数对映射向量进行激活,得到网络输出值向量;
[0107] 第一计算模块,用于以网络输出值向量和人脸图像样本的标签数据为输入量,通过交叉熵损失函数计算出网络误差;
[0108] 第二串联模块,用于将各个统一维度特征向量串联成一个联合特征向量;
[0109] 第五映射模块,用于将联合特征向量通过线性降维映射矩阵进行降维映射得到综合特征向量;
[0110] 第二计算模块,用于为网络误差分配权重,并计算线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度;
[0111] 更新模块,用于利用线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核的更新梯度对线性映射矩阵、统一维度线性映射矩阵、线性降维映射矩阵和卷积核进行迭代更新;
[0112] 判断模块,用于判断网络误差和迭代次数是否符合要求,若是,结束,否则,转至第二提取模块。
[0113] 本发明通过softmax分类网络进行联合训练,进一步避免了梯度弥散问题,并且可以进一步通过对分类网络误差加权增加网络学习的灵活度。
[0114] 作为本发明的人脸认证的装置的再一种改进,第一比对模块包括:
[0115] 第一计算单元,用于以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行余弦相似度操作,得到余弦相似度;
[0116] 第二计算单元,用于以得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量为输入量进行绝对值归一化余弦操作,得到绝对值归一化余弦值;
[0117] 第三计算单元,用于对得到的待认证人脸图像的综合特征向量和人脸图像模板的综合特征向量进行求模操作,得到第一模长与第二模长;
[0118] 第二向量化单元,用于将余弦相似度、绝对值归一化余弦值、第一模长与第二模长组成一个四维的差异向量;
[0119] 映射单元,用于使用差异向量映射矩阵将差异向量映射,得到一维向量,作为比对分值;
[0120] 比对单元,用于将比对分值与比对阈值进行比对,若比对分值大于比对阈值,则人脸认证通过。
[0121] 本发明将比对特征的余弦相似度、绝对值归一化余弦值以及两个特征模长组合为一个四维差异向量,进行线性判别分析,进一步的提高了认证准确率。
[0122] 下面以一个具体的实施例对本发明进行描述:
[0123] 本发明在认证之前需要进行训练,具体的流程如图4所示,训练过程如下:
[0124] 本发明首先提出新的卷积网络提取图像特征向量,多层级特征融合的累积赋权深度卷积网络(多层级深度卷积网络),然后利用softmax网络和图3所示的学习流程对图像进行特征学习。
[0125] 网络学习过程主要包括网络的前向计算和网络误差的后向传播。
[0126] (A)卷积网络前向计算
[0127] 基本的卷积网络(如图5所示,注意图5只是一个卷积网络的示例,不是本发明使用的卷积网络,本发明的卷积网络为:卷积、激活、下采样,…)中包括卷积操作、激活操作和下采样操作,为了后续计算方便,一般还需要进行向量化操作。在图6中,每一层的卷积网络都表示一个基本的卷积网络,其中包含的各种操作的顺序和次数均可以根据具体问题进行设定。
[0128] 卷积操作有不同的方式,本发明采用same形式的卷积操作,操作时对输入图像进行零填充。same形式的卷积操作所得到的特征图与输入图像原尺寸相同。
[0129] 根据卷积计算公式,可以得到,当输入数据为二维图像时,卷积特征图元素的计算公式,如式(2):
[0130]
[0131] 其中,ck表示卷积操作第k个卷积核,ck(i,j)表示ck的第i行、第j列的元素,sc表示卷积核的边长,MCk表示输入图像I与ck卷积得到的卷积特征图,MCk(m,n)表示MCk第m行、第n列的元素,neighborhood(m,n,sc) 表示以(m,n)为中心,边长为sc的邻域, 表示same形式的卷积操作符。
[0132] 而当输入数据为经过若干操作得到的特征图时,卷积特征图元素的计算公式,如式(3):
[0133]
[0134] 对由卷积操作得到的卷积特征图MCk进行激活操作,是指将MCk的每个元素输入到激活函数f中进行映射,如式(4):
[0135] MAk(m,n)=f(MCk(m,n)).    (4)
[0136] 其中,MAk表示MCk经过激活函数得到的激活特征图,f表示激活函数。
[0137] 本发明采用ReLU激活函数。
[0138] f(x)=ReLU(x)=max(0,x).    (5)
[0139] 对激活操作得到的激活特征图MAk做下采样操作,主要是通过采样的方式降低特征的维数,进一步压缩和抽象图像特征。
[0140] 下采样操作首先将输入数据划分成无重合的ss×ss的小块,ss表示采样核的边长,然后将每个子块的数据输入到采样函数中进行映射,映射输出即为子块对应的采样值,如式(6):
[0141] MSk(m,n)=s(MAk(ss·(m-1)+1:ss·m,ss·(n-1)+1:ss·n))     (6)
[0142] 其中,MSk表示MAk经过采样函数得到的采样特征图,MSk(m,n)表示 MSk第m行、第n列的元素,s表示采样函数。图8展示了对大小为4×4的输入数据进行下采样操作的过程,其中ss=2。
[0143] 本发明采用最大值采样。
[0144] 最大值采样将采样块内元素值的最大值作为采样块的特征,如式(7):
[0145] s(I)=max(I)       (7)
[0146] 在图像处理中,最大值采样能够提取图像的纹理信息,并且在一定程度上维持图像的某种不变性,如旋转、平移、缩放等;另外,根据统计学实验,相较平均采样而言,最大值采样对数据分布变化不敏感,特征提取相对稳定。
[0147] 当特征提取结束后,需要对得到的特征图进行向量化操作,得到特征向量fea,以便将特征输入到分类网络中,进而对网络参数进行学习。
[0148] 向量化操作如式(8):
[0149]
[0150] 其中,v表示将非向量数据拉伸为一个列向量,concat表示将指示的向量串联成为一个高维向量,K表示特征图的总个数。
[0151] (B)统一维度线性映射
[0152] 图像经过了卷积网络的若干次卷积、激活和下采样操作后会得到一系列特征图,本发明利用线性映射,将各个层级的特征都映射为相同维数的特征。如式(9),式中nf表示统一维度特征向量的维度,ni表示feai的维度:
[0153]
[0154] (C)softmax分类网络
[0155] 图7展示了softmax网络的基本结构,图示中,fi表示输入特征向量f 的第i个分量,NC表示类别数量,Wid表示线性映射矩阵。
[0156] 此处需要说明的是,利用网络形式实现线性映射时,一般都会采用带有偏差(bias)的线性映射。由于向量加法可以通过改写映射矩阵与映射向量乘法实现等价,因此,本发明为了书写方便,所涉及所有线性映射操作表达式均采用改写形式,并且直接利用原变量名称表示改写后的映射矩阵和映射向量,而不在表达式中体现bias,式中o表示线性映射后的输出,图中oi表示o的第i个分量。
[0157] o=Wid·f      (10)
[0158] hi表示o经过softmax函数激活后得到的网络输出值h的第i个分量:
[0159] h=softmax(o).      (11)
[0160] 其中,softmax函数是softmax网络所采用的非线性激活函数,其表达式为:
[0161]
[0162] 由式(12)可以得出,softmax函数是“非负且和归一函数”,因此,可以将其函数输出值作为“输入数据属于对应类的概率”,即
[0163] hi=P(lablei=1)=P(input∈CLASSi).      (13)
[0164] 其中, 为数据原始标签LABEL(表示数据集中的第LABEL 个人)的二值向量,如式(14);CLASSi表示第i类数据集,在人脸识别中表示第i个人的所有图像:
[0165]
[0166] class为网络根据网络输出h给出的分类决策:
[0167]
[0168] 识别图像中的人脸身份为图像分类问题,本发明采用的分类算法是softmax分类网络,其采用的损失函数为交叉熵损失函数,如式(16):
[0169]
[0170] 其中,h为分类网络中经过softmax函数的网络输出值向量,label为数据原始标签LABEL的二值向量。
[0171] 由于网络的参数较多,很容易出现过拟合问题,因此采用正则化对网络参数进行限制,从而在一定程度上缓解过拟合现象,本发明采用二范数正则化。根据以上说明,网络的误差可以表示为式(17):
[0172] J(θ)=loss(h,label)+λΣ||θ||2.       (17)
[0173] 其中,J(θ)表示网络误差,λ为正则项系数,θ为特征学习网络中所有可学习参数的集合,如式(18),包括卷积网络的卷积核、分类网络的线性映射矩阵:
[0174] θ={θc,θid},θc={c1,c2,...,cK},θid=Wid    (18)[0175] 网络的学习目标为求解最小化网络误差(17)的参数集θopt,如(19)所示:
[0176]
[0177] 在图6中,J(Θi)表示第i层卷积网络计算的网络误差,其中,Θi表示由第1层到第i层卷积网络所有的网络参数与当前层统一维度线性映射矩阵Wi的集合,如式(20):
[0178]
[0179] 其中,θi表示第i层卷积网络的可学习参数集合,包括卷积操作、激活操作和下采样操作中涉及的所有可学习参数。
[0180] (D)多层级特征融合与降维
[0181] 如图6所示,featuremerge表示由各层级统一维度特征向量fi串联形成的联合特征向量,即
[0182]
[0183] WT表示对联合特征向量featuremerge进行线性降维映射的映射矩阵,fT表示由featuremerge经过线性降维映射得到的综合特征向量,其包含了各层级网络的特征向量信息,如式(22),式中nT表示设定的fT的维度:
[0184]
[0185] J(ΘT)表示分配给综合特征向量fT的分类网络的网络误差;其中,ΘT表示所有卷积网络参数、所有统一线性映射矩阵以及线性降维映射矩阵的集合,如式(23):
[0186]
[0187] (E)网络误差的反向传播
[0188] 本发明利用BP算法对网络参数进行更新。
[0189] 按照链式法则,网络误差是从后向前传播。
[0190] 分类网络线性映射求导:
[0191] 第i(i=1…4,T)层的分类网络中的可学习参数为Wi,id,根据J(Θi)定义与链式求导法则可有:
[0192]
[0193] 同时可以得到J(Θi)关于f的导数:
[0194]
[0195] 统一维度线性映射求导:
[0196] 每个统一维度线性映射矩阵Wi会对J(Θi)与J(ΘT)两个网络误差产生作用,因此,利用BP算法对Wi进行更新时,Wi的更新梯度是由J(Θi)对Wi的导数与J(ΘT)对Wi的导数联合形成,同时,在训练过程中,会赋予每个网络误差一个权重,综上,可以得到Wi的更新梯度,如式(26):
[0197]
[0198] 根据链式求导法则可有:
[0199]
[0200]
[0201] 因此,可有
[0202]
[0203] 综合特征层的线性降维映射求导:
[0204] 综合特征层的线性降维映射矩阵WT只对J(ΘT)产生作用,按照链式求导法则容易得到:
[0205]
[0206] 同时,可以计算得到各层级统一维度线性映射的输入特征向量的导数为:
[0207]
[0208] 卷积网络参数求导:
[0209] 卷积网络中可学习的参数只有卷积操作中的卷积核,因此,需要计算 J(Θi)关于各层级卷积核c的更新梯度。根据链式求导法则可有:
[0210]
[0211] 其中,
[0212]
[0213]
[0214]
[0215]
[0216] location表示MS的值在MA中的位置的二值化矩阵,即:
[0217]
[0218]
[0219] 上述为利用多层级特征融合的累积赋权深度卷积网络进行特征学习的过程的原理介绍,下面给出具体的算法,如表1所示:
[0220] 表1为利用多层级特征融合的累积赋权深度卷积网络进行特征学习的过程。
[0221]
[0222]
[0223] 下面就可以进行本发明的认证过程:
[0224] (一)图像预处理
[0225] 本发明采用基于级联Adaboost的人脸检测算法对图像进行人脸检测,然后利用基于SDM的人脸特征点定位算法对检测出来的人脸进行特征点定位,并通过图像缩放、旋转与平移对人脸进行矫正和归一化对齐,最终得到尺寸为100*100的人脸图像,且在图像中,左眼的图像坐标为(30,30),右眼的图像坐标为(30,70),如图3所示。
[0226] 本发明采用简单的灰度归一化预处理,如下式(1),式中I(i,j)表示图像 (i,j)的灰度值。灰度归一化的主要目的是便于网络处理连续数据而避免处理较大的离散灰度值,从而避免出现异常情况。
[0227]
[0228] (二)特征提取
[0229] 利用训练完成的网络提取图像特征
[0230] 完成对多层级特征融合的累积赋权深度卷积网络的训练后,就可以利用训练出的网络提取输入图像的特征,如表2所示:
[0231]
[0232] (三)特征比对
[0233] (I)绝对值归一化余弦值
[0234] 本发明提出的绝对值归一化余弦值(cosine normalized by absolute value,cosAN)定义如式(39):
[0235]
[0236] 其中,
[0237]
[0238] 实验表明,绝对值归一化余弦值对比对向量的模长差异敏感,能够弥补余弦相似度忽略向量的模长差异而造成的差异描述不全面的问题。
[0239] (II)基于LDA的多差异融合比对算法
[0240] 本发明将比对特征的余弦相似度、绝对值归一化余弦值以及两个特征模长组合为一个四维差异向量,即
[0241] fdiff(fT1,fT2)=[cos(fT1,fT2),cosAN(fT2,fT2),|fT2|,|fT2|]T   (41)[0242] 然后利用LDA(线性判别分析)将四维差异向量融合为一维相似量,也就是,差异向量映射矩阵WLDA需要将四维差异向量映射为一维向量。
[0243] sim(fT1,fT2)=WLDAfdiff    (42)
[0244] 其中WLDA表示利用LDA得到的映射向量。
[0245] 本发明实施例技术方案带来的有益效果:
[0246] 本实施例利用多层级特征融合的累积加权深度卷积网络进行特征学习和特征提取,然后利用基于LDA的多差异融合比对算法对两幅人脸图像的特征进行比对,具有以下五个优势:一、本发明利用卷积网络自动学习和提取特征,避免了人工特征的不足;二、通过多层分类网络联合训练避免了梯度弥散问题;三、通过多层级特征融合,增加图像特征丰富度,弥补了一般的深度网络对各层级特征处理不充分、仅利用高层特征不足以充分描述图像的缺陷;四、通过对多层分类网络误差加权增加网络学习的灵活度;五、通过基于LDA的多差异融合比对算法解决了余弦相似度对特征向量差异刻画不完整的问题。在FERET数据库上测试,四个子库Fb, Fc,DupI,DupII上分别取得了99.9%,100%,98.8%,99.6%的认证率(错误判对率为0.1%)。
[0247] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈