首页 / 专利库 / 人工智能 / 三维形变模型 / 一种二维人脸图像的识别方法

一种二维人脸图像的识别方法

阅读:398发布:2021-02-13

专利汇可以提供一种二维人脸图像的识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种二维人脸 图像识别 的方法,属于 模式识别 和 计算机视觉 领域。所述方法包括:根据已知三维人脸 数据库 ,建立三维人脸形变模型;输入二维人脸图像进行注册,利用三维人脸形变模型,对注册后的二维人脸图像进行 三维重建 ,得到对所述注册的二维人脸图像的三维重建结果;通过建立光照模型,从所述三维重建结果中生成 姿态 、光照变化的虚图像;利用所述虚图像进行变化限制分类器设计;输入待识别的二维人脸图像,进行特征提取和压缩处理,然后将所述 抽取 和压缩处理后的特征输入到所述变化限制分类器中,输出分类结果,最后实现了对人脸图像的识别。通过采用本发明的方法,实现了识别过程完全自动化,提高了识别准确率,识别速度也有很大改善。,下面是一种二维人脸图像的识别方法专利的具体信息内容。

1.一种二维人脸图像的识别方法,其特征在于,所述方法包括:
根据已知三维人脸数据库,建立三维人脸形变模型;
输入二维人脸图像进行注册,利用所述三维人脸形变模型,对所述注册后的二维人脸图 像进行三维重建,得到对所述注册的二维人脸图像的三维重建结果;
通过建立光照模型,从所述三维重建结果中生成姿态、光照变化的虚图像;
利用所述虚图像进行变化限制分类器设计;
输入待识别的二维人脸图像,进行特征提取和压缩处理,然后将所述抽取和压缩处理后 的特征输入到所述变化限制分类器中,输出分类结果,最后实现了对人脸图像的识别。
2.根据权利要求1所述的二维人脸图像的识别方法,其特征在于,所述通过建立光照模 型,从所述三维重建结果生成姿态、光照变化的虚图像的步骤,具体包括:
制定光照模型,获得人脸姿态旋转度值的区间和光源参数值对的区间;
根据所述人脸姿态旋转角度值的区间和光源参数值对的区间,选取至少一个人脸姿态旋 转角度值和光源参数值对;
根据所述人脸姿态旋转角度值和光源参数值对,对所述三维重建结果进行三维几何变换;
利用所述光照模型,在光照条件下,合成所述三维几何变换后的图像,并进行投影变换;
对所述投影变换后的图像进行消隐处理,生成姿态、光照变化的虚图象。
3.根据权利要求1所述的二维人脸图像的识别方法,其特征在于,所述利用所述虚图像 进行变化限制分类器设计的步骤,具体包括:
执行 c * = arg max c j C p ( c j / X f ) 实现最优分类,其中,样本Xf属于N个模式类别 C={c1,c2,…,cN}之一,c*∈C为分类结果,p(cj/Xf)为后验概率;
执行 c * = arg max c j C P ( c j ) p ( X f / c j ) 实现后验概率p(cj/Xf)由类别先验概 率P(cj)和类条件概率密度p(Xf/cj)来表示;
执行 c * = arg max c j C p ( X f / c j ) = arg max c j C Σ m = 1 M P ( v m ) p ( X f / c j , v m )
得到最大条件概率分类器,其中,P(vm)1≤m≤M为变化因素的先验概率,M为变化因素的 阶数;
利用所述虚图像进行分类器参数的估计,完成变化限制分类器设计。
4.根据权利要求1所述的二维人脸图像的识别方法,其特征在于,所述利用所述虚图像 进行变化限制分类器设计的步骤,还包括:
执行
得到一种离散变化的修正二次鉴别函数分类器,其中,μi,m为类cj在变化因素vm作用下 的分布均值,Σi,m为类cj在变化因素vm作用下的分布的协方差矩阵,Σi,m的特征对为(λi,i), h2和k为通过实验确定的参数。

说明书全文

技术领域

发明涉及模式识别计算机视觉领域,特别涉及一种二维人脸图像的识别方法

背景技术

虽然对人脸识别的研究持续了数十年,但是,时至今日,它依然是模式识别领域中一个 极具挑战性的问题。人脸识别方法还有一系列难以解决的问题,例如当人脸姿态、表情以及 环境光照(PIE,Pose Illumination Expression)发生较大变化的时候,识别率将急剧下降。如 何解决人脸在不同姿态、光照和表情条件下的识别问题,仍然是当前研究的热点。
对于姿态和光照变化的人脸识别问题,如果采用传统的方法,必须获得足够多的不同姿 态和光照条件下用于学习的人脸训练图像,然而在很多情况下,这些图像并不容易获得。其 实,即使待识别的测试图像存在明显的姿态变化,也仅仅需要展示一张正面的标准人脸图像 就能够进行识别的工作了,这是因为人脑具有联想的功能。
为了实现不依赖姿态和环境光照的人脸识别,现有技术中提出下述方法:
一种是“不变特征”的方法,是在图像中提取对姿态、光照变化不敏感的特征作为原始图 像的测度,比如边界图(edge maps)。从近年的测试来看,相对于直接利用原始图像数据进 行识别的算法来说,不变特征的研究取得了很大的进步,使得算法对光照变化在一定程度上 有了适应性。但是没有任何一种特征可以独自克服图像的光照变化,并且,很难获得姿态变 化下的不变特征。
另外一种是“变化校正”的方法,主要是人脸三维形变模型,利用对输入的两维人脸图像 进行形状和纹理的双重匹配,能够获得不依赖于姿态的三维人脸特征,从而很好地解决不依 赖于姿态的识别问题。当被用于侧面人脸的姿态矫正,实验结果显示有非常好的识别性能。 但是由于它需要对形状和纹理同时进行优化,耗时巨大且易陷入局部最小,且初始的特征点 位置需要手工获得,不可能满足实际应用的要求。
因此,现有技术中要么是无法克服光照变化对图像产生的影响,要么是耗时,需要手工 操作。

发明内容

为了实现自动化和快速准确的进行人脸的识别,并且在识别过程中,克服图象的姿态和 光照变化的影响,本发明提供了一种二维人脸图像识别的方法。
本发明是基于一种变化模拟方法,通过建立人脸三维形变模型,将二维图像在模型约束 下重构得到特定人的三维人脸,由此生成虚图像并训练变化限制分类器,达到提高人脸识别 的准确率的目的。具体方法如下:
一种二维人脸图像的识别方法,所述方法包括:
根据已知三维人脸数据库,建立三维人脸形变模型;
输入二维人脸图像进行注册,利用所述三维人脸形变模型,对所述注册后的二维人脸图 像进行三维重建,得到对所述注册的二维人脸图像的三维重建结果;
通过建立光照模型,从所述三维重建结果中生成姿态、光照变化的虚图像;
利用所述虚图像进行变化限制分类器设计;
输入待识别的二维人脸图像,进行特征提取和压缩处理,然后将所述抽取和压缩处理后 的特征输入到所述变化限制分类器中,输出分类结果,最后实现了对人脸图像的识别。
所述通过建立光照模型,从所述三维重建结果生成姿态、光照变化的虚图像的步骤,具 体包括:
制定光照模型,获得人脸姿态旋转度值的区间和光源参数值对的区间;
根据所述人脸姿态旋转角度值的区间和光源参数值对的区间,选取至少一个人脸姿态旋 转角度值和光源参数值对;
根据所述人脸姿态旋转角度值和光源参数值对,对所述三维重建结果进行三维几何变换;
利用所述光照模型,在光照条件下,合成所述三维几何变换后的图像,并进行投影变换;
对所述投影变换后的图像进行消隐处理,生成姿态、光照变化的虚图象。
所述利用所述虚图像进行变化限制分类器设计的步骤,具体包括:
执行 c * = arg max c j C p ( c j / X f ) 实现最优分类,其中,样本Xf属于N个模式类别 C={c1,c2,…,cN}之一,c*∈C为分类结果,p(cj/Xf)为后验概率;
执行 c * = arg max c j C P ( c j ) p ( X f / c j ) 实现后验概率p(cj/Xf)由类别先验概 率P(cj)和类条件概率密度p(Xf/cj)来表示;
执行 c * = arg max c j C p ( X f / c j ) = arg max c j C Σ m = 1 M P ( v m ) p ( X f / c j , v m )
得到最大条件概率分类器,其中,P(vm)1≤m≤M为变化因素的先验概率,M为变化因素的 阶数;
利用所述虚图像进行分类器参数的估计,完成变化限制分类器设计。
在本发明中,所述利用所述虚图像进行变化限制分类器设计的步骤,还包括:
执行
得到一种离散变化的修正二次鉴别函数分类器,其中,μi,m为类cj在变化因素vm作用下的分 布均值,Σi,m为类cj在变化因素vm作用下的分布的协方差矩阵,Σi,m的特征对为(λi,i),h2和 k为通过实验确定的参数。
本发明提供的技术方案的有益效果是:
利用了人脸检测定位的方法,通过对正面人脸特征点自动进行检测,使得重建过程完全 自动化;通过对虚图像设计变化限制分类器,可以获得很高的识别率,在训练过程利用虚图 像,不需要在识别阶段进行姿态的校正,从而使得识别过程速度有很大提高。
附图说明
图1为本发明实施例1中的人脸图像识别方法的流程图
图2为本发明实施例1中的透视投影的示意图;
图3为本发明实施例1中立方体的各种正投影示意图;
图4为本发明实施例1中的图像二义性示意图;
图5为本发明实施例1中的Phong光照模型图;
图6为本发明实施例2中的识别系统中训练阶段的框架图;
图7为本发明实施例2中的识别系统中注册阶段的框架图;
图8为本发明实施例2中的识别系统中测试阶段的框架图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进 一步地详细描述。
实施例1
本实施例中的人脸数据库取自200个欧洲人的三维人脸数据,每个人脸数据包含十万左 右个顶点,每个顶点的坐标(x,y,z)和纹理(R,G,B)已知。
本实施例中的二维人脸图像识别方法包括:建立三维人脸形变模型,人脸图像三维重建, 生成姿态和光照变化虚图像,变化限制分类器设计,人脸图像识别。
如图l所示,下面具体介绍相应的步骤:
步骤101:根据已知三维人脸数据库,建立三维人脸形变模型。
具体过程包括:
步骤101a:获取数据库中所有人脸的顶点的坐标(x,y,z)和纹理(R,G,B)等原始数据,并 对原始数据进行量化处理。
获取原始数据可以利用多种方法,常见为利用三维扫描仪采集或二维图像重构,本实施 例中采用的是通过三维扫描仪扫描得到的;量化处理将原始数据中模拟量转化为数字量,便 于计算机存储,可以采用数学运算完成。
步骤101b:对原始数据进行预处理,去除非人脸的部分。
采取三维人脸的切割,将人脸区域从整个头部扫描数据中分离出来,即去除头发、肩部等 部位。分离人脸区域先要确定分离的边界。确定了分割边界,即可将人脸区域从原始扫描数 据中分离出来。
步骤101c:建立人脸图像像素对应关系。
对所有的人脸数据进行点对点的配准,建立高密度的点点对应关系(即同一个下标的顶 点表示同样的语意,比如第1000号顶点对于所有的人脸数据都是鼻尖,等等)。
步骤101d:建立三维人脸形变模型。具体步骤如下:
1.将预处理后的坐标和纹理数据按(1)式排列成形状和纹理向量:
S 1 = ( x i 1 , y i 1 , z i 1 , . . . , x i M , y i n , z i n ) T , T i = ( R i 1 , G i 1 , B i 1 , . . . , R i n , G i n , B i n ) T - - - ( 1 )
其中i表示第i个人脸数据,n表示模型的顶点数。
2.为了得到一个更为紧凑的参数表示,对所有样本的形状向量和纹理矢量进行主分量分 析(PCA)。PCA是一种常用的无监督的线性降维方法,它寻找一个线性子空间,以使得样本 在该子空间投影的协方差尽可能地大。具体方法如下(假设共有N个三维人脸数据):
三维人脸数据的形状均值 S = 1 N Σ i = 1 N S i
协方差矩阵 C x = 1 N Σ i = 1 N ( S i - s ) ( S i - s ) T - - - ( 2 )
构成PCA子空间的基,即形状特征向量sj,可由以下特征分解得到:
Cxsj=λjsj  j= 1,2,...,ms
3.得到了三维人脸形变模型:
S mod = S + Σ i = 1 M s α i s i , T mod = T + Σ j = 1 M T β j t j - - - ( 3 )
其中,为平均人脸形状向量,αj为第j个形状系数,sj为第j个形状特征向量,Ms为 截取的形状主元个数;同理为平均纹理向量,βj为第j个纹理系数,tj为第j个纹理特征向 量,MT为截取的纹理主元个数。通过变化系数αj和βj,即将形状和纹理特征向量分别按照 不同的系数进行线性组合,就能够得到不同形状、不同纹理的三维人脸。
由于不同三维人脸的几何点数量不一定相同,需要建立稠密点对应并通过插值等方法将 不同人脸的几何点数规格化成相同数量,通常可以使用光流方法或者标记锚点的方法。假设 人脸数据满足正态分布,经过(3)式的正交变换后形变参数满足下式(4)的分布:
P ( α ) ~ exp [ - 1 2 ( Σ i = 1 M s ( α i 2 / σ i ) ) ] ,
P ( β ) ~ exp [ - 1 2 ( Σ i = 1 M T ( β i 2 / λ i ) ) ] - - - ( 4 )
即形变参数不是任意变化的,而是服从该概率分布,从而可以避免畸变人脸的产生。
步骤102:输入二维人脸图像进行注册,利用所述三维人脸形变模型,对所述注册后的 二维人脸图像进行三维重建,得到对所述注册的二维人脸图像的三维重建结果。
输入二维人脸图像进行注册,并对注册后的二维人脸图像进行三维人脸重建,方法很多, 常见的为(随机)梯度法、(随机)顿法、Levenberg-Marquardt法等,本实施例中采用的是 Levenberg-Marquardt法,对特定人脸的三维重建过程为:
步骤102a:将上述步骤101中得到的三维人脸形变模型与特定人脸图像进行匹配得到形 变参数和即调节形变参数,使模型产生的三维人脸在特定视角看到的图像与待识别的 二维人脸图像的误差最小。具体步骤为:
1.调节形变参数时会合成不同形状的三维人脸图像,同样,当形变参数改变时,则 会形成不同纹理的三维人脸图像,将二维人脸的图象依次进行三维几何变换。
三维几何变换通过三维点在空间中的位置平移、缩放、旋转,如果用齐次坐标的形式, 可以用矩阵乘法的形式表示出来。
1)平移变换 x y z 1 = 1 0 0 t x 0 1 0 t y 0 0 1 t z 0 0 0 1 x y z 1 = x + t x y + t y z + t z 1 - - - ( 5 )
其中x,y,z是平移前的三维点坐标,x′,y′,z′是平移后的点坐标,tx,ty,tz是延X,Y,Z轴方 向的平移。
2)缩放变换 x y z 1 = s x 0 0 0 0 s y 0 0 0 0 s z 0 0 0 0 1 = s x x 0 0 0 0 s y y 0 0 0 0 s z z 0 0 0 0 1 - - - ( 6 )
其中sx,sy,sz分别为x,y,z轴缩放比例。
3)绕坐标轴的旋转变换
右手坐标系下相对坐标原点绕坐标轴旋转θ角的变换 绕X轴旋转: x y z 1 = 1 0 0 0 0 cos θ - sin θ 0 0 sin θ cos θ 0 0 0 0 1 x y z 1 = R X ( θ ) x y z 1 - - - ( 7 )
绕Y轴旋转: x y z 1 = cos θ 0 sin θ 0 0 1 0 0 - sin θ 0 cos θ 0 0 0 0 1 x y z 1 = R Y ( θ ) x y z 1 - - - ( 8 )
绕Z轴旋转: x y z 1 = cos θ - sin θ 0 0 sin θ cos θ 0 0 0 0 1 0 0 0 0 1 x y z 1 = R Z ( θ ) x y z 1 - - - ( 9 )
合起来可以得到,三维几何变换的表达式为:
[x′y′z′]T=R(θx,θy,θz)·S(sx,sy,sx)·[x y z]T+M(tx,ty,tz)    (10)
S(sx,sy,sz)为缩放矩阵: S ( s x , s y , s z ) = s x 0 0 0 s y 0 0 0 s z
M(tx,ty,tz)为平移矩阵: M ( t x , t y , t z ) = t x t y t z
R ( θ x , θ y , θ z ) = 1 0 0 0 cos θ x - sin θ x 0 sin θ x cos θ x cos θ y 0 sin θ y 0 1 0 - sin θ y 0 cos θ y cos θ z - sin θ z 0 sin θ z cos θ z 0 0 0 1 - - - ( 10 )
= cos θ y cos θ z - cos θ y cos θ z cos θ y sin θ x sin θ y cos θ z + cos θ x sin θ z - sin θ x sin θ y sin θ z + cos θ x cos θ z - sin θ x cos θ y - cos θ x sin θ y cos θ z cos θ x sin θ y sin θ z + cinθ x cos θ z cos θ x cos θ y
其中,[x y z]T为旋转前的顶点坐标,[x′y′z′]T为旋转后的顶点坐标,θx,θy,θz分 别为绕x,y,z轴旋转的角度。
2.将经过三维几何变换后的人脸图像进行投影变换。
把三维物体变为二维表示的过程称为投影变换。透视投影及其常用的一种简化形式为正 投影,以x0,y0,z0表示物体上的点坐标,xp,yp,zp为投影点坐标,如图2所示,其中图a为透 视投影观察坐标系图,图b为透视投影计算图。
透视投影:投影射线汇聚于投影中心,或者说投影中心在有限远处的投影。如图3所示, 为透视投影的示意图和坐标计算方法。
如图3所示,透视投影变换的观察坐标系中,投影中心处于坐标系原点,投影平面与z轴 垂直并距原点距离为d。由相似三角形关系得:
x p y p z p 1 T = x 0 · d z 0 y 0 · d z 0 d 1 T - - - ( 11 )
正平行投影:正投影的投影方向与观察坐标系的某个坐标轴方向平行,即投影方向与另 外两个坐标轴组成的平面垂直。图4给出了立方体的各种正投影。
在观察坐标系中进行平行正投影很方便,如果是按z方向投影,物体的投影图坐标便与 它的z值无关,所以去掉z变量便是三维物体的二维投影描述。沿z方向正投影的变换可表示 成:
x p y p z p 1 = 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 x 0 y 0 z 0 1 = P zort x 0 y 0 z 0 1 - - - ( 12 )
对三维模型上的一个顶点[x y z]T,经过(10)几何变换后的坐标为[x′y′z′]T。使用 正投影模型可以得到该点在图像平面上的投影坐标为:
Px′=x′×(width/edge)+width/2 Py′=y′×(height/edge)+height/2    (13)
其中width为二维图象的宽度,height为二维图象的高度,edge为三维视区边界的长度。
如图4所示,由于投影变换失去了深度信息,往往导致图形的二义性。要消除二义性,就 必须在绘制时消除被遮挡的不可见的线或面,习惯上称作消除隐藏线和隐藏面,或简称为消 隐。经过消隐得到的投影图称为物体的真实图形。
消隐可以采用Z-buffer、扫描线、光线投射等。
前述中的三维人脸形变模型都是基于顶点计算的,即三维人脸的三维顶点经投影后形成 二维的点,这会导致形成的二维图像不连续。为了构造真实感的二维虚图像,必须将三维人 脸的点形式变换为面形式,将原始的三维点连接为三维空间中的三角形面片,这一步称为三 角剖分。三角剖分有很多方法,例如,逐点插入方法实现的三角剖分算法过程如下:
a.遍历所有散点,找出点集的包容盒,得到作为点集凸壳的初始三角形并放入三角形链 表;
b.将点集中的散点依次插入,在三角形链表中找出其外接圆包含插入点的三角形(称为 该点的影响三角形),删除影响三角形的公共边,将插入点同影响三角形的全部顶点连接起 来,从而完成一个点在Delauney三角形链表中的插入;
c.根据优化准则对局部新形成的三角形进行优化(例如互换对角线等)。将形成的三角 形放入Delauney三角形链表;
d.循环执行上述第2步,直到所有散点插入完毕为止。
3.使用上述经投影变换后的人脸图像与输入的待识别的人脸图像对应像素点的灰度差的 平方和作为两图像的误差,则要求模型参数和使得下式最小:
E I = Σ x , y | | I input ( x , y ) - I mode l ( x , y ) | | 2 - - - ( 14 )
其中:Imput是给定人脸图像,为经三维几何变换得到的二维图象;Imod el是模型产生的人脸图 像,由于Imod el是由三维模型产生的模型图像,所以在上面误差中除了模型参数和外,还 涉及摄像机的平和俯仰角度、尺度变换因子、像平面上的旋转和平移、环境光和方向性光 源等与投影和光照有关的参数,使用来表示这些参数。
4.对参数使用先验经验进行合理性约束。因为一张二维图像可能对应着多个可能 的三维形体,这些当中有一些并不是真实的人脸。由等式(4)给定的分布进行约束,的 先验分布可用正态分布进行估计。给定时,假设图像Impul的观察受标准差为σN的高斯 噪声的影响,即:
P ( I input | α , β , ρ ) ~ exp ( - E I / 2 σ N 2 ) - - - ( 15 )
从而问题转化为给定特定人脸图像的最大后验估计问题。由贝叶斯(Bayesian)估计理 论,后验概率的最大化等价于下式代价函数的最小化:
E = E I σ N 2 + Σ i = 1 M S α i 2 σ i + Σ i = 1 M T β i 2 λ i + Σ i ( ρ i - ρ i ) 2 σ ρ i 2 - - - ( 16 )
ρi为第i个摄影参数(投影、光照等参数),和σρi分别为该参数的均值和标准差。从而模 型对于特定人脸图像的匹配问题转化为上式关于的最小优化问题。可以使用确定性优 化或随机优化算法来求式(16)的最优解。从而得到特定的人脸三维图像。该三维图像包括纹 理和形状信息。
步骤102b:利用输入的人脸图像对模型进行纹理映射。对于三维模型上任意一点,其空 间坐标为[x y z]T,由(12)式和(13)得到其在图像平面上的投影坐标为[Px Py]T,将该坐标 上输入的人脸图像的像素值作为三维模型上对应点的纹理,从而得到三维人脸的纹理重建。
因此,通过步骤102,完成了将二维人脸图像的三维重建,包括形状和纹理信息,并且, 对重建结果中的纹理作进一步映射处理,获得了更好效果的纹理重建结果。
步骤103:通过建立光照模型,从上述三维重建结果中生成姿态、光照变化的虚图像。
具体步骤如下:
步骤103a:对上述步骤102中得到的人脸三维图像,制定光照模型,可以是采用Phong 模型,也可以是其他的光照模型;其中,Phong模型的制定方法如下:
当光照射到物体表面时,光线可能被吸收、反射和透射。被物体吸收的部分转化为热, 反射、透射的光进入人的视觉系统,使我们能看见物体。为模拟这一现象,人们建立了一些 数学模型来替代复杂的物理模型,这些模型就称为光照模型。
如图5所示为Phong光照模型图,其中图a为Phong光照模型的示意图,图b为Phong 光照模型的几何向量图。
在Phong光照模型中,有三个分量:环境光、漫反射和镜面反射。由物体表面上一点P反 射到视点的光强I为环境光的反射光强、理想漫反射光强、和镜面反射光的总和,即:
I=IaKa+IpKd(L·N)+IpKs(R·V)n    (17)
其中Ia为环境光的光强,Ka为物体对环境光的反射系数,Ip为入射光强,Kd是与物体 有关的漫反射系数,0<Kd<1,Ks是与物体有关的镜面反射系数。物体表面上点P的法向 为N,从点P指向光源的向量为L,视线方向为V,反射方向为R。
步骤103b:在确定了光照模型后,就可以根据人脸姿态三维的旋转角度值θx,θy,θz的区 间和光源参数的区间,选取一定数量的θx,θy,θz值和光源参数值对,对特定人的人脸图像进行 三维几何变换,利用光照模型合成光照条件下的图像,进行投影变换,将三维人脸投影到图 像平面,并进行消隐,从而产生光照和姿态变化的人脸虚图象。
步骤104:利用虚图像进行变化限制分类器设计。
具体包括如下步骤:
步骤104a:预处理。在模式识别技术领域中,样本的预处理对于后面步骤中的分类器的 性能十分重要。样本所具有的变化是否能体现真实样本的变化,采用的样本预处理方法是否 能减小模式类内的变化,将直接影响分类器的性能。因此,基于对上述问题结果的最优化, 本实施例中将人脸样本的特征矢量Xf经过预处理过程变换为XNor,采用如下的方法;
首先,对得到的虚图像进行特征点检测,特征点可以是指定的任意点,利用AdaBoost 等算法进行人眼等特征点的检测。
AdaBoost算法是人脸检测的常用算法。它通过利用一些固定大小的包含人脸特征点样本 和背景样本,训练产生一个能够识别特征点是否存在的分类器。然后通过在输入的人脸图像 上进行窗口搜索,找到包含特征点窗口,从而确定特征点的位置。
然后,对特征点检测后的虚图像进行几何归一化:包括将人脸图像的主要器官位置矫正 到标准位置,然后根据器官位置剪裁出人脸区域。人脸矫正的目的是将人脸的主要器官矫正 到指定位置,减小样本间的尺度、平移和平面旋转差异。矫正的方法是对图像进行二维仿射 变换(平移、放缩和旋转)将标定的器官位置变换到定义的标准位置。剪裁的目的是使人脸 样本尽量少地引入背景干扰,使人脸样本的器官位置具有一致性。
最后,对几何归一化处理后的虚图像进行灰度归一化:由于外界光照、成像设备等因素 可能导致人脸图像亮度对比度异常,出现强阴影或反光等情况。所以还需要对几何归一化 后的人脸样本进行灰度均衡化处理,改善其灰度分布,增强模式间的一致性。虽然目前的灰 度预处理方式都不可能从根本上解决光照、姿态问题,但是它仍然在很大程度上改善了识别 算法的性能。常用的图像灰度均衡化方法包括灰度直方图均衡、照度平面修正和灰度均值、 方差归一化等。
步骤104b:特征抽取和压缩。虚图像中的特征进行抽取,是人脸识别中非常关键的环节。 常用的特征有灰度特征、边缘特征、小波特征、Gabor特征等。本发明实施例以Gabor特征 为例。
在获得长度为L的初始特征矢量Xf后,可以进一步进行特征压缩,从中抽取具有鉴别能 的特征,例如利用前述中的PCA、LDA或两者相结合,同时改善特征的分布,降低特征的 维数,从而提高系统的识别性能。
步骤104c:利用虚图像进行分类器设计,这有很多方法可以实现,常用的有最小欧氏距 离和二次分类器等方法。
在传统的人脸识别中,面对的都是小样本问题,即在少量甚至只有一张模板图像下的识 别问题。如果按传统的单模板或少量模板的情况进行分类器设计,即不能利用大量虚样本所 提供的信息,也不能避免虚图像所造成的缺陷,有可能会造成识别性能的下降,因此,本发 明实施例在二次分类器的基础上,提出一类基于虚图像特点的变化限制分类器(VCC,Variation Conscious Classifier)及其一种特殊形式变化限制修正二次鉴别函数分类器(VC-MQDF)。
迄今为止,贝叶斯(Bayesian)决策理论是分类器设计的理论基础,并获得了广泛的应 用,也取得了较好的识别性能,成为人脸识别中分类器设计的主流方法。贝叶斯决策理论指 出:设样本Xf属于N个模式类别C={c1,c2,...,cN}之一,如果已知Xf属于类别cj,1≤j≤N的 后验概率为p(cj/Xf),那么执行如下的判决规则将实现最小错误意义上的最优分类:
c * = arg max c j C p ( c j / X f ) - - - ( 18 )
其中c*∈C是分类结果。通常后验概率p(cj/Xf )由类别的先验概率P(cj)和类条件概率密 度p(Xf/cj)来表示,则式(18)成为:
c * = arg max c j C P ( c j ) p ( X f / c j ) - - - ( 19 )
假设各人脸类别的先验概率相等,即P(cj)=P(ci)1≤i,j≤N,则最大后验概率变为最大 类条件概率密度准则:
c * = arg max c j C p ( X f / c j ) - - - ( 20 )
实际应用中,类条件概率密度的函数形式和参数通常都是未知的。为了实现贝叶斯决策, 分类器设计的一种方式是利用训练样本对类条件概率密度进行估计,即估计类条件概率密度 的函数形式及参数。但目前在有限数量的训练样本上尚难以通过统计方法得到类条件概率的 函数形式,因此该函数形式通常由经验方法预先给定。采用不同方法对p(Xf/cj)进行建模, 就得到不同形式的鉴别函数和对应的分类器。下面介绍一些常用的方法。
目前的人脸识别基本都是在小样本情况下进行的。如果假设每个类别都具有高斯分布, 就可以得到式(21)的二次鉴别函数分类器:
c * = arg max c j C g j ( X f ) - - - ( 21 )
其中 g j ( X f ) = ( X f - μ j ) T Σ j - 1 ( X f - μ j ) + log | Σ j |
μj为类cj的均值,Σj是类cj的协方差矩阵。
如果每类的协方差矩阵都相等,类内各特征间相互独立,具有相等的方差。此时式(21) 的分类器变为最小距离分类器(MDC):
c * = arg min c j C | | X f - μ j | | - - - ( 22 )
其中,μj为类cj的均值,所以在小样本情况下只需要估计类均值即可。
对本发明实施例中在光照、旋转变化因素V的作用下所产生的大量虚图像,类条件概率 分布普遍存在着多峰和非对称等现象,难以用简单的高斯分布来有效地描述,而且当拥有大 量样本时,估计随机变量的高阶距成为可能。基于这个考虑,本发明实施例设计了在旋转变 化变化因素V限制下的分类器,以更好地描述人脸特征的类条件概率分布,称为变化限制分 类器(Variation Conscious Classifier,简称VCC)。
如果在估计类条件概率密度的时候,考虑变化因素的存在。此时,(20)式的最大条件概 率分类器为:
c * = arg max c j C p ( X f / c j ) = arg max c j C Σ m = 1 M P ( v m ) p ( X f / c j , v m ) - - - ( 23 )
其中M为变化因素的阶数。
在此将变化因素进行了离散化,在实际中,变化都是连续的,比如姿态变化,严格来说, (23)式中的求和应当是积分,在此为了简化,采用了离散化处理,称之为离散变化(DV,Dicrete Variation)。其中P(vm)1≤m≤M为变化因素的先验概率,在本发明实施例中假设先验概率相 等,则上式为:
c * = arg max c j C Σ m = 1 M p ( X f / c j , v m ) - - - ( 24 )
采用不同方法对p(Xf/cj,vm)进行建模,就得到不同形式的变化限制分类器。确定鉴别 函数的形式后,就可以利用虚图象进行分类器训练,估计分类器的参数。训练完成后可以根 据鉴别函数,代入进行(24)式识别。
利用所述进行特征抽取和压缩处理后的虚图像进行分类器参数的估计,从而完成变化限 制分类器设计。
如果采用修正二次鉴别函数分类器(MQDF)分类器作为鉴别函数,可以得到一种 DV-MQDF分类器。形式为:

式中μi,m为类cj在变化因素vm作用下的分布均值,Σi,m为类cj在变化因素vm作用下的分布的 协方差矩阵,Σi,m的特征对为(λi,i),h2和k为常数。本实施例中h2取所有类别的第k+1个 本征值估计量的均值,k通过实验确定。
估计(25)式的参数可以采用现有的估计样本均值、协方差的方法,并进行特征值分解来 进行。
步骤105:输入待识别的二维人脸图像,进行抽取和压缩处理,然后将抽取和压缩处理 后的特征输入到变化限制分类器中,输出分类结果,最后实现了对二维人脸图像的识别。由 于分类结果与人脸的一一对应关系,所以,实现了人脸身份的识别。
实施例2
本实施例以两个人脸数据库为例,说明本发明中的二维人脸图像识别的过程。
人脸数据库一为CMU PIE人脸库的一个子集,包含67个人的脸部图像,每人有8个姿 态。使用一张正面人脸图象进行注册。该数据库为二维图像数据库,用于注册阶段的数据输 入。
人脸数据库二为来源于488个中国人的三维人脸数据库,是通过三维扫描仪获取的,进 行预处理后可以根据实施例1步骤101中的建立人脸三维形变模型。接下来的流程具体实施 时分为训练、注册、识别三个阶段,如图6、图7和图8所示,具体流程介绍如下:
步骤201:训练阶段。
对于输入的正面人脸首先自动检测人脸区域。
对人脸区域,进行平面旋转的矫正和尺度、灰度归一化以后,得到180×280大小的人脸。 进行三维人脸重建得到特定人的人脸三维图像。
然后根据人脸三维图像在θx[-45°,45°]和θy[-90°,90°]区间范围内,采用正投影模型,生成 随姿态变化的虚图像。
对虚图像提取Gabor特征,通过先训练PCA投影子空间,得到PCA投影矩阵,存储PCA 投影矩阵,然后用压缩后的特征训练LDA投影子空间,得到LDA投影矩阵,与PCA投影矩 阵相乘,得到总的特征压缩矩阵,存储这个压缩矩阵以便后面阶段进行特征压缩。
PCA与上述实施例1中一样,LDA是一种常用的有监督的线性降维方法,它寻找一个 线性子空间,以使得样本在该子空间上投影的类内散布紧密、类间散布分散。以人脸图像为 例,具体做法如下:首先将所有的两维人脸图像按照行序或者列序排列成列向量的形式 xii=1,2,...,N。这样一幅图像对应了高维空间中的一个样本。假设这些样本共分为c类,每 类有Ni个样本,则有:
总均值 m = 1 N Σ i = 1 N x i
各类均值 m i = 1 N i Σ x j X i x j ( i = 1,2 , · · · c ) - - - ( 26 )
类内散布矩阵 S w = Σ i = 1 c Σ x j X i ( x j - m i ) ( x j - m i ) T
类间散布矩阵 S b = Σ i = 1 c N i ( m i - m ) ( m i - m ) T
构成LDA子空间的基 W LDA = arg max W | W T S b W | | W T S w W | = [ w 1 , w 2 , . . . , w m ] 可由以下广义特征值分 解得到:
Sbwi=λiSwWi    (27)
步骤202:注册阶段。
对于输入的含人脸图像,首先检测人脸区域。
对人脸区域,进行平面旋转的矫正和尺度、灰度归一化以后得到XNor,进行三维人脸重 建得到特定人的三维人脸。
然后用训练阶段同样的方法,根据人脸三维图像在θx[-45,45]和θy[-90,90]区间范围 内,采用正投影模型生成姿态变化的虚图像。
对虚图像提取Gabor特征XGab,用前面训练得到的特征压缩矩阵进行特征压缩,然后用 得到的Xf训练身份的DV-MQDF分类器。
步骤203:识别阶段。
对于输入的含人脸图像,对人脸区域进行平面旋转的矫正和尺度、灰度归一化以后得到 XNor,提取Gabor特征XGab,然后进行特征压缩,最后用DV-MQDF分类器对得到的Xf进行 分类识别。
在实施例中,采用本方法对8个姿态的人脸进行识别,分别是c05(左转22.5°)、c37(左 转45°)、c02(左转67.5°)、c29(右转22.5°)、c11(右转45°)、c14(右转67.5°)、c09(低 头)、c07(抬头)。分别达到了70%,94%,100%,100%,95%,68%的首选识别率。
本发明实施例,通过对正面人脸特征点自动进行检测,使得重建过程完全自动化;利用 该三维人脸重建算法得到充分的不同姿态下的虚拟人脸图像,从而在仅有一张正面标准人脸 图像的情况下使得下一步的训练、识别过程可以实施;通过在训练阶段使用变化模拟方法生 成姿态和光照变化的虚图象,增加学习到的样本变化情况,以提高图像的姿态和光照与样本 发生变化时的识别率,并且避免在测试阶段进行费时的姿态校正;通过对虚图像设计变化限 制分类器,可以获得很高的识别率,在训练过程利用虚图像,不需要在识别阶段进行姿态的 校正,从而使得识别过程速度有很大提高。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之 内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈