专利汇可以提供基于增量学习算法的人脸识别跟踪器专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于Haar-like特征和 增量学习 算法 的 人脸识别 跟踪 器,主要涉及 计算机视觉 和 图像处理 领域。本发明使用积分图对Haar-like特征求值进行 加速 ,使用AdaBoost算法训练区分人脸和非人脸的强分类器,用筛选式级联把强分类器级联到一起,从而提高准确率。人脸追踪部分根据上一 帧 图像追踪框的中心点的 位置 ,预测本时刻框中心点的位置。利用PCA算法提取框中图像的主要特征,根据本时刻框中心点的位置预测相应的 降维 后的图形。引入遗忘因子,每五帧一次更新图像数据。这种增量算法无需训练模型,从而提高了效率。理论和实践表明,我们的方法能够自动识别人脸,在人脸的方向产生巨大变化时如正脸变成侧脸时可以继续识别跟踪,并保持连续性的识别,避免了中断。,下面是基于增量学习算法的人脸识别跟踪器专利的具体信息内容。
1.本发明结合Haar-like级联分类器与增量学习算法,提供一种识别率高的人脸识别跟踪器,为了实现上述目的,本发明实例提供的技术方案如下:
步骤1)对于摄像头所拍摄到的每一帧图像进行归一化处理;
步骤2)使用Haar-like级联分类器进行归一化图像的人脸检测,并框出所检测到的人脸,记录框内数据;
步骤3)将方框数据(中点位置,大小)传入追踪器作为第一帧的追踪目标;
步骤4)追踪算法自动识别出人脸作为第一帧;
步骤5)计算方框内的像素点的特征基向量(寻找方框内像素点互相的关系);
步骤6)进入循环,计算物体在初始点为中心的周围点的概率分布;
步骤7)追踪器根据观测模型计算得出的权重,预测下一帧的位置;
步骤8)记录所预测的方框内像素点的特征基向量;
步骤9)每5帧更新一次,使用新的数据更新特征基向量(使其能够持续追踪),进行新的循环。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)具体包括:通过公式对图像进行光照修正,其中 表示归一化之后的图像,而i(x,y)表示原始图像;μ表示图像的均值,一张图像的均值即为该图像中所有像素值的总和除以像素总个数;σ表示图像的标准差,c为常数;
作为本发明的进一步改进,所述步骤(2)中的Haar-like级联器在训练过程中提取图像特征值的原理主要包括:
提取图像的Haar-like特征;Haar-like特征有很多种分类,例如边缘特征,线特征,中心环绕特征等;一张图片由多个像素点组成,不同颜色的像素点具有不同的值;在归一化处理后,图片中的像素分为黑色和白色;将图片中某一区域黑色部分所包含所有像素的值之和减去白色部分所有像素的值之和,所得到的值即为该区域图像的特征值;
为了更加高效的计算图像的特征值,我们使用积分图来加快像素值的计算;积分图的定义如下:
其中(x,y)为图像上的一点的坐标,公式所表示的含义是:在位置(x,y)上,对应的积分图中的像素为该位置的左上角所有的像素之和;(x,y),(x′,y′)均表示像素坐标;ii(x,y)表示积分图值;我们使用以下两个递归公式计算积分图:
s(x,y)=s(x,y-1)+i(x,y)
ii(x,y)=ii(x-1,y)+s(x,y)
其中初始值s(x,-1)=0,ii(-1,y)=0;s(x,y)表示每行像素值的总和;计算的流程为:
先计算每行的像素值总和,再计算所有列的总和;至此我们就可以使用积分图来加速计算某标定区域内像素之和,高效提取图片的特征值。
3.根据权利要求1所述的方法,其特征在于,所述步骤(2)中的Haar-like级联器的训练过程原理主要包括:
使用多个弱分类器组合形成一个强分类器进而提高分类的准确率;其中弱分类器的定义如下:
公式中pi表示控制不等式方向的参数,fj(x)表示输入的像素窗口,该窗口是被训练图像的一部分,称为窗口;例如18*18像素的窗口,通过fj提取特征,并通过阈值θj判定该窗口是否为所要检测的目标;本专利中索要检测的目标为人脸;
假设训练样本图像为(x1,y1),…,(xn,yn),其中yi=0或1,1表示正样本,0表示负样本;
假设有l个正样本,m个负样本,首先初始化权重 初始化yi为 对于t=1,…,T,权重可归一化为 对于每一个特征,我们都需要一个弱分类器进行训练,记为ht,每个分类器只对应训练一个特征;假设训练单个特征j的误差为∈j,则∈j=∑ωi|hj(xi)-yi|,其中i表示所有窗口;在比较每一个∈j后找出拥有最低误差的分类器ht0,并更新权重βt为在更新权重时所得到的系数,在这里t的值为t0;其中分类正确时
ei=1,错误时ei=0;由此得到由多个弱分类器组合而成的一个强分类器,其表达式为:
其中 将多个强分类器级联在一起,第一个强分类器的输入为所有子窗口,该强分类器进行分类,去除掉部分子窗口,将剩余子窗口传递给下一个分类器;当任何一个强分类器拒绝某一个子窗口时,后续分类器便可无需再次处理该窗口;这样能有效降低每个分类器需要处理的子窗口数量,从而提高识别精度。
4.根据权利要求1所述的方法,其特征在于,所述步骤(6)具体包括:
将特征基向量U初始化为空白向量,然后计算第一帧窗口内人脸的均值为μ,此时模型所包含的数据数量n=1,并且运用动态模型来预测下一帧中人脸的位置;到t时刻,根据观测的图像{I1,…,It},预测隐状态变量Xt的值;用贝叶斯定理可以得到t-1时刻的观测图像正确预测t时刻图像的位置的概率为:p(Xt|It-1)∝p(It|Xt)∫p(Xt|Xt-1)p(Xt-1|It-1)dXt-1;
整个追踪的过程由观测模型p(It|Xt-1)主导,用一种粒子滤波算法的变体来模拟物体位置的分布:在t时刻仿射变换的六个参数:Xt=(xt,yt,θt,st,αt,φt)分别代表了x,y方向的位移,旋转角度,比例,纵横比以及偏斜分布;Xt中的每个参数都独立地以Xt-1时刻相应的高斯分布模拟,因此,物体在不同帧之间的运动可以看作仿射变换,得到概率p(Xt|Xt-1)=N(Xt;Xt-1,Ψ);其中,Ψ是包含了每个仿射变换参数的方差的对角协方差矩阵(假设每个放射参数的方差不随时间变化);为了更有效的进行追踪,我们将平衡粒子滤波器的复杂度,比如Ψ所含元素的大小以及粒子数量的选取。
5.根据权利要求1所述的方法,其特征在于,所述步骤(7)具体包括:
根据PCA算法的概率特性模拟观测图像:假设图像It由Xt预测得到,是由目标图像以μ为中心扩展到U的子空间,一个样本从这个子空间产生的概率与它到子空间参考点的位置的距离成反比,并且这个距离可以被分解为样本到子空间的距离dt和投射的样本到子空间中心的距离dw;则样本能从子空间产生的概率: I是一个单位矩阵,μ
是均值,εI表示观察过程中附加的高斯噪音,和投射样本能够被从中心点的马氏距离模拟的概率为 其中μ是均值,∑是U的列对应的奇异值矩阵;由此我
们可以得到样本由子空间产生的概率为:
为了减少噪声,我们使用了一个鲁棒的误差范数: 其
中高斯噪声的潜在模型x=Wz+μ+∈, 是一个正交矩阵,并且有WWT=Iq;z服从均值为0,方差为L的高斯分布,L是一个对角矩阵;由1.可得p(x|z)~N(Wz+μ,σ2Id),并且,可以计算出由模型正确预测观察样本x的概率p(x):
p(x)=∫p(x|z)p(z)dz~N(μ,WLWT+σ2Id),
根据Sherman-Morrison-Woodbury公式,得到:
在概率PCA模型中,W和D对应特征向量和样本协方差矩阵特征值的对角矩阵;将5的表达式可知,当观测噪声σ2增加时,dt的分布减少,并且我们使用dt和dw来计算p(x)。
6.根据权利要求1所述的方法,其特征在于,所述步骤(8)具体包括:
如已有数据模型为一个d×n的矩阵A={I1,…,In},其中每列In代表一帧的数据,我们已经对A进行了奇异值分解,算式为A=U∑VT,算法已预测的新数据B为一个d×m的矩阵;此时我们要用一种高效的增量算法将B中的数据添加到A和B的联合特征基向量中,也就是他们的奇异值分解[A B]=U′Σ′V′T中的U′.我们可以通过以下公式:
其中, 是B与U正交的部分;
我们使一个大小为k+m的方阵 其中k是在Σ中奇异值的数量,R的奇异值
分解可以写为 现在,AB的奇异值分解可以被表示为:
最后,特征基向量U得以更新:
设置遗忘因子,更新新的向量并且将之前的信息的权重降低,已达到有效的学习新的信息,改变模型,适应物体光线,角度的变化。具体实现如下:
设置参数f∈[0,1],更新特征基向量后将之前的特征值与f相乘,计算 的QR分解,具体公式为:
经过以上步骤,算法可以持续运行,而且有较强的鲁棒性,不易受物体外形,角度,光线的变化而影响跟踪的效果。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种短波多通道多带宽信道的模拟方法 | 2020-05-08 | 926 |
用于焦距调节和深度图确定的装置和方法 | 2020-05-12 | 278 |
基于范数正则化离散线性系统的滤波方法、离散线性系统 | 2020-05-08 | 39 |
基于大数据服务器的可疑病态面部检测系统 | 2020-05-12 | 298 |
操作用于检测卫星信号变形的多个GNSS接收器的方法 | 2020-05-14 | 889 |
一种探地雷达资料中管线目标的自动识别方法及系统 | 2020-05-13 | 171 |
一种消防应急灯 | 2020-05-15 | 187 |
一种语种识别方法、装置和用于语种识别的装置 | 2020-05-11 | 368 |
一种工业原材料价格预测方法 | 2020-05-14 | 646 |
一种上行功率控制方法及装置 | 2020-05-13 | 471 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。