首页 / 专利库 / 人工智能 / 机器学习 / 人工神经网络 / 玻尔兹曼机 / 受限玻尔兹曼机 / 利用降维方法进行人脸姿态估计的方法

利用降维方法进行人脸姿态估计的方法

阅读:450发布:2020-11-22

专利汇可以提供利用降维方法进行人脸姿态估计的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 图像识别 技术领域的利用 降维 方法进行人脸 姿态 估计的方法,具体包括如下步骤:(1)对不同姿态的人脸图像训练样本进行预处理操作;(2)对预处理后的数据进行主成分分析处理;(3)初始化受限 玻尔兹曼机 神经网络;(4)用主成分分析处理后的数据预训练 受限玻尔兹曼机 神经网络;(5)调整受限玻尔兹曼机神经网络参数;(6)对新的人脸图像进行姿态识别;本发明与 现有技术 相比错误率进一步降低,同时由于其数据的维数经过主成分分析处理后大大降维,后续的网络中每一层的 节点 数也随之减少,不仅减少了训练时间,同时测试速度也大为提高。,下面是利用降维方法进行人脸姿态估计的方法专利的具体信息内容。

1.一种利用降维方法进行人脸姿态估计的方法,具体包括如下步骤:
(1)对不同姿态的人脸图像训练样本进行预处理操作;
(2)对预处理后的数据进行主成分分析处理;
(3)初始化受限玻尔兹曼机神经网络;
(4)用主成分分析处理后的数据预训练受限玻尔兹曼机神经网络;
(5)调整受限玻尔兹曼机神经网络参数;
(6)对新的人脸图像进行姿态识别。
2.根据权利要求1所述的利用降维方法进行人脸姿态估计的方法,其特征是, 所述的步骤(1)具体包括:
1)对于每个人脸图像训练样本,首先把其缩放为高为h个像素、宽为w个像素的 图像;
2)把该缩放后的人脸图像变换为灰度图像;
3)把所有像素的灰度值归一化到[0,1];
4)把它们拉成长度为h×w的向量,即该向量的维数是h×w。
3.根据权利要求2所述的利用降维方法进行人脸姿态估计的方法,其特征是, 所述的步骤(2)具体包括:
1)对预处理后的数据进行主成分分析操作,去除冗余信息和噪音,保持98%的信 息量;
2)把所有数据都从h×w降到s维,同时得到平均向量x和特征向量P,具体关 系如下:X=x+Pb,降维后的数据b表示为:b=PT(X-x),其中X为原始h×w 维的向量数据,b为降维后的s维数据。
4.根据权利要求1所述的利用降维方法进行人脸姿态估计的方法,其特征是, 所述的步骤(3)具体包括:
1)设定该神经网络有L层;每一层的结点数分别为N1,N2,…,NL;类别个数为 C;预训练和调整参数的次数分别为Pt和Pc;
2)根据网络层数和每层结点的个数确定网络结构,同时产生[0,1]之间的随机数 作为网络结点之间连接权值。
5.根据权利要求3所述的利用降维方法进行人脸姿态估计的方法,其特征是, 所述的步骤(4)具体包括:
1)设置网络中第一层受限玻尔兹曼机的可视层的结点与步骤(2)中向量中的s个 值一一对应,即第一层受限玻尔兹曼机的可视层的结点数为s,训练该受限玻尔兹曼 机可视层结点与隐层结点之间的权值参数,共训练Pt次;
2)再以第一层受限玻尔兹曼机的隐层结点作为第二层受限玻尔兹曼机可视层结 点,同样训练该受限玻尔兹曼机可视层结点与隐层结点之间的权值参数,也训练Pt 次;
3)依此类推,即上一层受限玻尔兹曼机的隐层结点作为下一层受限玻尔兹曼机的 可视层结点以训练下一层受限玻尔兹曼机,最终完成了整个网络的预训练,同时也得 到了预训练好的各层受限玻尔兹曼机的参数。
6.根据权利要求1所述的利用降维方法进行人脸姿态估计的方法,其特征是, 所述的步骤(5)是指:利用梯度下降法以重建误差最小为准则反向传播并调整所有受 限玻尔兹曼机可视层结点与隐层结点之间的权值参数,该步骤共执行Pc次。
7.根据权利要求1所述的利用降维方法进行人脸姿态估计的方法,其特征是, 所述的步骤(6)是指:对于一幅新的待进行姿态识别的人脸图像,先把其缩放到高为 h,宽为w的图像,并把该缩放的图像变换为灰度图像,然后把图像灰度值归一化到 [0,1],接着把归一化后的图像拉成一个长度为h×w的向量X,并利用b=PT(X-x) 把该向量的维数降到s,最后把该s维的向量送入已经训练好的网络进行姿态识别。

说明书全文

技术领域

发明涉及一种图像识别技术领域的方法,具体是一种结合了主成分分析(PCA) 和受限玻尔兹曼机神经网络的降维方法进行人脸姿态估计的方法。

背景技术

目前人脸识别的研究重点已经从二维拓展到三维,而三维人脸识别中最为核心的 技术就是如何根据二维人脸图像估计该人脸的三维姿态。姿态估计本质上是一个分类 问题,即判断一幅人脸图像中的人脸属于哪一个姿态。但是人脸图像是典型的高维数 据,一般的分类方法根本不能够被直接应用于姿态估计,因此首先必须对高维人脸数 据进行降维,然后再对降维后的数据进行姿态估计。
经对现有技术文献的检索发现,G.G.Hilton等在《Science》(科学杂志,2006 年第313卷第5786期第504页)发表的“Reducing the Dimensionality of Data with Neural Networks”(用神经网络降低数据维数),该文提出了一种基于受限玻尔兹曼 机神经网络的非线性降维方法,实验证明该方法可以被用于姿态估计。利用大量的不 同姿态的人脸图像数据对网络进行预训练得到初始权值,然后再用原始数据对整个网 络的权值进行调整使网络达到最佳状态。但是该方法的训练时间随着训练样本的个数 和维数的上升而急剧增加。但是在实际应用上,人脸图像在生成过程中受到外界的干 扰而包含了很多冗余的信息和噪音,这些冗余的信息和噪音不但会增加计算时间,还 会影响后期的识别精度,因此在真正对这些数据利用神经网络进行降维处理之前有必 要去除这些冗余的信息和噪音,另外受限玻尔兹曼机神经网络降维方法同时还有速度 慢、精度低等缺陷

发明内容

本发明的目的在于克服现有技术中的不足,提供一种利用降维方法进行人脸姿态 估计的方法,即首先对原始数据进行PCA(主成分分析)处理从而去除冗余信息和噪 音,然后再利用神经网络方法对主成分分析处理后的数据进行降维处理操作。把这种 新的降维方法应用到人脸姿态识别,从而可以提供人脸姿态信息以能够在多度下进 行人脸识别。
本发明是通过以下技术方案实现的,本发明首先对训练样本进行主成分分析处 理,去除原始数据中的冗余信息和噪音,并得到PCA处理后的数据,然后使用该数据 对受限玻尔兹曼机神经网络进行预训练,得到预训练网络参数,并用梯度下降方法调 整整个网络参数。最后对于待进行姿态估计的人脸图像,对其进行主成分分析处理, 再把主成分分析处理后的数据送入该学习好的神经网络中进行姿态识别分类。
本发明具体包括如下步骤:
(1)对不同姿态的人脸图像训练样本进行预处理操作;
(2)对预处理后的数据进行主成分分析处理;
(3)初始化受限玻尔兹曼机神经网络;
(4)用主成分分析处理后的数据预训练受限玻尔兹曼机神经网络;
(5)调整受限玻尔兹曼机神经网络参数;
(6)对新的人脸图像进行姿态识别;
所述的步骤(1),是指:对于每个人脸图像训练样本,首先把其缩放为高为h个 像素、宽为w个像素的图像。然后把该缩放后的人脸图像变换为灰度图像,并把所有 像素的灰度值归一化到[0,1],最后把它们拉成长度为h×w的向量,即该向量的维 数是h×w。
所述的步骤(2),是指:对步骤(1)中的预处理后的数据进行主成分分析操作,去 除冗余信息和噪音,保持98%的信息,把所有数据都从h×w降到s维,同时得到平 均向量x和特征向量P,如果把原始h×w维的向量数据表示为X,降维后的s维数据 表示为b,那么X可以表示为:X=x+Pb,降维后的数据b可以表示为:b=PT(X-x)。
所述的步骤(3),是指:设定该神经网络有L层。每一层的结点数分别为N1, N2,…,NL。类别个数为C,预训练和调整参数的次数分别为Pt和Pc。根据网络层数 和每层结点的个数确定网络结构,同时产生[0,1]之间的随机数作为网络结点之间连 接权值。
所述的步骤(4),是指:设置网络中第一层受限玻尔兹曼机的可视层的结点与步 骤(2)中向量中的s个值一一对应,即第一层受限玻尔兹曼机的可视层的结点数为s, 训练该受限玻尔兹曼机可视层结点与隐层结点之间的权值参数,共训练Pt次。然后 再以第一层受限玻尔兹曼机的隐层结点作为第二层受限玻尔兹曼机可视层结点,同样 训练该受限玻尔兹曼机可视层结点与隐层结点之间的权值参数,也训练Pt次。依此 类推,即上一层受限玻尔兹曼机的隐层结点作为下一层受限玻尔兹曼机的可视层结点 以训练下一层受限玻尔兹曼机。这样就完成了整个网络的预训练,同时也得到了预训 练好的各层受限玻尔兹曼机的参数。
所述的步骤(5),是指:利用梯度下降法以重建误差最小为准则反向传播并调整 所有受限玻尔兹曼机可视层结点与隐层结点之间的权值参数,该步骤共执行Pc次。
所述的步骤(6),是指:对于一幅新的待进行姿态识别的人脸图像,先把其缩放 到高为h,宽为w的图像,并把该缩放的图像变换为灰度图像,然后把图像灰度值归 一化到[0,1],接着把归一化后的图像拉成一个长度为h×w的向量X,并利用 b=PT(X-x)把该向量的维数降到s,最后把该s维的向量送入已经训练好的网络进 行姿态识别。
本发明提出的人脸姿态估计方法具有相当高的精度,用拍摄的人脸库做测试,其 识别错误率为1.95%。与没有经过主成分分析处理而直接用受限玻尔兹曼机神经网进 行降维的方法相比,该方法的错误率进一步降低。同时由于其数据的维数经过主成分 分析处理后大大降维,后续的网络中每一层的节点数也随之减少,这不仅减少了训练 时间,同时测试速度也大为提高。
附图说明
图1为本实施例姿态示意图
其中:1到9分别表示的人脸图像的姿态角度为-90°、-60°、-45°、-30°、 0°、30°、45°、60°、90°。
图2为本实施例姿态识别的结果
其中:人脸图像的姿态角度为60°。

具体实施方式

下面结合附图对本发明的实施例作详细说明:本实施例在以本发明技术方案为前 提下进行实施,给出了详细的实施方式和具体过程,但本发明的保护范围不限于下述 的实施例。
实施例
1.把人脸库(该人脸库包含有2270个人的9个不同姿态的人脸图像。如图1所 示,图a、b、c、d、e、f、g、h、i这9个人脸图像的姿态分别为-90°、-60°、-45 °、-30°、0°、30°、45°、60°、90°。把人脸库中的图像按照其不同的姿态分 为9类,每一类有2270个。)中的所有图像缩放为高为30个像素,宽为30个像素的 图像,然后把该缩放后的人脸图像变换为灰度图像,并把图像的像素灰度值归一化到 [0,1],最后把灰度图像拉成长度为900的向量。
2.对步骤(1)中的所有的向量数据进行主成分分析处理,保持98%的信息,最终 把向量的维数从900维降到342维,同时得到平均向量x和特征向量P,如果把原始 900维的向量数据表示为X,降维后的342维数据表示为b,那么X可以表示为: X=x+Pb,降维后的数据b可以表示为:b=PT(X-x)。
3.设定该神经网络有3层。每一层的结点数分别为300,300,800。类别个数 为9,预训练和调整参数的次数分别为50和100。根据网络层数和每层结点的个数确 定网络结构,同时产生[0,1]之间的随机数作为网络结点之间连接权值。
4.设置网络中第一层受限玻尔兹曼机的可视层的结点与步骤(2)中向量中的342 个值一一对应,即第一层受限玻尔兹曼机的可视层的结点数为342,训练该受限玻尔 兹曼机可视层的342个结点与隐层的300个结点之间的权值参数,共训练50次。然 后再以第一层受限玻尔兹曼机的隐层结点作为第二层受限玻尔兹曼机可视层结点,同 样训练该受限玻尔兹曼机可视层的300个结点与隐层的300个结点之间的权值参数, 也训练50次。依此类推,即上一层受限玻尔兹曼机的隐层结点作为下一层受限玻尔 兹曼机的可视层结点以训练下一层受限玻尔兹曼机。这样就完成了整个网络的预训 练,同时也得到了预训练好的各层受限玻尔兹曼机的参数。
5.利用梯度下降法以重建误差最小为准则反向传播并调整所有受限玻尔兹曼机 可视层结点与隐层结点之间的权值参数,该步骤共执行100次。
6.对于一幅新的待进行姿态识别的人脸图像,先把其缩放到高为30,宽为30 的图像,并把该缩放的图像变换为灰度图像,然后把图像灰度值归一化到[0,1],接 着把归一化后的图像拉成一个长度为900的向量,并利用b=PT(X-x)把该向量的 维数降到342,最后把该342维的向量送入已经训练好的网络进行姿态识别。如图2 所示,该待进行姿态识别的图像为一幅60°的人脸图像,用本发明的方法可以正确 地识别出该人脸图像的姿态。
从以上可以看出,本实施例提出的人脸姿态识别方法可以进一步应用于三维人脸 识别。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈