技术领域
[0001] 本
申请涉及人脸识别领域,特别是涉及一种基于深度信念网络的多姿态人脸识别的方法和装置。
背景技术
[0002] 深度信念网络(Deep Neural Networks,DNN)可以理解为有很多
隐藏层的神经网络,又被称为深度前馈网络或多层
感知机。DNN可以分为
输入层、隐藏层和
输出层,一般第一层是输入层,最后一层是输出层,而中间的层数都是隐藏层。层与层之间是全连接的。深度信念网络是一种良好的
无监督学习方法,其特征提取功能能够针对不同概念的粒度大小,能够在很多领域得到广泛的应用。通常,通过级联多层卷积网络组成深度信念网络的模型主要用于二维数据,例如图像等。
[0003] 目前,已经存在采用深度信念网络进行人脸
图像识别的应用,将经过分
帧及优化之后的人脸图像作为原始数据输入,并采用SVM(Support Vector Machine,
支持向量机)作为分类器,训练深度信念网络提取人脸的特征,从而进行人脸识别。其中,深度信念网络还在最高层添加逻辑回归层,一方面在训练学习阶段用于对整个网络结构进行参数微调,另一方面在测试阶段对人脸图像进行分类识别。与基于梅尔
倒谱系数特征分类的方法相比,分类
精度得到了提高,但是对于多姿态的人脸图像存在非线性问题和低
分辨率问题。
发明内容
[0004] 本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
[0005] 根据本申请的一个方面,提供了一种基于深度信念网络的多姿态人脸识别的方法,包括:
[0006] 获取人脸图像的训练集并进行预处理;
[0007] 将深度信念网络分解成多层相邻量程构成的RBM(Restricted Boltzmann Machine,受限
玻尔兹曼机),输入所述预处理后的训练集通过贪心
算法预训练所述深度信念网络的参数;
[0008] 使用自
编码器对训练好的深度信念网络进行参数微调;
[0009] 在所述微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别。
[0010] 可选地,输入所述预处理后的训练集通过贪心算法预训练所述深度信念网络的参数,包括:
[0011] 将所述预处理后的训练集输入所述深度信念网络,通过贪心算法训练第一层
受限玻尔兹曼机的第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量,通过所述第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量计算出第一层受限玻尔兹曼机的隐藏层向量,并以上一层的输出作为下一层的输入递归计算出每层受限玻尔兹曼机的网络权重、可视单元偏移量和隐藏单元偏移量及隐藏层向量。
[0012] 可选地,使用自编码器对训练好的深度信念网络进行参数微调,包括:
[0013] 将训练好的深度信念网络的输出,输入到自编码器,作为标签对所述自编码器进行训练,通过训练好的自编码器微调所述深度信念网路的参数。
[0014] 可选地,在所述微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别,包括:
[0015] 在所述微调后的深度信念网络的最顶层添加极限学习机,以所述极限学习机作为单隐层前馈型神经网络,对多姿态人脸图像进行分类识别。
[0016] 可选地,获取人脸图像的训练集并进行预处理,包括:
[0017] 对人脸库图像中的训练图像取其镜像图像,并与所述训练图像一起组成训练集,对所述训练集中的所有人脸图像进行预处理,将其中低分辨率人脸图像进行插值处理,使其与高分辨率人脸图像具有同等的分辨率。
[0018] 根据本申请的另一个方面,提供了一种基于深度信念网络的多姿态人脸识别的装置,包括:
[0019] 获取模
块,其配置成获取人脸图像的训练集并进行预处理;
[0020] 训练模块,其配置成将深度信念网络分解成多层相邻量程构成的受限玻尔兹曼机,输入所述预处理后的训练集通过贪心算法预训练所述深度信念网络的参数;
[0021] 微调模块,其配置成使用自编码器对训练好的深度信念网络进行参数微调;
[0022] 识别模块,其配置成在所述微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别。
[0023] 可选地,所述训练模块具体配置成:
[0024] 将所述预处理后的训练集输入所述深度信念网络,通过贪心算法训练第一层受限玻尔兹曼机的第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量,通过所述第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量计算出第一层受限玻尔兹曼机的隐藏层向量,并以上一层的输出作为下一层的输入递归计算出每层受限玻尔兹曼机的网络权重、可视单元偏移量和隐藏单元偏移量及隐藏层向量。
[0025] 可选地,所述微调模块具体配置成:
[0026] 将训练好的深度信念网络的输出,输入到自编码器,作为标签对所述自编码器进行训练,通过训练好的自编码器微调所述深度信念网路的参数。
[0027] 可选地,所述识别模块具体配置成:
[0028] 在所述微调后的深度信念网络的最顶层添加极限学习机,以所述极限学习机作为单隐层前馈型神经网络,对多姿态人脸图像进行分类识别。
[0029] 可选地,所述获取模块具体配置成:
[0030] 对人脸库图像中的训练图像取其镜像图像,并与所述训练图像一起组成训练集,对所述训练集中的所有人脸图像进行预处理,将其中低分辨率人脸图像进行插值处理,使其与高分辨率人脸图像具有同等的分辨率。
[0031] 根据本申请的又一个方面,提供了一种计算设备,包括
存储器、处理器和存储在所述存储器内并能由所述处理器运行的
计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的方法。
[0032] 根据本申请的又一个方面,提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如上所述的方法。
[0033] 根据本申请的又一个方面,提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述的方法。
[0034] 本申请提供的技术方案,通过获取人脸图像的训练集并进行预处理,将深度信念网络分解成多层相邻量程构成的RBM,输入所述预处理后的训练集通过贪心算法预训练所述深度信念网络的参数,使用自编码器对训练好的深度信念网络进行参数微调,在所述微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别,从而将深度信念网络与极限学习机相结合,在复杂函数的非线性问题方面具有优异的性能,能够有效地学习带有姿态变化的高低分辨率图像之间流形假设的点对联系,充分挖掘带有姿态变化的高低分辨率图像中姿态变化的非线性联系以及高低分辨率图像之间的共有特性,从而克服姿态变化的非线性和分辨率低的影响,进而提取输入图像的本质特征。由于采用自编码器微调网络参数并使用极限学习机进行分类识别,使得最后的分类时间和识别效果都具有明显的提升。
[0035] 根据下文结合
附图对本申请的具体
实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
附图说明
[0036] 后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
[0037] 图1是根据本申请一个实施例的基于深度信念网络的多姿态人脸识别的方法
流程图;
[0038] 图2是根据本申请另一个实施例的基于深度信念网络的多姿态人脸识别的方法流程图;
[0039] 图3是根据本申请另一个实施例的基于深度信念网络的多姿态人脸识别的装置结构图;
[0040] 图4是根据本申请另一个实施例的计算设备结构图;
[0041] 图5是根据本申请另一个实施例的计算机可读存储介质结构图。
具体实施方式
[0042] 图1是根据本申请一个实施例的基于深度信念网络的多姿态人脸识别的方法流程图。参见图1,该方法包括:
[0043] 101:获取人脸图像的训练集并进行预处理;
[0044] 102:将深度信念网络分解成多层相邻量程构成的受限玻尔兹曼机,输入预处理后的训练集通过贪心算法预训练深度信念网络的参数;
[0045] 103:使用自编码器对训练好的深度信念网络进行参数微调;
[0046] 104:在微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别。
[0047] 本实施例中,可选的,输入预处理后的训练集通过贪心算法预训练深度信念网络的参数,包括:
[0048] 将预处理后的训练集输入深度信念网络,通过贪心算法训练第一层受限玻尔兹曼机的第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量,通过第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量计算出第一层受限玻尔兹曼机的隐藏层向量,并以上一层的输出作为下一层的输入递归计算出每层受限玻尔兹曼机的网络权重、可视单元偏移量和隐藏单元偏移量及隐藏层向量。
[0049] 本实施例中,可选的,使用自编码器对训练好的深度信念网络进行参数微调,包括:
[0050] 将训练好的深度信念网络的输出,输入到自编码器,作为标签对自编码器进行训练,通过训练好的自编码器微调深度信念网路的参数。
[0051] 本实施例中,可选的,在微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别,包括:
[0052] 在微调后的深度信念网络的最顶层添加极限学习机,以极限学习机作为单隐层前馈型神经网络,对多姿态人脸图像进行分类识别。
[0053] 本实施例中,可选的,获取人脸图像的训练集并进行预处理,包括:
[0054] 对人脸库图像中的训练图像取其镜像图像,并与训练图像一起组成训练集,对训练集中的所有人脸图像进行预处理,将其中低分辨率人脸图像进行插值处理,使其与高分辨率人脸图像具有同等的分辨率。
[0055] 本实施例提供的上述方法,通过获取人脸图像的训练集并进行预处理,将深度信念网络分解成多层相邻量程构成的RBM,输入所述预处理后的训练集通过贪心算法预训练所述深度信念网络的参数,使用自编码器对训练好的深度信念网络进行参数微调,在所述微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别,从而将深度信念网络与极限学习机相结合,在复杂函数的非线性问题方面具有优异的性能,能够有效地学习带有姿态变化的高低分辨率图像之间流形假设的点对联系,充分挖掘带有姿态变化的高低分辨率图像中姿态变化的非线性联系以及高低分辨率图像之间的共有特性,从而克服姿态变化的非线性和分辨率低的影响,进而提取输入图像的本质特征。由于采用自编码器微调网络参数并使用极限学习机进行分类识别,使得最后的分类时间和识别效果都具有明显的提升。
[0056] 图2是根据本申请另一个实施例的基于深度信念网络的多姿态人脸识别的方法流程图。参见图2,该方法包括:
[0057] 201:对人脸库图像中的训练图像取其镜像图像,并与训练图像一起组成训练集,对训练集中的所有人脸图像进行预处理,将其中低分辨率人脸图像进行插值处理,使其与高分辨率人脸图像具有同等的分辨率;
[0058] 其中,经过对人脸图像的训练集进行预处理,能够加大深度信念网络对姿态变化的容忍度。
[0059] 202:将深度信念网络分解成多层相邻量程构成的受限玻尔兹曼机;
[0060] 203:将预处理后的训练集输入深度信念网络,通过贪心算法训练第一层受限玻尔兹曼机的第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量,通过第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量计算出第一层受限玻尔兹曼机的隐藏层向量,并以上一层的输出作为下一层的输入递归计算出每层受限玻尔兹曼机的网络权重、可视单元偏移量和隐藏单元偏移量及隐藏层向量;
[0061] 204:将训练好的深度信念网络的输出,输入到自编码器,作为标签对自编码器进行训练,通过训练好的自编码器微调深度信念网路的参数;
[0062] 本实施例中,无需在深度信念网络的最高层添加逻辑回归层,也不应用
梯度下降法,而是通过自编码器对预训练的深度信念网络参数进行微调,能够使误差收敛到最小。
[0063] 205:在微调后的深度信念网络的最顶层添加极限学习机,以极限学习机作为单隐层前馈型神经网络,对多姿态人脸图像进行分类识别。
[0064] 其中,添加极限学习机后的深度信念网络,输入层与隐藏层权矩阵参数W和隐藏层偏置单元b无需进行调整,且可以任意
指定,从而使得整个深度信念网络的结构训练参数变少。特别是当分类标签较多时,与经典深度信念网络模型添加逻辑回归层的方法相比,克服了训练分类非常耗时、速度慢的
缺陷,训练分类较快,极大地提高了性能,应用更广泛。
[0065] 另外,在深度信念网络的训练微调过程中,可以对整个网络权重参数和各层
节点的偏置参数的学习率都统一初始化,在整个学习过程中再分别对其进行动态调整。具体为在训练的前期,由于网络的
能量下降的速度较快,因此前期的学习率一般都较高,而随着时间的推移,能量的下降速度逐渐趋于稳定整个网络逼近低能量的状态,这样就调小学习率以采取精细搜索。由于输入数据较多,若逐个输入
训练数据,会使得整个训练过程非常缓慢,为加快网络的收敛速度,对输入数据采取分批的处理方式,并且对网络的参数也可以按批调整。
[0066] 本实施例提供的上述方法,通过获取人脸图像的训练集并进行预处理,将深度信念网络分解成多层相邻量程构成的RBM,输入所述预处理后的训练集通过贪心算法预训练所述深度信念网络的参数,使用自编码器对训练好的深度信念网络进行参数微调,在所述微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别,从而将深度信念网络与极限学习机相结合,在复杂函数的非线性问题方面具有优异的性能,能够有效地学习带有姿态变化的高低分辨率图像之间流形假设的点对联系,充分挖掘带有姿态变化的高低分辨率图像中姿态变化的非线性联系以及高低分辨率图像之间的共有特性,从而克服姿态变化的非线性和分辨率低的影响,进而提取输入图像的本质特征。由于采用自编码器微调网络参数并使用极限学习机进行分类识别,使得最后的分类时间和识别效果都具有明显的提升。
[0067] 图3是根据本申请另一个实施例的基于深度信念网络的多姿态人脸识别的装置结构图。参见图3,该装置包括:
[0068] 获取模块301,其配置成获取人脸图像的训练集并进行预处理;
[0069] 训练模块302,其配置成将深度信念网络分解成多层相邻量程构成的受限玻尔兹曼机,输入预处理后的训练集通过贪心算法预训练深度信念网络的参数;
[0070] 微调模块303,其配置成使用自编码器对训练好的深度信念网络进行参数微调;
[0071] 识别模块304,其配置成在微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别。
[0072] 本实施例中,可选的,训练模块具体配置成:
[0073] 将预处理后的训练集输入深度信念网络,通过贪心算法训练第一层受限玻尔兹曼机的第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量,通过第一网络权重、第一可视单元偏移量和第一隐藏单元偏移量计算出第一层受限玻尔兹曼机的隐藏层向量,并以上一层的输出作为下一层的输入递归计算出每层受限玻尔兹曼机的网络权重、可视单元偏移量和隐藏单元偏移量及隐藏层向量。
[0074] 本实施例中,可选的,微调模块具体配置成:
[0075] 将训练好的深度信念网络的输出,输入到自编码器,作为标签对自编码器进行训练,通过训练好的自编码器微调深度信念网路的参数。
[0076] 本实施例中,可选的,识别模块具体配置成:
[0077] 在微调后的深度信念网络的最顶层添加极限学习机,以极限学习机作为单隐层前馈型神经网络,对多姿态人脸图像进行分类识别。
[0078] 本实施例中,可选的,获取模块具体配置成:
[0079] 对人脸库图像中的训练图像取其镜像图像,并与训练图像一起组成训练集,对训练集中的所有人脸图像进行预处理,将其中低分辨率人脸图像进行插值处理,使其与高分辨率人脸图像具有同等的分辨率。
[0080] 本实施例提供的上述装置,可以执行上述任一方法实施例提供的方法,详细过程详见方法实施例中的描述,此处不赘述。
[0081] 本实施例提供的上述装置,通过获取人脸图像的训练集并进行预处理,将深度信念网络分解成多层相邻量程构成的RBM,输入所述预处理后的训练集通过贪心算法预训练所述深度信念网络的参数,使用自编码器对训练好的深度信念网络进行参数微调,在所述微调后的深度信念网络中添加极限学习机,对多姿态人脸图像进行分类识别,从而将深度信念网络与极限学习机相结合,在复杂函数的非线性问题方面具有优异的性能,能够有效地学习带有姿态变化的高低分辨率图像之间流形假设的点对联系,充分挖掘带有姿态变化的高低分辨率图像中姿态变化的非线性联系以及高低分辨率图像之间的共有特性,从而克服姿态变化的非线性和分辨率低的影响,进而提取输入图像的本质特征。由于采用自编码器微调网络参数并使用极限学习机进行分类识别,使得最后的分类时间和识别效果都具有明显的提升。
[0082] 根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
[0083] 本申请实施例还提供了一种计算设备,参照图4,该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。
[0084] 本申请实施例还提供了一种计算机可读存储介质。参照图5,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。
[0085] 本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。
[0086] 在上述实施例中,可以全部或部分地通过
软件、
硬件、
固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、
计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个
网站站点、计算机、
服务器或
数据中心通过有线(例如同轴
电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、
微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是
磁性介质,(例如,
软盘、
硬盘、磁带)、光介质(例如,DVD)、或者
半导体介质(例如固态硬盘Solid State Disk(SSD))等。
[0087] 专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以
电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。
专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
[0088] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如
随机存取存储器,
只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
[0089] 以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉
本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以
权利要求的保护范围为准。