首页 / 专利库 / 图形技术 / 迭代重建 / 一种基于结构先验的人脸图像超分辨率方法

一种基于结构先验的人脸图像超分辨率方法

阅读:91发布:2020-05-08

专利汇可以提供一种基于结构先验的人脸图像超分辨率方法专利检索,专利查询,专利分析的服务。并且本 发明 公开基于结构先验的人脸图像超 分辨率 方法,包括:将人脸图像数据集的图像数据预处理,得到 训练数据 集与测试数据集;通过计算生成网络生成的人脸图像与真实的人脸图像之间的结构先验损失,能够使得生成的人脸图像保持拓扑结构的合理性。训练包括生成网络与判别网络的模型,生成网络包括16个残差 块 ,得到能对低分辨率人脸图像进行超分到高分辨人脸图像的人脸图像超分模型;使用训练好的人脸图像超分模型,对测试数据集中的低分辨率图像超分处理,测试训练好的人脸图像超分模型的超分性能。本发明能显著的提高生成的高分辨率图像的视觉 质量 。,下面是一种基于结构先验的人脸图像超分辨率方法专利的具体信息内容。

1.一种基于结构先验的人脸图像超分辨率方法,其特征在于,包括步骤:
S1.将人脸图像数据集中的图像预处理,得到训练数据集与测试数据集:
S2.使用训练数据集训练模型,得到能对低分辨率人脸图像进行超分到高分辨人脸图像的人脸图像超分模型,包括一个生成网络、一个人脸parsing图生成网络和一个判别网络;生成网络包含16个残差;人脸parsing图生成网络为BiSeNet网络;
利用低分辨率人脸图像作为模型的输入,使用相应的高分辨率图像作为监督,训练模型中的生成网络;
将目标高分辨率人脸图像和生成网络所生成的高分辨率人脸图像输入到判别网络中,由判别网络判断出输入图像的真假,模型迭代多次达到稳定后完成模型的训练;
将目标高分辨人脸图像和生成网络所生成的高分辨率人脸图像输入到人脸paring图生成网络中,分别得到目标高分辨率人脸图像的parsing图和生成人脸图像的parsing图;
约束两种parsing图的欧式距离,使得生成的人脸图像的五官位置符合目标要求;
S3.使用训练好的人脸图像超分模型,超分测试数据集中的低分辨率图像,测试该人脸图像超分模型的超分性能。
2.根据权利要求1所述基于结构先验的人脸图像超分辨率方法,其特征在于,所述的BiSeNet网络包含两个支路:空间支路和内容之路;空间支路包含三个卷积层,来获得1/8的特征图大小;内容之路的Xception末尾添加一个全局池化层,使得网络的感受野最大。
3.根据权利要求1所述的基于结构先验的人脸图像超分辨率方法,其特征在于,步骤S2包括:
S21.使用标准高斯分布随机初始化生成网络和判别网络的权重参数,其中生成网络的重建损失函数为L2,结构先验损失为Lprior,对抗损失函数为 判别网络的损失函数为S22.将低分辨率人脸图像输入到生成网络中,生成网络输出与目标高分辨率人脸图像大小一致的生成图像,将生成图像作为判别网络的输入,依次迭代使对抗损失函数 和损失函数L2均降低至趋于稳定;
S23.将目标高分辨率人脸图像和生成图像输入到人脸parsing图生成网络中,分别得到对应的parsing图;计算这两种parsing图之间的欧式距离,使得生成的人脸图像拓扑结构符合目标要求;
S24.判别网络输入为生成网络生成的高分辨率人脸图像和目标高分辨率人脸图像,判别网络判断输入图像真假,计算损失函数 该损失函数 只用于更新判别网络参数;
S25.交替训练生成网络和判别网络,直到所有损失函数不再降低,得到最终人脸图像超分模型。
4.根据权利要求3所述的基于结构先验的人脸图像超分辨率方法,其特征在于,所述生成网络的目标函数如下:
其中,λ1,λ2,λ3为平衡因子,用于调整各个损失函数所占的权重;
所述判别网络的目标函数为
5.根据权利要求3所述的基于结构先验的人脸图像超分辨率方法,其特征在于,所述生成网络的重建损失函数为:
其中x,y分别为从低分辨图像集X和高分辨率图像集Y中采样出来的低分辨率人脸图像和对应的高分辨率人脸图像,E(*)表示取平均操作, 表示L2范数,Fgenerator为生成网络对应的映射函数。
6.根据权利要求3所述的基于结构先验的人脸图像超分辨率方法,其特征在于,所述生成网络的对抗损失函数为:
其中,E(*)表示取平均操作,x~P(X)表示低分辨率图像从P(X)中采样取得,D(*)表示判别网络的映射函数,G(x)表示生成网络生成的高分辨率人脸图像。
7.根据权利要求3所述的基于结构先验的人脸图像超分辨率方法,其特征在于,所述结构先验损失函数为:
其中,其中x,y分别为从低分辨图像集X和高分辨率图像集Y中采样出来的低分辨率人脸图像和对应的高分辨率人脸图像,E(*)表示取平均操作, 表示L2范数,Fgenerator为生成网络对应的映射函数。Φ为人脸parsing图生成网络对应的映射函数。
8.根据权利要求3所述的基于结构先验的人脸图像超分辨率方法,其特征在于,所述判别网络的目标函数为:
其中,E(*)表示取平均操作,y~P(Y)表示目标高分辨率图像从分布P(Y)中采样得到,D(*)表示判别网络的映射函数,x~P(X)表示低分辨率图像从分布P(X)中采样得到,G(x)表示生成网络生成的高分辨率图像。
9.根据权利要求1所述的基于结构先验的人脸图像超分辨率方法,其特征在于:
所述训练数据集中的图像对为[x,y],其中,x为低分辨率人脸图像,y为目标高分辨率人脸图像,且生成网络的输出为
10.根据权利要求1所述的基于结构先验的人脸图像超分辨率方法,其特征在于,步骤S1包括以下步骤:
以统一对齐裁剪方式裁剪原始的高分辨率人脸图像,只保留人脸区域;使用双线性下采样方法下采样对齐裁剪后的高分辨率人脸图像,得到对应的低分辨人脸图像;对生成的低分-高分人脸图像对进行数据增广,以增加训练数据集中的图像数量;第四,使用LFW人脸数据集作为测试集,用于测试其模型的泛化性能。

说明书全文

一种基于结构先验的人脸图像超分辨率方法

技术领域

[0001] 本发明涉及计算机视觉模式识别机器学习、图像超分等技术领域,特别是涉及一种基于结构先验的人脸图像超分辨率方法。

背景技术

[0002] 人脸图像超分任务,指的是从给定的一张低分辨人脸图像中推理恢复出对应的高分辨人脸图像。人脸图像超分辨率是计算机视觉和图像处理中一个重要的任务,受到了AI公司和研究社区的广泛关注。在现实世界的很多场景下都能够看到广泛的应用,比如高安全检查、禁系统和实验室打卡系统等等。
[0003] 除了提高人脸图像的视觉质量外,人脸图像超分任务还为其他的计算机视觉和图像处理任务提供帮助,比如人脸识别、上妆和转脸等。所以人脸图像超分任务具有重要的研究意义。
[0004] 但是这个问题仍然具有挑战性,因为这是个典型的病态问题,即给定一张低分辨率的人脸图像,可能存在多张对应的高分辨率人脸图像。
[0005] 因此,现有人脸图像超分技术在还待进一步的提升。

发明内容

[0006] 本发明的目的是针对现有技术中存在的技术缺陷,而提供一种结构先验的人脸图像超分辨率方法,可以生成具有丰富纹理细节的人脸图像。
[0007] 为实现本发明的目的所采用的技术方案是:
[0008] 一种基于结构先验的人脸图像超分辨率方法,包括步骤:
[0009] S1.将人脸图像数据集中的图像预处理,得到训练数据集与测试数据集:
[0010] S2.使用训练数据集训练模型,得到能对低分辨率人脸图像进行超分到高分辨人脸图像的人脸图像超分模型,包括一个生成网络、一个人脸parsing图生成网络和一个判别网络;生成网络包含16个残差;人脸parsing图生成网络为BiSeNet网络;
[0011] 利用低分辨率人脸图像作为模型的输入,使用相应的高分辨率图像作为监督,训练模型中的生成网络;
[0012] 将目标高分辨率人脸图像和生成网络所生成的高分辨率人脸图像输入到判别网络中,由判别网络判断出输入图像的真假,模型迭代多次达到稳定后完成模型的训练;
[0013] 将目标高分辨人脸图像和生成网络所生成的高分辨率人脸图像输入到人脸paring图生成网络中,分别得到目标高分辨率人脸图像的parsing图和生成人脸图像的parsing图;约束两种parsing图的欧式距离,使得生成的人脸图像的五官位置符合目标要求;
[0014] S3.使用训练好的人脸图像超分模型,超分测试数据集中的低分辨率图像,测试该人脸图像超分模型的超分性能。
[0015] 本发明基于结构先验的人脸图像超分辨率方法,使用残差块作为构建网络的基础,结合多种损失函数,使得模型收敛更快,效果更好,泛化能更强;可生成具有丰富纹理细节的人脸图像。
[0016] 本发明使用生成网络,提高了模型容量和加快训练速度,提高模型的泛化能力和加快训练速度;引入了判别网络,使生成的高分辨率人脸图像更加接近真实的高分辨率人脸图像,显著的提高生成的高分辨率图像的视觉质量。
[0017] 本发明引入人脸的结构先验信息。通过人脸parsing图生成网络分别生成目标人脸高分辨图像的parsing图和生成图像的parsing图,通过计算两种parsing图的欧式距离,来使得生成人脸的拓扑结构符合常理。附图说明
[0018] 图1是本发明在测试数据集中的一张人脸图像上的测试结果,左边是时输入的低分辨率人脸图像,中间是生成的高分辨率人脸图像,右边是目标高分辨率人脸图像。
[0019] 图2是本发明基于结构先验的人脸图像超分辨率方法的流程图
[0020] 其中:LR表示输入的低分辨率图像,Conv表示卷积神经网络,Pixelshuffle表示上采样模块,HR_rec表示生成的高分辨率图像,HR_tar表示目标高分辨率图像,D表示判别网络,Parsing表示人脸parsing图生成网络,RB表示残差块,Lprior表示结构先验损失函数,ReLU表示激活函数。
[0021] 图3为人脸parsing图生成网络输出实例。图中左边为输入图像,右边为人脸parsing图网络的生成图像。

具体实施方式

[0022] 以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0023] 本发明通过一种基于结构先验的人脸图像超分辨率方法来学习一组高度复杂的非线性的变换,用于把低分辨率的人脸图像映射到高分辨的图像,同时保持很好的纹理和身份特征。
[0024] 如图2所示,基于结构先验的人脸图像超分辨率方法,包括以下步骤:
[0025] 步骤S1,先对CelebA人脸数据集中的人脸图像进行预处理。
[0026] 第一,以一种统一的对齐裁剪方式裁剪原始的高分辨率人脸图像,且只保留人脸区域;
[0027] 第二,使用双线性下采样方法下采样对齐裁剪后的高分辨率人脸图像,得到对应的低分辨人脸图像;
[0028] 第三,对生成的低分-高分人脸图像对进行数据增广,以增加训练数据集中的图像数量,包括随机平翻转,随机颜色变换;
[0029] 第四,选择LFW数据集作为测试集,其处理方式同CelebA的预处理。使用LFW数据集,测试其模型的泛化性能。
[0030] 步骤S2,利用步骤S1输入训练数据,训练基于结构先验的人脸图像超分辨率方法模型,以用来完成人脸图像的超分辨率任务。
[0031] 在模型的生成网络中利用卷积神经网络结构先进行浅层的特征提取,然后通过16个残差块,进行深层特征提取,其次通过pixelshuffle层上采样操作保持生成的人脸图像的大小和GroundTruth真实高分辨率人脸图像的大小一致,最后通过一份卷积层以将通道数缩放到3。残差块中不包含正则化。
[0032] 其中,稠密残差神经网络的第一个卷积层的输入通道数,输出通道数,滤波器大小,步长和填充分别是3,64,3,1,1。每个残差块中包含2个卷积层。稠密残差块中的2个卷积层的输入通道和输出通道均为64,滤波器大小,步长和填充分别是3,1,1。最后一个卷积层输入通道数,输出通道数,滤波器大小,步长和填充分别是64,3,3,1,1。pixelshuffle层中包含一个卷积层、pixelshuffle和relu层。
[0033] 本发明中包含2个pixelshuffle层。残差块中的每一层卷积层的输入均为前面所有卷积层输出之合。在残差块中,第一个卷积层后均连接有RulU激活层。残差块的个数可根据实际情况进行选择设置。残差块中的通道数也可以根据实际情况进行选择设置。
[0034] 判别网络结构为由卷积层,BN层和激活层堆叠而成的,其中卷积层滤波器大小,步长,填充分别为3,1,1,本发明中卷积层个数为7,这一部分作为图像的特征提取,然后在加上两个全连接层来分类,该判别网络的输入为生成网络生成的高分辨率人脸图像 和真实的目标高分辨率人脸图像y,同样判别器的网络结构可根据需求自由设置。
[0035] 该步骤中,利用低分辨率人脸图像作为模型的输入,真实的高分辨率人脸图像作为生成目标,交替训练模型中的生成网络和判别网络完成人脸图像超分辨率任务。
[0036] 具体地,通过模型中的生成网路对低分辨比率人脸图像进行超分处理,得到生成的高分辨率人脸图像,与真实的高分辨率人脸图像进行重建L2损失函数的计算。
[0037]
[0038] 其中x,y分别为从低分辨图像集X和高分辨率图像集Y中采样出来的低分辨率人脸图像和对应的高分辨率人脸图像,E(*)表示取平均操作, 表示L2范数,Fgenerator为生成网络对应的映射函数。
[0039] 并将生成的高分辨率人脸图像作为判别网络的输入,计算对抗损失函数
[0040]
[0041] 其中,E(*)表示取平均操作,x~P(X)表示低分辨率图像从P(X)中采样取得,D(*)表示判别网络的映射函数,G(x)表示生成网络生成的高分辨率人脸图像。
[0042] 将生成的高分辨人脸图像和目标高分辨率人脸图像作为人脸parsing图生成网络的输入,计算其输出的两种parsing图之间的欧氏距离,即结构先验损失函数Lprior:
[0043]
[0044] 其中,其中x,y分别为从低分辨图像集X和高分辨率图像集Y中采样出来的低分辨率人脸图像和对应的高分辨率人脸图像,E(*)表示取平均操作, 表示L2范数,Fgenerator为生成网络对应的映射函数。Φ为人脸parsing图生成网络对应的映射函数。
[0045] 通过判别网络对输入的生成的高分辨率人脸图像和目标高分辨率人脸图像判断真假,并计算对抗损失函数 该损失函数只用于更新判别网络的参数。模型迭代多次达到稳定后完成模型的训练。
[0046]
[0047] 其中,E(*)表示取平均操作,y~P(Y)表示目标高分辨率图像从分布P(Y)中采样得到,D(*)表示判别网络的映射函数,x~P(X)表示低分辨率图像从分布P(X)中采样得到,G(x)表示生成网络生成的高分辨率图像。
[0048] 本发明中,利用所述卷积神经网络的高度非线性拟合能力,针对人脸图像超分任务,构造以低分辨人脸图像作为输入的神经网络模型。
[0049] 特别的,模型中生成网络以残差块为基础,具有更好的模型容量,且不易出现梯度消失和爆炸的问题。本发明中,生成网络结合了人脸的结构先验。这样,通过如图2所示的网络,利用对抗生成网络可以训练一个,具有良好感知效果的人脸图像超分模型。在测试阶段,使用测试集中的低分辨人脸图像作为模型的输入,且只通过模型中的生成网络,判别网络不参与测试,得到生成的效果图,如图1所示。
[0050] 具体的,基于结构先验的人脸图像超分辨率模型包含三个网络,分别是生成网络、人脸parsing图生成网络和判别网络。特别的,模型的生成网络目标函数如下:
[0051]
[0052] 其中,λ1,λ2,λ3为平衡因子,用于调整各个损失函数所占的权重。本发明中,λ1,λ2,λ3均为1。
[0053] 上述的生成网络模型,主要完成人脸图像超分任务,所述模型的最终目标为L2、Lprior和 三个损失函数降低至最低且保持稳定。
[0054] 所述基于结构先验的人脸图像超分辨率模型的三个网络如下训练:
[0055] 步骤S21:初始化模型中的生成网络,λ1,λ2,λ3均为1,批处理大小设为32,学习率设为10-4,并在整个训练过程中保持不变;
[0056] 步骤S22:对于人脸图像超分任务,具体地,通过生成网络对低分辨图像进行超分辨处理,得到生成的高分辨率人脸图像,与真实的高分辨率人脸图像进行重建L2损失的计算,将生成的高分辨率人脸图像输入到判别器中,并计算 损失函数。
[0057] 步骤S23:人脸parsing图生成网络的输入为生成网络生成的高分辨人脸图像和目标高分辨人脸图像,计算其Lprior结构先验损失函数。
[0058] 将目标高分辨人脸图像和生成网络所生成的高分辨率人脸图像输入到人脸paring图生成网络中,分别得到目标高分辨率人脸图像的parsing图和生成人脸图像的parsing图,通过约束两种parsing图的欧式距离,使得生成的人脸图像的五官位置符合目标要求。
[0059] 步骤S24:判别网络的输入为模型中生成网络生成的高分辨率人脸图像和目标高分辨率人脸图像。判别网络判断输入人脸图像的真假,并计算 损失函数。该损失函数只用于更新判别网络的参数。
[0060] 步骤S25:模型中的生成网络和判别网络同时交替训练,更新其网络权重。
[0061] 步骤S3:使用训练好的生成网络,对测试数据集中的低分辨率人脸图像进行超分处理。
[0062] 其中,人脸parsing图生成网络采用BiSeNet网络包,所述的BiSeNet网络包含两个支路:空间支路和内容之路;空间支路包含三个卷积层,来获得1/8的特征图大小;内容之路的Xception末尾添加一个全局池化层,使得网络的感受野最大。
[0063] 为了详细说明本发明的具体实施方式及验证本发明的有效性,将本发明提出的方法应用于一个公开的数据集中训练(CelebA),该人脸图像大概有2万多张人脸图像。选择LFW人脸数据集作为其测试集,用于测试模型的泛化性能。
[0064] 先对CelebA人脸数据集中的人脸图像进行预处理:第一,以一种统一的对齐裁剪方式裁剪原始的高分辨率人脸图像,且只保留人脸区域;第二,使用双线性下采样方法下采样对齐裁剪后的高分辨率人脸图像,得到对应的低分辨人脸图像;第三,对生成的低分-高分人脸图像对进行数据增广,以增加训练数据集中的图像数量,包括随机水平翻转,随机颜色变换。使用训练数据集训练模型,利用梯度反传技术优化模型参数,得到用来人脸图像超分的模型。
[0065] 为了测试该模型有效性,使用测试集LFW作为训练好的模型的测试集,可视化结果如图1所示。实验中,与GroundTruth真实图像进行对比,实验结果如图1所示,该实施例有效证明了本发明方法对人脸图像超分辨率的有效性。
[0066] 所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈