专利汇可以提供基于自编码器的人脸图像旋转方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于自 编码器 的人脸图像旋转方法,依次包括以下步骤:首先,采集每一位用户的原始 正面 和侧面人脸图像,并通过手工方式选取包含人脸的区域构成纯人脸图像,并以此作为用户人脸图像的模板;然后,将模板库中的彩色图像转换成灰度图像;其次,从自编码器的 输入层 到 中间层 ,将相邻两层看作RBM,逐层训练每个RBM。将训练后RBM堆叠得到自编码器,并用训练RBM得到的权值和偏置作为自编码器的初始化权值和偏置;再次,使用反向传播 算法 逐层调整自编码器各层的权值和偏置;最后,使用新用户的侧面人脸图像,对训练过的自编码器进行测试,将侧面图像重建成正面人脸图像。该方法重建过程更加智能化。,下面是基于自编码器的人脸图像旋转方法专利的具体信息内容。
1.一种基于自编码器的人脸旋转方法,其特征在于:该方法依次包括以下步骤,步骤1、建立人脸图像模板库,定义有N个用户,使用图像采集设备,为每一个用户拍摄正面和侧面原始人脸图像,拍摄侧面图像时,让人脸以正前方为基准,旋转一定角度进行拍摄;设人脸旋转的角度为α,-45°≤α≤45°;获得原始人脸图像后,手工选择图像中只包含人脸部分构成纯人脸图像,每个用户选一张正面图像作为目标图像模板和m张侧面图像作为侧面图像模板,第c个用户的正面图像和侧面图像分别用Pc和 表示,1≤c≤N,1≤m≤100,(c-1)m+1≤t≤cm,用Hc和Wc分别表示正面图像的高和宽, 和 分别表示侧面图像的高和宽,用 表示N个用户的纯人脸图像模板库,把
N个用户的人脸图像模板SOF分成两部分,一部分为训练人脸库D1,包含每个用户的一幅正面图像和m幅侧面图像,用于训练自编码器;剩余用户的正面图像和侧面图像作为测试人脸库D2,用于测试训练后的自编码器;
步骤2、如果纯人脸图像模板是彩色图像,则首先将彩色图像转换成灰度图像,用Rc(h,w)、Gc(h,w)和Bc(h,w)分别表示第c个用户正面人脸图像中第(h,w)个像素的红色分量、绿色分量和蓝色分量,根据著名灰度化心理学公式计算其灰度值如下:
gc(h,w)=(Rc(h,w)×299+Gc(h,w)×587+Bc(h,w)×114+500)/1000
灰度化后的人脸图像分别用 表示;
步骤3、使用训练人脸库D1中每个用户经过灰度化后的侧面图像为训练图像,每个用户对应的灰度化后的正面图像为目标输出,训练自编码器;
定义自编码器包含2r-1个隐含层,输入层的节点数为l,l=Hc×Wc;第k个隐含层的节点数分别为lk,1≤k≤2r-1,输出层的节点数和输入层的节点数相同,都为l,网络的参数为各个层的权值和偏置;
自编码器的训练过程包含逐层无监督预训练和有监督微调两个阶段,在逐层无监督预训练过程中,从自编码器的输入层到中间层,把相邻两层看作受限玻尔兹曼机,其中每个RBM的输出是上一个相邻RBM的输入,从最底层的RBM开始,逐层对所有RBM进行学习训练;逐层训练完成后,采用有监督的方式,从网络的输出层到输入层,逐层调整网络的参数;
第k个RBM的可视层为hk-1,1≤k≤r,隐含层为自编码器的第k个隐含层hk,RBM的学习过程具体步骤如下:
步骤3.1、随机初始化权值矩阵Wk,可视层偏置向量ak和隐含层偏置向量bk为接近于0的数值;
步骤3.2、对输入向量hk-1,计算下面的概率值:
随机产生i个0到1之间的随机数βi,将P(hki=1|hk-1)与对应的βi进行比较,若P(hki=1|hk-1)大于βi,则令P(hki=1|hk-1)=1;否则,令P(hki=1|hk-1)=0;
步骤3.3、使用采样得到的P(hki=1|hk-1),计算下面的概率值,得到可视层的重建步骤3.4、使用可视层的重建 计算下面的概率值:
步骤3.5、按照下式更新各个参数:
式中,η表示学习率,0<η<1;
步骤4、依照步骤3,依次学习第1个到第r个RBM;
步骤5、将训练后的r个RBM从底向上堆叠,然后以第r个RBM的隐含层作为中间层,将这r个RBM再反向堆叠,得到自编码器,并用步骤4得到的权值和偏置初始化自编码器;
步骤6、采用反向传播算法调整自编码器的参数;
步骤6.1、对于输入向量x,根据以下公式,计算自编码器各层神经元的激活:
-x
其中,σ(·)为sigmoid函数,σ(x)=1/1+e ,表示第1个隐含层第i个节点的偏置, 表示第k个隐含层第i个节点的偏置, 表示第2r-1个隐含层第i个节点的偏置,且
1≤k≤2r-1;
步骤6.2、目标函数为实际输出向量o与目标输出向量y的交叉熵,用f表示:
步骤6.3、令 1≤k≤2r-1,1≤t≤mN,计算各代价函数f对 的
偏导数;
计算代价函数f对输出层 的偏导数,用 表示:
对于hk(k=2r-1,…,1)隐含层,计算代价函数f对各层 的偏导:
步骤6.4、计算代价函数关于权值和偏置的偏导:
步骤6.5、利用共轭梯度下降法对权值和偏置进行迭代更新,得到最终的权值和偏置;
步骤7、读取测试人脸图像库D2,将测试人脸图像库D2中的侧面人脸图像重建成正面人脸图像。
2.根据权利要求1所述的一种基于自编码器的人脸旋转方法,其特征在于:在实施时需要数码相机或数码摄像机之类的数字图像采集设备和具有图像处理能力的普通台式微机;
具体实施方案为,
步骤(1)、使用图像采集卡CG300、CP240松下摄像机和75mm高精度日本进口镜头组装成数字图像采集设备,并选用lenovo启天M8000微型计算机,组成基于自编码器的人脸图像旋转系统;系统在光照条件下采集距离一米处的用户-45°到+45°的原始人脸图像,并输入计算机中;
步骤(2)、利用步骤(1)组建的自编码器人脸图像旋转系统,采集200个用户的人脸图像各5幅,包括1幅正面人脸图像和4幅侧面人脸图像,左右2个侧面各2幅图像;同时采用手工的方式选择只包含人脸的部分构成纯人脸图像作为模板;给200个用户进行编号,编号从1~200;用Pc表示第c个人的正面图像模板,用 表示第c个人的侧面图像模板,4c-3≤t≤4c;
正面人脸这些人脸模板的高和宽分别用Hc和Wc表示,在拍摄的人脸图像模板中Hc从100~
1800、Wc从100~1800;侧面人脸这些人脸模板的高和宽分别用 和 表示,在拍摄的人脸图像模板中 从100~1800、 从100~1800;
由于原始图像过大和电脑配置的限制,同时防止计算量过大,每幅图像都裁剪成高和宽均为40像素的图;
步骤(3)、对纯人脸图像模板库SOF中的每一个图像模板进行灰度化处理;用Rc(h,w)、Gc(h,w)和Bc(h,w)分别表示模板库中第c个用户的正面人脸图像的第(h,w)个像素的红色分量、绿色分量和蓝色分量,计算其灰度值如下:
gc(h,w)=(Rc(h,w)×299+Gc(h,w)×587+Bc(h,w)×114+500)/1000
把灰度化后的人脸图像表示为Pc={gc(h,w)}, 其中0≤h≤Hc-1,0≤w≤
Wc-1;
步骤(4)、把200个对象的人脸图像模板分成两部分,编号1~100的用户人脸图像用于训练自编码器,编号101~200的用户人脸图像用于测试训练好的自编码器;利用1~100号用户的正面和侧面人脸图像模板训练一个含有7个隐含层的自编码器,自编码器输入层节点数为1600,7个隐含层的节点数分别为1000、500、200、100、200、500、1000,输出层的节点数为1600;
步骤(5)、从自编码器的输入层到中间层,把相邻两层看作受限玻尔兹曼机,其中每个RBM的输出是上一个相邻RBM的输入,从最底层的RBM开始,逐层对所有RBM进行学习训练;逐层训练完成后,采用有监督的方式,从网络的输出层到输入层,逐层调整网络的参数;
第k个RBM的可视层为hk-1,1≤k≤4,隐含层为自编码器的第k个隐含层hk,RBM的学习过程具体步骤如下:
步骤(5.1)、随机初始化权值矩阵Wk,可视层偏置向量ak和隐含层偏置向量bk为接近于0的数值;
步骤(5.2)、对输入向量hk-1,计算下面的概率值:
随机产生i个0到1之间的随机数βi,将P(hki=1|hk-1)与对应的βi进行比较,若P(hki=1|hk-1)大于βi,则令P(hki=1|hk-1)=1;否则,令P(hki=1|hk-1)=0;
步骤(5.3)、使用采样得到的P(hki=1|hk-1),计算下面的概率值,得到可视层的重建步骤(5.4)、使用可视层的重建 计算下面的概率值:
步骤(5.5)、按照下式更新各个参数:
式中,η表示学习率,0<η<1;
步骤(6)、依照步骤(5),依次学习第1个到第4个RBM;
步骤(7)、将训练后的4个RBM从底向上堆叠,然后将第4个RBM的隐含层作为中间层,将这4个RBM再反向堆叠,得到自编码器,并用步骤(5)得到的权值和偏置初始化自编码器;
步骤(8)、采用反向传播算法调整自编码器的参数;
步骤(8.1)、对于输入向量x,根据以下公式,计算自编码器各层神经元的激活:
其中,σ(·)为sigmoid函数,σ(x)=1/1+e-x, 表示第k个隐含层第i个节点的偏置,且k=1,2,3,4,5,6,7;
步骤(8.2)、目标函数为实际输出向量o与目标输出向量y的交叉熵,用f表示:
步骤(8.3)、令 1≤k≤7,1≤t≤400,计算代价函数f对 的偏
导数;
计算代价函数f对输出层 的偏导数,用 表示:
对于hk,k=7,…,1隐含层,计算代价函数f对各层 的偏导:
步骤(8.4)、计算代价函数关于权值和偏置的偏导:
步骤(8.5)、利用共轭梯度下降法对权值和偏置进行迭代更新,得到最终的权值和偏置;
步骤(9)、读取测试人脸图像库D2,对训练好的自编码器进行检测,将测试人脸图像库D2中的侧面图像重建成正面人脸图像。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种心理学的催眠教具及其操作方法 | 2020-05-15 | 856 |
一种心理学职业能力测评系统 | 2020-05-16 | 803 |
一种心理学咨询用催眠装置 | 2020-05-16 | 295 |
一种心理学实验用眼罩 | 2020-05-12 | 93 |
心理学测试装置 | 2020-05-11 | 822 |
一种心理学专用讲台 | 2020-05-14 | 879 |
一种心理学方法 | 2020-05-11 | 86 |
心理学实验用调节式眼罩 | 2020-05-16 | 395 |
一种心理学职业能力测评系统 | 2020-05-15 | 776 |
一种心理学实验头眼距离固定装置 | 2020-05-14 | 406 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。