首页 / 专利库 / 人工智能 / 人脸姿态估计 / 基于深度学习的大角度人脸姿态估计方法

基于深度学习的大度人脸姿态估计方法

阅读:618发布:2020-05-13

专利汇可以提供基于深度学习的大度人脸姿态估计方法专利检索,专利查询,专利分析的服务。并且本 发明 公开的属于人脸 姿态 估计技术领域,具体为该基于 深度学习 的大 角 度 人脸姿态估计 方法的具体步骤如下:S1:输入检测人脸图像:将人脸图像输入网络;S2:简化shuffleNet V2大角度人脸姿态估计:将步骤S1中 人脸检测 后的人脸图像输入 卷积神经网络 支持大角度人脸姿态估计,根据现有数据集数据增强生成姿态大角度数据使得网络支持大角度人脸姿态精准估计;S3:人脸姿态角度,针对人脸姿态角度回归人脸姿态欧拉角,通过数据增强使得网络支持大角度人脸姿态估计;不依赖关键点的精准 定位 ,误差小,更快速,轻量模型耗时短;卷积神经网络支持大角度人脸姿态估计,减少其他环节判断,应用场景丰富。,下面是基于深度学习的大度人脸姿态估计方法专利的具体信息内容。

1.基于深度学习的大度人脸姿态估计方法,其特征在于:该基于深度学习的大角度人脸姿态估计方法的具体步骤如下:
S1:输入检测人脸图像:将人脸图像输入网络;
S2:简化shuffleNet V2大角度人脸姿态估计:将步骤S1中人脸检测后的人脸图像输入卷积神经网络支持大角度人脸姿态估计,根据现有数据集数据增强生成姿态大角度数据使得网络支持大角度人脸姿态精准估计,卷积神经网络直接回归人脸姿态欧拉角俯仰角(Pitch)、偏航角(Yaw)、翻滚角(Roll);
S3:人脸姿态角度:针对人脸姿态角度回归人脸姿态欧拉角,通过数据增强使得网络支持大角度人脸姿态估计。
2.根据权利要求1所述的基于深度学习的大角度人脸姿态估计方法,其特征在于:所述步骤S2中人脸检测后的人脸图像输入卷积神经网络前对其调整到112×112尺寸。

说明书全文

基于深度学习的大度人脸姿态估计方法

技术领域

[0001] 本发明涉及人脸姿态估计技术领域,具体为基于深度学习的大角度人脸姿态估计方法。

背景技术

[0002] 人脸识别的英文名称是HumanFaceRecognition.人脸识别产品利用AVS03A图像处理器;可以对人脸明暗侦测,自动调整动态曝光补偿,人脸追踪侦测,自动调整影像放大。
[0003] 人机交互技术是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。人机交互技术包括机器通过输出或显示设备给人提供大量有关信息及提示请示
等,人通过输入设备给机器输入有关信息,回答问题及提示请示等。人机交互技术是计算机用户界面设计中的重要内容之一。
[0004] 人脸姿态估计在人脸识别和人机交互等领域中有着重要的作用。人脸姿态估计是对二维图像中的人脸在三维空间中所处的姿态进行估计。人脸姿态变化较大时,导致类内
间距增加,严重影响人脸识别率。
[0005] 现有基于几何方法的人脸姿态估计,严重依赖关键点的精准定位,关键点出现误差时,造成人脸姿态估计较大误差;
[0006] 现有基于分类的人脸姿态估计,按照一定角度间距分类,姿态空间不连续,误差较大;
[0007] 现有基于回归方法的人脸姿态估计,精度高但网络结构复杂,模型较大不适合实时估计;
[0008] 现有的人脸姿态估计不支持直接大角度人脸姿态估计,多是通过分类过滤大角度姿态后再估计人脸姿态。

发明内容

[0009] 本发明的目的在于提供基于深度学习的大角度人脸姿态估计方法,以解决上述背景技术中提出的现有基于几何方法的人脸姿态估计,严重依赖关键点的精准定位,关键点
出现误差时,造成人脸姿态估计较大误差,按照一定角度间距分类,姿态空间不连续,误差较大,精度高但网络结构复杂,模型较大不适合实时估计,不支持直接大角度人脸姿态估
计,多是通过分类过滤大角度姿态后再估计人脸姿态的问题。
[0010] 为实现上述目的,本发明提供如下技术方案:基于深度学习的大角度人脸姿态估计方法,该基于深度学习的大角度人脸姿态估计方法的具体步骤如下:
[0011] S1:输入检测人脸图像:将人脸图像输入网络;
[0012] S2:简化shuffleNet V2大角度人脸姿态估计:将步骤S1中人脸检测后的人脸图像输入卷积神经网络支持大角度人脸姿态估计,根据现有数据集数据增强生成姿态大角度数
据使得网络支持大角度人脸姿态精准估计,卷积神经网络直接回归人脸姿态欧拉角俯仰
(Pitch)、偏航角(Yaw)、翻滚角(Roll);
[0013] S3:人脸姿态角度:针对人脸姿态角度回归人脸姿态欧拉角,通过数据增强使得网络支持大角度人脸姿态估计。
[0014] 优选的,所述步骤S2中人脸检测后的人脸图像输入卷积神经网络前对其调整到112×112尺寸。
[0015] 与现有技术相比,本发明的有益效果是:
[0016] 1)针对人脸姿态角度回归人脸姿态欧拉角,通过数据增强使得网络支持大角度人脸姿态估计;
[0017] 2)不依赖关键点的精准定位,误差小,更快速,轻量模型耗时短,可实现实时估计;
[0018] 3)卷积神经网络支持大角度人脸姿态估计,减少其他环节判断,应用场景丰富。附图说明
[0019] 图1为本发明方法的流程图
[0020] 图2为本发明人脸图像姿态估计的操作图。

具体实施方式

[0021] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
[0022] 在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0023] 实施例:
[0024] 请参阅图1-2,本发明提供技术方案:基于深度学习的大角度人脸姿态估计方法,该基于深度学习的大角度人脸姿态估计方法的具体步骤如下:
[0025] S1:输入检测人脸图像:将人脸图像输入网络;
[0026] S2:简化shuffleNet V2大角度人脸姿态估计:将步骤S1中人脸检测后的人脸图像输入卷积神经网络支持大角度人脸姿态估计,人脸检测后的人脸图像输入卷积神经网络前
对其调整到112×112尺寸,根据现有数据集数据增强生成姿态大角度数据使得网络支持大
角度人脸姿态精准估计,卷积神经网络直接回归人脸姿态欧拉角俯仰角(Pitch)、偏航角
(Yaw)、翻滚角(Roll);
[0027] 该卷积神经网络为修改ShuffleNet V2轻量型网络结构,使得卷积神经网络拥有ShuffleNet V2优点的同时,进一步简化,得到模型更小,速度更快的网络结构;
[0028] 修改后卷积神经网络结构如表1所示:
[0029] 表1修改后ShuffleNet V2人脸姿态网络结构
[0030]
[0031] 相比ShuffleNet V2 0.5,Conv1层Stride改为1,输入改为112×112,Stage3网络单元由7个改为3个,Stage4网络单元由3个改为1个,最后连接FC层直接回归三个角度,简化后大大减少网络训练参数,最终模型0.5M,相比ShuffleNet V2 0.5模型1.4M降低了
64.29%。
[0032] S3:人脸姿态角度:针对人脸姿态角度回归人脸姿态欧拉角,通过数据增强使得网络支持大角度人脸姿态估计;
[0033] 构造Roll大角度数据集:随机筛选部分数据,针对Roll角左右分别旋转90度,左右旋转90度,Roll=Roll±90,左旋转180度,Yaw=-Yaw,Roll=Roll-180;
[0034] 损失函数采用L2损失函数,得到人脸姿态估计值。
[0035] 以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或
基本特征的情况下,能够以其他的具体形式实现本发明;因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说
明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明
内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0036] 尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换
和变型,本发明的范围由所附权利要求及其等同物限定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈