专利汇可以提供一种基于深度学习的人体动作捕捉与虚拟动画生成方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 深度学习 的人体 动作捕捉 与虚拟动画生成方法,包含以下步骤:A、采集演员动作并转换成 视频流 信号 输入;B、 姿态 检测网络预训练;C、提取人体姿态序列;D、姿态条件生成对抗网络预训练;E、将姿态序列输入姿态条件生成对抗网络,输出与人体动作同步的动画视频。本发明有效的减少了动画制作的成本,提升了普通用户的可操作性,也提高了动画的产出效率,可作为一种媒体创建工具来进行特效演示、Demo的实时生成以及动画和电影的快速制作,也可作为短视频应用中的交互式滤镜, 虚拟现实 体感游戏的辅助等,从而有利于动作捕捉技术大范围落地商用与推广。,下面是一种基于深度学习的人体动作捕捉与虚拟动画生成方法专利的具体信息内容。
1.一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,包含以下步骤:
A、采集演员动作并转换成视频流信号输入;
B、姿态检测网络预训练;
C、提取人体姿态序列;
D、姿态条件生成对抗网络预训练;
E、将姿态序列输入姿态条件生成对抗网络,输出与人体动作同步的动画视频;将姿态检测网络P得到的人体姿态序列输入训练好的生成网络G输出自动生成的虚拟形象图片,按照一定帧率连接即可得到与人体动作同步的动画视频。
2.根据权利要求1所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,步骤A具体是:采用光学传感设备采集得到的演员运动视频数据。
3.根据权利要求2所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,光学传感设备包括相机和手机等。
4.根据权利要求1所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,步骤B具体是:采用深度卷积神经网络作为姿态检测网络,将人体动作捕捉过程拆解为单张图像的姿态估计问题,定位人体骨骼关键点位置,并在图像中连结各关键点描绘出人体的形状,用于姿态检测的深度卷积神经网络分为多个阶段进行:其中第一个阶段利用VGG-19网络对输入图片进行处理,得到初步的关键点响应图,然后将它与另一路网络提取的特征融合作为下一阶段的输入,后续阶段与第一阶段步骤一致,通过多重阶段不断扩大卷积网络感受野,得到关键点在各个尺度下的响应图,历经六个阶段后最后网络会输出关键点总体响应图,并找到预测的关键点位置,连接各关键点位置即得到人体姿态信息,搭建好姿态检测网络后,首先需要利用大量标记好的人体图像数据进行预先的训练,利用MSCOCO数 据集进行姿态检测模型的预训练 ,整个网络的 损失函数为
其中T代表不同的阶段,N代表图中的人,J代表关键点,P
代表热力图,通过反向传播过程不断迭代优化网络权重参数降低损失函数,最终得到训练好的网络。
5.根据权利要求4所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,姿态检测算法的步骤如下:一、在不同的尺度下,将待检测图像输入深度卷积神经网络,计算各个关键点的响应图;二、将每个关键点在各个尺度下的响应图累加起来,得到关键点总体响应图;三、在各关键点的总体响应图上,找出相应最大的点,确定关键点位置;四、连结各关键点,得到人体姿态信息。
6.根据权利要求1所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,步骤C具体是:首先将输入视频逐帧处理为图片,对每一张图像都输入训练好的姿态检测网络进行姿态提取,得到一组连续的人体动作姿态序列。
7.根据权利要求1所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,步骤D具体是:首先制作虚拟形象标准全姿态数据库,然后设计姿态条件生成对抗网络,并利用虚拟形象标准全姿态数据库对网络进行对抗性预训练。
8.根据权利要求7所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,虚拟形象标准全姿态数据库是包含各种姿态的虚拟形象全身图片集,可根据用户的喜好个性化定制虚拟形象。
9.根据权利要求7所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,姿态条件生成对抗网络由三大模块构成:分别是步骤B中的姿态检测网络P,生成网络G,以及判别网络D,其中,姿态检测网络P与步骤B中结构功能相同,主要完成对多种动作姿态的虚拟形象进行姿态提取,获得姿态图形,生成网络G由深度卷积网络构成,主要功能是完成给定姿态下虚拟形象的自动创建与渲染;我们采用了跳跃连接的编解码架构,即每一层反卷积层的输入都是前一层的输出加上该层镜像卷积层的输出,从而保证编码网络的信息在解码时可以被重新记忆,使得生成的图像尽可能保留原图像的细节信息,网络总共包含9层,采用了5层卷积层作为编码器,4层反卷积层作为解码器,判别网络D由6层卷积神经网络构成,目的是为了进行生成模型的对抗性训练。
10.根据权利要求9所述的一种基于深度学习的人体动作捕捉与虚拟动画生成方法,其特征在于,对抗性预训练的具体过程是:1.从个性化定制的虚拟形象标准全姿态数据库中使用预训练的姿态检测网络P获得对应的姿态图形,2.使用生成网络G对获得的姿态图形进行自动渲染,将自动渲染的图像称为“虚假图像”,3.分别将原虚拟形象数据集中的真实图像、自动渲染的虚假图像与姿态图形组成两组图像数据对,分别记为真实图像姿态图形、虚假图像姿态图形,采用数据对的形式进行网络训练是要建立姿态图形与自动渲染的虚拟形象之间一一对应的映射关系,4.将两组图像数据对传入判别网络,判别网络在训练过程中要优化的目标是使得自身能够准确地鉴别数据对的真伪,即对真实图像姿态图形数据对的结果判定为真,而对虚假图像姿态图形数据对的结果判定为假,5.在整个训练过程中,生成网络将不断优化调整自身网络权重参数,使得自动渲染生成的“虚假图像”越来越逼近真实图像,它的优化目标是使得判别网络对虚假图像姿态图形数据对的判定结果为真,此时可理解为判别网络已经无法正确区分真实图像与虚假图像,也就是由生成网络渲染的“虚假图像”已经与真实图像接近,达到了以假乱真的地步,由于生成网络与判别网络两者的优化目标是相互矛盾的,这两个网络始终处于一种博弈对抗的状态,这种训练过程称为对抗性训练,两个网络在相互斗争中自身的性能都得到了提高,当判别网络对“真实图像对”与“虚假图像对”判别正确的概率都为50%时,渲染生成的图像与真实图像达到了难以区分的地步,模型训练过程结束,此时称网络达到了纳什均衡状态,姿态条件生成对抗网络的整体损失函数为: 其中第一部分是条件GAN的损失函
数,第二部分是模型的渲染损失函数,λ为超参数,用来平衡两种损失的相对大小,采用Adam优化算法,生成网络G与判别网络D交替训练的方式进行对抗式训练,得到训练好的生成网络G。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于上下文的通信会话桥接 | 2020-05-08 | 243 |
虚拟内容的交互方法、系统及其交互装置 | 2020-05-08 | 115 |
一种虚拟现实系统中三维环境地图的可视化方法 | 2020-05-11 | 462 |
设备控制方法、装置、车载平视显示设备及存储介质 | 2020-05-08 | 944 |
一种基于虚拟现实的机器人行为控制方法 | 2020-05-11 | 921 |
虚拟现实头戴设备支架 | 2020-05-08 | 253 |
信息识别方法、装置、电子设备及计算机可读存储介质 | 2020-05-08 | 460 |
一种虚拟现实映像装置 | 2020-05-08 | 99 |
用于控制虚拟对象的系统和方法 | 2020-05-08 | 617 |
一种游戏场景中的物品采集方法、装置、设备和存储介质 | 2020-05-08 | 552 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。