专利汇可以提供基于轻量级多分支网络的二维人体姿态估计方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及 姿态 估计领域,具体涉及一种基于轻量级多分支网络的二维人体姿态估计方法及系统,包括:输入图像,对其进行预处理;将图像传入主干网络进行特征提取和信息编码;使用轻量级上 采样 单元对主干网络的不同编码阶段进行解码,形成多个解码分支的网络结构;将各解码分支生成的特征图与真实标记热 力 图进行均方损失的求解,并将损失之和回传给神经网络进行 迭代 训练;训练完成后,将包含行人的图像输入到训练好的神经网络模型中,得到各关 节点 在图像中的坐标 位置 ,对人体姿态进行 可视化 。本发明能够对任意输入的行人图片输出其各关节点坐标并进行姿态的可视化,同时,由于本发明的计算成本较低,便于移动端部署,增加了相关产品的适用性。,下面是基于轻量级多分支网络的二维人体姿态估计方法及系统专利的具体信息内容。
1.一种基于轻量级多分支网络的二维人体姿态估计方法,其特征在于,包括以下步骤:
S1、输入带有关节点注释的行人姿态的图片集合作为数据集,对数据集进行预处理,并根据关节点注释生成以关节点为中心的真实标记热力图;
S2、基于预处理后的数据集,通过行人检测器用矩形框框选出图片中的行人,将矩形框区域内的图像记为图像M;
S3、将图像M输入到主干网络中,进行特征提取和信息编码;
S4、通过解码器对主干网络的不同编码阶段进行解码,形成具有多个解码分支的网络结构,即神经网络的后端网络,同时,在各解码分支的末端生成特征图;
S5、将各解码分支生成的特征图与真实标记热力图进行均方损失的求解,并将各解码分支的均方损失之和回传给主干网络重复编码解码过程,对神经网络进行迭代训练;
S6、经过多轮训练后,神经网络损失趋于稳定,迭代训练过程结束,得到训练好的神经网络模型;
S7、将包含行人的图像输入到训练好的神经网络模型中,训练好的神经网络模型输出该图像对应的关节点预测热力图,选取该热力图的最高概率值,将最高概率值对应的坐标作为关节点在图像中的坐标位置输出,并对人体姿态进行可视化处理。
2.根据权利要求1所述的一种基于轻量级多分支网络的二维人体姿态估计方法,其特征在于,所述预处理包括:对数据集中的原始图像进行随机翻转、随机旋转、随机缩放。
3.根据权利要求1所述的一种基于轻量级多分支网络的二维人体姿态估计方法,其特征在于,真实标记热力图的生成过程包括:以图像M的关节标记点为中心生成一个高斯分布的概率区域,该区域的中心概率值最大,最接近1,越远离区域中心,概率值越小,此二维高斯概率图即为真实标记热力图,关节标记点zk=(xk,yk)的真实标记热力图生成公式包括:
其中mk(x,y)为标记点k在图像上一点产生的高斯置信值,代表该点为标记点的可能性,σ2表示高斯函数的空间方差值,x,y表示图像上任意一点的横纵坐标,xk,yk表示标记点k的横纵坐标。
4.根据权利要求1所述的一种基于轻量级多分支网络的二维人体姿态估计方法,其特征在于,所述主干网络上存在多个解码分支结构,解码分支结构分布在不同编码阶段。
5.根据权利要求1所述的一种基于轻量级多分支网络的二维人体姿态估计方法,其特征在于,迭代训练中的解码过程包括:
S51、调节所要解码特征图的空间信息,采用空间注意力通道调节特征图各像素的权重,通过1×1卷积和Sigmoid进行归一化处理,过滤空间层面的噪声信息干扰;
S52、对特征图进行上采样解码,使用深度转置卷积将特征图放大2倍,将深度转置卷积的每个通道与对应通道的输入特征图分别进行运算,提取特征图各个通道的解码特征信息;
S53、通过1×1逐点卷积整合各个通道提取到的解码特征信息,并缩减输出通道数,进一步压缩参数量;
S54、利用通道注意力对解码后输出的各通道的权重进行调整,从而完成整个解码过程。
6.根据权利要求1所述的一种基于轻量级多分支网络的二维人体姿态估计方法,其特征在于,对人体姿态进行可视化处理包括:以各关节预测坐标点为圆心,以2~5像素为半径在原图副本上画一个实心圆,作为关节点的标记;并按照从头至脚的顺序依次将预测点连接起来,形成肢体连线,得到具有关节点连线的人体姿态图片和关节点具体坐标。
7.一种基于轻量级多分支网络的二维人体姿态估计系统,其特征在于,包括:图像获取模块,数据预处理模块,行人检测模块,可视化模块,神经网络模块,输出模块;
图像获取模块用于输入数据集,获取原始图像信息;
数据预处理模块用于对输入的数据集中的原始图像进行翻转、旋转、缩放处理,对有限的训练数据进行扩增;
行人检测模块用于识别并框选出图像中的行人;
神经网络模块用于网络的训练和预测热力图的生成;
可视化模块用于对神经网络模块输出的预测热力图进行可视化处理,将预测热力图中的最大置信点作为各个关节点的位置,在原图副本中画出关节点,连接原图副本中的各关节点,得到人体姿态估计图;
输出模块用于输出人体姿态估计图。
8.根据权利要求7所述的一种基于轻量级多分支网络的二维人体姿态估计系统,其特征在于,所述神经网络模块包括主干网络模块和后端网络模块,主干网络模块由轻量级的高效网络Efficient-net组成,该主干网络模块用于信息的编码,平衡网络的深度、宽度和分辨率;后端网络模块由多个解码分支构成,用于信息的解码。
9.根据权利要求8所述的一种基于轻量级多分支网络的二维人体姿态估计系统,其特征在于,一个解码分支由多个轻量级上采样单元串联而成。
10.根据权利要求9所述的一种基于轻量级多分支网络的二维人体姿态估计系统,其特征在于,所述轻量级上采样单元包括:空间注意力模块、深度转置卷积模块、逐点卷积模块和通道注意力模块,空间注意力模块用于自适应地突出特征图中的关节点相关区域;深度转置卷积模块用于对特征图进行运算;逐点卷积模块用于将各个通道的信息进行整合;通道注意力模块用于自适应的调整各卷积滤波器的权重,使对任务更有效的特征的通道权重更大,效果小的或无效的特征的通道权重更小。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于候选框选择的深度学习遥感影像目标检测方法及装置 | 2020-05-12 | 117 |
图像精细化阴影区域分割系统、方法、装置 | 2020-05-08 | 213 |
一种电力安防智能物联网系统 | 2020-05-11 | 365 |
双阶段语义词向量生成方法 | 2020-05-11 | 232 |
针对弥漫性和串联性病变中冠状动脉疾病的非侵入性评估和治疗指导 | 2020-05-11 | 578 |
一种联合超分辨率重建的小目标检测方法 | 2020-05-12 | 762 |
用于存储器安全的计数器完整性树 | 2020-05-12 | 27 |
一种基于深度神经网络的卫星影像特征提取方法及系统 | 2020-05-12 | 553 |
基于轻量化语义分割网络的遥感图像地物分类方法 | 2020-05-08 | 276 |
用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 | 2020-05-11 | 469 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。