专利汇可以提供一种摄像头自动跟随人脸转动的控制方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种摄像头自动跟随人脸转动的控制方法,包括以下步骤:S1,摄像头实时获取人脸图像 帧 ,对人脸图像帧进行预处理;S2,基于多任务 卷积神经网络 模型对人脸图像帧进行实时运算,检测出图像中的所有人脸;S3,根据检测出人脸的 位置 坐标和得分信息,计算获取最佳人脸;S4,根据最佳人脸的位置信息计算人脸框与视频框中间的位置差值;S5,控制步进 电机 转动,使最佳人脸始终保持在视频框的中间位置。本发明通过上述方法使人脸始终保持在 视频帧 的中间位置,很好的克服了由于摄像头安装 角 度固定、用户姿势、光照或遮挡等原因造成的 人脸检测 精度 低的问题,为 人脸识别 和身份认证提供高 质量 的人脸图片信息。,下面是一种摄像头自动跟随人脸转动的控制方法专利的具体信息内容。
1.一种摄像头自动跟随人脸转动的控制方法,其特征在于:包括以下步骤:
S1,摄像头实时获取人脸图像帧,对人脸图像帧进行预处理;
S2,基于多任务卷积神经网络模型对人脸图像帧进行实时运算,检测出图像中的所有人脸;
S3,根据检测出人脸的位置坐标和得分信息,计算获取最佳人脸;
S4,根据最佳人脸的位置信息计算人脸框与视频框中间的位置差值;
S5,控制步进电机转动,使最佳人脸始终保持在视频框的中间位置。
2.根据权利要求1所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述步骤二中的多任务卷积神经网络模型包括三个级联的网络,分别为生成候选人脸框的P-Net网络、对候选框优选过滤的R-Net网络和生成最终边界框与人脸关键点的O-Net网络。
3.根据权利要求2所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述步骤二中对人脸图像帧进行实时运算包括以下步骤:
S2.1:首先将图像进行不同尺度的变换,构建图像金字塔;
S2.2:将图像输入P-Net网络,P-Net网络输出人脸的ROI区域候选框和候选框边界回归向量;
S2.3:将P-Net网络的候选边框输入R-Net网络,得到人脸与非人脸的判定分类得分和候选框边界回归向量,如果分类得分超过阈值,则为人脸,继续保留该候选框,否则舍弃该候选框;然后通过回归向量对候选框边界进行回归,对保留下来的候选框边界进行校准;最后通过非极大值抑制算法去掉高度重叠的的候选框;
S2.4:O-Net网络给出人脸判定分类得分、候选框边界回归向量以及五个面部特征点的位置。
4.根据权利要求3所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述步骤S2.1具体为:将图像缩小到上一次操作图像面积的一半,直到达到预先设置的最小人脸尺寸为止。
5.根据权利要求3所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述步骤S2.2具体为:
对于输入大小为:W*H的图像,产生N*M个候选框和N*M*4个回归向量,其中W为图像的宽,H为图像的高,
保留得分超过阈值的候选框,通过回归向量对候选框边界进行回归,对保留的候选框边界进行校准,最终通过非极大值抑制算法去除高度重叠的候选边框。
6.根据权利要求2所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述多任务卷积神经网络对人脸/非人脸的分类、边界框的回归和特征点的定位进行训练。
7.根据权利要求6所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述人脸/非人脸的分类的训练函数为:
其中,pi为候选框样本被网络预测为人脸的分类概率, 表示该候选框样本为真的标记;
边界框的回归的训练函数为:
其中, 为人脸区域框, 为真实人脸区域框;
特征点的定位的训练函数为:
yi∈R10
其中, 为网络预测的特征点位置, 为真实人脸区域特征点的位置坐
标。
8.根据权利要求2所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述多任务卷积神经网络使用wider_face数据集对人脸分类任务和候选框边界回归任务进行训练。
9.根据权利要求1所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述步骤4中人脸框的中间位置的计算公式为:
hbox-middle=ymin+(ymax-ymin)/2;
人脸框与当前视频框中间位置的差值的计算公式为:
hcurrent=hbox-middle-hframe/2;
其中,(xmin,ymin)为最佳人脸框左上角坐标,(xmax,ymax)为最佳人脸框右下角坐标,hframe为人脸图像帧的高度,单位为像素(px)。
10.根据权利要求9所述的一种摄像头自动跟随人脸转动的控制方法,其特征在于:所述步骤5中具体为:
首先计算人脸框面积S,公式为:
S=(xmax-xmin)*(ymax-ymin);
当人脸框面积S大于所设阈值时,若:0≤abs(hcurrent)≤25,说明人脸框处于视频帧的中间位置摄像头不需要转动,控制串口发送控制步进电机的PWM占空比为0%的命令;
若:±26≤hcurrent≤±100,则发送PWM占空比为25%的命令控制步进电机缓慢转动;
若:±101≤hcurrent≤±240,则发送PWM占空比为50%的命令控制步进电机快速转动;
使人脸框中间位置和视频框中间位置的差值小于阈值,从而保证人脸处于视频框的中间位置。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
声音产生设备 | 2020-05-08 | 953 |
一种支持创客与小微企业孵化的4M1T创新系统 | 2020-05-08 | 217 |
一种便于定位与导航的列车广播系统 | 2020-05-08 | 741 |
一种红外探测器的驱动电路及红外探测器系统 | 2020-05-08 | 302 |
基于巡检机器人和Cascade RCNN算法的变压器外观缺陷识别方法 | 2020-05-08 | 37 |
声音产生设备 | 2020-05-08 | 724 |
一种FHSS-GMSK系统多重同步方法 | 2020-05-08 | 884 |
车联网环境下基于IGA-BP神经网络的车辆碰撞预警系统及方法 | 2020-05-08 | 99 |
一种摄像头自动跟随人脸转动的控制方法 | 2020-05-08 | 20 |
基于自适应分类策略和混合优化SVR的光功率预测方法 | 2020-05-08 | 837 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。