首页 / 专利库 / 人工智能 / 特征向量 / 基于深度学习的车载人脸识别方法

基于深度学习的车载人脸识别方法

阅读:1发布:2024-01-22

专利汇可以提供基于深度学习的车载人脸识别方法专利检索,专利查询,专利分析的服务。并且一种基于 深度学习 的车载 人脸识别 方法:获取图像,构建驾驶员数据集;构建模型,包括提取视觉特征和语义特征以及构成特征处理模型;训练特征处理模型;根据测试结果优化实验结果,将优化后的特征处理模型传送到总控制端;在车上安装警示灯和摄像头,实时将驾驶员的操作情况上传到总控制端,总控制端根据优化后的特征处理模型判断驾驶员是否有违规驾驶,当有违规驾驶,总控制端发出 信号 ,激发警示灯,提醒驾驶员文明行驶。本 发明 通过实时分析人脸变化,提取人脸特征,检测其是否有违规操作,与数据集进行分析对比,一旦发现有违法违规行为,如发现疲劳驾驶和接听电话,看手机等现象,会自动发出警报,及时制止驾驶员的不良行为。减少交通事故发生的可能性。,下面是基于深度学习的车载人脸识别方法专利的具体信息内容。

1.一种基于深度学习的车载人脸识别方法,其特征在于,包括如下步骤:
1)获取图像,构建驾驶员数据集;
2)构建模型,包括:
(1)通过卷积神经网络和LSTM网络,分别从驾驶员数据集中提取视觉特征和语义特征;
(2)将提取的视觉特征和语义特征输入到带有attention机制的LSTM网络中构成特征处理模型;
3)训练特征处理模型,将驾驶员数据集中的60%的图像用于训练,20%的图像用于验证,20%的图像用于测试;
4)根据测试结果分别对参数Wz、Wr、W进行微调,优化实验结果,将优化后的特征处理模型传送到总控制端;
5)在车上安装警示灯和摄像头,实时将驾驶员的操作情况上传到总控制端,总控制端根据优化后的特征处理模型判断驾驶员是否有违规驾驶,当有违规驾驶,总控制端发出信号,激发警示灯,提醒驾驶员文明行驶。
2.根据权利要求1所述的基于深度学习的车载人脸识别方法,其特征在于,步骤1)包括利用基于python的网络图片获取脚本,通过互联网获取不同驾驶员图像,对图像制作标签,标签详细注明图像内容,然后汇总,作为驾驶员数据集,所述的图像内容包括:驾驶员正常驾驶、低头看手机、四处观看、闲聊及疲劳驾驶。
3.根据权利要求1所述的基于深度学习的车载人脸识别方法,其特征在于,步骤2)中的第(1)包括:利用卷积神经网络中的VGG-19网络的conv5_3层提取驾驶员数据集的14×14×
512维视觉特征,得到特征向量ai,通过attention机制产生视觉信息上下文向量zvt;通过LSTM网络提取驾驶员数据集的语义特征,并获得语义上下文向量zst。
4.根据权利要求1所述的基于深度学习的车载人脸识别方法,其特征在于,步骤2)中的第(2)步包括:
(1)将视觉信息上下文向量zvt和语义上下文向量zst通过仿射变换形成能够更加充分的表达图像信息的上下文向量zt;
(2)将得到的上下文向量zt输入到带有attention机制的LSTM网络,分析驾驶员的行为。
5.根据权利要求4所述的基于深度学习的车载人脸识别方法,其特征在于,所述的特征处理模型,如下:
et=fatt(ai,ht-1)
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
其中,zvt表示视觉信息上下文向量,ai表示视觉特征向量,αt表示权重,zt表示上下文向量,xt表示当前时刻的输入,ht和ht-1分别表示当前时刻和上一时刻的隐藏层状态,为当前时刻隐藏层的候选状态,Wz、Wr、W为参数。

说明书全文

基于深度学习的车载人脸识别方法

技术领域

[0001] 本发明涉及一种人脸识别方法。特别是涉及一种基于深度学习的车载人脸识别方法。

背景技术

[0002] 随着信息获取和信息处理技术的快速发展,计算机视觉,即如何利用计算机技术高效准确地从环境图像或者视频中获取相关信息,进而对客观世界中的事物及发生的现象进行分析、判断和决策,已经成为一个非常重要的研究课题。随着深度学习的快速发展,计算机视觉在近几年发展迅速,深层卷积神经网络对进行计算机视觉方面的研究发展起到了非常重要的作用。
[0003] 随着计算机视觉的快速发展,人脸识别技术发展势头良好,人脸识别的应用也越来越广泛,人脸识别是基于人脸的面部特征进行识别的一种生物识别技术,通过摄像机等图像采集设备采集含有人脸的图像或者视频流,然后在图像中进行人脸检测和人脸跟踪,进而对检测到的人脸进行脸部相关的一系列相关技术。目前人脸识别技术主要包括(1)几何特征的人脸识别方法;(2)基于特征脸(PCA)的人脸识别方法(3)神经网络的人脸识别方法(4)弹性图匹配的人脸识别方法(5)线段Hausdorff距离(LHD)的人脸识别方法(6)支持向量机(SVM)的人脸识别方法。
[0004] 目前交通事故频发,除了自然原因外,有很大一部分是驾驶员自身的问题,主要包括疲劳驾驶、接听电话、开车时看手机分心等,以上原因造成的意外不计其数。
[0005] 目前我国的车载摄像头虽然有一定的发展,但是主要集中于车速测试、目标跟踪、行人检测、障碍物检测等领域,针对驾驶员的安全文明驾驶没有过多的研究,以前由于技术的限制,如何判断驾驶员是否违规行驶缺乏实时高效的判断方法。基于深度学习的人脸识别技术,能够对驾驶员的实时操作进行监督和判断,能够有效减少驾驶员违规操作而造成交通事故。

发明内容

[0006] 本发明所要解决的技术问题是,提供一种能够通过实时分析人脸变化,判断司机是否有疲劳驾驶等现象,并给出及时提醒的基于深度学习的车载人脸识别方法。
[0007] 本发明所采用的技术方案是:一种基于深度学习的车载人脸识别方法,包括如下步骤:
[0008] 1)获取图像,构建驾驶员数据集;
[0009] 2)构建模型,包括:
[0010] (1)通过卷积神经网络和LSTM网络,分别从驾驶员数据集中提取视觉特征和语义特征;
[0011] (2)将提取的视觉特征和语义特征输入到带有attention机制的LSTM网络中构成特征处理模型;
[0012] 3)训练特征处理模型,将驾驶员数据集中的60%的图像用于训练,20%的图像用于验证,20%的图像用于测试;
[0013] 4)根据测试结果分别对参数Wz、Wr、W进行微调,优化实验结果,将优化后的特征处理模型传送到总控制端;
[0014] 5)在车上安装警示灯和摄像头,实时将驾驶员的操作情况上传到总控制端,总控制端根据优化后的特征处理模型判断驾驶员是否有违规驾驶,当有违规驾驶,总控制端发出信号,激发警示灯,提醒驾驶员文明行驶。
[0015] 步骤1)包括利用基于python的网络图片获取脚本,通过互联网获取不同驾驶员图像,对图像制作标签,标签详细注明图像内容,然后汇总,作为驾驶员数据集,所述的图像内容包括:驾驶员正常驾驶、低头看手机、四处观看、闲聊及疲劳驾驶。
[0016] 步骤2)中的第(1)包括:利用卷积神经网络中的VGG-19网络的conv5_3层提取驾驶员数据集的14×14×512维视觉特征,得到特征向量ai,通过attention机制产生视觉信息上下文向量zvt;通过LSTM网络提取驾驶员数据集的语义特征,并获得语义上下文向量zst。
[0017] 步骤2)中的第(2)步包括:
[0018] (1)将视觉信息上下文向量zvt和语义上下文向量zst通过仿射变换形成能够更加充分的表达图像信息的上下文向量zt;
[0019] (2)将得到的上下文向量zt输入到带有attention机制的LSTM网络,分析驾驶员的行为。
[0020] 所述的特征处理模型,如下:
[0021] et=fatt(ai,ht-1)
[0022]
[0023]
[0024] zt=σ(Wz·[ht-1,xt])
[0025] rt=σ(Wr·[ht-1,xt])
[0026]
[0027]
[0028] 其中,zvt表示视觉信息上下文向量,ai表示视觉特征向量,αt表示权重,zt表示上下文向量,xt表示当前时刻的输入,ht和ht-1分别表示当前时刻和上一时刻的隐藏层状态,为当前时刻隐藏层的候选状态,Wz、Wr、W为参数。
[0029] 本发明的基于深度学习的车载人脸识别方法,在驾车过程中通过车载摄像头获取驾驶员实时信息,通过实时分析人脸变化,提取人脸特征,通过卷积神经网络检测其是否有违规操作,与数据集进行分析对比,一旦发现有违法违规行为,如发现疲劳驾驶和接听电话,看手机等现象,会自动发出警报,及时制止驾驶员的不良行为。减少交通事故发生的可能性。附图说明
[0030] 图1是本发明基于深度学习的车载人脸识别方法的流程图

具体实施方式

[0031] 下面结合实施例和附图对本发明的基于深度学习的车载人脸识别方法做出详细说明。
[0032] 如图1所示,本发明的基于深度学习的车载人脸识别方法,包括如下步骤:
[0033] 1)获取图像,构建驾驶员数据集,包括:
[0034] 利用基于python的网络图片获取脚本,通过互联网获取不同驾驶员图像,对图像制作标签,标签详细注明图像内容,然后汇总,作为驾驶员数据集,所述的图像内容包括:驾驶员正常驾驶、低头看手机、四处观看、闲聊及疲劳驾驶。
[0035] 2)构建模型,包括:
[0036] (1)为了能够更好的分辨驾驶员的行为,本发明提取视觉特征和语义特征。通过卷积神经网络和LSTM网络,分别从驾驶员数据集中提取视觉特征和语义特征;包括:利用卷积神经网络中的VGG-19网络的conv5_3层提取驾驶员数据集的14×14×512维视觉特征,得到特征向量ai,通过attention机制产生视觉信息上下文向量zvt;通过LSTM网络提取驾驶员数据集的语义特征,并获得语义上下文向量zst。
[0037] (2)将提取的视觉特征和语义特征输入到带有attention机制的LSTM网络中构成特征处理模型;包括:
[0038] (2.1)将视觉信息上下文向量zvt和语义上下文向量zst通过仿射变换形成能够更加充分的表达图像信息的上下文向量zt;
[0039] (2.2)将得到的上下文向量zt输入到带有attention机制的LSTM网络,分析驾驶员的行为。例如:聊天时嘴型变化,疲劳时的眼睛的变化。
[0040] LSTM(Long Short Term)是一种特殊的RNN模型,可以学习长期依赖信息。LSTM能够通过一个忘记来选择性的记住或者遗忘之前的信息。Attention机制是当前非常流行的一种图像处理的方法,它是通过计算图像相关区域的权重来分配关注程度。所述的特征处理模型,如下:
[0041] et=fatt(ai,ht-1)
[0042]
[0043]
[0044] zt=σ(Wz·[ht-1,xt])
[0045] rt=σ(Wr·[ht-1,xt])
[0046]
[0047]
[0048] 其中,zvt表示视觉信息上下文向量,ai表示视觉特征向量,αt表示权重,zt表示上下文向量,xt表示当前时刻的输入,ht和ht-1分别表示当前时刻和上一时刻的隐藏层状态,为当前时刻隐藏层的候选状态,Wz、Wr、W为参数。
[0049] 3)训练特征处理模型,将驾驶员数据集中的60%的图像用于训练,20%的图像用于验证,20%的图像用于测试;
[0050] 4)根据测试结果分别对参数Wz、Wr、W进行微调,优化实验结果,将优化后的特征处理模型传送到总控制端;
[0051] 5)在车上安装警示灯和摄像头,实时将驾驶员的操作情况上传到总控制端,总控制端根据优化后的特征处理模型判断驾驶员是否有违规驾驶,当有违规驾驶,总控制端发出信号,激发警示灯,提醒驾驶员文明行驶。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈