专利汇可以提供一种基于卷积神经网络和深度核网络的视频行为识别方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种基于 卷积神经网络 和深度核网络的视频行为识别方法,包括以下步骤:步骤1:采集视频并按行为类别进行分类;步骤2:对筛选后的视频进行预处理;步骤3:用经过预处理后的数据训练模型;步骤4:采集待检测视频并进行预处理;步骤5:根据步骤3得到的训练好的模型用步骤4得到的预处理后的数据作为输入进行行为识别;步骤6:根据步骤5的识别结果就可以得到与待识别视频相似度最高的行为类别。,下面是一种基于卷积神经网络和深度核网络的视频行为识别方法专利的具体信息内容。
1.一种基于卷积神经网络和深度核网络的视频行为识别方法,其特征在于,包括如下步骤:
步骤1:采集视频并按行为类别进行分类;
步骤2:对视频进行预处理;
步骤3:用经过预处理后的视频数据训练模型;
步骤4:采集待检测视频并进行预处理;
步骤5:根据步骤3得到的训练好的模型,用步骤4得到的预处理后的数据作为输入进行行为识别;
步骤6:根据步骤5的识别结果,得到与待识别视频相似度最高的行为类别。
2.根据权利要求1所述的方法,步骤2包括如下步骤:
步骤2-1,将采集的视频分割成三个部分,每个部分持续的时间相同;
步骤2-2,从分割的每个部分中采样得到长度为T的视频片段,并且计算得到对应的光流场;
步骤2-3,在视频片段和光流场上裁剪,得到大小为H×W×c×T的连续彩色图像序列,以及大小为H×W×2L×T的光流场序列,其中H和W分别表示裁剪图像的高度和宽度,c表示彩色图像的通道数,L表示堆叠的光流场的数量。
3.根据权利要求2所述的方法,其特征在于,步骤3包括如下步骤:
步骤3-1,构造神经网络模型;
步骤3-2,初始化神经网络模型;
步骤3-3,用步骤2得到的连续彩色图像序列以及光流或翘曲光流场序列对神经网络模型进行训练,并保存训练好的模型。
4.根据权利要求3所述的方法,其特征在于,步骤3-1包括:
构造神经网络模型,所述模型包括卷积神经网络和深度核网络;所述模型将三个视频片段分别输入至卷积神经网络提取外观特征后,再输入至深度核网络提取时变特征,最后再融合三个视频片段的输出特征以获取对完整视频的行为预测;
其中,深度核网络包括三个构造块,每个构造块通过三次操作对输入特征向量完成三次变换,第一次变换使用公式 第二次变换使用公式 其中x为输
入特征向量,θ为激活函数,Z为基底向量组成的矩阵,||·||2表示向量的2范数,T表示矩阵的转置,前两次变换的组合用函数φ表示, 第三次变换为
步长为2的最大化池化,用以增加平移不变性及扩大感受野。
5.根据权利要求4所述的方法,其特征在于,对于第二次变换 计算在使用反向传播算法训练网络参数阶段所需用到的梯度:
T
令X=θ(ZZ),并且 L=l(Y),其中X,Y为矩阵,函数f的功能是求矩阵的次方,l为损失函数,L为损失值,此时已知损失值相对于矩阵Y的梯度 目标是计算损失值相对于矩阵X梯度
6.根据权利要求5所述的方法,其特征在于,所述计算损失值相对于矩阵X梯度 具体包括如下步骤:
步骤3-1-1,对矩阵X进行特征分解,X=QΛQT,其中Q为正交矩阵,Λ为对角矩阵且对角线元素依次为矩阵X的D个特征值λ1,λ2,...,λD,λD表示第D个特征值;
步骤3-1-2,计算得到
步骤3-1-3,计算得到 其中符号 表示矩阵阿达马乘积,R是
新引入的矩阵,其第i行第j列元素 λi,λj为矩阵X的特征值。
7.根据权利要求6所述的方法,其特征在于,步骤3-2包括:
使用ImageNet数据集预训练卷积神经网络,并且使用无监督学习初始化深度核网络的参数;学习率值初始化为0.001,并且每1000次迭代后其值减半。
8.根据权利要求7所述的方法,其特征在于,步骤4包括:采集待检测视频并利用步骤2中的方法对视频进行预处理。
9.根据权利要求8所述的方法,其特征在于,步骤5中,将步骤4中得到的预处理后的视频数据作为输入,使用步骤3中训练好的神经网络模型对输入进行检测,判断输入的视频所属的类别。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于深度学习的遥感影像自动标注方法 | 2020-05-08 | 157 |
一种声学模型训练方法和装置、计算机设备、存储介质 | 2020-05-08 | 960 |
基于长短期记忆网络的梯级水电站发电量预测方法 | 2020-05-11 | 517 |
射频基因库建立方法及违法违规无线电波检测方法 | 2020-05-12 | 14 |
行李车收集方法及行李车收集设备 | 2020-05-08 | 105 |
一种基于卷积神经网络和深度核网络的视频行为识别方法 | 2020-05-11 | 915 |
一种基于图像语义分割的损失函数及其设计方法 | 2020-05-12 | 676 |
基于半监督学习的图片分类方法、装置和计算机设备 | 2020-05-11 | 544 |
基于目标高度信息和色彩信息的固废在线识别方法 | 2020-05-08 | 116 |
一种图片标记方法、装置、设备及存储介质 | 2020-05-13 | 184 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。