专利汇可以提供一种基于时序行为检测的工作流识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于时序行为检测的工作流识别方法。本发明提出了一种时序视频稀疏 采样 的方法,减少无用数据的同时加快了 框架 的整体速度。同时,为了加快识别速度和识别 精度 ,本发明使用三维残差网络来提取特征,以保证 时空 特征提取的速度和效率。在时序候选子网中,为了避免漏掉某些候选 片段 ,本发明使用Soft-NMS对NMS进行了更新,保证了检测结果的召回率。通过上述策略,使得本发明所提出的框架更加适用于复杂工厂生产环境中的工作流识别。发明解决了动作在视频中的时序 定位 问题,有效利用了工厂环境下产生的大量智能监控视频,通过神经网络检测出视频中活动的类别及其发生的时间片段,对工作流进行建模,从而进一步的对整个生产流程进行优化。,下面是一种基于时序行为检测的工作流识别方法专利的具体信息内容。
1.一种基于时序行为检测的工作流识别方法,其特征在于包括如下步骤:
步骤(1)、使用一种稀疏采样策略对待处理视频进行处理,包括将视频中的连续帧划分为一个区间,在区间内部进行随机取样,避免视频冗余;
步骤(2)、使用三维残差网络来提取特征,减少训练时间并缩小模型大小;
步骤(3)、使用一种锚点机制来获取候选的活动片段,构成锚点片段;
步骤(4)、通过一个分类网络判断这些候锚点片段里面是否包含有动作以及通过一个边界回归网络来确定这些锚点片段的边界,从而得出构成候选列表Ⅰ;
步骤(5)、使用一种Soft-NMS方法来去除候选列表Ⅰ中高度重叠和低置信度的活动片段,得到最终的候选列表Ⅱ;
步骤(6)、通过一种最大池化的方法,使得任意长度的候选特征都变成了固定维度为
512*1*4*4的特征Ⅰ;
步骤(7)、将固定维度的特征Ⅰ同时输入两个全连接层,其中两个连续的全连接层连接着一个softmax分类器用于判断活动类别,另外两个连续的全连接层连接一个回归层用于改善候选活动发生的时间段;
步骤(8)、根据得到的动作的类别及其发生的活动片段,对工作流进行建模,从而进一步的对整个生产流程进行优化。
2.根据权利要求1所述的一种基于时序行为检测的工作流识别方法,其特征在于:
相关概念定义及符号说明如下:
ft:表示视频在t时刻的视频帧;
ak:表示某一时序位置上的第k个锚点的大小;
Lcls:表示一个多分类的softmax损失函数,用于判断工作流中活动片段的类别;
Lreg:表示L1平滑损失函数,用于优化候选片段和真实情况的相对偏移;
PLIST:包含置信度的候选列表;
PLIST:通过soft-NMS筛选之后得到的返回列表;
ROI:感兴趣区域;
softmax:多类型分类器,每一类别的概率如下:
步骤(1)具体采样方式如下:
1-1.将原始视频分解为连续的视频帧序列{f1,f2,f3,…,ft};
1-2.将连续4帧作为一个区间,每次在一个区间里面随机读取一帧,从而避免时序上冗余的同时也避免了每次都在相同的位置上获取视频帧;
1-3.将得到的连续随机帧作为训练样本输入三维残差神经网络。
3.根据权利要求2所述的一种基于时序行为检测的工作流识别方法,其特征在于步骤(2)使用三维残差网络来提取时空特征,对输入视频帧进行时空特征提取,为了保证计算效率同时保证端到端的训练,时序候选子网络和行为分类子网络将共享该时空特征,具体实现如下:
2-1.将输入视频帧的维度压缩为为112*112,用来最大化GPU性能;
2-2.通过残差块来避免出现梯度消失或者梯度爆炸的现象,增加的网络的深度;
2-3.将连续的尺寸为3*112*112的RGB视频帧对三维残差神经网络进行输入,该网络最终输出为512*L/8*7*7的时空特征。
4.根据权利要求3所述的一种基于时序行为检测的工作流识别方法,其特征在于步骤(3)具体实现如下:
3-1.针对时空特征,时序候选子网络能快速生成大小不一的锚点片段,并判断该锚点片段内视频为目标或背景的概率,用于初步生成候选候选列表Ⅰ,锚点片段表示公式如下:
anchor={ci,li}
其中,ci表示锚点片段的中心位置,li表示锚点片段在时序上的长度;
3-2.锚点片段分布在长度为8/L的时空特征中,每一个时空特征的时序位置上都有k个锚点,因此在时序候选子网络中,每一个时空特征的时序位置都会有k个不同长度的锚点片段序列;即某一时序位置上的锚点片段的长度递增序列为:
{a1,a2,a3,…,ak}
ak即为某一时序位置上的第k锚点;
3-3.每秒读取f帧(FPS=f),则这些锚点片段在时序位置上的覆盖长度为:
{a1*8/f,a2*8/f,a3*8/f,…,ak*8/f}
这些不同长度的锚点片段,通过一个边界回归网络就能够确定一个锚点片段的时序位置位置。
5.根据权利要求4所述的一种基于时序行为检测的工作流识别方法,其特征在于步骤(4)通过一个分类网络判断这些锚点片段里面是否包含有动作以及通过一个边界回归网络来确定这些锚点片段,从而得出构成候选列表Ⅰ;对于步骤2-3中产生的时空特征进行一系列操作,将产生的候选活动片段作为下一阶段行为分类网络的输入,具体实现如下:
4-1.添加一个大小为3*3*3的三维卷积核来拓展时空感受野;
4-2.添加一个三维最大池化核,大小为1*H/16*W/16,用于产生仅包含时序特征的特征图;
4-3.添加两个1*1*1的卷积核操作后,最终得到的特征图大小为512*L/8*1*1;
4-4.通过一个边界回归网络和一个行为分类网络得到候选列表Ⅰ(候选列表PLIST),具体损失函数如下:
其,中Ncls为分类归一化值,即批处理数量;Nreg为回归归一化值,即锚点片段的数量,i为特征图中锚点片段的索引值;λ为权重值,用于平衡两种损失,由于cls项和reg项差不多等权重,故λ取1。
6.根据权利要求5所述的一种基于时序行为检测的工作流识别方法,其特征在于步骤(5)使用一种Soft-NMS方法来去除候选列表Ⅰ(候选列表PLIST)中高度重叠和低置信度的活动片段,得到最终的候选列表Ⅱ(返回列表RLIST),具体过程如下:
5-1.从候选列表PLIST里面选出一个置信度最大的候选活动片段M,将其从候选列表PLIST中删除并放入返回列表RLIST中;
5-2.对于候选列表PLIST里面的每一个候选bi,其置信度分数为si,如果计算出bi与M重合度大于阈值,则通过一种线性的方式对其置信度进行降低;即:
si(1-iou(M,bi))
其中,其中iou为交并比,即M和bi的交集与并集的比值;
5-3.重复步骤5-1和5-2,直至候选列表PLIST为空。
7.根据权利要求6所述的一种基于时序行为检测的工作流识别方法,其特征在于步骤(6)通过一种最大池化的方法得到固定维度的特征,使用ROI池化从时空特征中提取固定尺度的特征Ⅰ,即上述输入为512*L/8*7*7在一个1*4*4的格子里面进行最大池化,得到最终的统一尺寸512*1*4*4。
8.根据权利要求7所述的一种基于时序行为检测的工作流识别方法,其特征在于步骤(7)将固定维度的特征Ⅰ同时输入两个全连接层,其中两个连续的全连接层连接着一个softmax分类器用于判断活动类别,另外两个连续的全连接层连接一个回归层用于改善候选活动发生的时间段,具体实现如下:
7-1添加两个全连接层;
7-2添加一个边界回归网络进行边界修正,通过一个行为分类网络进行行为分类,得到目标动作类别,具体损失函数如下:
其中,Ncls为分类归一化值,即批处理数量;Nreg为回归归一化值,即候选片段的数量;λ为权重值,用于平衡两种损失,仍设为1。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种位移检测传感器采样频率与检测准确度设计方法 | 2020-05-08 | 563 |
一种曝光方法、一种图像系统及图像系统协同工作的方法 | 2020-05-08 | 787 |
窄带无线通信终端中的同步检测方法 | 2020-05-08 | 79 |
具有保压存储和转移功能的全海深宏生物采样器 | 2020-05-08 | 288 |
基于优化占空比的永磁同步电机模型预测控制方法 | 2020-05-08 | 834 |
一种飞机地面电源线缆压降补偿的控制方法 | 2020-05-08 | 486 |
一种基于时序行为检测的工作流识别方法 | 2020-05-08 | 675 |
一种DoS攻击下的目标跟踪方法 | 2020-05-08 | 514 |
一种急诊科的血液采样器的收纳装置 | 2020-05-11 | 98 |
高度测量装置 | 2020-05-11 | 92 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。