基于动态模式分解的运动检测方法、终端设备及计算机可读
存储介质
技术领域
背景技术
[0002] 随着互联网技术的飞速发展,大量的监控终端设备接入到网络,从而产生了大量的视频数据。因此基于视频的各类应用得到社会的广泛关注,例如智能监控、安防检测、行为分析等。而运动检测是这些应用的
基础,也是
计算机视觉和
人工智能领域的重要研究课题之一。基于视频的运动目标检测是对
图像序列中的运动物体进行检测和提取,为目标的识别和分析提供基础数据。目前常见的运动检测
算法有
帧差法、光流法、混合高斯模型(GMM)算法和Vibe算法等。然而这些算法均存在各自局限性,并对噪声和光线的抗干扰性较差。
[0003] 其中,帧差法是对时间序列的视频信息进行相邻的两帧或三帧图像信息进行差分处理,通过判断差值的绝对值的大小来实现前景和后景的分离,进而实现运动目标的检测。该算法对光线叫暗或者噪声较大的情况下,帧间的差值会较小,无法准确区分前后景信息,严重影响运动目标的检测率。由于慢运动物体的临近帧之间的差分值较小,通过帧差法无法准确该类目标。
[0004] 光流法是利用图像序列中
像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。该方法容易受光照因素的影响,对应用场景要求过高。
[0005] GMM算法是一种经典的自适应背景建模方法,该方法假设每个像素在时域上符合正态分布,在一定
阈值范围内的像素判定为背景,并用来更新模型,不符合该分布的像素即为前景,再根据形态学处理提取运动目标。该方法建模需要一定的时间,若背景变化过大,会导致背景模型重建时间过长,影响检测效果。
[0006] ViBe背景建模算法是随机选取邻域20个样本为每个像素点建立一个基于样本的背景模型,随后,利用一个二次抽样因子φ,使有限的样本基数能近似表示无限的
时间窗口,即在较少样本前提下,保证算法的准确性,最后,并采用一种领域传播机制保证算法的空间一致性实现背景的更新。该方法建模思想简单,但是当背景模型的初始帧存在运动目标或者背景模型的更新速贷无法与背景速率同步,会出现鬼影现象;此外由于ViBe样本模型受限于样本个数,容易产生运动目标的不完整性。
[0007] 鉴于上述原因,有必要提出一种新的运动检测算法。
发明内容
[0008] 本发明的主要目的在于提供一种基于动态模式分解的运动检测方法、终端设备及计算机可读存储介质,旨在提供一种能够准确、有效地对视频中的运动物体进行检测和提取的方法。
[0009] 为实现上述目的,本发明提供的一种基于动态模式分解的运动检测方法,所述方法包括如下步骤:
[0010] 步骤S10,根据获取的
视频流信息,将视频流信息转换成相应的矩阵形式;
[0011] 步骤S20,通过DMD算法实现视频矩阵的动态模型分解,得到基于DMD算法的多个模型;
[0012] 步骤S30,根据分解计算各模型在整个时间序列贡献度和
频率特性,选择前若干个物理频率为零的主模型来构造背景信息;
[0013] 步骤S40,通过视频图像和背景信息的差值来检测运动目标。
[0014] 优选地,所述步骤S10为:
[0015] 根据获取的视频流信息,将视频流信息转换成相应的输入矩阵X 和观察矩阵Y。
[0016] 优选地,所述步骤S10包括:
[0017] 设定获取的视频流信息的视频数据为Vn,其中 n为帧数,对于第j帧视频数据Vj为m*n*3的矩阵,其中m和n分别表示视频的横纵的像素数,3代表该视频数据为彩色视频;
[0018] 首先将Vj转换成灰度图像,再转换成m*n的一维矩阵Ij的形式;
[0019] 定义输入矩阵X和观察矩阵Y为如下形式:
[0020] X=[I1,I2,…IN-1];
[0021] Y=[I2,I3,…IN];
[0022] 若相邻的帧之间存在转换矩阵A,则存在如下形式:
[0023] In=AIn-1.
[0024] 获取如下等式:
[0025] Y=AX;
[0026] 其中A为M*M的矩阵,M每帧视频的像素数。
[0027] 优选地,所述步骤S20中的DMD的计算流程包括:
[0028] 获取输入矩阵X和观察矩阵Y;
[0029] 实现XSVD分解:X=U∑VH.,其中U和V分别为左右奇异向量构成的矩阵,且均为酉矩阵,∑为由奇异值组成的对
角矩阵,VH为V 的共轭转置矩阵;
[0030] 计算
[0031] 计算 的特征分解: 其中W为由
特征向量构成的举证,N为由特征值构成的对角矩阵;
[0032] 计算DMD模型:Φ=YV∑-1W;
[0033] 计算幅值α=Φ-1x1;
[0034] 计算Vand。
[0035] 优选地,所述步骤S20中的DMD的计算流程包括:
[0036] 对于系统方程Y=AX,通过X的SVD分解获取A的相似矩阵
[0037] X=U∑VH.
[0038] 通过最小Y和AX的F-范数,来实现 的求解:
[0039]
[0040] 其中 获得下式
[0041]
[0042] 由相似矩阵的特性,得到A和 具有相同的特征值,则 的特征值分解为如下形式:
[0043]
[0044] 进而获得:
[0045]
[0046] 其中W是由 的特征向量wj构成,N为A的特征值μj构成的对角矩阵。通过推导获得如下形式:
[0047]
[0048] 其中Φ是以动态模型为:φj=Uwj为列向量的矩阵,U可以表示为 U=YV∑-1,因此:
[0049] Φ=YV∑-1W
[0050] 令α=W-1UHx1=Φ-1x1=[α1,α2,…αr]T,所以: 由此可以获取如下系统描述:
[0051] X=[x1,x2,…xN-1]=ΦDαVand
[0052] 其中Vand为范德蒙矩阵,构成成员为A的特征值,Dα为αi构成的对角线矩阵。
[0053] 优选地,所述步骤S30包括:
[0054] 首先计算各模型在整个时间序列的贡献度,对于任意帧数据均可表示成如下形式:
[0055]
[0056] 若φjμji-1αj越大,则φj对Ii的影响越大,因此,定义DMD的主模型排序条件为:
[0057]
[0058] 其中||φj||F为φj的F-范数。
[0059] 模型φj的频率信息通过特征值来求取:
[0060] ωj=lm(log(μj))/Δt
[0061] 因此ωj为零的模型为背景信息构建的主要成分;
[0062] 通过上述方法筛选的模型 构建的背景信息为:
[0063]
[0064] 对应的前景信息为:
[0065] Fg=abs(X=Bg)
[0066] 最后再通过硬阈值和中值滤波去除前景中存在的噪声成分。
[0067] 此外,为实现上述目的,本发明还提出了一种终端设备,包括
存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的
计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
[0068] 此外,为实现上述目的,本发明还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
[0069] 本发明基于动态模式分解的运动检测方法包括如下步骤:步骤 S10,根据获取的视频流信息,将视频流信息转换成相应的输入矩阵 X和观察矩阵Y;步骤S20,通过DMD算法实现视频矩阵的动态模型分解,得到基于DMD算法的多个模型;步骤S30,根据分解计算各模型在整个时间序列贡献度和频率特性,选择前若干个物理频率为零的主模型来构造背景信息;步骤S40,通过视频图像和背景信息的差值来检测运动目标。本发明的方法为基于DMD主模型的运动检测算法,算法是基于矩阵特征分解的前后景分离算法,具有较强的自适应性和抗噪性,能够准确、有效地对视频中的运动物体进行检测和提取,并且有较好的噪声鲁棒性。
附图说明
[0070] 附图作为本发明的一部分,用来提供对本发明的进一步的理解,本发明的示意性
实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。在附图中:
[0071] 图1为本发明基于动态模式分解的运动检测方法的
流程图;
[0072] 图2a为本发明实施例实测视频的运动目标检测效果图中表示视频的底470帧的检测数据原始图片;
[0073] 图2b为本发明实施例实测视频的运动目标检测效果图中提取出的背景信息;
[0074] 图2c为本发明实施例实测视频的运动目标检测效果图中采用本发明方法获取的前景信息;
[0075] 图2d为本发明实施例实测视频的运动目标检测效果图获取的前景信息经阈值和中值滤波后的效果;
[0076] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0077] 下面结合附图以及具体实施例对本发明实施例解决的技术问题、所采用的技术方案以及实现的技术效果进行清楚、完整的描述。显然,所描述的实施例仅仅是本
申请的一部分实施例,并不是全部实施例。基于本申请中的实施例,本领域普通技术人员在不付出创造性劳动的前提下,所获得的所有其它等同或明显变型的实施例均落在本发明的保护范围内。本发明实施例可以按照
权利要求中限定和涵盖的多种不同方式来具体化。
[0078] 需要说明的是,在下面的描述中,为了方便理解,给出了许多具体细节。但是很明显,本发明的实现可以没有这些具体细节。
[0079] 需要说明的是,在没有明确限定或不冲突的情况下,本发明中的各个实施例及其中的技术特征可以相互组合而形成技术方案。
[0080] 本发明的主要目的在于提供一种基于动态模式分解的运动检测方法,旨在提供一种能够准确、有效地对视频中的运动物体进行检测和提取的方法。
[0081] 在本实施例中,参照图1,所述方法包括如下步骤:
[0082] 步骤S10,根据获取的视频流信息,将视频流信息转换成相应的输入矩阵X和观察矩阵Y;
[0083] 步骤S20,通过DMD算法实现视频矩阵的动态模型分解,并根据分解进行计算;
[0084] 步骤S30,根据分解计算个模型在整个时间序列贡献度和频率特性,选择前若干个物理频率为零的主模型来构造背景信息;
[0085] 步骤S40,通过视频图像和背景信息的差值来检测运动目标。
[0086] 本算法是基于矩阵特征分解的前后景分离算法,具有较强的自适应性和抗噪性。能够准确地检测时视频中的运动目标,并且有较好的噪声鲁棒性,该特性主要得益于通过对DMD的模型的
能量和
频谱分析,进行背景信息建模,该模型对噪声具有抑制效果。
[0087] 本发明主要是将视频数据转换成时间序列的矩阵形式,并通过 DMD进行分解,以获取各类动态模型。通过分析各动态模型在视频数据中的贡献度,以及各模型的频谱特性,选取构成背景成分的动态模型,实现背景的准确建模。
[0088] 具体地,上述方法的具体算法过程如下:
[0089] (1)输入矩阵和观察矩阵的生成:
[0090] 对于存在的视频数据Vn,其中 为帧数。针对第j帧视频数据Vj为m*n*3的矩阵,其中m和n分别表示视频的横纵的像素数, 3代表该视频数据为彩色视频。本文首先将Vj转换成灰度图像,再转换成m*n的一维矩阵Ij的形式。
[0091] ,定义输入矩阵观察矩阵X和观察矩阵Y为如下形式:
[0092] X=[I1,I2,…IN-1] (1)
[0093] Y=[I2,I3,…IN] (2)
[0094] 若相邻的帧之间存在转换矩阵A,则存在如下形式:
[0095] In=AIn-1. (3)
[0096] 则获取如下等式:
[0097] Y=AX (4)
[0098] 其中A为M*M的矩阵,M每帧视频的像素数。
[0099] (2)基于DMD的视频的动态模型分解:
[0100] DMD为一种数据驱动的
降维算法,本发明通过DMD算法实现视频数据的动态模式分解。
[0101] 对于系统方程Y=AX,可以通过X的SVD分解获取A的相似矩阵
[0102]
[0103] X=U∑VH. (5)
[0104] 通过最小Y和AX的F-范数,来实现 的求解:
[0105]
[0106] 其中 获得下式
[0107]
[0108] 由相似矩阵的特性,知道A和 具有相同的特征值。 的特征值分解为如下形式:
[0109]
[0110] 进而获得:
[0111]
[0112] 其中W是由 的特征向量wj构成,N为A的特征值μj构成的对角矩阵。通过推导获得如下形式:
[0113]
[0114] 其中Φ是以动态模型为:φj=Uwj为列向量的矩阵,U可以表示为 U=YV∑-1,因此:
[0115] Φ=YV∑-1W (11)
[0116] 令α=W-1UHx1=Φ-1x1=[α1,α2,…αr]T,所以: 由此可以获取如下系统描述:
[0117] X=[x1,x2,…xN-1]=ΦDαVand
[0118] (12)
[0119] 其中Vand为范德蒙矩阵,构成成员为A的特征值,Dα为αi构成的对角线矩阵。
[0120] DMD计算流程如下:
[0121] 获取X、Y;
[0122] 实现XSVD分解:X=U∑VH.;其中U和V分别为左右奇异向量构成的矩阵,且均为酉矩阵,∑为由奇异值组成的对角矩阵,VH为V的共轭转置矩阵;
[0123] 计算
[0124] 计算 的特征分解: 其中W为由特征向量构成的举证, N为由特征值构成的对角矩阵;
[0125] 计算DMD模型:Φ=YV∑-1W;
[0126] 计算幅值α=Φ-1x1;
[0127] 计算Vand;
[0128] (3)DMD主模型的筛选:
[0129] 由上述方法求得DMD模型可以用于表达整个视频数据各时间序列的状态改变,但是各模型在视频种占据的比重是不同的,其中比重最大的因为背景信息,比重较小的应为运动物体。此外各模型据具有各自的频谱特性,随时间的推进,缓慢变换的因为成分应为背景信息,快递变换的应为运动物体。基于上述的两个条件,本发明提出了基于 DMD主模型的运动物体检测算法。
[0130] 首先计算各模型在整个时间系列的贡献度。对于任意帧数据均可表示成如下形式:
[0131]
[0132] 若φjμji-1αj越大,则φj对Ii的影响越大。因此,本发明定义DMD的主模型排序条件为:
[0133]
[0134] 其中||φj||F为φj的F-范数。
[0135] 模型φj的频率信息通过特征值来求取:
[0136] ωj=lm(log(μj))/Δt (15)[0137] 因此ωj为零的模型为背景信息构建的主要成分。
[0138] 通过上述方法筛选的模型 构建的背景信息为:
[0139]
[0140] 对应的前景信息为:
[0141] Fg=abs(X=Bg) (17)
[0142] 最后再通过硬阈值和中值滤波去除前景中存在的噪声成分。
[0143] 为了验证本发明正确性和有效性的验证,参照图2a~图2d本发明使用运动检测
网站(change-detection.net)提供的实测数据turnpike_0_5fps进行实验验证。该数据为高速公路中的车辆运行的检测视频。本实验展示视频的第470帧的检测效果如图2所示。从检测效果中可以看出本发明可以准确检测视频中的运动目标。
[0144] 此外,为实现上述目的,本发明还提出了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
[0145] 此外,为实现上述目的,本发明还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
[0146] 本发明的各个步骤可以用通用的计算装置来实现,例如,它们可以集中在单个的计算装置上,例如:个人计算机、
服务器计算机、
手持设备或便携式设备、平板型设备或者多处理器装置,也可以分布在多个计算装置所组成的网络上,它们可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成
电路模
块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。因此,本发明不限于任何特定的
硬件和
软件或者其结合。
[0147] 本发明提供的方法可以使用
可编程逻辑器件来实现,也可以实施为计算机程序软件或程序模块(其包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件或数据结构等等),例如根据本发明的实施例可以是一种计算机程序产品,运行该计算机程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现所述方法。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可以从计算机主体上拆卸下来的可移动介质(例如:采用
热插拔技术的存储设备)。所述内置介质包括但不限于可重写的
非易失性存储器,例如:RAM、ROM、快闪存储器和
硬盘。所述可移动介质包括但不限于:光存储介质(例如:CD-ROM和DVD)、磁光存储介质(例如: MO)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置ROM的媒体(例如: ROM盒)。
[0148] 以上仅为本发明的优选实施例,并非因此限制本发明的
专利范围,凡是利用本发明
说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。