首页 / 专利库 / 数学与统计 / 聚类算法 / 一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法

一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法

阅读:182发布:2024-02-11

专利汇可以提供一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于密集尺度不变特征转换字典学习的高 精度 火灾火焰检测方法,包括以下步骤:S1:对 视频流 进行 运动检测 获取运动目标;S2:进行 颜色 检测,获取具有火焰特征的目标:对S1获得的运动目标的HSI颜色特征判断,获得具有火焰特征颜色的 像素 ;S3:对符合运动检测和颜色检测的像素基于Dense-SIFT字典学习进行 空域 形态特征判别;S4:对上述获取的目标结合时域上闪烁特征综合判别:在S3进行空域形态特征检测的 基础 上,结合时域动态闪烁特征,计算火焰像素点的个数与设定的 阈值 比较,综合判定实现对火焰的检测。,下面是一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法专利的具体信息内容。

1.一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法,其特征在于:包括以下步骤:
S1:对视频流进行运动检测获取运动目标:基于改进型视觉背景提取算法、根据邻域像素间的空间分布相关性、运用尺度不变局部三值模式提取特征对视频流进行运动检测获得运动目标;
S2:进行颜色检测获取具有火焰特征的目标:对S1获得的运动目标的HSI颜色特征判断,获得具有火焰特征颜色的像素;
S3:对符合运动检测和颜色检测的像素进行空域上形态特征判别:提取S2获得的可能火焰目标像素区域的Dense-SIFT特征,利用离线训练好的火焰字典进行编码,使用支持向量机分类器判定;
S4:对上述获取的目标结合时域上闪烁特征综合判别:在S3进行空域形态特征检测的基础上,结合时域动态闪烁特征,计算火焰像素点的个数与设定的阈值比较,综合判定实现对火焰的检测。
2.根据权利要求1所述的一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法,其特征还在于:S1中具体采用如下方式:
S11:取视频序列中第一图像,定义每个像素的红、绿、蓝分量分别为R、G、B,利用平均值法计算每个像素点(x,y)的灰度值I:
S12:对每个像素点(x,y)的上下左右4个邻域像素,自右邻域像素,按逆时针方向计算其SILTP特征,用SM(x,y)表示:
式(2)、(3)中,Ik是4邻域像素的灰度值,Θ表示是将所有邻域的二进制值sτ(I,Ik)连接成字符串,τ为变化的阈值范围;
S13:在以像素点(x,y)为中心,R为半径的邻域中,随机抽取N个样本,构建该像素背景模型样本M(x,y):
M(x,y)={SM1(x,y),SM2(x,y),…,SMN(x,y)} (4)
S14:从第二帧开始,同S12过程,为每个像素点(x,y)建立一个样本S(x,y);
S15:定义Cn(x,y)为S(x,y)与背景模型样本M(x,y)中第n个样本SMn(x,y)的单个匹配度,n=1,2,…,N,其结果为所对应为异或结果为1的位的个数:
Cn(x,y)=S(x,y)⊕SMn(x,y) (5)
S16:计算待测点x是否为前景点:
式(7)中,Bn(x,y)表示匹配度小于半径R的一个样本,Sum(x,y)表示匹配度小于R的所有样本的总和,Th为判别阈值,f(x,y)为像素(x,y)的分类结果;
S17:运动目标作为前景在一段持续的时间内会表现出相同的分类结果,对一段时间内m帧的f(x,y)进行判别和分析,设F(x,y)为像素点(x,y)在m帧中f(x,y)分类结果的集合:
S18:运动像素判决的条件为:
F(x,y)≤Gh (10)
当F(x,y)的值小于整体判别值Gh时,则确定为运动目标,否则为背景目标,其中m的取值范围与视频帧速率有关,接近于帧速率的值;
S19:实时更新背景模型:
(a)若点(x,y)被认为是背景点,给定更新频率ω,将S(x)按1/ω的概率依次替换被随机抽取的样本,再次按照1/ω的概率,随机选取x的R半径邻域的某一个像素点,将该邻域背景模型中随机选取的SMn(x,y)用S(x,y)替换,则更新了选定邻域的背景模型;
(b)对像素点进行统计,如果某个像素点连续M次被检测为前景,则将其更新为背景点,即按照1/ω的概率用随机选取的样本SMn(x,y)将其替代。
3.根据权利要求1所述的一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法,其特征还在于:S2中具体采用如下方式:
S21:将上述获得的运动目标的RGB空间转换为HSI:
I的含义同前式(1);
S22:根据多次实验的结果,选定火焰HSI模型中H、S、I各自的检测范围值:
S23:将S18中获得的运动像素根据S22中火焰HSI模型中H、S、I的值分别进行匹配比较,如在此范围内,则为运动的疑似火焰;
S24:对S23中判别为动态疑似火焰的区域,以其区域的平均灰度值与相邻域像素灰度值比较,如果灰度差小于阈值T,则合并至可疑火焰像素。
4.根据权利要求1所述的一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法,其特征还在于S3中具体采用如下方式:
S31:提取S24中可能火焰目标的Dense-SIFT特征,则此图像集U可以表示成Dense-SIFT特征bi的集合,即U={bi,bi∈U},具体步骤为:
(1)在图像上设定密集采样网格,网格上的交叉点作为特征提取点,以8×8像素大小的窗口进行固定采样;
(2)以4像素的步长自左向右、从上到下在图像上提取SIFT特征描述子;
S32:根据已离线训练好的火焰字典对S31中的Dense-SIFT特征进行特征编码;
采用基于投票策略编码中的硬投票的编码方式:
其中,bj为不同的K-均值聚类中心,J是K-均值聚类的类中心数目,v(i)为编码后Dense-SIFT的J维特征向量
S33:将S32中获得的特征向量取平均池化,以生成图像级别的全局表达,式中,H为每一幅视频帧图像中的Dense-SIFT特征数目;vk即为第k个被特征编码的Dense-SIFT,vki表示vk的第i维,Zi为得到的特征向量,J等于K-均值的类中心数;
S34:将S33中得到的特征向量输入已经离线训练好的SVM分类器,从而判断该视频帧图像是否包含火焰。
5.根据权利要求1所述的一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法,其特征还在于:S4中具体采用如下方式:
S41:在视频第一帧时,建立与视频图像像素大小相同的计数矩阵SUM,用于记录视频序列相邻两帧间像素的亮度变化,初始值均为0;
S42:记I(x,y,t)为像素(x,y)在时刻t对应于HSI空间的亮度值,t与t-1时刻连续两帧图像对应像素的亮度差ΔI(x,y,t):
ΔI(x,y,t)=|I(x,y,t)-I(x,y,t-1)| (16)
S43:SUM(x,y,t)和SUM(x,y,t-1)分别表示像素(x,y)在时刻t和t-1时计数器的值,若相邻两帧图像对应位置像素的亮度值I(x,y,t)有变化,则t时刻像素(x,y)对应的计数器值SUM(x,y,t)累加1,否则加0;
式(17)中,T1是为消除系统噪声影响,而对于亮度变化ΔI(x,y,t)的范围设定的一个阈值,ΔI(x,y,t)超过阈值T1时,才认为相邻帧对应位置像素的亮度值I(x,y,t)有变化;
S44:统计时刻t各候选火焰区域的像素是否满足像素闪烁条件:
(SUM(x,y,t)-SUM(x,y,t-p))>SUM0 (18)
式(18)中,p是设定的时间步长,大小与视频帧采集速率相近,SUM0表示判决闪烁的阈值,其值与时间步长有关;
S45:将候选火焰区域中满足像素闪烁条件的像素总数记为NisO,刻区域前景点总数记为NiRECT,则火焰闪烁条件为:
Niso/NiRECT>ρ (19)
其中,ρ为阈值,由实验测定,其取值范围0-1,当NisO与NiRECT的比值大于阈值ρ时,则判断该区域为检测的火焰区;
S46:若判断当前时刻视频图像存在火焰目标,则与静态检测结果相与,如判断存在火焰目标,则报警后读取新的帧图像,否则直接读取新一帧图像,再进入新一轮检测。
6.根据权利要求1所述的一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法,其特征还在于:离线训练火焰字典和SVM分类器具体采用如下方式:
离线训练火焰字典和SVM分类器的过程依次为输入训练图像、提取Dense-SIFT特征、建立火焰字典、利用字典进行特征编码、池化获得图像全局表达及最后训练SVM分类器,具体实现步骤为:
M1:提取所有训练集图像中每张图像的Dense-SIFT特征,则训练图像集L表示成Dense-SIFT特征di的集合,即L={di,di∈I},具体步骤为:
M11:在图像上设定密集采样网格,网格上的交叉点作为特征提取点,以8×8像素大小的窗口进行固定采样;
M12以4像素的步长自左向右、从上到下在图像上提取SIFT特征描述子;
M2:通过K-均值聚类方法,用提取的Dense-SIFTT特征聚类分析,从而训练出火焰字典,具体步骤为:
4
M21:从所有Dense-SIFT特征中,随机选取10个Dense-SIFT组成Dense-SIFT特征集;
M22:从Dense-SIFT特征集中任意选择400个Dense-SIFT特征作为初始聚类质心b;
M23:对除聚类质心外的每个Dense-SIFT特征di,计算di到所有聚类质心bj的欧式距
2
离Dij=||di-bj||,并把该Dense-SIFT特征di归到欧式距离Dij最短的质心所属的聚类Cj中,由此形成400个新聚类集C;
其中J为类别中心数目,H为训练Dense-SIFT特征个数,若第i个样本属于第j个类
4
中心,则rij为1,否则为0,其中J为400,H为10 ;
M24:更新聚类的质心,计算新聚类中所有Dense-SIFT的均值,并作为新聚类的质心:
其中|Cj|是聚类Cj中Dense-SIFT特征的个数;
M25:重复过程M23和M24直至收敛,收敛是指新聚类的质心趋于稳定;
M26:K-均值收敛时,得到的每个聚类最终的质心bj,由此便得到由400个聚类质心组成整个火焰字典:
V={bj,j=1:400} (22)
M3:通过计算Dense-SIFT特征集与M2中离线训练好的火焰字典的相关性,对上述的Dense-SIFT特征进行特征编码成特征向量表示,采用基于投票策略编码中的硬投票编码方式:
其中,v(i)为编码后Dense-SIFT的J维特征向量;
M4:将(3)中获得的特征向量取平均池化,以生成图像级别的全局表达;
式中,H为每一幅视频帧图像中的Dense-SIFT特征数目;vk即为第k个被特征编码的Dense-SIFT,vki表示vk的第i维,Zi为得到的特征向量,J等于K-均值的类中心数;
M5:训练支持向量机SVM分类器
采用径向基RBF核函数作为SVM的核函数,为火焰图片训练集训练SVM模型;RBF核函数公式为:
2
K(zi,zj)=exp(-g||zi-zj||) (25)
其中,zi、zj表示M4中得到的图像表达;g为RBF的核参数;训练SVM模型时还需输入惩罚因子C。

说明书全文

一种基于密集尺度不变特征转换字典学习的高精度火灾火

焰检测方法

技术领域

[0001] 本发明涉及图像处理技术领域,尤其涉及一种基于密集尺度不变特征转换(Dense [1]Scale Invariant Feature Transform,Dense-SIFT) 字典学习的实时火灾火焰检测方法。

背景技术

[0002] 楼宇建筑的火灾会造成生命、财产的重大损失。传统的火灾检测技术一般是基于感烟和感温的。目前基于计算机视觉火灾探测技术可直接利用现有视频监控系统所获得的视频信息,具有非接触式、准确性高、成本低、检测范围大、结果直观、适用多种场合等优势,应用前景十分广阔。图像火灾火焰检测技术一般是在获取监控视频,对图像进行去噪、增强等预处理基础上,提取火焰的静态、动态特征,然后运用模式识别等技术加以分类识别。
[0003] 在公开号为CN 101515326A的专利中,谢迪提出了一种适用于识别和检测大空间火灾火焰的方法,具体为:先高斯平滑每一输入视频来滤除噪音,然后用固定阈值的时域差分法检测视频中的运动目标,再通过图像RGB分量提取具有火焰颜色像素。之后把符合火焰特征且相互连接的像素点组成连通区域,进行频域分析,计算周长和面积,通过形状和面积变化判断是否有火焰。固定阈值的时域差分法,对实际应用中常出现的阴影、遮挡和背景扰动问题,各帧视频间的背景像素灰度会发生较大变化,因此检测准确率不高。方法虽然运用了火焰面积改变量动态特征,但没有结合火焰的闪动频率。另外,方法没有使用更好的模式识别技术,容易误检。
[0004] 在“基于颜色模型和稀疏表示的图像型火焰探测”论文中[2],宗方等基于HSI颜色模型的自然直观性,利用其提取疑似区域,建立稀疏表示模型。该方法包括三部分:首先在HSI空间建立颜色模型对火灾图像进行预处理,提取出疑似区域,然后建立稀疏表示模型,用主成分分析方法构造火焰和疑似火焰物体的特征字典,最后利用最小l1-范数方法计算测试样本与训练样本的最小逼近残差,实现火焰和干扰物体的分类识别。虽然该方法无需大量训练样本进行学习与参数优化,但在字典有限的情况下,易出现过拟合,尽管对训练样本检测效果较好,但对真实样本检测效果并不好,容易误判,更难以实现复杂环境实时检测。

发明内容

[0005] 根据现有技术存在的问题,本发明公开了一种基于Dense-SIFT字典学习的实时火灾火焰检测方法,包括以下步骤:
[0006] S1:对视频流进行运动检测获取运动目标:基于运动目标检测背景减除法的改进[3]型视觉背景提取(Visual Background extractor,ViBe) 算法,根据邻域像素间的空间分布相关性,运用尺度不变局部三值模式(Scale Invariant Local Ternary Pattern,SILTP)[4]
提取特征,对视频流进行运动检测获得运动目标;
[0007] S2:进行颜色检测,获取具有火焰特征的目标:对S1获得的运动目标的HSI颜色特征判断,获得具有火焰特征颜色的像素;
[0008] S3:对符合运动检测和颜色检测的像素进行空域上形态特征判别:提取S2获得的可能火焰目标像素区域的Dense-SIFT特征,利用离线训练好的火焰字典进行编码,使用支持向量机(Support Vector Machine,SVM)分类器判定;
[0009] S4:对上述获取的目标结合时域上闪烁特征综合判别:在S3进行空域形态特征检测的基础上,结合时域动态闪烁特征,计算火焰像素点的个数与设定的阈值比较,综合判定实现对火焰的检测。
[0010] S1中具体采用如下方式:
[0011] S11:取视频序列中第一帧图像,定义每个像素的红、绿、蓝分量分别为R、G、B,利用平均值法计算每个像素点(x,y)的灰度值I:
[0012]
[0013] S12:对每个像素点(x,y)的上下左右4个邻域像素,自右邻域像素,按逆时针方向[5]计算其SILTP特征 ,用SM(x,y)表示:
[0014]
[0015]
[0016] 式(2)、(3)中,Ik是4邻域像素的灰度值,Θ表示是将所有邻域的二进制值sτ(I,Ik)连接成字符串,τ为变化的阈值范围,其取值范围0-1。
[0017] S13:在以像素点(x,y)为中心,R为半径的邻域中,随机抽取N个样本,构建该像素背景模型样本M(x,y):
[0018] M(x,y)={SM1(x,y),SM2(x,y),···,SMN(x,y)} (4)
[0019] 本发明R的取值范围1-5;
[0020] S14:从第二帧开始,同S12过程,为每个像素点(x,y)建立一个样本S(x,y);
[0021] S15:定义Cn(x,y)为S(x,y)与背景模型样本M(x,y)中第n个样本SMn(x,y)的单个匹配度,n=1,2,…,N,其结果为所对应为异或结果为1的位的个数:
[0022]
[0023] S16:计算待测点x是否为前景点:
[0024]
[0025]
[0026]
[0027] 式(7)中,Bn(x,y)表示匹配度小于半径R的一个样本,Sum(x,y)表示匹配度小于R的所有样本的总和,Th为判别阈值,f(x,y)为像素(x,y)的分类结果。
[0028] S17:运动目标作为前景在一段持续的时间内会表现出相同的分类结果,对一段时间内m帧的f(x,y)进行判别和分析。设F(x,y)为像素点(x,y)在m帧中f(x,y)分类结果的集合:
[0029]
[0030] S18:运动像素判决的条件为:
[0031] F(x,y)≤Gh (10)
[0032] 当F(x,y)的值小于整体判别值Gh时,则确定为运动目标,否则为背景目标。本发明m取值范围与视频帧速率有关,一般接近于帧速率大小。
[0033] S19:实时更新背景模型:
[0034] (a)若点(x,y)被认为是背景点,给定更新频率ω,将S(x)按1/ω的概率依次替换被随机抽取的样本,再次按照1/ω的概率,随机选取x的R半径邻域的某一个像素点,将该邻域背景模型中随机选取的SMn(x,y)用S(x,y)替换,则更新了选定邻域的背景模型;
[0035] (b)对像素点进行统计,如果某个像素点连续M次被检测为前景,则将其更新为背景点,即按照1/ω的概率用随机选取的样本SMn(x,y)将其替代。本发明M取值范围10-30。
[0036] S2中具体采用如下方式:
[0037] S21:将上述获得的运动目标的RGB空间转换为HSI:
[0038]
[0039]
[0040] I的含义同前式(1);
[0041] S22:根据多次实验的结果,选定火焰HSI模型中H、S、I各自的检测范围值:
[0042]
[0043] S23:将S18中获得的运动像素根据S22中火焰HSI模型中H、S、I的值分别进行匹配比较,如在此范围内,则为运动的疑似火焰。
[0044] S24:视频图像中,只有满足颜色条件判决的运动区域才可能为火焰,但火焰的底部和内部在一些瞬间处于静止的状态,无法将它们作为动目标检测出来。所以,在提取的火焰动态目标周围,采用基于灰度差的区域生长的方法,对S23中判别为动态疑似火焰的区域,以其区域的平均灰度值与相邻域像素灰度值比较,如果灰度差小于阈值T,则合并至可疑火焰像素。
[0045] S3中具体采用如下方式:
[0046] S31:提取S24中可能火焰目标的Dense-SIFT特征,则此图像集U可以表示成Dense-SIFT特征bi的集合,即U={bi,bi∈U}。具体步骤为:
[0047] (1)在图像上设定密集采样网格,网格上的交叉点作为特征提取点。以8×8像素大小的窗口进行固定采样;
[0048] (2)以4像素的步长自左向右、从上到下在图像上提取SIFT特征描述子;
[0049] S32:根据已离线训练好的火焰字典(训练过程见6),对S31中的Dense-SIFT特征进行特征编码。
[0050] 考虑到时效性要求,本发明编码方式采用Voting-Based Coding中的Hard Voting:
[0051]
[0052] 其中,bj为不同的K-均值聚类中心,J是K-均值聚类的类中心数目,v(i)为编码后Dense-SIFT的J维特征向量
[0053] S33:将S32中中获得的特征向量取平均池化,以生成图像级别的全局表达。
[0054]
[0055] 式中,H为每一幅视频帧图像中的Dense-SIFT特征数目;vk即为第k个被特征编码的Dense-SIFT,vki表示vk的第i维,Zi为得到的特征向量,J等于K-均值的类中心数。
[0056] S34:将S33中得到的特征向量输入已经离线训练好的SVM分类器(训练过程见6),从而判断该视频帧图像是否包含火焰。
[0057] S4中具体采用如下方式:
[0058] 火焰燃烧时,目标轮廓的色度亮度呈现快速变化,直接体现在像素的颜色分量变化中。因此,火焰的频闪特征可以通过区域目标像素的色度变化来表征。
[0059] S41:在视频第一帧时,建立与视频图像像素大小相同的计数矩阵SUM,用于记录视频序列相邻两帧间像素的亮度变化,初始值均为0。
[0060] S42:记I(x,y,t)为像素(x,y)在时刻t对应于HSI空间的亮度值,t与t-1时刻连续两帧图像对应像素的亮度差ΔI(x,y,t):
[0061] ΔI(x,y,t)=|I(x,y,t)-I(x,y,t-1)| (16)
[0062] S43:SUM(x,y,t)和SUM(x,y,t-1)分别表示像素(x,y)在时刻t和t-1时计数器的值。若相邻两帧图像对应位置像素的亮度值I(x,y,t)有变化,则t时刻像素(x,y)对应的计数器值SUM(x,y,t)累加1,否则加0。
[0063]
[0064] 式(17)中,T1是为消除系统噪声影响,而对于亮度变化ΔI(x,y,t)的范围设定的一个阈值。ΔI(x,y,t)超过阈值T1时,才认为相邻帧对应位置像素的亮度值I(x,y,t)有变化,其取值范围0到10。
[0065] S44:统计时刻t各候选火焰区域的像素是否满足像素闪烁条件:
[0066] (SUM(x,y,t)-SUM(x,y,t-p))>SUM0 (18)
[0067] 式(22)中,p是设定的时间步长,大小一般与视频帧采集速率相近,SUM0表示判决闪烁的阈值,其值与时间步长有关,当帧速率为常用25帧每秒时,其设定为10左右。
[0068] S45:将候选火焰区域中满足像素闪烁条件的像素总数记为NisO,刻区域前景点总数记为NiRECT,则火焰闪烁条件为:
[0069] Niso/NiRECT>ρ (19)
[0070] 其中,ρ为阈值,由实验测定,其取值范围0-1。当NisO与NiRECT的比值大于阈值ρ时,则判断该区域为检测的火焰区。
[0071] S46:若判断当前时刻视频图像存在火焰目标,则与静态检测结果相与,如判断存在火焰目标,则报警后读取新的帧图像,否则直接读取新一帧图像,再进入新一轮检测。
[0072] 离线训练火焰字典和SVM分类器具体采用如下方式:
[0073] 离线训练火焰字典和SVM分类器的过程依次为输入训练图像、提取Dense-SIFT特征、建立火焰字典、利用字典进行特征编码、池化获得图像全局表达及最后训练SVM分类器。具体实现步骤为:
[0074] (1)提取所有训练集图像中每张图像的Dense-SIFT特征,则训练图像集L可以表示成Dense-SIFT特征di的集合,即L={di,di∈I}。具体步骤为:
[0075] (1.1)在图像上设定密集采样网格,网格上的交叉点作为特征提取点。以8×8像素大小的窗口进行固定采样;
[0076] (1.2)以4像素的步长自左向右、从上到下在图像上提取SIFT特征描述子;
[0077] (2)通过K-均值聚类方法,用提取的Dense-SIFTT特征聚类分析,从而训练出火焰字典。具体步骤为:4
[0078] (2.1)从所有Dense-SIFT特征中,随机选取10个Dense-SIFT组成Dense-SIFT特征集;
[0079] (2.2)从Dense-SIFT特征集中任意选择400个Dense-SIFT特征作为初始聚类质心b。选择的样本数增大时,识别准确率会在一定范围内增高,但当选择的数目过大时,识别准确率不能明显提高,计算量却明显增大。本发明取400。
[0080] (2.3)对除聚类质心外的每个Dense-SIFT特征di,计算di到所有聚类质心bj的2
欧式距离Dij=||di-bj||,并把该Dense-SIFT特征di归到欧式距离Dij最短的质心所属的聚类Cj中,由此形成400个新聚类集C。
[0081]
[0082] 其中J为类别中心数目,H为训练Dense-SIFT特征个数,若第i个样本属于第j个4
类中心,则rij为1,否则为0。本发明即J为400,H为10 。
[0083] (2.4)更新聚类的质心。计算新聚类中所有Dense-SIFT的均值,并作为新聚类的质心:
[0084]
[0085] 其中|Cj|是聚类Cj中Dense-SIFT特征的个数。
[0086] (2.5)重复过程(2.3)和(2.4)直至收敛,收敛是指新聚类的质心趋于稳定。
[0087] (2.6)K-均值收敛时,可得到的每个聚类最终的质心bj,每个聚类质心即为视觉词,由此便得到由400个聚类质心组成整个火焰字典:
[0088] V={bj,j=1:400} (22)
[0089] (3)通过计算Dense-SIFT特征集与(2)中离线训练好的火焰字典的相关性,对前面的Dense-SIFT特征进行特征编码成特征向量表示。考虑到时效性要求,本发明编码方式采用Voting-Based Coding中的Hard Voting:
[0090]
[0091] 其中,v(i)为编码后Dense-SIFT的J维特征向量;
[0092] (4)将(3)中获得的特征向量取平均池化,以生成图像级别的全局表达。
[0093]
[0094] 式中,H为每一幅视频帧图像中的Dense-SIFT特征数目;vk即为第k个被特征编码的Dense-SIFT,vki表示vk的第i维,Zi为得到的特征向量,J等于K-均值的类中心数。
[0095] (5)训练支持向量机SVM分类器
[0096] 本发明采用径向基RBF核函数作为SVM的核函数,为火焰图片训练集训练SVM模型。RBF核函数公式为:
[0097]
[0098] 其中,zi、zj表示(4)中得到的图像表达;g为RBF的核参数。另外,训练SVM模型时还需输入惩罚因子C,C∈[0.1,1000],g∈[0.0001,20]。本实验用网格搜索法,设置惩罚因子C=2,稀疏参数g=4。
[0099] 本发明提出了一种基于Dense-SIFT字典学习的针对楼宇等大空间的高精度火灾火焰检测方法,优化了整个火焰识别的过程,减少了冗余判决,大大提高了检测准确率。首先构建了一套完整的、基于流程作业递进式的火焰检测方法,按照运动目标检测+可疑火焰颜色判据+Dense-SIFT字典学习形态特征判别+动态闪烁特征判断的流程,将动静检测融为一体,大大降低了误检率,提高了识别度,优化了整个火焰识别的过程。改进了运动目标检测算法中的视觉背景提取算法ViBe,基于空间像素分布的高相似性,运用尺度不变局部三值模式SILTP提取特征,在背景模型更新中将传统选择性更新和盲目更新背景合二为一。检测采取离线训练和在线检测结合的方式,通过离线训练火焰字典和SVM分类器,在线提取火焰形态的Dense-SIFT特征进行对比检测。试验了基于Dense-SIFT提取火焰形态特征的方法,兼顾实时性和准确性,采用Hard Voting编码,实验证明检测准确率高,实时性强,效果好。此外,还提出了火灾火焰检测中空域上形态特征检测和时域上闪烁特征检测结合的方法,实际运行时并行运行,增强实时性。附图说明
[0100] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0101] 图1火灾火焰检测流程图
[0102] 图2火灾火焰检测功能框图
[0103] 图3为视频图像火灾火焰检测结果示图。
[0104] 图4为视频图像疑似火焰检测结果示图。

具体实施方式

[0105] 为使本发明的技术方案和优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述:
[0106] 如图1所示的一种基于Dense-SIFT字典学习的高精度火灾火焰检测方法,根据现有技术存在准确率不高、实时性不好和大空间中检测效果不好的问题,本发明公开了一种基于Dense-SIFT字典学习的完整的、流程作业递进式的、动静结合式的针对楼宇等高大空间的高精度火灾火焰检测方法,包括以下步骤:
[0107] S1:对视频流进行运动检测获取运动目标:基于运动目标检测背景减除法的改进[3]型视觉背景提取(Visual Background extractor,ViBe) 算法,根据邻域像素间的空间分布相关性,运用尺度不变局部三值模式(Scale Invariant Local Ternary Pattern,SILTP)[4]
提取特征,对视频流进行运动检测获得运动目标;
[0108] S2:进行颜色检测,获取具有火焰特征的目标:对S1获得的运动目标的HSI颜色特征判断,获得具有火焰特征颜色的像素;
[0109] S3:对符合运动检测和颜色检测的像素进行空域上形态特征判别:提取S2获得的可能火焰目标像素区域的Dense-SIFT特征,利用离线训练好的火焰字典进行编码,使用支持向量机(Support Vector Machine,SVM)分类器判定;
[0110] S4:对上述获取的目标结合时域上闪烁特征综合判别:在S3进行空域形态特征检测的基础上,结合时域动态闪烁特征,计算火焰像素点的个数与设定的阈值比较,综合判定实现对火焰的检测。
[0111] 实验用视频部分是从美国国家标准技术研究院建筑与火灾研究实验室视频上下载(http://www.Fire.nist.gov/tree_fire.htm),部分是楼宇内外监控拍摄和自己拍摄,其余部分来自互联网络。采用一般CMOS 640×480摄像头,共获取了122个视频,包括102个火焰视频和20个疑似火焰视频,帧速率25帧/秒。训练离线字典、SVM分类器中,从视频中整理选取了1620帧图片,其中火焰图片10组1360张,疑似火焰图片5组260张。
[0112] S1中具体采用如下方式:
[0113] S11:取视频序列中第一帧图像,定义每个像素的红、绿、蓝分量分别为R、G、B,利用平均值法计算每个像素点(x,y)的灰度值I:
[0114]
[0115] S12:对每个像素点(x,y)的上下左右4个邻域像素,自右邻域像素,按逆时针方向[5]计算其SILTP特征 ,用SM(x,y)表示:
[0116]
[0117]
[0118] 式(2)、(3)中,Ik是4邻域像素的灰度值,Θ表示是将所有邻域的二进制值sτ(I,Ik)连接成字符串,τ为变化的阈值范围,其取值范围0-1。
[0119] S13:在以像素点(x,y)为中心,R为半径的邻域中,随机抽取N个样本,构建该像素背景模型样本M(x,y):
[0120] M(x,y)={SM1(x,y),SM2(x,y),···,SMN(x,y)} (4)
[0121] 本发明R的取值范围1-5;
[0122] S14:从第二帧开始,同S12过程,为每个像素点(x,y)建立一个样本S(x,y);
[0123] S15:定义Cn(x,y)为S(x,y)与背景模型样本M(x,y)中第n个样本SMn(x,y)的单个匹配度,n=1,2,…,N,其结果为所对应为异或结果为1的位的个数:
[0124]
[0125] S16:计算待测点x是否为前景点:
[0126]
[0127]
[0128]
[0129] 式(7)中,Bn(x,y)表示匹配度小于半径R的一个样本,Sum(x,y)表示匹配度小于R的所有样本的总和,Th为判别阈值,f(x,y)为像素(x,y)的分类结果。
[0130] S17:运动目标作为前景在一段持续的时间内会表现出相同的分类结果,对一段时间内m帧的f(x,y)进行判别和分析。设F(x,y)为像素点(x,y)在m帧中f(x,y)分类结果的集合:
[0131]
[0132] S18:运动像素判决的条件为:
[0133] F(x,y)≤Gh (10)
[0134] 当F(x,y)的值小于整体判别阀值Gh时,则确定为运动目标,否则为背景目标。本发明m取值范围与视频帧速率有关,一般接近于帧速率大小。
[0135] S19:实时更新背景模型:
[0136] (a)若点(x,y)被认为是背景点,给定更新频率ω,将S(x)按1/ω的概率依次替换被随机抽取的样本,再次按照1/ω的概率,随机选取x的R半径邻域的某一个像素点,将该邻域背景模型中随机选取的SMn(x,y)用S(x,y)替换,则更新了选定邻域的背景模型;
[0137] (b)对像素点进行统计,如果某个像素点连续M次被检测为前景,则将其更新为背景点,即按照1/ω的概率用随机选取的样本SMn(x,y)将其替代。本发明M取值范围10-30。
[0138] S2中具体采用如下方式:
[0139] S21:将上述获得的运动目标的RGB空间转换为HSI:
[0140]
[0141]
[0142] I的含义同前式(1);
[0143] S22:根据多次实验的结果,选定火焰HSI模型中H、S、I各自的检测范围值:
[0144]
[0145] S23:将S18中获得的运动像素根据S22中火焰HSI模型中H、S、I的值分别进行匹配比较,如在此范围内,则为运动的疑似火焰。
[0146] S24:视频图像中,只有满足颜色条件判决的运动区域才可能为火焰,但火焰的底部和内部在一些瞬间处于静止的状态,无法将它们作为动目标检测出来。所以,在提取的火焰动态目标周围,采用基于灰度差的区域生长的方法,对S23中判别为动态疑似火焰的区域,以其区域的平均灰度值与相邻域像素灰度值比较,如果灰度差小于阈值T,则合并至可疑火焰像素。
[0147] S3中具体采用如下方式:
[0148] S31:提取S24中可能火焰目标的Dense-SIFT特征,则此图像集U可以表示成Dense-SIFT特征bi的集合,即U={bi,bi∈U}。具体步骤为:
[0149] (1)在图像上设定密集采样网格,网格上的交叉点作为特征提取点。以8×8像素大小的窗口进行固定采样;
[0150] (2)以4像素的步长自左向右、从上到下在图像上提取SIFT特征描述子;
[0151] S32:根据已离线训练好的火焰字典(训练过程见6),对S31中的Dense-SIFT特征进行特征编码。
[0152] 编码方式主要有Voting-Based Coding,Saliency-Based Coding和Fisher [6]Coding等 。其中Fisher Coding效果最好,但时间复杂度较高。考虑到时效性要求,本发明编码方式采用Voting-Based Coding中的Hard Voting:
[0153]
[0154] 其中,bj为不同的K-均值聚类中心,J是K-均值聚类的类中心数目,v(i)为编码后Dense-SIFT的J维特征向量;
[0155] S33:将S32中中获得的特征向量取平均池化,以生成图像级别的全局表达。
[0156]
[0157] 式中,H为每一幅视频帧图像中的Dense-SIFT特征数目;vk即为第k个被特征编码的Dense-SIFT,vki表示vk的第i维,Zi为得到的特征向量,J等于K-均值的类中心数。
[0158] S34:将S33中得到的特征向量输入已经离线训练好的SVM分类器(训练过程见6),从而判断该视频帧图像是否包含火焰。
[0159] S4中具体采用如下方式:
[0160] 火焰燃烧时,目标轮廓的色度或亮度呈现快速变化,直接体现在像素的颜色分量变化中。因此,火焰的频闪特征可以通过区域目标像素的色度变化来表征。
[0161] S41:在视频第一帧时,建立与视频图像像素大小相同的计数矩阵SUM,用于记录视频序列相邻两帧间像素的亮度变化,初始值均为0。
[0162] S42:记I(x,y,t)为像素(x,y)在时刻t对应于HSI空间的亮度值,t与t-1时刻连续两帧图像对应像素的亮度差ΔI(x,y,t):
[0163] ΔI(x,y,t)=|I(x,y,t)-I(x,y,t-1)| (16)
[0164] S43:SUM(x,y,t)和SUM(x,y,t-1)分别表示像素(x,y)在时刻t和t-1时计数器的值。若相邻两帧图像对应位置像素的亮度值I(x,y,t)有变化,则t时刻像素(x,y)对应的计数器值SUM(x,y,t)累加1,否则加0。
[0165]
[0166] 式(17)中,T1是为消除系统噪声影响,而对于亮度变化ΔI(x,y,t)的范围设定的一个阈值。ΔI(x,y,t)超过阈值T1时,才认为相邻帧对应位置像素的亮度值I(x,y,t)有变化,其取值范围0到10。
[0167] S44:统计时刻t各候选火焰区域的像素是否满足像素闪烁条件[7]:
[0168] (SUM(x,y,t)-SUM(x,y,t-p))>SUM0 (18)
[0169] 式(22)中,p是设定的时间步长,大小一般与视频帧采集速率相近,SUM0表示判决闪烁的阈值,其值与时间步长有关,当帧速率为常用25帧每秒时,其设定为10左右。
[0170] S45:将候选火焰区域中满足像素闪烁条件的像素总数记为NisO,刻区域前景点总数记为NiRECT,则火焰闪烁条件为:
[0171] Niso/NiRECT>ρ (19)
[0172] 其中,ρ为阈值,由实验测定,其取值范围0-1。当NisO与NiRECT的比值大于阈值ρ时,则判断该区域为检测的火焰区。
[0173] S46:若判断当前时刻视频图像存在火焰目标,则与静态检测结果相与,如判断存在火焰目标,则报警后读取新的帧图像,否则直接读取新一帧图像,再进入新一轮检测。
[0174] 离线训练火焰字典和SVM分类器具体采用如下方式:
[0175] 离线训练火焰字典和SVM分类器的过程依次为输入训练图像、提取Dense-SIFT特征、建立火焰字典、利用字典进行特征编码、池化获得图像全局表达及最后训练SVM分类器。具体实现步骤为:
[0176] (1)提取所有训练集图像中每张图像的Dense-SIFT特征,则训练图像集L可以表示成Dense-SIFT特征di的集合,即L={di,di∈I}。具体步骤为:
[0177] (1.1)在图像上设定密集采样网格,网格上的交叉点作为特征提取点。以8×8像素大小的窗口进行固定采样;
[0178] (1.2)以4像素的步长自左向右、从上到下在图像上提取SIFT特征描述子;
[0179] (2)通过K-均值聚类方法,用提取的Dense-SIFTT特征聚类分析,从而训练出火焰字典。具体步骤为:
[0180] (2.1)从所有Dense-SIFT特征中,随机选取104个Dense-SIFT组成Dense-SIFT特征集;
[0181] (2.2)从Dense-SIFT特征集中任意选择400个Dense-SIFT特征作为初始聚类质心b。选择的样本数增大时,识别准确率会在一定范围内增高,但当选择的数目过大时,识别准确率不能明显提高,计算量却明显增大。本发明取400。
[0182] (2.3)对除聚类质心外的每个Dense-SIFT特征di,计算di到所有聚类质心bj的2
欧式距离Dij=||di-bj||,并把该Dense-SIFT特征di归到欧式距离Dij最短的质心所属的聚类Cj中,由此形成400个新聚类集C。
[0183]
[0184] 其中J为类别中心数目,H为训练Dense-SIFT特征个数,若第i个样本属于第j个4
类中心,则rij为1,否则为0。本发明即J为400,H为10 。
[0185] (2.4)更新聚类的质心。计算新聚类中所有Dense-SIFT的均值,并作为新聚类的质心:
[0186]
[0187] 其中|Cj|是聚类Cj中Dense-SIFT特征的个数。
[0188] (2.5)重复过程(2.3)和(2.4)直至收敛,收敛是指新聚类的质心趋于稳定。
[0189] (2.6)K-均值收敛时,可得到的每个聚类最终的质心bj,每个聚类质心即为视觉词,由此便得到由400个聚类质心组成整个火焰字典:
[0190] V={bj,j=1:400} (22)
[0191] (3)通过计算Dense-SIFT特征集与(2)中离线训练好的火焰字典的相关性,对前面的Dense-SIFT特征进行特征编码成特征向量表示。考虑到时效性要求,本发明编码方式采用Voting-Based Coding中的Hard Voting:
[0192]
[0193] 其中,v(i)为编码后Dense-SIFT的J维特征向量;
[0194] (4)将(3)中获得的特征向量取平均池化,以生成图像级别的全局表达。
[0195]
[0196] 式中,H为每一幅视频帧图像中的Dense-SIFT特征数目;vk即为第k个被特征编码的Dense-SIFT,vki表示vk的第i维,Zi为得到的特征向量,J等于K-均值的类中心数。
[0197] (5)训练支持向量机SVM分类器
[0198] 本发明采用径向基RBF核函数作为SVM的核函数,为火焰图片训练集训练SVM模型。RBF核函数公式为:
[0199]
[0200] 其中,zi、zj表示(4)中得到的图像表达;g为RBF的核参数。另外,训练SVM模型时还需输入惩罚因子C,C∈[0.1,1000],g∈[0.0001,20]。本实验用网格搜索法,设置惩罚因子C=2,稀疏参数g=4。
[0201] 本发明的有益效果:
[0202] 为了验证本发明方法的有效性,搜寻了视较开阔、距离较远、环境复杂的楼宇等高大空间火灾场景作为实验素材,就10组不同的火焰场景分别进行了120次实验测试。按照图1所示的流程进行火焰识别,识别步骤分别为运动目标检测、可疑火焰检测和火焰特征识别等。
[0203] 实验反馈的结果中,如果有显示火焰颜色则表示识别火焰成功,识别结果如图3所示。从中可以看出本文算法能够精准识别面积较小的火焰。
[0204] 此外,为了证明本算法对于复杂火焰相似物具有很强的辨识能,特进行了对疑似火焰检测的对比实验。图4是实验中身着火焰黄色衣服的逃生人员在运动状态下被检测系统识别。第一幅图为原始检测视频帧图片,第二张图片为运动目标识别和颜色识别之后的结果,第三张则为火焰特征识别效果。最终识别结果为无火灾,通过类似30组实验,表明了本算法具有非常优良的误检漏检改善效果。
[0205] 对比典型火焰检测算法[8]、[9]单特征检测和[10]、[11]多特征检测及本文的检测算法,特分别进行30组实验,对多运动目标场景下的楼宇等大空间火灾进行检测,得到了各种算法的识别准确率如表1所示。
[0206] 表1各火焰检测算法识别准确率
[0207]
[0208] 从表1可以看出,在复杂环境的火焰检测中,基于颜色特征识别的耿庆田等算法识别率只有66%,基于能量识别的Toreyin B U算法只有88%。从理论上来看,这些结果又是显然的,单特征方法并未全面描绘火焰的多维特征。同为多特征检测,杨亚洁、荣建忠的算法检测率93%左右,而本算法识别度达到了97.2%。本文使用了流程化的识别手段,将运动目标识别、可疑火焰识别和特征提取融为一体,必将大大降低误检率,提高识别度。因此,相对于近年来的一些经典火焰识别算法,所提算法具有了更高的识别准确率,适合在复杂楼宇等大空间监控系统中使用。
[0209] 本发明针对楼宇等高大空间火灾火焰检测,在实现高精度检测的基础上,也兼顾了实时高效要求,因此本发明具有广泛的应用价值和前景。
[0210] 参考文献
[0211] [1]Lazebnik S,Schmid C,Ponce J.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories[C]//Computer Vision and Pattern Recognition,2006IEEE Computer Society Conference on.IEEE,2006,2:2169-2178.
[0212] [2]马宗方,程咏梅,潘泉等.基于颜色模型和稀疏表示的图像型火焰探测[J].光子学报,2011,40(8):1220-1224.
[0213] [3]Barnich O,Van Droogenbroeck M.ViBe:A universal background subtraction algorithm for video sequences[J].Image Processing,IEEE Transactions on,2011,20(6):1709-1724.
[0214] [4]Liao S,Zhao G,Kellokumpu V,et al.Modeling pixel process with scale invariant local patterns for background subtraction in complex scenes[C]//Computer Vision and Pattern Recognition (CVPR),2010IEEE Conference on.IEEE,2010:1301-1306.
[0215] [5]杨国亮,周丹,张进辉.基于SILTP纹理信息的运动目标检测算法[J].计算机科学,2014,41(4).
[0216] [6]Huang Y,Wu Z,Wang L,et al.Feature coding in image classification:A comprehensive study[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2014,36(3):493-506.
[0217] [7]Juan Chen,Yaping He,Jian Wang.Multi-feature fusion based fast video flame detection,Building and Environment[J],2010:1113-1122.
[0218] [8]耿庆田,于繁华,赵宏伟等.基于颜色特征的火焰检测新算法[J].吉林大学学报(工学版),2014,6:039.
[0219] [9]Toreyin B U,Dedeoglu Y,Cetin A E.Contour based smoke detection in video using wavelets[C]//European Signal Processing Conference.2006:1-5.[0220] [10]荣建忠,姚卫,高伟,姚嘉杰,陈娟,汪箭.基于多特征融合技术的火焰视频探测方法[J].燃烧科学与技术,2013.06:227-232.
[0221] [11]杨亚洁,薛静,乔鸿海,刘宇.基于多特征匹配的视频图像火灾火焰检测方法研究[J].电子设计工程.2014.02:186-189.
[0222] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈