专利汇可以提供手势识别方法、装置、终端设备及计算机可读存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 手势识别 方法、装置、终端设备及计算机可读存储介质,本发明通过先对图像进行肤色分割,然后将肤色分割后的彩色图像转化为灰度图像,使用 帧 差法对灰度图进行处理来获取手势目标的运动信息,使用自适应的高效的图像二值化 算法 对差分图像进行二值化处理,然后进行形态学处理;使用Camshift算法结合上一步分割出来的图像实现对手势目标的 跟踪 ;对Camshift算法得到的点序列进行特征提取,然后使用隐 马 尔可夫模型进行手势目标的识别。在发明中,结合了中值滤波算法、帧差法、图像二值化算法、Camshift算法等算法,并结合肤色检测改善了帧差法,通过先分割后追踪提高了追踪效果,简单快速有效地从追踪结果提取了特征,实现了图像手势的准确识别,识别效果佳。,下面是手势识别方法、装置、终端设备及计算机可读存储介质专利的具体信息内容。
1.一种手势识别方法,其特征在于,包括:
采用中值滤波算法来对图像进行平滑处理,以消除噪音;
对消除噪音后的图像进行肤色分割,将肤色分割后的彩色图像转化为灰度图像,使用帧差法对灰度图进行处理来获取手势目标的运动信息,并使用图像二值化算法对差分图像进行二值化处理,然后进行形态学处理,以实现对手势目标的检测与分割;
使用Camshift算法结合上一步分割出来的图像实现对手势目标的跟踪;
对Camshift算法得到的点序列进行特征提取,然后使用隐马尔可夫模型进行手势目标的识别。
2.如权利要求1所述的手势识别方法,其特征在于,所述采用中值滤波算法来对图像进行平滑处理包括:
设置一个N乘以N的采样窗口来对图像的每个像素进行采样,N为正奇数;
计算窗口内的中值,并将窗口中间的值用中值替代。
3.如权利要求1或2所述的手势识别方法,其特征在于,所述采用中值滤波算法来对图像进行平滑处理中的图像为静态图像或视频帧图像。
4.如权利要求3所述的手势识别方法,其特征在于,所述对消除噪音后的图像进行肤色分割,将肤色分割后的彩色图像转化为灰度图像,使用帧差法对灰度图进行处理来获取手势目标的运动信息,并使用图像二值化算法对差分图像进行二值化处理,然后进行形态学处理包括:
先对图像进行肤色分割,肤色部分应该满足如下条件:R>95,G>40,B>20,|R-G|>15,R>G,R>B,MAX(R,G,B)-MIN(R,G,B>15),不满足条件的将R,G,B的值都设置为0;
然后将肤色分割后的彩色图像转化为灰度图,每个像素的灰度值Y=0.3R+0.59G+
0.11B;
使用帧差法计算差分图像,Gi(x,y)=|Yi+1(x,y)-Yi(x,y)|;
设置一个阈值Th将图像分成两组,像素值大于Th值的为前景,小于Th值的为背景;设图像G(x,y),Th为设置的阈值;前景像素点占图像所有像素点的比例为w0,灰度的平均值为μ0;
背景像素点占图像所有点的比例为w1,灰度的平均值为μ1;假设图像的大小为M×N,灰度值大于Th的个数记为N1,小于Th的个数记为N0,图像的灰度均值记为μ,背景和前景的方差记为g,计算步骤如下:
w0=N0/M×N
w1=N1/M×N
N0+N1=M×N
w0+w1=1
μ=w0×μ0+w1×μ1
g=w0(μ0-μ)2+w1(μ1-μ)2
代入得到:
g=w0w1(μ0-μ1)2
阈值Th的取值范围为0~255,当前景和背景之间的方差最大时,所使用的阈值就是性能最好的阈值。使用最佳阈值进行二值化操作,对小于阈值的灰度值设置为0,大于阈值的灰度值设置为1;
对二值化得到的图像进行形态学处理,先进行腐蚀操作,设二值图像为M,S代表结构元素,表达式为 然后进行膨胀操作,表达式为
5.如权利要求4所述的手势识别方法,其特征在于,所述使用Camshift算法结合上一步分割出来的图像实现对手势目标的跟踪,包括如下步骤:
从得到的二值化图像中计算最大连通区域,并找到最小外接矩形;
将最小外接矩形作为作为初始搜索窗口,在经过中值滤波的原图进行操作,计算:
将图像从RGB颜色空间转化到HSV颜色空间,提取出H分量;
计算目标区域H分量的颜色直方图,再根据颜色直方图计算每个H值在目标区域出现的概率在原图像中将像素值替换成概率,不在目标区域的像素点概率值设置为0;
对替换后的图像在窗口内计算0阶矩 1阶矩 和
2阶矩 和
然后计算新的质心xc=M10/M00,yc=M01/M00和搜索窗口宽度 以及长度l=
1.2s;
移动中心到该质心处,计算移动距离,若移动距离小于一定的阈值或者循环次数大于一定值,循环结束;若没有达到阈值,继续进行操作;
将最终得到的质心作为序列当中的其中一个观测值,将得到的搜索窗口作为下一帧搜索窗口的输入,继续进行,直到视频帧被读完。
6.如权利要求1所述的手势识别方法,其特征在于,所述对Camshift算法得到的点序列进行特征提取,然后使用隐马尔可夫模型进行手势目标的识别包括:
对所有Camshift得到的点序列进行遍历,每两个点进行计算,将前后两点作为起点和终点作向量,根据向量的角度大小分成[0°,45°],[45°,90°],[90°,135°],[135°,180°],[180°,225°],[225°,270°],[270°,315°],[315°,360°],每个区间分别取值2,1,8,7,6,5,
4,3作为特征值;
将所有得到的特征值序列作为训练集放入隐马尔可夫模型使用前向后向算法进行训练,得到每个手势对应的隐马尔可夫模型;最后得到的各个手势的隐马尔可夫模型用于视频手势的识别,将需要识别的视频使用上述的方法进行手势检测,分割,跟踪以及特征提取然后将特征输入到隐马尔科夫模型使用前向算法即可识别。
7.一种手势识别装置,其特征在于,包括:
噪音消除模块,其采用中值滤波算法来对图像进行平滑处理,以消除噪音;
检测与分割模块,其用于对消除噪音后的图像进行肤色分割,将肤色分割后的彩色图像转化为灰度图像,使用帧差法对灰度图进行处理来获取手势目标的运动信息,并使用图像二值化算法对差分图像进行二值化处理,然后进行形态学处理,以实现对手势目标的检测与分割;
跟踪模块,其使用Camshift算法结合上一步分割出来的图像实现对手势目标的跟踪;
识别模块,其用于对Camshift算法得到的点序列进行特征提取,然后使用隐马尔可夫模型进行手势目标的识别。
8.如权利要求7所述的手势识别装置,其特征在于,所述采用中值滤波算法来对图像进行平滑处理中的图像为视频帧。
9.一种手势识别终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6任一所述的方法步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一所述的方法步骤。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于人工智能控制的物联网搜索系统及其搜索方法 | 2020-05-08 | 169 |
一种EtherCAT总线二轴机械臂控制系统 | 2020-05-13 | 408 |
光学照明器模块 | 2020-05-11 | 693 |
手势识别方法、装置、终端设备及计算机可读存储介质 | 2020-05-11 | 760 |
一种智能增压燃气热水器及控制方法 | 2020-05-12 | 16 |
信息处理设备和信息处理方法 | 2020-05-12 | 524 |
一种基于计算机视觉的手势识别方法及手势识别手环 | 2020-05-12 | 157 |
一种基于梯度提升决策树的识别系统、装置和方法 | 2020-05-11 | 383 |
一种基于手势识别的全息投影装置的工作方法 | 2020-05-12 | 850 |
一种多功能云端服务家居机器人 | 2020-05-12 | 305 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。