首页 / 专利库 / 人工智能 / 语义概念 / 基于语义概率网络的手势识别方法

基于语义概率网络的手势识别方法

阅读:527发布:2020-05-11

专利汇可以提供基于语义概率网络的手势识别方法专利检索,专利查询,专利分析的服务。并且本 申请 公开了一种基于语义概率网络的 手势识别 方法,用于在使用语义概率网络的视频序列中进行均匀识别,该方法涉及使用预定义的领域本体,将事件和场景描述为简单概念和变量的层次结构分解他们之间的关系,然后,本体用于自动 贝叶斯网络 生成,这使我们能推断观察场景中的事件和场景,输入变量的转换图用于预测事件和方案,快速且稳健,提高收拾识别的效率及准确性。,下面是基于语义概率网络的手势识别方法专利的具体信息内容。

1.一种基于语义概率网络的手势识别方法,包括:
将预设阶段中视频识别出的一组图像手势作为识别事件,再对所述识别事件采用一组分层的本体概念来构建领域本体,计算出各领域本体中的变量和状态;
基于所述领域本体,以各个领域本体及其变量和状态进行聚合作为组成节点构建贝叶斯网络,贝叶斯网络的连通矩阵定义各组成节点之间的条件依赖关系,构成预设的手势识别模型;
将视频抓取到的手势图像输入所述手势识别模型,由所述手势识别模型对所输入的图像进行识别分类,并确定输出最终的手势识别结果。
2.根据权利要求1所述的基于语义概率网络的手势识别方法,其特征在于,对所述识别事件采用一组分层的本体概念来构建领域本体,计算出各领域本体中的变量和状态,包括:
领域本体中的每个识别事件通过聚合与其他识别事件分组,构成对应于各识别事件的变量数据集、状态数据集,其中,变量数据集中的变量为从观察到的识别事件计算出的可视描述符派生的属性,状态数据集中的状态为所述识别事件的聚合变量。
3.根据权利要求2所述的基于语义概率网络的手势识别方法,其特征在于,对所述识别事件采用一组分层的本体概念来构建领域本体时,还对若干识别事件进行聚合分组构成事件数据集,事件数据集中的事件数据为一组图像手势,
4.根据权利要求2或3所述的基于语义概率网络的手势识别方法,其特征在于,对所述识别事件采用一组分层的本体概念来构建领域本体时,还对若干识别事件进行聚合分组构成场景数据集,场景数据集中的场景为与识别事件同时并行发生的多组识别事件。
5.根据权利要求1所述的基于语义概率网络的手势识别方法,其特征在于,贝叶斯网络的连通矩阵定义各组成节点之间的条件依赖关系,构成预设的手势识别模型,包括:
通过所述识别事件的开始和结束的本体关系来建立贝叶斯网络中各组成节点之间的连接,如考虑的关系为真则使用其来连接相应的贝叶斯网络的组成节点。
6.根据权利要求5所述的基于语义概率网络的手势识别方法,其特征在于,基于各识别事件之间的关系的似然性和连接强度值计算所述贝叶斯网络的各组成节点的权重。
7.根据权利要求6所述的基于语义概率网络的手势识别方法,其特征在于,基于各识别事件之间的关系的似然性和连接强度值计算所述贝叶斯网络的各组成节点的权重,包括:
从观察到的识别事件计算对应图像中的可视描述符派生的属性,即为输入变量,设定输入变量所对应的的似然等级分别为低、中、高可能性等级,使用渐变的可能性等级,同时结合单个识别事件、一组识别事件以及整体场景下的连接强度,计算贝叶斯网络中组成节点的权重。
8.一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。
9.一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如权利要求1-7中任一项所述的方法。
10.一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行实现如权利要求1-7中任一项所述的方法。

说明书全文

基于语义概率网络的手势识别方法

技术领域

[0001] 本申请涉及视觉识别技术领域,特别是涉及一种基于语义概率网络的手势识别方法。

背景技术

[0002] 现实生活中,计算机视觉是指使用普通的摄像头采集动态手势图像或者视频,然后采用计算机针对动态手势的识别算法来识别动态手势信息,并转化成相对应机器的指令。这种方法的特点是输入设备便宜,并且对人手不做其余的附加限制,这样就会使计算机设备与人的交互更加的趋于自然化。
[0003] 基于计算机视觉的手势识别系统除了采用普通的摄像机外,也会采用一些专业的辅助设备,例如使用红外摄像头来解决光照不足的问题,采用专用的摄像机Strucetured Light或则TOF(Time of Flight)来解决深度感知识别的问题。这种深度摄像机可以对拍摄到的图像产生自己的输入描述方式,并且可以复现采集到的图像的原貌三维图像,其功能强大可以应用在生产生活的各个方面,极大的促进了相关应用领域的发展,同时该种摄像机的一个应用就是在手势识别领域,手势检测分割所需要的理论技术,首先是肤色分割技术,即从一幅图片中分割提取出肤色区域作为后续的处理区域。肤色分割的原理是:根据皮肤颜色特性,设定一个阈值,满足该阈值的肤色区域即可判别为肤色区域。阈值法的关键点是需要选择一个合适的颜色空间表示形式,合适的聚类范围加上合适的阈值才能更好的分割目标区域。目前常用的颜色空间模型主要有RGB 颜色空间、HSV颜色空间、YCb Cr颜色空间。把一幅图像定义成一个函数f(x,y),其中以f(x,y)唯一确定的一个点的f(x,y)值,称为该点的灰度或则强度。当x,y 与幅值f(x,y)为有限的离散数值时,称该图像为数字图像。
[0004] 但是做存在的问题在于,动态手势跟踪方面算法跟踪运动目标时循环次数过多,非动态手势肤色干扰大,算法计算量复杂无法满足实时性的需求。发明内容
[0005] 本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
[0006] 根据本申请的一个方面,提供了一种基于语义概率网络的手势识别方法,包括:
[0007] 将预设阶段中视频识别出的一组图像手势作为识别事件,再对所述识别事件采用一组分层的本体概念来构建领域本体,计算出各领域本体中的变量和状态;
[0008] 基于所述领域本体,以各个领域本体及其变量和状态进行聚合作为组成节点构建贝叶斯网络,贝叶斯网络的连通矩阵定义各组成节点之间的条件依赖关系,构成预设的手势识别模型;
[0009] 将视频抓取到的手势图像输入所述手势识别模型,由所述手势识别模型对所输入的图像进行识别分类,并确定输出最终的手势识别结果。
[0010] 优选地,对所述识别事件采用一组分层的本体概念来构建领域本体,计算出各领域本体中的变量和状态,包括:
[0011] 领域本体中的每个识别事件通过聚合与其他识别事件分组,构成对应于各识别事件的变量数据集、状态数据集,其中,变量数据集中的变量为从观察到的识别事件计算出的可视描述符派生的属性,状态数据集中的状态为所述识别事件的聚合变量。
[0012] 优选地,对所述识别事件采用一组分层的本体概念来构建领域本体时,还对若干识别事件进行聚合分组构成事件数据集,事件数据集中的事件数据为一组图像手势,[0013] 优选地,对所述识别事件采用一组分层的本体概念来构建领域本体时,还对若干识别事件进行聚合分组构成场景数据集,场景数据集中的场景为与识别事件同时并行发生的多组识别事件。
[0014] 优选地,贝叶斯网络的连通矩阵定义各组成节点之间的条件依赖关系,构成预设的手势识别模型,包括:
[0015] 通过所述识别事件的开始和结束的本体关系来建立贝叶斯网络中各组成节点之间的连接,如考虑的关系为真则使用其来连接相应的贝叶斯网络的组成节点。
[0016] 优选地,基于各识别事件之间的关系的似然性和连接强度值计算所述贝叶斯网络的各组成节点的权重。
[0017] 优选地,基于各识别事件之间的关系的似然性和连接强度值计算所述贝叶斯网络的各组成节点的权重,包括:
[0018] 从观察到的识别事件计算对应图像中的可视描述符派生的属性,即为输入变量,设定输入变量所对应的的似然等级分别为低、中、高可能性等级,使用渐变的可能性等级,同时结合单个识别事件、一组识别事件以及整体场景下的连接强度,计算贝叶斯网络中组成节点的权重。
[0019] 根据本申请的又一个方面,提供了一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的方法。
[0020] 根据本申请的又一个方面,提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如上所述的方法。
[0021] 根据本申请的又一个方面,提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行如上所述的方法。
[0022] 本申请所提供的技术方案,实现基于语义概率网络的手势识别方法,用于在使用语义概率网络的视频序列中进行均匀识别,该方法涉及使用预定义的域本体,将事件和场景描述为简单概念和变量的层次结构分解他们之间的关系,然后,本体用于自动贝叶斯网络生成,这使我们能推断观察场景中的事件和场景,输入变量的转换图用于预测事件和方案,快速且稳健,提高收拾识别的效率及准确性。
[0023] 根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。

附图说明

[0024] 后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
[0025] 图1是根据本申请一个实施例的基于语义概率网络的手势识别方法流程图
[0026] 图2是根据本申请另一个实施例的计算设备结构图;
[0027] 图3是根据本申请另一个实施例的计算机可读存储介质结构图。

具体实施方式

[0028] 图1是根据本申请一个实施例的基于语义概率网络的手势识别方法流程图。参见图1,该基于语义概率网络的手势识别方法,包括:
[0029] 101:将预设阶段中视频识别出的一组图像手势作为识别事件,再对所述识别事件采用一组分层的本体概念来构建领域本体,计算出各领域本体中的变量和状态;
[0030] 102:基于所述领域本体,以各个领域本体及其变量和状态进行聚合作为组成节点构建贝叶斯网络,贝叶斯网络的连通矩阵定义各组成节点之间的条件依赖关系,构成预设的手势识别模型;
[0031] 103:将视频抓取到的手势图像输入所述手势识别模型,由所述手势识别模型对所输入的图像进行识别分类,并确定输出最终的手势识别结果。
[0032] 优选地,对所述识别事件采用一组分层的本体概念来构建领域本体,计算出各领域本体中的变量和状态,包括:
[0033] 领域本体中的每个识别事件通过聚合与其他识别事件分组,构成对应于各识别事件的变量数据集、状态数据集、事件数据集和场景数据集,其中,变量数据集中的变量为从观察到的识别事件计算出的可视描述符派生的属性,状态数据集中的状态为所述识别事件的聚合变量,事件数据集中的事件数据为一组图像手势,场景数据集中的场景为与识别事件同时并行发生的多组识别事件。
[0034] 对应于前述的分层的本体概念,第一层包含变量,这些变量是从观察到的场景计算出的可视描述符派生的属性,这些表示贝叶斯网络的输入变量可以采用的可能状态和值。领域本体的下一层由一组状态组成,其中被观察对象可以找到自己并且主要用于聚合变量层的输出,以便简化本体并减少连接量。领域本体的第三层保留用于场景中发生的一组事件,通过连接到各个“事件”,将领域本体中的一组图像被分组为一个事件。在这种情况下,当场景包含具有更复杂行为的对象时,第四层则可用于描述整体场景,其由同时发生的一组事件组成。
[0035] 优选地,贝叶斯网络的连通矩阵定义各组成节点之间的条件依赖关系,构成预设的手势识别模型,包括:
[0036] 通过所述识别事件的开始和结束的本体关系来建立贝叶斯网络中各组成节点之间的连接,如考虑的关系为真则使用其来连接相应的贝叶斯网络的组成节点。
[0037] 优选地,基于各识别事件之间的关系的似然性和连接强度值计算所述贝叶斯网络的各组成节点的权重。
[0038] 优选地,基于各识别事件之间的关系的似然性和连接强度值计算所述贝叶斯网络的各组成节点的权重,包括:
[0039] 从观察到的识别事件计算对应图像中的可视描述符派生的属性,即为输入变量,设定输入变量所对应的的似然等级分别为低、中、高可能性等级,使用渐变的可能性等级,同时结合单个识别事件、一组识别事件以及整体场景下的连接强度,计算贝叶斯网络中组成节点的权重。
[0040] 根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
[0041] 本申请实施例还提供了一种计算设备,参照图2,该计算设备包括存储器 1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。
[0042] 本申请实施例还提供了一种计算机可读存储介质。参照图3,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。
[0043] 本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。
[0044] 在上述实施例中,可以全部或部分地通过软件硬件固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
[0045] 专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。
专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
[0046] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
[0047] 以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈