首页 / 专利库 / 变压器和转换设备 / 传感器 / 一种基于信息熵的人体活动端点检测方法

一种基于信息熵的人体活动端点检测方法

阅读:560发布:2022-10-02

专利汇可以提供一种基于信息熵的人体活动端点检测方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于信息熵的人体活动端点检测方法,其特征在于包括以下步骤:1)将 传感器 信号 作为信源以流数据的形式作为信号输入;2)通过计算 输入信号 的信息熵描述信源所承载的信息量;3)设置信号由低熵环境中过渡到某设定熵值的这一过程;4)利用联合熵的特征提取出端点,并利用端点的变化特点将其识别出来,识别出的这一端点作为人体活动的端点。本发明可在大规模人体活动数据中将活动段端点在 服务器 端细粒度地检测出来,从而提高人体行为识别准确率。,下面是一种基于信息熵的人体活动端点检测方法专利的具体信息内容。

1.一种基于信息熵的人体活动端点检测方法,其特征在于包括以下步骤:1)将传感器信号作为信源以流数据的形式作为信号输入;2)通过计算输入信号的信息熵描述信源所承载的信息量;3)设置信号由低熵环境中过渡到Hk熵值的这一过程;4)利用联合熵的特征提取出端点,并利用端点的变化特点将其识别出来,识别出的这一端点作为人体活动的端点,具体方法如下:
4.1)测定信号在传感器无有效加速度施加时的熵基准线;
4.2)取信号在无有效加速度施加状态时的若干,帧数为n,那么有传感器常态静止下的联合熵:
该值描述了在静止段的平均联合熵;
4.3)由于当时间轴从静止段经过端点进入到活动段的同时,信号联合熵具有较大的跃升变化,因此需要根据大量的实验确定Hk以作为检测人体活动端点的针对加速度信号联合熵的阈值
4.4)将测定信号分为静止段、过渡段和活动段三种类型;
4.5)统计三维信号中每一个分量轴上的最大值与最小值:Max和Min;
4.6)针对信号计算信源的联合熵:
4.7)检测每一帧信号计算所得联合熵,与经验阈值Hk做比较,当Hi大于等于Hk时,对该帧进行标记,并作为起始点,同时判定信号进入活动段,也即标记人体活动的端点;
4.8)继续取下一帧信号计算所得联合熵,与经验阈值Hk做比较,当Hi小于等于Hk时,对该帧进行标记,并作为终点。
2.如权利要求1所述的一种基于信息熵的人体活动端点检测方法,其特征在于在步骤
7)中,当识别出人体活动的端点时,需要设定最短活动段的时间限度,在被标记为起始点后信号联合熵的值在少于最短活动段时间内回落到阈值Hk以下,则判定该段为噪声。

说明书全文

一种基于信息熵的人体活动端点检测方法

技术领域

[0001] 本发明涉及一种基于信息熵的人体活动端点检测方法,属于信号处理与模式识别技术领域。

背景技术

[0002] 加速传感器信息作为人体活动信息的重要组成部分,其携带的人体步态特征、行为模式等信息对于人体活动语义理解具有至关重要重要的意义。人体活动数据是用户长期的不间断的传感器数据流,数据中缺乏必要的基准点,对此需要对数据流中人体活动的起始点做标定,而标定的前提条件是对人体行为活动的端点进行准确检测。对于智能移动终端来说,大部分时间为相对静止状态,当加速度传感器数据作为一种流式数据进行处理时,单纯的加窗识别算法对其处理显得捉襟见肘。由于流数据具有庞大的数据量和时间跨度,必须对其进行适当地处理才能够做进一步的研究。而目前对于利用加速度对人体行为方面的研究主要局限于在特定的窗口内对行为活动进行识别,恰恰忽略了移动设备离开人体或人体在静止时的检测。如果对长时间连续数据进行分析,其中必将包含大量设备离体和人体相对静止时的传感器数据,处理数据时将在无意义数据上耗费大量的计算,导致资源的浪费。

发明内容

[0003] 本发明的目的是提供一种基于信息熵的人体活动端点检测方法,可在大规模人体活动数据中将活动段端点在服务器端细粒度地检测出来,从而提高人体行为识别准确率。
[0004] 本发明的技术方案是:一种基于信息熵的人体活动端点检测方法,包括以下步骤:1)将传感器信号作为信源以流数据的形式作为信号输入;2)通过计算输入信号的信息熵描述信源所承载的信息量;3)设置信号由低熵环境中过渡到某设定熵值的这一过程;4)利用联合熵的特征提取出端点,并利用端点的变化特点将其识别出来,识别出的这一端点作为人体活动的端点。
[0005] 所述步骤4)的具体方法如下:
[0006] 1)测定信号在传感器无有效加速度施加时的熵基准线;
[0007] 2)取信号在无有效加速度施加状态时的若干,帧数为n,那么有传感器常态静止下的联合熵:
[0008]
[0009] 该值描述了在静止段的平均联合熵;
[0010] 3)由于当时间轴从静止段经过端点进入到活动段的同时,信号联合熵具有较大的跃升变化,因此需要根据大量的实验确定Hk以作为检测人体活动端点的针对加速度信号联合熵的阈值
[0011] 4)将测定信号分为静止段、过渡段和活动段三种类型;
[0012] 5)统计三维信号中每一个分量轴上的最大值与最小值:Max和Min;
[0013] 6)针对信号计算信源的联合熵:
[0014]
[0015] 7)检测每一帧信号计算所得联合熵,与经验阈值Hk做比较,当Hi大于等于Hk时,对该帧进行标记,并作为起始点,同时判定信号进入活动段,也即标记人体活动的端点;
[0016] 8)继续取下一帧信号计算所得联合熵,与经验阈值Hk做比较,当Hi小于等于Hk时,对该帧进行标记,并作为终点。
[0017] 步骤7)中,当识别出人体活动的端点时,需要设定最短活动段的时间限度,在被标记为起始点后信号联合熵的值在少于最短活动段时间内回落到阈值Hk以下,则判定该段为噪声。
[0018] 本发明的技术效果:本发明通过对人体行为起始终止端点的检测,可以有效地在实际应用环境中提取出有价值有意义的数据信息,从而提高在人体日常行为活动识别方面的计算效率,减少计算量,同时对于在实际应用场景中的检测正确率和语义建模分析有着更大的现实意义。附图说明
[0019] 图1为“骑车”活动联合信息熵曲线。
[0020] 图2为“休息”活动联合信息熵曲线。
[0021] 图3为发明利用联合熵的特征提取出端点的方案流程图

具体实施方式

[0022] 一、本发明方案的具体细节
[0023] (1)熵函数的构造
[0024] 对于有限的离散数据不确定性可以由熵来表征,根据公式,系数K由对数运算法则可以转化成log的底数,则信息熵公式变为:
[0025]
[0026] 且一般地K∈{2,e,10},对于对数底数的选取仅仅决定了系数的大小。而p(u)代表了该随机变量的概率密度函数。作为信源U,其概率模型可以表示为:
[0027]
[0028] 其中0≤P(ui)≤1且
[0029] 针对于一维数据的信息熵模型由上述公式表示,回归到加速度数据上来看:假设有一段连续的三轴加速度数据AC=(ACx,ACy,ACz),在整合后变为一维数据|AC|,显然,|ACi|≥0。在数据加窗之后,设每个窗口的长度为M,在一个窗口下首先统计出该窗口内的最大值Max和最小值Min,在整个窗内有0≤Min≤|ACi|≤Max。由于信号为离散状态,直接利用统计学公式求出窗口内每一个幅度值出现的频率:Pi=ni/N,其中N为整个窗内的采样点数,ni为|ACi|出现的次数。所以定义一维的加速度传感器数据信息熵为:
[0030]
[0031] 当理想情况下信号为单一值时,也即N个离散信号幅值均为M时,计算出H(U)=0,此时信号的信息熵是最小的。而鉴于信号当中必定会有噪声影响,|ACi|的幅度在实际情况当中会有抖动或者变化。在相对静止状态和日常活动状态相比较来说,日常活动会带来数量较大的信号随机事件,也就是说信息熵在活动的端点出会有较大的差异。由此原理通过检测每一帧信息熵的变化来确定人体活动的端点。
[0032] (2)三维加速度信源信息熵模型
[0033] 三轴加速度传感器是以三个轴的加速度数据作为基础信源,得到的原始数据也是三维的。因此,将三维数据整合成为一维数据|ACi|会损失方向信息,相对于直接在原始数据上做处理,采用一维数据信息熵的方法有很大的局限性。因此,需要将三轴加速度数据当中的每一个分量轴的计数直接相互关系考虑进来,也即将三轴加速度合矢量的方向信息考虑进熵的计算当中。
[0034] 在此,以x轴为例,定义x轴加速度传感器数据信源X,有:
[0035]
[0036] 其概率密度模型:
[0037]
[0038] 其中0≤P(xi)≤1且
[0039] 与此同理,对y轴有:
[0040]
[0041] 概率模型为:
[0042]
[0043] 对于z轴有:
[0044]
[0045] Z轴概率密度为:
[0046]
[0047] (3)三维加速度信源的联合熵
[0048] 我们首先将三轴加速度信号(X,Y,Z)视为一种三维离散性随机变量。那么考虑三轴加速度传感器数据X、Y、Z轴在统计学中作为三维随机变量的独立性与否:设三维随机变量的联合分布函数为F(X,Y,Z),如果对任意三个实数Xi,Yi,Zi有F(Xi,Yi,Zi)=Fx(Xi)Fy(Yi)Fz(Zi),则称随机变量(X,Y,Z)相互独立。很显然,对于实际的人体活动加速度数据,有很小的概率达到以上标准。
[0049] 所以在统计数据中当X、Y、Z三轴并非相互独立时,利用三维加速度信源信息熵模型计算具有三维特征的信源数据的三维信息熵并没有去除三个传感器轴信号非独立带来的附加因素。因此需要考虑另一种描述信源的测度函数:联合熵。
[0050] 对于二维信源的联合熵H(X,Y),有如下定义:
[0051]
[0052] 将此定义推广到三维信源的联合熵H(X,Y,Z),有:
[0053]
[0054] 根据子可加性(Subadditivity),三维信源联合熵H(X,Y,Z)与三维信息熵之和有如下关系:H(X,Y,Z)≤H(X)+H(Y)+H(Z)。即三维信息熵之和始终大于或等于三维信源联合熵。
[0055] 二、本发明方案的实施步骤
[0056] 作为举例,同样选取“骑车”、“休息”两种活动对比联合信息熵曲线,而且从图1图2中可以看出,信息熵对于区别活动段与休息段(静止段)具有非常良好的性能,具体实施方式如下:
[0057] 当传感器信号作为信源以流数据的形式作为信号输入时,通过计算其信息熵这一测度可以描述信源所承载的信息量,将信号由低熵环境中过渡到熵值增大到一定程度的这一过程,利用联合熵的特征准确提取出来并利用其变化特点将其识别出来,这一端点便代表着人体活动的端点。
[0058] 在普通条件下,需要测定信号在传感器无有效加速度施加时的熵基准线:取信号在无有效加速度施加状态时的若干帧,帧数为n,那么有传感器常态静止下的联合熵:
[0059]
[0060] 该值描述了在静止段的平均联合熵。
[0061] 由于当时间轴从静止段经过端点进入到活动段的同时,信号联合熵具有较大的跃升变化,根据大量的实验确定Hk,以作为检测人体活动端点的针对加速度信号联合熵的阈值,当信号联合熵超过该值的时候判定信号进入活动段,也即标记人体活动的端点。
[0062] 利用单一阈值来判定信号端点时会出现一个问题,如果信号中存在突发性的短暂噪声,在时域分析当中噪声到达时会导致计算出的信源的信息熵发生明显的跃升,从而导致熵值很容易便超过定义的阈值Hk。针对这种情况,考虑到突发性的噪声(例如手机跌落)可以引发信息熵升高,但一般不会持续太久。设定最短活动段的时间限度,在被标记为起始点后信号联合熵的值在少于最短活动段时间内回落到阈值Hk以下则判定该段为噪声。
[0063] 根据以上,判别方法描述如下:
[0064] (1)、将信号分为静止段、过渡段和活动段三种类型。
[0065] (2)、首先统计三维信号中每一个分量轴上的最大值与最小值:Max和Min
[0066] (3)、针对信号计算信源的联合熵:
[0067]
[0068] (4)、检测每一帧计算所得联合熵,与经验阈值Hk做比较,当Hi大于等于Hk时,对该帧进行标记。
[0069] (5)、设定最短活动段的时间限度,在被标记为起始点后信号联合熵的值在少于最短活动段时间内回落到阈值Hk以下则判定该段为噪声。
[0070] 根据上述算法文字描述,流程图如图3。
[0071] 三、本发明方案的伪代码
[0072]
[0073] 四、本发明方案的效果验证
[0074] 根据本发明,在服务器端对人体活动数据进行精细检测,可以提高行为识别准确率。
[0075] 将活动段与静止段拟合成为一个时间段的数据,同时保证连接点数据相对平滑,在活动与静止的连接点处做出标记(起始点与终止点)。利用两种端点检测算法对该段拟合数据进行检测分析,将检测结果分别与标记的连接点做对比,若检测结果与标记点误差范围小于R,则判定检测正确,反之记检测错误。
[0076] 通过这种方法,本文分别选取了“上楼”、“下楼”、“骑车”、“跑步”、“走路”五种基本活动,每个活动取20组数据作拟合,端点检测结果如下表:
[0077] 表1端点检测算法准确率
[0078]
[0079] 基于信息熵的人体活动端点检测算法作为人体行为识别当中的数据预处理技术用以提取大量复杂数据中的活动段。本节采用研究者使用最普遍的支持向量机(Support Vector Machine,SVM)作为分类器,选取均值、四分位间距、绝对平均差、相关系数四类时域特征分别对两种数据进行识别分类:一、利用上文方法拟合后不进行端点检测直接进行识别。二、对拟合后的数据进行基于信息熵的端点检测,检测后提取有效活动段后进行识别。
[0080] 为避免活动之间本身的分类难度带来的问题,本文只从“上楼”、“下楼”之中保留“上楼”,所以选取“上楼”、“骑车”、“跑步”、“走路”四种人体基本活动作为原始数据。在分析之初,首先将未作拟合的数据利用SVM分类器做识别分类得到基础识别率作为参考线,而后将数据与“休息”数据拟合,模拟实际情况中采集到的数据,将拟合后的数据直接进行识别分类。最后将拟合后的数据利用基于信息熵的端点检测算法提取活动段后进行识别分类。得到识别结果如下:
[0081] 表1准确率对比
[0082]
[0083] 从表中的数据可以明显看到,经过提取活动段后的数据在识别正确率上达到了76.67%,明显高于拟合数据的识别正确率40.84%,已然接近原始数据79.17%的正确率。
在识别正确率方面通过预处理提高了1/3左右。并且,本文发现在“走路”这一行为下的识别率在经过端点检测提取活动段之后识别率反而超过了原始数据73.33%的正确率,在仔细排查原因后发现原始数据在“走路”活动下包含了一些静止数据以及由静止向活动过渡阶段的加速度信息,经过活动段提取后恰恰将其中的非活动段信息剔除掉,从而达到了识别率相比原始数据升高的效果。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈