首页 / 专利库 / 银行与财务事项 / 截止时间 / 面向WiFi活动识别的信号特征提取方法

面向WiFi活动识别的信号特征提取方法

阅读:1036发布:2020-05-29

专利汇可以提供面向WiFi活动识别的信号特征提取方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种面向Wi-Fi活动识别的 信号 特征提取方法,鲁棒性好,精简有效。本发明方法,包括如下步骤:(10)CSI 数据采集 :从数据包中获取一组包含k个 子载波 的CSI幅值信息。(20)主成分提取:利用 带通滤波 对采集到的CSI幅值信号进行预处理,提取其第一主成分;(30)信号特征提取:对时域主成分信号进行STFT,获得细粒度的活动时频图;分别提取时域特征和 频域特征 ,构成特征矩阵;(40)信号特征筛选:针对特征样本点,分别寻找类内最近邻点和类间最近邻点,更新每个特征的贡献权值,根据权值评分对特征有效性进行排序,引入互信息来度量特征的冗余性,找到精简有效的特征子集。,下面是面向WiFi活动识别的信号特征提取方法专利的具体信息内容。

1.一种面向Wi-Fi活动识别的信号特征提取方法,其特征在于,包括如下步骤:
(10)CSI数据采集:在采样时间t内,从Intel 5300网卡的3根接收天线的数据包中获取一组包含k个子载波的CSI幅值信息Ak×t。
(20)主成分提取:利用带通滤波对采集到的CSI幅值信号进行预处理,根据相邻子载波的互相关度对活动信号进行分段,对3根天线的信号分别进行PCA处理,提取其第一主成分;
(30)信号特征提取:对3根天线的时域主成分信号进行STFT,获得细粒度的活动时频图;将每根天线的主成分信号分割成13个时间,分别提取8个时域特征和5个频域特征,最后,将3根天线的特征矩阵合并,构成维度为1×39×13的特征矩阵;
(40)信号特征筛选:针对特征样本点Ri,分别寻找类内最近邻点和类间最近邻点,更新每个特征的贡献权值,根据权值评分对特征有效性进行排序,引入互信息来度量特征的冗余性,找到精简有效的特征子集。
2.根据权利要求1所述的信号特征提取方法,其特征在于,所述(10)CSI数据采集步骤包括:
(11)信道状态信息收集:首先从网卡发送的数据包中获得一组包含30个子载波的CSI:
H=[H1,...,Hk,...,H30]
其中每个分量代表了传输信号对应子载波的幅度和相位,即:
这里,Hk是第k个子载波的CSI,|Hk|表示CSI的幅值,记为Ak,∠Hk表示CSI的相位,记为φk;
(12)幅值信息获取:接收机持续收集CSI并将某个特定时间窗内的t个幅值序列记为:
这t次CSI幅值测量值将作为活动识别算法的基本输入。
3.根据权利要求2所述的信号特征提取方法,其特征在于,所述(20)主成分提取步骤包括:
(21)带通滤波:采用巴特沃兹滤波器对原始CSI幅值进行带通滤波,将上限截止频率设为80赫兹,下限截止频率设为0.5赫兹,从而确保目标频段内的人体活动信息得以保留,以剔除非目标频段噪声;
(22)信号分段:通过计算相邻5个子载波的互相关系数来判断人体是否进行活动,阈值设为0.8,如果阈值大于0.8,则判断人体进行活动,对当前时间段内的信号进行保留;如果阈值小于0.8,则表明当前环境无人运动;
(23)主成分分析:对每根天线采集到的幅值信息分别进行PCA处理,提取第一主成分。
4.根据权利要求3所述的信号特征提取方法,其特征在于,所述(30)信号特征提取步骤包括:
(31)短时傅里叶变换:分别对三根天线的第一主成分进行STFT,以获得频域的信号特征,其中,窗宽设置为采样率的1/2;
(32)时频特征提取:将每根天线的第一主成分信号分割成13个时间块,分别从中提取8个时域特征和5个频域特征,
所述8个时域特征包括平均值、最大值、最小值、标准差、中位数、熵值、偏度系数以及峰态系数,
所述5个频域特征,包括频谱熵、平均速度、最大速度、速度标准差以及分形维数;
(33)特征矩阵构建:将三个特征矩阵重新组合,构建成一个1×39×13的特征矩阵Φ:
其中Ai表示第i个特征, 表示第j根天线的第u个时间块内所提取到的第i个特征。
5.根据权利要求4所述的信号特征提取方法,其特征在于,所述(40)信号特征筛选步骤包括:
(41)输入参数:训练集J,取样次数m,最近邻数k,阈值σ,初始化权值向量W、存储集合变量St和Sf,评价指标θ,其中,θ定义如下:
I(Ai,Aj)=E(Ai)+E(Aj)-E(Ai,Aj)
其中,Red(S)表示特征集合S的冗余度,E(Ai)、E(Aj)分别为特征项A中第i个和第j个的信息熵,I(Ai,Aj)表示特征项A中第i个和第j个的互信息,|S|表示特征集合S中包含的特征数量;
(42)随机挑选样本:在J中随机选择样本点Ri;
(43)寻找最近邻样本:对于每个CH=class(Ri),分别找到与Ri同类的k个最近邻样本H(CH);对于每个CM≠class(Ri),分别找到与Ri不同类的k个最近邻样本M(CH);
(44)更新贡献权值:计算特征A的权值贡献W:
W(A)=W(A)-J[H(CH)]+J[M(CM)],
其中:
D[H(CH)]和D[M(CM)]分别表示样本Ri与同类最近邻点和不同类最近邻点的平均距离。Hj(CH)和Mj(CM)分别表示第CH与第CM类的第j个最近邻点;P(CH)和P(CM)分别表示样本落入第CH与第CM类的概率。
(45)输出权重向量:根据步骤(44)获得权重向量W;
(46)删除评分较低特征:根据阈值σ得到特征集S,当特征集S中的特征数量大于0时,按照后向顺序依次删除评分较低的特征:St=S-Ai,执行步骤(47);
(47)比较冗余程度:当删除评分最末的特征Ai后,只有评分有较大提高才能直接输出当前特征集合,即θ(St)-θ(S)>σ时,Sf=St;如果是评分只有略微提高,即θ(St)-θ(S)>0,则将当前循环部分的子集St和θ(St)记录下来,令S=St;若评分下降,则令S=St;当特征集S中的特征数量等于0时,开始步骤(48);
(48)比较特征集合评分:找出所有的记录中使得函数f=argmaxf(θ(St))的St,把St存入集合Sf中;
(49)输出特征集合:输出Sf,结合特征集合的规模和有效性,对最终的集合进行挑选。

说明书全文

面向WiFi活动识别的信号特征提取方法

技术领域

[0001] 本发明属于无线感知技术领域,涉及一种面向Wi-Fi活动识别的信号特征提取方法,鲁棒性好,精简有效。

背景技术

[0002] 活动信息在智能家居、安防监控、老幼监护、身份认证等一系列人机交互服务中发挥重要作用。迄今为止,大部分的用户活动识别系统要求目标人员佩戴可穿戴设备(如手机、运动手表等)或是提前在目标区域布设感知设备(如摄像头、无线传感器网络等)。前者全天候的佩戴要求导致用户“不一定愿意佩戴、不一定方便佩戴以及不一定记得佩戴”。后者需要额外购置硬件,不利于全场景的推广。其中,基于摄像头的识别技术仅能在光照的视距路径条件下工作,且涉及隐私泄露的问题;无线传感器网络则需要大规模部署节点
[0003] 近年来,无线通信领域在基于Wi-Fi信号的活动识别上取得突破,如CARM、Wifi-ID、FallDeFi等技术的提出,应用于活动分类、手势识别、身份认证等领域。原理上,这些工作利用了人体活动对无线Wi-Fi信号的干扰现象,对接收到的信号波动特征进行提取。与传统手段不同,基于Wi-Fi信号的无线感知是使能非接触、全覆盖、低成本、隐私保护的用户活动识别技术的理想范型。
[0004] 然而,现有工作无法准确描述用户活动的本质特征。这是因为:(1)现有工作不能从噪声环境中准确提取活动主成分,导致提取信号受环境影响较大;(2)现有工作缺乏对无效特征和冗余特征的筛选,导致提取特征无法反映活动的物理本质。为了实现基于Wi-Fi信号的活动识别,提取并筛选本质的信号特征至关重要。

发明内容

[0005] 本发明的目的在于提供一种面向Wi-Fi活动识别的信号特征提取方法,鲁棒性好,精简有效。
[0006] 实现本发明目的的技术方案为:
[0007] 一种面向Wi-Fi活动识别的信号特征提取方法,其特征在于,包括如下步骤:
[0008] (10)CSI(Channel State Information,信道状态信息)数据采集:在采样时间t内,从Intel 5300网卡的3根接收天线的数据包中获取一组包含k个子载波的CSI幅值信息Ak×t。
[0009] (20)主成分提取:利用带通滤波对采集到的CSI幅值信号进行预处理,根据相邻子载波的互相关度对活动信号进行分段,对3根天线的信号分别进行PCA(Principle Component Analysis,主成分分析)处理,提取其第一主成分;
[0010] (30)信号特征提取:对3根天线的时域主成分信号进行STFT(Short-time Fourier Transform,短时傅里叶变换),获得细粒度的活动时频图;将每根天线的主成分信号分割成13个时间,分别提取8个时域特征和5个频域特征,最后,将3根天线的特征矩阵合并,构成维度为1×39×13的特征矩阵;
[0011] (40)信号特征筛选:针对特征样本点Ri,分别寻找类内最近邻点和类间最近邻点,更新每个特征的贡献权值,根据权值评分对特征有效性进行排序,引入互信息来度量特征的冗余性,找到精简有效的特征子集。
[0012] 本发明与现有技术发明相比,其显著优点为:
[0013] 1、鲁棒性好:体现在:(1)本发明提出的主成分提取方法能够准确提取人体活动的有效信号,避免了无关变量对实验结果的干扰;(2)本发明提出的特征提取方法从时域-频域-空域三方面提取具有明确物理意义的活动特征,刻画了人体活动的本质,适用于不同场景下的活动信号描述。
[0014] 2、精简有效:本发明提出的信号特征提取方法,一方面通过评价和排序特征的权值贡献,确保提取的特征足够有效;另一方面,引入互信息的概念,对贡献较低的冗余特征进行删除,克服了传统方法不能去除特征冗余项的缺点,确保提取特征精简有效。附图说明
[0015] 图1为本发明面向基于Wi-Fi活动识别的信号特征提取方法的主流程图
[0016] 图2为图1中CSI数据采集步骤的流程图。
[0017] 图3为图1中主成分提取步骤的流程图。
[0018] 图4为原始CSI幅值信号(4a)和巴特沃兹滤波(4b)示意图。
[0019] 图5为无人活动(5a)和有人活动时(5b)子载波互相关系数示意图。
[0020] 图6为90个子载波(6a)、第一根天线(6b)、第二根天线的(6c)、第三根天线(6d)的PCA结果。
[0021] 图7为图1中信号特征提取步骤的流程图。
[0022] 图8为第一根天线(8a)、第二根天线(8b)、第三根天线(8c)对应的第一主成分频谱图。
[0023] 图9为第一根天线(9a)、第二根天线(9b)、第三根天线(9c)对应的第一主成分的特征矩阵。
[0024] 图10为图1中信号特征筛选的流程图。
[0025] 图11为本发明所采用的三种室内场景的示意图,分别是走廊(11a)、会议室(11b)、工作室(11c)。
[0026] 图12为本发明方法与其他相关技术在图9所示场景的精度对比示意图。
[0027] 图13为本发明为验证特征精简有效的示意图。

具体实施方式

[0028] 如图1所示,本发明面向Wi-Fi活动识别的信号特征提取方法,包括如下步骤:
[0029] (10)CSI数据采集:在采样时间t内,从Intel 5300网卡的3根接收天线的数据包中获取一组包含k个子载波的CSI(Channel State Information,信道状态信息)幅值信息Ak×t。
[0030] 如图2所示,所述(10)CSI数据采集步骤包括:
[0031] (11)信道状态信息收集:首先从网卡发送的数据包中获得一组包含30个子载波的CSI:
[0032] H=[H1,...,Hk,...,H30]
[0033] 其中每个分量代表了传输信号对应子载波的幅度和相位,即:
[0034]
[0035] 这里,Hk是第k个子载波的CSI,|Hk|表示CSI的幅值,记为Ak,∠Hk表示CSI的相位,记为φk。
[0036] 特别地,由于采用了1根发射天线和3根接收天线,因此共获得商用网卡提供的90个子载波信号。其中,相位信息包含随机相位偏差,无法直接使用。
[0037] (12)幅值信息获取:接收机持续收集CSI并将某个特定时间窗内的t个幅值序列记为:
[0038]
[0039] 这t次CSI幅值测量值将作为活动识别算法的基本输入。
[0040] 为了实现连续的活动识别,接收机持续收集CSI。
[0041] (20)主成分提取:利用带通滤波对采集到的CSI幅值信号进行预处理,根据相邻子载波的互相关度对活动信号进行分段,对3根天线的信号帧分别进行PCA(Principle Component Analysis,主成分分析)处理,提取其第一主成分;
[0042] 如图3所示,所述(20)主成分提取步骤包括:
[0043] (21)带通滤波:采用巴特沃兹滤波器对原始CSI幅值进行带通滤波,将上限截止频率设为80赫兹,下限截止频率设为0.5赫兹,从而确保目标频段内的人体活动信息得以保留,以剔除非目标频段噪声;
[0044] 原始的CSI幅值测量中包含了低频的直流分量和高频的噪声分量,如图4(a)所示。因此采用巴特沃兹滤波器对非目标频段噪声进行剔除。由于大多数的人体活动频率在1到
75赫兹之间,因此将上限截止频率设为80赫兹,下限截止频率设为0.5赫兹,从而确保活动信息得以保留。滤波后信号曲线如图4(b)所示。
[0045] (22)信号分段:通过计算相邻5个子载波的互相关系数来判断人体是否进行活动,阈值设为0.8,如果阈值大于0.8,则判断人体进行活动,对当前时间段内的信号进行保留;如果阈值小于0.8,则表明当前环境无人运动;
[0046] 通过图5所示实验现象,观察到无人运动时相邻子载波的互相关系数值较低;当有人运动时,相邻子载波的互相关系数值显著提升。因此,可以通过计算相邻5个子载波的互相关系数来判断人体是否进行活动,阈值设为0.8。
[0047] (23)主成分分析:对每根天线采集到的幅值信息分别进行PCA处理,提取第一主成分。
[0048] 为了进一步提取包含活动信息的信号主成分,避免主成分挑选的问题,对每根天线采集到的幅值信息分别进行PCA处理,提取到的第一主成分如图6所示。其中,图6(a)展示了3根天线90个子载波进行PCA处理后的主成分挑选问题,可以观察到第一主成分包含了最多的信号波动信息但是同时伴随着噪声,第二主成分受噪声影响较小但是丢失了活动信息。图6(b)、(c)、(d)中分别指代第一、第二、第三根天线的PCA处理结果,可以观察到第一主成分的信号波形最为理想。
[0049] (30)信号特征提取:对3根天线的时域主成分信号进行STFT(Short-time Fourier Transform,短时傅里叶变换),获得细粒度的活动时频图;将每根天线的主成分信号分割成13个时间块,分别提取8个时域特征和5个频域特征,最后,将3根天线的特征矩阵合并,构成维度为1×39×13的特征矩阵;
[0050] 如图7所示,所述(30)信号特征提取步骤包括:
[0051] (31)短时傅里叶变换:分别对三根天线的第一主成分进行STFT,以获得频域的信号特征,其中,窗宽设置为采样率的1/2;
[0052] 为了获得频域的信号特征,分别对三根天线的第一主成分进行STFT。其中,窗宽设置为采样率的1/2。如图8所示,生成的频谱图能够反映出相似的细粒度活动信息。
[0053] (32)时频特征提取:将每根天线的第一主成分信号分割成13个时间块,分别从中提取8个时域特征和5个频域特征,
[0054] 所述8个时域特征包括平均值、最大值、最小值、标准差、中位数、熵值、偏度系数以及峰态系数,
[0055] 所述5个频域特征,包括频谱熵、平均速度、最大速度、速度标准差以及分形维数;
[0056] 如图9所示为生成的特征矩阵,纵坐标为时频特征的序号,横坐标为信号的时间块序号。可以观察到,三根天线各自对应的特征矩阵在检测相同的活动时仍会存在差异,因此能够反映空域特征。
[0057] (33)特征矩阵构建:将三个特征矩阵重新组合,构建成一个1×39×13的特征矩阵Φ:
[0058]
[0059] 其中Ai表示第i个特征, 表示第j根天线的第u个时间块内所提取到的第i个特征。
[0060] (40)信号特征筛选:针对特征样本点Ri,分别寻找类内最近邻点和类间最近邻点,更新每个特征的贡献权值,根据权值评分对特征有效性进行排序,引入互信息来度量特征的冗余性,找到精简有效的特征子集。
[0061] 如图10所示,所述(40)信号特征筛选步骤包括:
[0062] (41)输入参数:训练集J,取样次数m,最近邻数k,阈值σ,初始化权值向量W、存储集合变量St和Sf,评价指标θ,其中,θ定义如下:
[0063]
[0064]
[0065] I(Ai,Aj)=E(Ai)+E(Aj)-E(Ai,Aj)
[0066] 其中,Red(S)表示特征集合S的冗余度,E(Ai)、E(Aj)分别为特征项A中第i个和第j个的信息熵,I(Ai,Aj)表示特征项A中第i个和第j个的互信息,|S|表示特征集合S中包含的特征数量;
[0067] 当两个特征项的相关性越强,互信息越大,冗余程度越高。
[0068] (42)随机挑选样本:在J中随机选择样本点Ri;
[0069] (43)寻找最近邻样本:对于每个CH=class(Ri),分别找到与Ri同类的k个最近邻样本H(CH);对于每个CM≠class(Ri),分别找到与Ri不同类的k个最近邻样本M(CH);
[0070] (44)更新贡献权值:计算特征A的权值贡献W:
[0071] W(A)=W(A)-J[H(CH)]+J[M(CM)],
[0072] 其中:
[0073]
[0074]
[0075] D[H(CH)]和D[M(CM)]分别表示样本Ri与同类最近邻点和不同类最近邻点的平均距离。Hj(CH)和Mj(CM)分别表示第CH与第CM类的第j个最近邻点;P(CH)和P(CM)分别表示样本落入第CH与第CM类的概率。
[0076] (45)输出权重向量:根据步骤(44)获得权重向量W;
[0077] (46)删除评分较低特征:根据阈值σ得到特征集S,当特征集S中的特征数量大于0时,按照后向顺序依次删除评分较低的特征:St=S-Ai,执行步骤(47);
[0078] (47)比较冗余程度:当删除评分最末的特征Ai后,只有评分有较大提高才能直接输出当前特征集合,即θ(St)-θ(S)>σ时,Sf=St;如果是评分只有略微提高,即θ(St)-θ(S)>0,则将当前循环部分的子集St和θ(St)记录下来,令S=St;若评分下降,则令S=St;当特征集S中的特征数量等于0时,开始步骤(48);
[0079] (48)比较特征集合评分:找出所有的记录中使得函数f=argmaxf(θ(St))的St,把St存入集合Sf中;
[0080] (49)输出特征集合:输出Sf,结合特征集合的规模和有效性,对最终的集合进行挑选。
[0081] 实验验证
[0082] 如图11所示,本发明选取了(11a)走廊、(11b)会议室、(11c)工作室等3种不同的室内场景下对用户特定活动进行识别。本发明选取了(1)Zhang J在文献“Wifi-id:Human identification using wifi signal.2016International Conference on Distributed Computing in Sensor Systems(DCOSS).IEEE,2016:75-82.”所提出的特征筛选方法ReliefF以及(2)Zhou Q在文献“Deep Activity Recognition in Smart Buildings with Commercial Wi-Fi Devices.International Journal of Simulation and Process Modelling 2019”不采用特征筛选的方法(W/O)进行对比,从而验证方法的鲁棒性高和精简有效。
[0083] 鲁棒性高:如图12所示,横坐标表示三个场景的编号,纵坐标表示精度值。可以观察到,本发明所提出的方法在三种环境下都取得了最高的识别精度。而ReliefF算法由于没有考虑特征的冗余性,可能导致提取到的特征虽然具有较好的特征评分,但是却无法全面地刻画活动的物理本质。
[0084] 精确有效:如图13所示,本发明所提出方法能够以相对较少的特征数量实现最高的特征精度。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈