首页 / 专利库 / 诊断设备和程序 / 多导睡眠监测 / 一种单导脑电自动睡眠分期方法

一种单导脑电自动睡眠分期方法

阅读:363发布:2020-05-19

专利汇可以提供一种单导脑电自动睡眠分期方法专利检索,专利查询,专利分析的服务。并且本 发明 属于睡眠监测技术领域,一种单导脑电自动睡眠分期方法,包括以下步骤:(1) 信号 预处理,(2)分类特征提取,(3)睡眠分期。本发明具有以下优点:一是设计了预处理 算法 ,获得 质量 较好的单导脑 电信号 ;二是本发明从时域、频域、非线性领域提取出多个特征,筛选出具有代表性的特征;三是本发明采用 随机森林 模型,所述方法不必担心过度拟合、具有很好的抗噪声能 力 ,并且能够得出每一棵 决策树 的分期结果,从而得到随机森林对每一个睡眠分期的置信概率;四是本发明结合D-S证据理论进一步提高睡眠分期的准确率。,下面是一种单导脑电自动睡眠分期方法专利的具体信息内容。

1.一种单导脑电自动睡眠分期方法,其特征在于包括以下步骤:
步骤1、信号预处理,考虑到原始脑电信号含有各种噪声干扰,所以首先要对原始脑电
信号进行预处理,具体包括以下子步骤:
(A)去除基线漂移,基线漂移属于低频噪声,是一种非平稳随机信号,基于小波变换
分辨率性质采用小波分解重构的方法去除基线漂移;
(B)去除工频干扰,工频干扰强度大,而且是在非屏蔽环境内无处不在的,必须通过专
用的陷波器滤除工频干扰,采用4阶IIR陷波器就能达到很好的效果,陷波频率设置为50Hz;
(C)去除非脑电信号成分,睡眠脑电信号包含以下几种脑电特征波:α波频率范围为8~
13Hz、β波频率范围为13~30Hz、δ波频率范围为1~4Hz、θ波频率范围为4~8Hz、锯齿波频率范围为2~6Hz、纺锤波频率范围为12~14Hz、β1波频率范围为13~17Hz、β2波频率范围为17~30Hz;对于在这些频率之外的信号成分,是由人体其他电生理活动产生的,需要滤除;采
用10阶IIR巴特沃斯带通滤波器,考虑到脑电信号的有效成分,将带通滤波频率设定为0.2
~40Hz;
(D)提取特征波形,为下一步提取时频域分类特征做准备,采用小波包分解wavelet 
packets decomposition即WPD的方法,将脑电信号分解为α波、β波、δ波、θ波、锯齿波、纺锤波、β1波和β2波各种节律成分,即将脑电信号在时频平面上细致划分,以提高脑电信号的分析能
步骤2、分类特征提取,包括时域特征提取、频域特征提取及非线性特征提取,将所有特
征提取完毕后,进行特征筛选,筛选出质量好、具有代表性的特征形成分类特征向量;考虑
每个睡眠分期持续时长及分析数据信息量的关系,设定以每τ=30s的数据进行一次睡眠分
期计算,每次处理的脑电数据点总个数为N=fs·τ,其中fs表示待分析脑电数据的采样
率,分类特征提取具体包括以下子步骤:
(A)时域特征提取,包括方差var,过零率,Hjorth Mobility,Hjorth Complexity,75百
分位数,α波能量、β波能量、δ波能量、θ波能量、锯齿波能量、纺锤波能量、β1波能量及β2波能量;时域特征中的方差var和75百分位数常见,这里不再叙述;过零率是信号的符号变化比
率,即脑电数据从正数变成负数及从负数变为正数的总个数与脑电数据点总个数的比值,
过零率ZCR通过公式(1)进行描述,
其中,xin(1≤i≤N)表示第in个脑电数据的信号幅值,sgn()为符号函数,通过公式(2)
进行描述,
Hjorth Mobility表示平均频率,由公式(3)计算得到,
其中,m0表示脑电数据x的方差,m2表示脑电数据x一阶导数的方差;
Hjorth Complexity表示频率变化,由公式(4)计算得到,
其中m4表示脑电数据x二阶导数的方差;
各类特征波能量,即α波能量、β波能量、δ波能量、θ波能量、锯齿波能量、纺锤波能量、β1波能量及β2波能量Energy分别由公式(5)计算得到,
(B)频域特征提取,包括α波、β波、δ波、θ波绝对功率谱,α波、β波、δ波、θ波相对功率谱,脑电特征波功率比,是其绝对功率谱的比值,即δ/α、δ/β、δ/θ、θ/α、θ/β、α/β、(δ+θ)/(α+β)、α×β1/δ、θ×β2/δ,相对功率谱,是其绝对功率谱与总功率谱的比值,功率谱计算采用Welch法,将脑电数据x分成L段,每段的长度为M,分别求出每一段的功率谱,然后平均,进而计算功率谱;Welch方法允许每一段都有部分数据重叠,采用汉明窗,50%重叠进行周期图谱估
计,设第l段的功率谱为 通过公式(6)进行描述,
其中,1≤m≤M,1≤l≤L, 表示第l段数据中第m个脑电数据点,wm表示所加的窗函数,f
为频率,窗函数平均能量U通过公式(7)计算得到,
平均后的功率谱通过公式(8)进行描述,
计算得到各类特征波的功率谱密度和频率,并计算其曲线下面积,得到绝对功率谱、相
对功率谱、功率比;
(C)非线性特征提取,采用的非线性特征为样本熵,样本熵的值越大,样本序列就越复
杂,样本熵SampleEnt的计算具体包括以下子步骤:
(a)导入脑电数据x,按照顺序将x组成一组嵌入维数为dim的向量组X1,X2,…,Xi,…,
XN-dim+1,其中Xi通过公式(9)进行描述,xi表示脑电数据x第i个脑电数据的信号幅值;
Xi=[xi,xi+1,…,xi+dim-1]       (9)
(b)Xi与Xj表示向量组中第i个和第j个向量,将Xi与Xj间的距离d[Xi,Xj]定义为两个矢
量中元素差值最大的一个,通过公式(10)进行描述,xj表示脑电数据x第j个脑电数据的信
号幅值;
(c)对于满足公式(10)的i和j,统计d[Xi,Xj]小于“相似度”的度量值r的数目即模板匹
配数,计算此数目与矢量总个数的比值,记为平均模板匹配数 通过公式(11)进行描
述,
(d) 的平均值Adim(r),通过公式(12)计算得到,
(e)嵌入维数dim+1,组成dim+1维矢量,重复上述子步骤(C)中的子步骤(a)~(d),得到
Adim+1(r);
(f)定义样本熵,通过公式(13)计算得到,
(g)当N为有限值时,样本熵通过公式(14)计算得到,
(D)特征筛选,将提取到的特征与人工睡眠分期结果组成特征向量组,基于过滤法中的
最小冗余最大相关性进行特征筛选,按照相关性对各个特征进行评分,所述特征中,样本熵
与分类标记之间相关性大,因此保留该特征,其它特征主要从时域与频域特征中进行筛选;
设定拟选择的特征数量,最大化特征与分类变量之间的相关性,最小化特征与特征之间的
相关性,从而筛选出具有代表性的特征;
步骤3、睡眠分期,将经过特征提取与特征筛选后的脑电特征重新组成训练集与测试
集,采用随机森林的方法得到睡眠分期的模型,并进行睡眠分期验证,得到各个睡眠分期的
置信概率,最后将置信概率进行D-S证据理论融合,得到单导脑电睡眠分期的结果,睡眠分
期具体包括以下子步骤:
(A)划分数据集,将时域特征,非线性特征以及睡眠分期结果组成第一个数据集Data1,
将频域特征和睡眠分期结果组成第二个数据集Data2;
(B)模型训练,将上述两个数据集,分别随机抽取80%数据作为训练集,20%数据作为
测试集,训练随机森林模型model1和model2,并通过测试集进行验证,得到各个睡眠分期的
置信概率,具体包括以下子步骤:
(a)随机抽样,应用bootstrap方法有放回的从训练集中抽取TN次,构成TN个样本,每次
未被抽到的样本组成TN个袋外数据Out-of-bag,OBB用来估计模型的预测准确度;
(b)构建TN棵决策树,设有nf个特征,在每一棵树的每个节点处随机抽取FN个特征
通过计算每个特征蕴含的信息量,在FN个特征中选择一个最具有分类能力的
特征进行节点分裂,并且每棵树最大限度地生长,不做任何剪裁,从而构建出TN棵决策树;
(c)决策树棵树个数寻优,通常TN的范围是100~800,在取值范围内利用子步骤(B)子
步骤(a)中未被抽到的袋外数据来估计决策树模型准确度,当准确度最高时,对应最优决策
树个数TN*;
(d)构建随机森林,计算置信概率,将TN*棵决策树组合在一起构成随机森林模型,应用
数据集Data1得到model1,重复上述方法用数据集Data2训练随机森林模型得到model2,将
测试数据输入到所述模型,得到对W、N1、N2、N3、REM五个分期的概率Ptw,其中t=1,2,w=1,
2…5,Ptw表示第t个随机森林模型中睡眠分期为第w个分期的数目与总决策树数目的比值;
(C)D-S证据理论数据融合,D-S证据理论数据融合方法是指Dempster组合规则,也称为
证据组合公式,设Θ为识别框架,由睡眠分期W、N1、N2、N3、REM、不确定分期和空集Φ组成单元素命题识别框架,A代表识别框架中任一命题,在识别框架上定义两个随机森林模型的基
本概率分配函数masst(A)∈(0,1),t=1,2满足:
masst(Φ)=0  (15)
对于 识别框架Θ上的mass1,mass2函数的Dempster合成规则通过公式(17)进
行描述,
其中,1≤p≤7,1≤q≤7,A1代表识别框架中的W,A2代表识别框架中的N1,A3代表识别框
架中的N2,A4代表识别框架中的N3,A5代表识别框架中的REM,A6代表识别框架中的不确定分期,A7代表识别框架中的Φ;K为归一化常数:
对于命题A的可信度分配Bel(A)为,
表示命题A中所有子集B的基本概率分配之和,即对A的总的信任度,当A是单元素命题
时,
Bel(A)=masst(A)    (20)
两个随机森林模型对每个睡眠分期的概率作为基本概率赋值,masst(A1)即Pt1,masst
(A2)即Pt2,masst(A3)即Pt3,masst(A4)即Pt4,masst(A5)即Pt5,masst(A6)和masst(A7)为0,运用上述Dempster合成规则,将各个证据合成一个新的证据体,将不同证据体的基本可信度分
配合并产生一个总体的可信度分配Bel(A),并根据最大信任值法,计算各命题的信任函数
值,选择具有最大信任值的结果作为最终识别的睡眠分期结果。

说明书全文

一种单导脑电自动睡眠分期方法

技术领域

[0001] 本发明涉及一种单导脑电自动睡眠分期方法,属于睡眠监测技术领域。

背景技术

[0002] 睡眠是生命的需要,是人重要的生理活动之一。根据最新美国睡眠医学会AASM标准,睡眠可分为清醒期W,非快速眼动期N1、N2、N3,快速眼动期REM,其中N1和N2为浅睡期,N3为深度睡眠期。足够的深度睡眠时长对于缓解疲劳程度、提高工作效率有很大的促进作用;
心脑血管疾病发病概率也与不同的睡眠分期之间存在着一定的关系;有一些大脑方面的疾
病在清醒状态下不易被发觉,但随着睡眠深度的增加,大脑活动程度降低,这些病灶就开始显现出来,并且在不同的睡眠阶段显现出来的症状也不同。因此,准确的睡眠分期显得尤为重要。
[0003] 目前的临床睡眠监测技术多采用多导睡眠监测设备(Polysomnography,PSG)。PSG一般要求在睡眠实验室中进行,同步采集脑电信号(Eletroencephalogram,EEG)、心电信号(Electrocardiograph,ECG)、眼电信号(Electrooculogram,EOG)、肌电信号
(Electromyography,EMG)等多导电生理信号,综合以上电生理信号实现睡眠分期。其不足之处在于:(1)使用大量的电极穿戴在被试者头部,使被试者感到不适,影响其正常的睡眠活动;(2)PSG价格较为昂贵,且需要专业的采集设备及合适的实验环境;(3)需要有经验的相关专家来进行睡眠分期,耗费时间长,增加专家的工作量;(4)分期结果含有一定的主观因素。因此,基于较少导联或单导脑电信号的自动睡眠分期技术成为睡眠监测领域的重要
发展方向之一。

发明内容

[0004] 针对现有技术中存在的不足,本发明目的是提供一种单导脑电自动睡眠分期方法。该方法通过对单导脑电信号进行处理,提取并筛选具有代表性的脑电特征,建立睡眠分期模型,结合有限状态机理论和D-S证据理论实现自动分期,可广泛应用于睡眠监测技术领域。
[0005] 为了实现上述发明目的,本发明采取的技术方案是:一种单导脑电自动睡眠分期方法,包括以下步骤:
[0006] 步骤1、信号预处理,考虑到原始脑电信号含有各种噪声干扰,所以首先要对原始脑电信号进行预处理,具体包括以下子步骤:
[0007] (A)去除基线漂移,基线漂移属于低频噪声,是一种非平稳随机信号,基于小波变换的多分辨率性质采用小波分解重构的方法去除基线漂移;
[0008] (B)去除工频干扰,工频干扰强度大,而且是在非屏蔽环境内无处不在的,必须通过专用的陷波器滤除工频干扰,采用4阶IIR陷波器就能达到很好的效果,陷波频率设置为
50Hz;
[0009] (C)去除非脑电信号成分,睡眠脑电信号包含以下几种脑电特征波:α波频率范围为8~13Hz、β波频率范围为13~30Hz、δ波频率范围为1~4Hz、θ波频率范围为4~8Hz、锯齿波频率范围为2~6Hz、纺锤波频率范围为12~14Hz、β1波频率范围为13~17Hz、β2波频率范围为17~30Hz;对于在这些频率之外的信号成分,是由人体其他电生理活动产生的,需要滤除;采用10阶IIR巴特沃斯带通滤波器,考虑到脑电信号的有效成分,将带通滤波频率设定为0.2~40Hz;
[0010] (D)提取特征波形,为下一步提取时频域分类特征做准备,采用小波包分解wavelet packets decomposition即WPD的方法,将脑电信号分解为α波、β波、δ波、θ波、锯齿波、纺锤波、β1波和β2波各种节律成分,即将脑电信号在时频平面上细致划分;在小波分析理论的基础上,引入最优基选择的概念,将频带经过多层次的划分之后,根据被分析脑电信号的特征,自适应地选取最佳基函数,使之与脑电信号相匹配,以提高脑电信号的分析能

[0011] 步骤2、分类特征提取,包括时域特征提取、频域特征提取及非线性特征提取,将所有特征提取完毕后,进行特征筛选,筛选出质量好、具有代表性的特征形成分类特征向量;考虑每个睡眠分期持续时长及分析数据信息量的关系,设定以每τ=30s的数据进行一次睡眠分期计算,每次处理的脑电数据点总个数为N=fs·τ,其中fs表示待分析脑电数据的采样频率,分类特征提取具体包括以下子步骤:
[0012] (A)时域特征提取,包括方差var,过零率,Hjorth Mobility,Hjorth Complexity,75百分位数,α波能量、β波能量、δ波能量、θ波能量、锯齿波能量、纺锤波能量、β1波能量及β2波能量;时域特征中的方差var和75百分位数常见,这里不再叙述;过零率是信号的符号变化比率,即脑电数据从正数变成负数及从负数变为正数的总个数与脑电数据点总个数的比
值,过零率ZCR通过公式(1)进行描述,
[0013]
[0014] 其中,xin(1≤i≤N)表示第in个脑电数据的信号幅值,sgn()为符号函数,通过公式(2)进行描述,
[0015]
[0016] Hjorth Mobility表示平均频率,由公式(3)计算得到,
[0017]
[0018] 其中,m0表示脑电数据x的方差,m2表示脑电数据x一阶导数的方差;
[0019] Hjorth Complexity表示频率变化,由公式(4)计算得到,
[0020]
[0021] 其中m4表示脑电数据x二阶导数的方差;
[0022] 各类特征波能量,即α波能量、β波能量、δ波能量、θ波能量、锯齿波能量、纺锤波能量、β1波能量及β2波能量Energy分别由公式(5)计算得到,
[0023]
[0024] (B)频域特征提取,包括α波、β波、δ波、θ波绝对功率谱,α波、β波、δ波、θ波相对功率谱,脑电特征波功率比,是其绝对功率谱的比值,即δ/α、δ/β、δ/θ、θ/α、θ/β、α/β、(δ+θ)/(α+β)、α×β1/δ、θ×β2/δ,相对功率谱,是其绝对功率谱与总功率谱的比值,功率谱计算采用Welch法,将脑电数据x分成L段,每段的长度为M,分别求出每一段的功率谱,然后平均,进而计算功率谱;Welch方法允许每一段都有部分数据重叠,采用汉明窗,50%重叠进行周期图谱估计,设第l段的功率谱为 通过公式(6)进行描述,
[0025]
[0026] 其中,1≤m≤M,1≤l≤L, 表示第l段数据中第m个脑电数据点,wm表示所加的窗函数,f为频率,窗函数平均能量U通过公式(7)计算得到,
[0027]
[0028] 平均后的功率谱通过公式(8)进行描述,
[0029]
[0030] 计算得到各类特征波的功率谱密度和频率,并计算其曲线下面积,得到绝对功率谱、相对功率谱、功率比;
[0031] (C)非线性特征提取,采用的非线性特征为样本熵,样本熵的值越大,样本序列就越复杂,样本熵SampleEnt的计算具体包括以下子步骤:
[0032] (a)导入脑电数据x,按照顺序将x组成一组嵌入维数为dim的向量组X1,X2,…,Xi,…,XN-dim+1,其中Xi通过公式(9)进行描述,xi表示脑电数据x第i个脑电数据的信号幅值;
[0033] Xi=[xi,xi+1,…,xi+dim-1]     (9)
[0034] (b)Xi与Xj表示向量组中第i个和第j个向量,将Xi与Xj间的距离d[Xi,Xj]定义为两个矢量中元素差值最大的一个,通过公式(10)进行描述,xj表示脑电数据x第j个脑电数据
的信号幅值;
[0035]
[0036] (c)对于满足公式(10)的i和j,统计d[Xi,Xj]小于“相似度”的度量值r的数目即模板匹配数,计算此数目与矢量总个数的比值,记为平均模板匹配数 通过公式(11)进行描述,
[0037]
[0038] (d) 的平均值Adim(r),通过公式(12)计算得到,
[0039]
[0040] (e)嵌入维数dim+1,组成dim+1维矢量,重复上述子步骤(C)中的子步骤(a)~(d),得到Adim+1(r);
[0041] (f)定义样本熵,通过公式(13)计算得到,
[0042]
[0043] (g)当N为有限值时,样本熵通过公式(14)计算得到,
[0044]
[0045] (D)特征筛选,将提取到的特征与人工睡眠分期结果组成特征向量组,基于过滤法中的最小冗余最大相关性进行特征筛选,按照相关性对各个特征进行评分,所述特征中,样本熵与分类标记之间相关性大,因此保留该特征,其它特征主要从时域与频域特征中进行
筛选;设定拟选择的特征数量,最大化特征与分类变量之间的相关性,最小化特征与特征之间的相关性,从而筛选出具有代表性的特征;
[0046] 步骤3、睡眠分期,将经过特征提取与特征筛选后的脑电特征重新组成训练集与测试集,采用随机森林的方法得到睡眠分期的模型,并进行睡眠分期验证,得到各个睡眠分期的置信概率,最后将置信概率进行D-S证据理论融合,得到单导脑电睡眠分期的结果,睡眠分期具体包括以下子步骤:
[0047] (A)划分数据集,将时域特征,非线性特征以及睡眠分期结果组成第一个数据集Data1,将频域特征和睡眠分期结果组成第二个数据集Data2;
[0048] (B)模型训练,将上述两个数据集,分别随机抽取80%数据作为训练集,20%数据作为测试集,训练随机森林模型model1和model2,并通过测试集进行验证,得到各个睡眠分期的置信概率,具体包括以下子步骤:
[0049] (a)随机抽样,应用bootstrap方法有放回的从训练集中抽取TN次,构成TN个样本,每次未被抽到的样本组成TN个袋外数据Out-of-bag,OBB用来估计模型的预测准确度;
[0050] (b)构建TN棵决策树,设有nf个特征,在每一棵树的每个节点处随机抽取FN个特征通过计算每个特征蕴含的信息量,在FN个特征中选择一个最具有分类能力的
特征进行节点分裂,并且每棵树最大限度地生长,不做任何剪裁,从而构建出TN棵决策树;
[0051] (c)决策树棵树个数寻优,通常TN的范围是100~800,在取值范围内利用子步骤(B)子步骤(a)中未被抽到的袋外数据来估计决策树模型准确度,当准确度最高时,对应最
优决策树个数TN*;
[0052] (d)构建随机森林,计算置信概率,将TN*棵决策树组合在一起构成随机森林模型,应用数据集Data1得到model1,重复上述方法用数据集Data2训练随机森林模型得到model2,将测试数据输入到所述模型,得到对W、N1、N2、N3、REM五个分期的概率Ptw,其中t=
1,2,w=1,2…5,Ptw表示第t个随机森林模型中睡眠分期为第w个分期的数目与总决策树数目的比值;
[0053] (C)D-S证据理论数据融合,D-S证据理论数据融合方法是指Dempster组合规则,也称为证据组合公式,设Θ为识别框架,由睡眠分期W、N1、N2、N3、REM、不确定分期和空集Φ组成单元素命题识别框架,A代表识别框架中任一命题,在识别框架上定义两个随机森林模型的基本概率分配函数masst(A)∈(0,1),t=1,2满足:
[0054] masst(Φ)=0      (15)
[0055]
[0056] 对于 识别框架Θ上的mass1,mass2函数的Dempster合成规则通过公式(17)进行描述,
[0057]
[0058] 其中,1≤p≤7,1≤q≤7,A1代表识别框架中的W,A2代表识别框架中的N1,A3代表识别框架中的N2,A4代表识别框架中的N3,A5代表识别框架中的REM,A6代表识别框架中的不确定分期,A7代表识别框架中的Φ;K为归一化常数:
[0059]
[0060] 对于命题A的可信度分配Bel(A)为,
[0061]
[0062] 表示命题A中所有子集B的基本概率分配之和,即对A的总的信任度,当A是单元素命题时,
[0063] Bel(A)=masst(A)   (20)
[0064] 两个随机森林模型对每个睡眠分期的概率作为基本概率赋值,masst(A1)即Pt1,masst(A2)即Pt2,masst(A3)即Pt3,masst(A4)即Pt4,masst(A5)即Pt5,masst(A6)和masst(A7)为0,运用上述Dempster合成规则,将各个证据合成一个新的证据体,将不同证据体的基本可信
度分配合并产生一个总体的可信度分配Bel(A),并根据最大信任值法,计算各命题的信任
函数值,选择具有最大信任值的结果作为最终识别的睡眠分期结果。
[0065] 本发明有益效果是:一种单导脑电自动睡眠分期方法,包括以下步骤:(1)信号预处理,(2)分类特征提取,(3)睡眠分期。与已有技术相比,本发明具有以下优点:一是设计了预处理算法,获得质量较好的单导脑电信号;二是本发明从时域、频域、非线性领域提取出三十多个特征,并设计特征筛选算法,筛选出具有代表性的特征;三是本发明采用随机森林模型,所述方法不必担心过度拟合、具有很好的抗噪声能力,并且能够得出每一棵决策树的分期结果,从而得到随机森林对每一个睡眠分期的置信概率;四是本发明结合D-S证据理论进一步提高睡眠分期的准确率。总之,本发明设计的一种单导脑电自动睡眠分期方法具有
算法容易理解、解释性强、泛化能力强等优点。
附图说明
[0066] 图1是本发明方法步骤流程图
[0067] 图2是信号预处理方法步骤流程图。
[0068] 图3是3层小波包分解结构示意图。
[0069] 图4是提取脑电特征波流程图。
[0070] 图5是分类特征提取步骤流程图。
[0071] 图6是睡眠分期详细步骤流程图。

具体实施方式

[0072] 下面结合附图对本发明作进一步说明。
[0073] 如图1所示,一种单导脑电自动睡眠分期方法,包括以下步骤:
[0074] 步骤1、信号预处理,考虑到原始脑电信号含有各种噪声干扰,所以首先要对原始脑电信号进行预处理,具体包括以下子步骤,如图2所示。
[0075] (A)去除基线漂移,基线漂移属于低频噪声,是一种非平稳随机信号,基于小波变换的多分辨率性质采用小波分解重构的方法去除基线漂移;导入脑电数据x,对x进行离散
小波分解,第一层分解得到近似系数C1和细节系数D1,其中近似系数主要为低频部分,细节系数主要为高频部分,对C1再次进行小波分解,得到近似系数C2和细节系数D2,以此类推;本发明采用‘db4’小波基对x进行8层离散小波分解,得到近似系数C8和细节系数D1、D2、D3、D4、D5、D6、D7、D8,其中C8的频带范围为 在采样频率fs为100Hz的条件下可得C8的频带范
围为0~0.1953Hz,这个频带范围对应于基线漂移;忽略C8仅根据D1~D8进行重构,即可得到去除基线漂移后的脑电信号;
[0076] (B)去除工频干扰,工频干扰强度高,而且是在非屏蔽环境内无处不在的,必须通过陷波器滤除工频干扰,采用4阶IIR陷波器就能达到很好的效果,陷波频率设置为50Hz;
[0077] (C)去除非脑电信号成分,睡眠脑电信号包含以下几种脑电特征波:α波频率范围为8~13Hz、β波频率范围为13~30Hz、δ波频率范围为1~4Hz、θ波频率范围为4~8Hz、锯齿波频率范围为2~6Hz、纺锤波频率范围为12~14Hz、β1波频率范围为13~17Hz、β2波频率范围为17~30Hz;对于在这些频率之外的信号成分,是由人体其他电生理活动产生的,需要滤除;采用10阶IIR巴特沃斯带通滤波器,考虑到脑电信号的有效成分,将带通滤波频率设定为0.2~40Hz;
[0078] (D)提取特征波形,为下一步提取时频域分类特征做准备,采用小波包分解wavelet packets decomposition即WPD的方法,将脑电信号分解为α波、β波、δ波、θ波、锯齿波、纺锤波、β1波和β2波等各种节律成分,将脑电信号在时频平面上细致划分,提高脑电信号的分析能力;如图3所示,这是三层小波包分解结构示意图。对脑电数据x进行小波包分
解,第一层分解得到近似系数(1,0)和细节系数(1,1),其中近似系数主要为低频部分,细节系数主要为高频部分,对(1,0)再次进行小波包分解,得到近似系数(2,0)和细节系数(2,
1),同样(1,1)也可以进行分解,以此类推,对x进行6层小波包分解,共有26=64个节点。每个节点可用一个坐标(u,v)表示,其中u代表小波包分解层数,v代表u层的第v+1个节点,图3所示的小波包分解树是一个满二叉树,为了计算方便,v从0开始,这样小波包分解树任意非叶子节点的左子树坐标为(u+1,2v)。
[0079] 设信号的采样频率为fs,所有第z层小波包分解系数的频带范围如下:
[0080]
[0081] 当采样频率为100Hz时,对应第6层频带范围为:
[0082] [0,0.78125],[0.78125,1.5625],[1.5625,2.34375],…,[49.21875,50]
[0083] EEG信号包含以下几种脑电特征波,α波频率范围8~13Hz、β波频率范围13~30Hz、δ波频率范围1~4Hz、θ波频率范围4~8Hz、纺锤波频率范围12~14Hz、锯齿波频率范围2~6Hz、β1波频率范围12~18、β1波频率范围18~30,而人在睡眠过程中,不同的睡眠分期对应不同的特征波起主导作用,当人处于清醒期W时,α波、β波占据主导地位,快速眼动期REM也具有α波、β波特征,还具有锯齿波的特征,深睡期和浅睡期不具有α波、β波特征,因此可根据这些特征来区分W期和REM期;浅睡期为N1、N2,深睡期为N3,δ波只出现在深睡期,浅睡期可出现θ波、纺锤波、K复合波等一系列特征波,可通过这些特能来区分深度睡眠期和浅度睡眠期。因此,要对获取的脑电信号进行睡眠分期,需要获取脑电信号对应的特征波,本项目采取6层小波包分解的方法,以‘db4’为小波基,获取α波、β波、θ波、δ波等一系列脑电特征波。
如图4所示,这是提取脑电特征波流程图。首先将输入脑电信号进行6层小波包分解,得到64个节点,再根据要提取的脑电特征波,找出频带范围,选择对应节点;以α波为例,α波的频率为8~13Hz,选取频率范围为7.8125~12.5Hz的节点,提取α波特征波,得到的节点为(6,8)、(6,9)、(6,10)、(6,11)、(6,14)、(6,15),由于小波包分解树是一个满二叉树,任意非叶子节点与该节点左子树的纵坐标成2倍关系,因此可对上述节点进行一些合并,如(6,8)和(6,9)合并成(5,4),(6,10)和(6,11)合并成(5,5),(6,14)和(6,15)合并成(5,7),(5,4)和(5,5)合并成(4,2),最后得到α波对应小波包分解节点为(4,2)+(5,7),将这些节点进行小波包分解重构,即可得到重构后的α波脑电特征波。同理,重构出其余脑电特征波,为下一步特征提取做准备。
[0084] 步骤2、分类特征提取。如图5所示,对经过带通滤波处理后的信号进行时域特征和非线性特征提取,对提取的脑电特征波进行时域和频域特征提取,将所有特征提取完毕后,进行特征筛选,筛选出质量好、具有代表性的特征形成分类特征向量。综合考虑每个睡眠分期持续时长及分析数据信息量的关系,本发明设定以每τ=30s的数据进行一次睡眠分期计算。在待分析脑电数据的采样频率为100Hz的情况下,每次处理的脑电数据点总个数为N=fs·τ=3000,以下说明即以3000个数据点为例。所述分类特征具体计算包括以下子步骤:
[0085] (A)时域特征提取,包括方差var,过零率,Hjorth Mobility,Hjorth Complexity,75百分位数,α波能量、β波能量、δ波能量、θ波能量、锯齿波能量、纺锤波能量、β1波能量及β2波能量;时域特征中的方差var和75百分位数常见,这里不再叙述;过零率是信号的符号变化比率,即脑电数据从正数变成负数及从负数变为正数的总个数与脑电数据点总个数的比
值,过零率ZCR通过公式(1)进行描述,
[0086]
[0087] 其中,xin(1≤i≤N)表示第in个脑电数据的信号幅值,sgn()为符号函数,通过公式(2)进行描述,
[0088]
[0089] Hjorth Mobility表示平均频率,由公式(3)计算得到,
[0090]
[0091] 其中,m0表示脑电数据x的方差,m2表示脑电数据x一阶导数的方差;
[0092] Hjorth Complexity表示频率变化,由公式(4)计算得到,
[0093]
[0094] 其中m4表示脑电数据x二阶导数的方差;
[0095] 各类特征波能量,即α波能量、β波能量、δ波能量、θ波能量、锯齿波能量、纺锤波能量、β1波能量及β2波能量Energy分别由公式(5)计算得到,
[0096]
[0097] (B)频域特征提取,包括α波、β波、δ波、θ波绝对功率谱,α波、β波、δ波、θ波相对功率谱,脑电特征波功率比,是其绝对功率谱的比值,即δ/α、δ/β、δ/θ、θ/α、θ/β、α/β、(δ+θ)/(α+β)、α×β1/δ、θ×β2/δ,相对功率谱,是其绝对功率谱与总功率谱的比值,功率谱计算采用Welch法,将脑电数据x分成L段,每段的长度为M,分别求出每一段的功率谱,然后平均,进而计算功率谱;Welch方法允许每一段都有部分数据重叠,采用汉明窗,50%重叠进行周期图谱估计,设第l段的功率谱为 通过公式(6)进行描述,
[0098]
[0099] 其中,1≤m≤M,1≤l≤L, 表示第l段数据中第m个脑电数据点,wm表示所加的窗函数,f为频率,窗函数平均能量U通过公式(7)计算得到,
[0100]
[0101] 平均后的功率谱通过公式(8)进行描述,
[0102]
[0103] 本发明采用汉明窗,窗宽为512,即为分割出每段信号的长度,每段之间有50%的重叠,通过以上公式计算得到功率谱密度和频率,频率的范围为0~50Hz;对频率范围为8~
13Hz的α波而言,将经过小波包分解提取出的α脑电特征波进行周期图谱估计,得到功率谱密度和频率,并截取出8~13Hz功率谱密度部分,计算其曲线下面积,得到绝对功率谱;将原始脑电信号进行周期图谱估计,并计算其曲线下面积得到的总功率谱,而相对功率谱,是其绝对功率谱与总功率谱的比值;所述脑电特征波功率比,是其绝对功率谱的比值。
[0104] (C)非线性特征提取,采用的非线性特征为样本熵,样本熵的值越大,样本序列就越复杂,样本熵SampleEnt的计算具体包括以下子步骤:
[0105] (a)导入脑电数据x,按照顺序将x组成一组嵌入维数为dim的向量组X1,X2,…,Xi,…,XN-dim+1,其中Xi通过公式(9)进行描述,xi表示脑电数据x第i个脑电数据的信号幅值;
[0106] Xi=[xi,xi+1,…,xi+dim-1]    (9)
[0107] (b)Xi与Xj表示向量组中第i个和第j个向量,将Xi与Xj间的距离d[Xi,Xj]定义为两个矢量中元素差值最大的一个,通过公式(10)进行描述,xj表示脑电数据x第j个脑电数据
的信号幅值;
[0108]
[0109] (c)对于满足公式(10)的i和j,统计d[Xi,Xj]小于“相似度”的度量值r的数目即模板匹配数,计算此数目与矢量总个数的比值,记为平均模板匹配数 通过公式(11)进行描述,
[0110]
[0111] (d) 的平均值Adim(r),通过公式(12)计算得到,
[0112]
[0113] (e)嵌入维数dim+1,组成dim+1维矢量,重复上述子步骤(C)中的子步骤(a)~(d),得到Adim+1(r);
[0114] (f)定义样本熵,通过公式(13)计算得到,
[0115]
[0116] (g)当N为有限值时,样本熵通过公式(14)计算得到,
[0117]
[0118] 上述式子中,对于脑电数据x的样本熵计算,N取3000,m取2,r表示相似容限,如果r取值太大,会丢失很多详细信息,本发明取r=0.2×std(X),所述std(X)为输入脑电数据的标准差。
[0119] (D)特征筛选,将提取到的特征与人工睡眠分期结果组成特征向量组,基于过滤法中的最小冗余最大相关性进行特征筛选,按照相关性对各个特征进行评分,所述特征中,样本熵与分类标记之间相关性大,因此保留该特征,其它特征主要从时域与频域特征中进行
筛选;设定拟选择的特征数量,最大化特征与分类变量之间的相关性,最小化特征与特征之间的相关性,从而筛选出具有代表性的特征;
[0120] 步骤3、睡眠分期,具体步骤如图6所示,将经过特征提取与特征筛选后的脑电特征重新组成训练集与测试集,采用随机森林的方法得到睡眠分期的模型,并进行睡眠分期验证,得到各个睡眠分期的置信概率,最后将所述置信概率进行D-S证据理论融合,得到单导脑电睡眠分期的结果。所述睡眠分期具体计算包括以下子步骤:
[0121] (A)划分数据集,将时域特征,非线性特征以及睡眠分期结果组成第一个数据集Data1,将频域特征和睡眠分期结果组成第二个数据集Data2;
[0122] (B)模型训练,将上述两个数据集,分别随机抽取80%数据作为训练集,20%数据作为测试集,训练随机森林模型model1和model2,并通过测试集进行验证,得到各个睡眠分期的置信概率,具体包括以下子步骤:
[0123] (a)随机抽样,应用bootstrap方法有放回的从训练集中抽取TN次,构成TN个样本,每次未被抽到的样本组成TN个袋外数据Out-of-bag,OBB用来估计模型的预测准确度;
[0124] (b)构建TN棵决策树,设有nf个特征,在每一棵树的每个节点处随机抽取FN个特征通过计算每个特征蕴含的信息量,在FN个特征中选择一个最具有分类能力的
特征进行节点分裂,并且每棵树最大限度地生长,不做任何剪裁,从而构建出TN棵决策树;
[0125] (c)决策树棵树个数寻优,通常TN的范围是100~800,在取值范围内利用子步骤(B)子步骤(a)中未被抽到的袋外数据来估计决策树模型准确度,当准确度最高时,对应最
优决策树个数TN*;
[0126] (d)构建随机森林,计算置信概率,将TN*棵决策树组合在一起构成随机森林模型,应用数据集Data1得到model1,重复上述方法用数据集Data2训练随机森林模型得到model2,将测试数据输入到所述模型,得到对W、N1、N2、N3、REM五个分期的概率Ptw,其中t=
1,2,w=1,2…5,Ptw表示第t个随机森林模型中睡眠分期为第w个分期的数目与总决策树数目的比值;
[0127] (C)D-S证据理论融合,D-S证据理论数据融合方法是指Dempster组合规则,也称为证据组合公式,设Θ为识别框架,由睡眠分期W、N1、N2、N3、REM、不确定分期和空集Φ组成单元素命题识别框架,A代表识别框架中任一命题,在识别框架上定义两个随机森林模型的基本概率分配函数masst(A)∈(0,1),t=1,2满足:
[0128] masst(Φ)=0    (15)
[0129]
[0130] 对于 识别框架Θ上的mass1,mass2函数的Dempster合成规则通过公式(17)进行描述,
[0131]
[0132] 其中,1≤p≤7,1≤q≤7,A1代表识别框架中的W,A2代表识别框架中的N1,A3代表识别框架中的N2,A4代表识别框架中的N3,A5代表识别框架中的REM,A6代表识别框架中的不确定分期,A7代表识别框架中的Φ;K为归一化常数:
[0133]
[0134] 对于命题A的可信度分配Bel(A)为,
[0135]
[0136] 表示命题A中所有子集B的基本概率分配之和,即对A的总的信任度,当A是单元素命题时,
[0137] Bel(A)=masst(A)   (20)
[0138] 两个随机森林模型对每个睡眠分期的概率作为基本概率赋值,masst(A1)即Pt1,masst(A2)即Pt2,masst(A3)即Pt3,masst(A4)即Pt4,masst(A5)即Pt5,masst(A6)和masst(A7)为0,运用上述Dempster合成规则,将各个证据合成一个新的证据体,将不同证据体的基本可信
度分配合并产生一个总体的可信度分配Bel(A),并根据最大信任值法,计算各命题的信任
函数值,选择具有最大信任值的结果作为最终识别的睡眠分期结果。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈