首页 / 专利库 / 林业机械与工程 / 森林健康 / 非临床环境下对高血压进行非干预式的监测和评估方法

非临床环境下对高血压进行非干预式的监测和评估方法

阅读:1018发布:2020-05-08

专利汇可以提供非临床环境下对高血压进行非干预式的监测和评估方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种非临床环境下对 高血压 进行非干预式的监测和评估方法,包括对采集的 心电图 数据进行分片,得到以5分钟的 时间窗 为单位的心电 信号 序列,利用交叠滑动窗口 算法 定位 每次心跳所发生的时刻,从而计算初级心跳间期序列;采用 阈值 法对获取的初级心跳间期序列进行修正处理;从每个时间窗的心跳间期序列中提取线性域、非线性域和 波形 分布形态特征,通过皮尔逊相关性分析方法定量计算心率变异性线性域和非线性域特征之间的相关性,并基于特征之间的相关强度进行特征聚合,通过信息增益选择特征形成特征子集;融合特征子集特征,使用 随机森林 方法构建高血压评估模型。本发明进行了更加细粒度的分析,对高血压患者的评估准确率可以达到97.1%。,下面是非临床环境下对高血压进行非干预式的监测和评估方法专利的具体信息内容。

1.非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,其步骤包括:
步骤S1:获取受试者的心电图数据:
S11:数据采集终端采集受试者夜间睡眠状态下的心电图数据,所述心电图数据采集时长范围为6-12h;
S12:细粒度分片:采用固定时间窗分片方法将采集的心电图数据切分成若干个时间窗,每个时间窗包括若干个心电波;
步骤S2:获取心跳间期序列:
S21:利用交叠滑动窗口算法定位每次心跳所发生的时刻,从而计算初级心跳间期序列;
S22:采用阈值法对获取的初级心跳间期序列进行修正处理,以获得最终的心跳间期序列;
步骤S3:多维心率变异特征的提取及数据分析:
S31:多维心率变异特征的提取:从每个时间窗的心跳间期序列中提取心率变异性特征,组合成原特征集,所述原特征集包括线性域特征、非线性域特征和分布形态特征;
S32:对线性域特征和非线性域特征进行相关性分析:
S321:将原特征集包括的所有线性域特征和非线性域特征排列成特征矩阵,采用皮尔逊相关性分析方法得到相关系数矩阵;
S322:基于线性域特征和非线性域特征之间的相关强度对提取的若干个线性域特征、若干个非线性域特征进行聚合,得到多组聚合后特征,采用信息增益对每组聚合后特征进行特征选择,除去冗余特征,形成新的特征子集;
S33:所述分布形态特征包括偏度、峰度及高斯混合模型的六个参数,对分布形态特征进行定量评价:
步骤S4:高血压评估模型构建:将上述步骤S3提取的特征子集进行融合,通过随机森林分类算法构建高血压评估模型;
步骤S5:通过特征子集的包含特征指标评价上述高血压评估模型的性能,验证评估模型的有效性,该特征指标包括方差、心跳间期标准差、差值均方根、间期大于50ms的比例、超低频、低频、高频、总功率、长轴标准差、短轴标准差、采样熵、近似熵。
2.根据权利要求1所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,在步骤S11中,所述心电图数据采集时长为8小时;
在步骤S12中,通过固定时间窗分片的方法将采集的心电图数据切分成96个时间窗,每个时间窗的时长为5min。
3.根据权利要求1所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,在步骤S31中,高血压患者心电图数据的采样频率是128HZ,则滑动窗口为128个采样点;健康人心电图数据的采样频率是200HZ,则滑动窗口为200个采样点,所述滑动窗口每次向前移动自身长度的一半。
4.根据权利要求2所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,步骤S321中,计算每个人的相关系数矩阵的具体方法为:
在特征提取部分,每个时间窗提取的线性域特征和非线性域特征共计16个特征,每个人8小时的数据划分为96个时间窗,从每个时间窗中提取同一维特征,组成特征列向量Fi,即Fi={Fi,1;Fi,2;...;Fi,j...Fi,96},其中Fi,j表示从第j个时间窗中的第i个特征,一共有16个特征,得到96行16列的特征矩阵FMk
其中,k表示的是第k个人,特征矩阵的行表示每个时间窗口中的特征,列表示每一维特征;
分别对特征矩阵FMk中的每两个特征向量计算皮尔逊相关系数,得到16行16列的相关系数矩阵CMk;
其中,PCCi,j表示表示第i,j这两个特征向量之间的相关系数;
皮尔逊相关系数,对于两个特征向量X和Y,X=(X1,X2,...,Xn),F2=(Y1,Y2,...,Yn),这两个特征的相关系数PCC的计算公式如下所示:
上式中,n是X和Y中特征值的个数,Xi、Yi分别表示特征向量X和Y中的第i个特征值,分别表示特征向量X、Y的平均值。
5.根据权利要求2所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,步骤S321中,计算每一类人的相关系数矩阵的具体方法为:
a.计算每个人的相关系数矩阵:
在特征提取部分,每个时间窗提取的线性域特征和非线性域特征共计16个特征,每个人8小时的数据划分为96个时间窗,从每个时间窗中提取同一维特征,组成特征列向量Fi,即Fi={Fi,1;Fi,2;...;Fi,j...Fi,96},其中Fi,j表示从第j个时间窗中的第i个特征,一共有16个特征,得到96行16列的特征矩阵FMk
其中,k表示的是第k个人,特征矩阵的行表示每个时间窗口中的特征,列表示每一维特征;
分别对特征矩阵FMk中的每两个特征向量计算皮尔逊相关系数,得到16行16列的相关系数矩阵CMk;
其中,PCCi,j表示表示第i,j这两个特征向量之间的相关系数;
皮尔逊相关系数,对于两个特征向量X和Y,X=(X1,X2,...,Xn),F2=(Y1,Y2,...,Yn),这两个特征的相关系数PCC的计算公式如下所示:
上式中,n是X和Y中特征值的个数,Xi、Yi分别表示特征向量X和Y中的第i个特征值,分别表示特征向量X、Y的平均值;
b.计算每类人内所有人的相关系数矩阵中的每一个元素的均值,得到该一类人的相关系数矩阵。
6.根据权利要求4或5所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,步骤S322中,选择特征的具体方法为:计算线性域特征和非线性域特征之间的相关强度,当线性域特征和非线性域特征之间的相关系数大于预设的相关强度阈值,其强度阈值范围值为(-1,+1),则判断该线性域特征和非线性域特征强相关,并将该线性域特征和非线性域特征分为一类,如此迭代,得到多组聚合后特征,并计算每组聚合后特征的信息增益,将每组中信息增益最大的特征代替该组的其他特征,完成特征选择。
7.根据权利要求6所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,在步骤S322中,将每个人所有时间窗单个特征的值进行聚合:由于所述时间窗为
96个,则每个特征对应96个数值,每个特征对应的96个数值范围相差大,通过min-max归一化方法将每个特征的数值范围变换到(0,1)区间;当需要聚合为一个值时,则采用平方和求根的方法进行特征聚合。
8.根据权利要求2所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,在步骤S33中,由于每个时间窗内心跳间期序列的分布呈现双峰分布,运用高斯混合模型对每个时间窗心跳间期的分布进行建模的具体方法:
对于给定的心跳间期序列RR={x1,x2,…,xn},该心跳间期序列对应的高斯混合模型的概率密度表达式为
其中,fi(xi|θi)表示第i个高斯分布的密度函数;未知参数θi=(μi,σi),μi和σi分别表示第i个高斯分布的均值和标准差,wi表示每个高斯分布在高斯混合模型中所占的权重系数;
满足的约束条件为 为了求解高斯混合模型中的未知参数
wi,μi,σi,采用期望最大化算法进行求解。
9.根据权利要求8所述的非临床环境下对高血压进行非干预式的监测和评估方法,其特征在于,采用期望最大化算法求解高斯混合模型的未知参数wi,μi,σi,具体包括:
高斯混合模型中的参数wi,μi,σi可以通过给定样本来确定,将高斯混合模型中的位置参数标记为ζ={ζ1,ζ2,L,ζK},对于ζi={wi,μi,σi},则表示混合高斯模型中第i个高斯分布的未知参数,分别对应每个高斯分布的权重、均值和标准差,为了得到未知参数的最优解,采用最大似然估计的方法来求解,具体为:先求样本的联合概率密度函数,因各个样本之间符合独立同分布,因此,这些样本的联合概率密度就是单个样本概率密度的乘积,表示为:
接着,求联合概率密度函数取对数,如下公式所示:
然后使用最大似然估计确定未知参数θi={μi,σi}的最优值,即:
具体步骤:
第一步,设定高斯混合模型中单个高斯分布的数量K,给每个高斯分布的未知参数wi,μi,σi赋初始值;
第二步,根据参数初值或上次迭代的模型参数计算隐变量w的后验概率,作为隐变量当前的估计值;
第三步,用上述计算得到的隐变量的值输入,将似然函数最大化计算新的参数wi,μi,σi的值;
第四步,反复迭代第二步和第三步,直至wi,μi,σi的值保持不变,这时就能得到参数wi,μi,σi的最大值。

说明书全文

非临床环境下对高血压进行非干预式的监测和评估方法

技术领域

[0001] 本发明属于高血压评价领域,具体涉及一种非临床环境下对高血压进行非干预式的监测和评估方法。

背景技术

[0002] 高血压是指以体循环动脉血压(收缩压和/或舒张压)增高为主要特征,可伴有心、脑、肾等器官的功能或器质性损害的临床综合征,是一种典型的慢性病。高血压的患病人数在持续上升,1975年全世界约有5.94亿的高血压患者,而到了2015年,这一数字则超过了11亿,这就意味着,自1975年以来,30年的时间中全世界患高血压的成年人数量翻了近一倍。在我国,高血压同样是威胁人们健康的主要疾病之一,我国分别在1959年、1979年、1991年、
2002年和2015年共进行过五次高血压患病率的调查,调查结果分别为5.10%,7.73%,
11.26%,18.80%和23%。可以看出我国高血压的患病率呈快速上升趋势。
[0003] 高血压因高患病率和高危害性一直是国内外重点防治的慢性病,是全社会普遍关注的重大公共卫生问题。高血压虽为慢性病,但危害性很大。短期来看,血压升高会引起头痛、头晕、失眠、记忆衰退、注意力不集中等症状,直接影响患者的正常工作、生活;长期来看,持续的血压升高会对人的大脑、肝、肾脏等重要器官造成损伤,甚至引发脑卒中、心肌梗死、心力衰竭、肾功能衰竭等危及生命的临床并发症,是造成中和心脏病的主要危险因素。此外,高血压致死率高,每年全世界约有750万人因高血压而死亡,其中我国因血压升高而过早死亡的达200万人,直接医疗费用约为366亿元,给家庭、社会带来极大的经济负担。
[0004] 心脏的每一次收缩和舒张的过程都会产生一定的电位变化,通过心脏周围的导电组织和体液,反应到体表。心电图技术就是一种以时间为单位来记录心脏跳动过程中带来的电位变化的方法,通过放置在体表特定位置电极来捕获和记录这种电位的变化。
[0005] 人体的自主神经系统能无意识地调节身体机能,如血压、心率、呼吸等,按照功能可分为交感神经和副交感神经。交感神经能使心跳加快,血压上升,当人处于紧张状态时,交感神经起主导作用,副交感神经能使心跳减慢,血压降低。高血压的形成有多种机制,交感神经兴奋是重要一环,高血压和交感神经的兴奋互为因果关系。心率变异性(HRV)能够反映自主神经系统活性,是定量评估交感神经与副交感神经张力及其平衡性的生理指标。因此,可以使用HRV作为反映心血管疾病病情的一个重要指标,用来区分健康人和高血压患者。
[0006] 目前,主要通过测量血压来判别是否患有高血压,一种是使用血压计袖带测量,这种方法虽然测量结果比较准确,但无法持续测量血压值,无法监测血压的变化动态。另一种是使用可穿戴设备中的各种传感器测量脉搏波的传导时间间接计算血压值,这种方法能持续监测,但准确率较低。综上所述,早期无明显症状是高血压知晓率低的主要原因,需要一种在非临床环境下对高血压进行非干预式的监测和评估方法。

发明内容

[0007] 本发明的目的是针对上述存在的问题和不足,提供一种非临床环境下基于非干预的,持续监测的心电信号实现高血压监测和评估的方法。
[0008] 本发明采用的技术方案是:
[0009] 非临床环境下对高血压进行非干预式的监测和评估方法,其步骤包括:
[0010] 步骤S1:获取受试者的心电图数据:
[0011] S11:数据采集终端采集受试者夜间睡眠状态下的心电图数据,所述心电图数据采集时长范围为6-12h;
[0012] S12:细粒度分片:采用固定时间窗分片方法将采集的心电图数据切分成若干个时间窗,每个时间窗包括若干个心电波;
[0013] 步骤S2:获取心跳间期序列:
[0014] S21:利用交叠滑动窗口算法定位每次心跳所发生的时刻,从而计算初级心跳间期序列;
[0015] S22:采用阈值法对获取的初级心跳间期序列进行修正处理,以获得最终的心跳间期序列;
[0016] 步骤S3:多维心率变异特征的提取及数据分析:
[0017] S31:多维心率变异特征的提取:从每个时间窗的心跳间期序列中提取心率变异性特征,组合成原特征集,所述原特征集包括线性域特征、非线性域特征和分布形态特征;
[0018] S32:对线性域特征和非线性域特征进行相关性分析:
[0019] S321:将原特征集包括的所有线性域特征和非线性域特征排列成特征矩阵,采用皮尔逊相关性分析方法得到相关系数矩阵;
[0020] S322:基于线性域特征和非线性域特征之间的相关强度对提取的若干个线性域特征、若干个非线性域特征进行聚合,得到多组聚合后特征,采用信息增益对每组聚合后特征进行特征选择,除去冗余特征,形成新的特征子集;
[0021] S33:所述分布形态特征包括偏度、峰度及高斯混合模型的六个参数,对分布形态特征进行定量评价:
[0022] 步骤S4:高血压评估模型构建:将上述步骤S3提取的特征子集进行融合,通过随机森林分类算法构建高血压评估模型;
[0023] 步骤S5:通过特征子集的包含特征指标评价上述高血压评估模型的性能,验证评估模型的有效性,该特征指标包括方差、心跳间期标准差、差值均方根、间期大于50ms的比例、超低频、低频、高频、总功率、长轴标准差、短轴标准差、采样熵、近似熵。
[0024] 优选的,在步骤S1中的1),所述心电图数据采集时长为8小时;
[0025] 在步骤S12中,通过固定时间窗分片的方法将采集的心电图数据切分成96个时间窗,每个时间窗的时长为5min。
[0026] 优选的,在步骤S31中,高血压患者心电图数据的采样频率是128HZ,则滑动窗口为128个采样点;健康人心电图数据的采样频率是200HZ,则滑动窗口为200个采样点,所述滑动窗口每次向前移动自身长度的一半。
[0027] 优选的,步骤S321中,计算每个人的相关系数矩阵的具体方法为:
[0028] 在特征提取部分,每个时间窗提取的线性域特征和非线性域特征共计16个特征,每个人8小时的数据划分为96个时间窗,从每个时间窗中提取同一维特征,组成特征列向量Fi,即Fi={Fi,1;Fi,2;...;Fi,j...Fi,96},其中Fi,j表示从第j个时间窗中的第i个特征,一共有16个特征,得到96行16列的特征矩阵FMk
[0029]
[0030] 其中,k表示的是第k个人,特征矩阵的行表示每个时间窗口中的特征,列表示每一维特征;
[0031] 分别对特征矩阵FMk中的每两个特征向量计算皮尔逊相关系数,得到16行16列的相关系数矩阵CMk;
[0032]
[0033] 其中,PCCi,j表示表示第i,j这两个特征向量之间的相关系数;
[0034] 皮尔逊相关系数,对于两个特征向量X和Y,X=(X1,X2,...,Xn),F2=(Y1,Y2,...,Yn),这两个特征的相关系数PCC的计算公式如下所示:
[0035]
[0036] 上式中,n是X和Y中特征值的个数,Xi、Yi分别表示特征向量X和Y中的第i个特征值,分别表示特征向量X、Y的平均值;
[0037] 优选的,步骤S321中,计算每一类人的相关系数矩阵的具体方法为:
[0038] a.计算每个人的相关系数矩阵:
[0039] 在特征提取部分,每个时间窗提取的线性域特征和非线性域特征共计16个特征,每个人8小时的数据划分为96个时间窗,从每个时间窗中提取同一维特征,组成特征列向量Fi,即Fi={Fi,1;Fi,2;...;Fi,j...Fi,96},其中Fi,j表示从第j个时间窗中的第i个特征,一共有16个特征,得到96行16列的特征矩阵FMk
[0040]
[0041] 其中,k表示的是第k个人,特征矩阵的行表示每个时间窗口中的特征,列表示每一维特征;
[0042] 分别对特征矩阵FMk中的每两个特征向量计算皮尔逊相关系数,得到16行16列的相关系数矩阵CMk;
[0043]
[0044] 其中,PCCi,j表示表示第i,j这两个特征向量之间的相关系数;
[0045] 皮尔逊相关系数,对于两个特征向量X和Y,X=(X1,X2,...,Xn),F2=(Y1,Y2,...,Yn),这两个特征的相关系数PCC的计算公式如下所示:
[0046]
[0047] 上式中,n是X和Y中特征值的个数,Xi、Yi分别表示特征向量X和Y中的第i个特征值,分别表示特征向量X、Y的平均值;
[0048] b.计算每类人内所有人的相关系数矩阵中的每一个元素的均值,得到该一类人的相关系数矩阵。
[0049] 优选的,步骤S322中,选择特征的具体方法为:计算线性域特征和非线性域特征之间的相关强度,当线性域特征和非线性域特征之间的相关系数大于预设的相关强度阈值,其强度阈值范围值为(-1,+1),则判断该线性域特征和非线性域特征强相关,并将该线性域特征和非线性域特征分为一类,如此迭代,得到多组聚合后特征,并计算每组聚合后特征的信息增益,将每组中信息增益最大的特征代替该组的其他特征,完成特征选择。
[0050] 优选的,在步骤S322中,将每个人所有时间窗单个特征的值进行聚合:由于所述时间窗为96个,则每个特征对应96个数值,每个特征对应的96个数值范围相差大,通过min-max归一化方法将每个特征的数值范围变换到(0,1)区间;当需要聚合为一个值时,则采用平方和求根的方法进行特征聚合。
[0051] 优选的,在步骤S33中,由于每个时间窗内心跳间期序列的分布呈现双峰分布,运用高斯混合模型对每个时间窗心跳间期的分布进行建模的具体方法:
[0052] 对于给定的心跳间期序列RR={x1,x2,…,xn},该心跳间期序列对应的高斯混合模型的概率密度表达式为
[0053]
[0054]
[0055] 其中,fi(xiθi)表示第i个高斯分布的密度函数;未知参数θi=(μi,σi),μi和σi分别表示第i个高斯分布的均值和标准差,wi表示每个高斯分布在高斯混合模型中所占的权重系数;满足的约束条件为 为了求解高斯混合模型中的未知参数wi,μi,σi采用期望最大化算法进行求解。
[0056] 优选的,采用期望最大化算法求解高斯混合模型的未知参数wi,μi,σi具体包括:
[0057] 高斯混合模型中的参数wi,μi,σi可以通过给定样本来确定,将高斯混合模型中的位置参数标记为ζ={ζ1,ζ2,L,ζK},对于ζi={wi,μi,σi},则表示混合高斯模型中第i个高斯分布的未知参数,分别对应每个高斯分布的权重、均值和标准差,为了得到未知参数的最优解,采用最大似然估计的方法来求解,具体为:先求样本的联合概率密度函数,因各个样本之间符合独立同分布,因此,这些样本的联合概率密度就是单个样本概率密度的乘积,表示为:
[0058]
[0059] 接着,求联合概率密度函数取对数,如下公式所示:
[0060]
[0061] 然后使用最大似然估计确定未知参数θi={μi,σi}的最优值,即:
[0062]
[0063] 具体步骤:
[0064] 第一步,设定高斯混合模型中单个高斯分布的数量K,给每个高斯分布的未知参数wi,μi,σi赋初始值;
[0065] 第二步,根据参数初值或上次迭代的模型参数计算隐变量w的后验概率,作为隐变量当前的估计值;
[0066] 第三步,用上述计算得到的隐变量的值输入,将似然函数最大化计算新的参数wi,μi,σi的值;
[0067] 第四步,反复迭代第二步和第三步,直至wi,μi,σi的值保持不变,这时就能得到参数wi,μi,σi的最大值。
[0068] 与现有技术相比,本发明使用心电数据提取多维心率异性特征进行高血压的评估,利用心电数据采集时非干预性和可持续监测等优势,通过采集夜晚睡眠状态下的心电信号,并采用固定时间窗分片方法将原始心电信号切分成细粒度的时间片,使用滑动窗口方法检测R波,并通过R波错检和漏检算法对R波进行修正,得到心跳间期序列,进而提取心率变异性的线性域特征和非线性域特征及分布形态特征,并通过高斯混合模型对每个时间窗内心跳间期序列的分布进行建模。分析线性域特征和非线性域特征之间的相关强度,并进行特征选择,除去冗余特征,将提取的多维心率变异性特征进行融合,通过随机森林分类算法进行高血压评估模型。本发明进行了更加细粒度的分析,对高血压患者的评估准确率可以达到97.1%。附图说明
[0069] 图1为本发明的结构图;
[0070] 图2为本发明中心跳间期提取过程的流程图
[0071] 图3为本发明进行特征选择的过程框图
[0072] 图4为本发明的流程框图;
[0073] 图5为本发明中偏度示意图;
[0074] 图6为本发明中高血压识别结果ROC曲线。

具体实施方式

[0075] 下面将结合附图对本发明的技术方案进行清楚完整的描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域的普通技术人员在没有做出创造性劳动的前提下所获得的其他实施例,都属于本发明的保护范围。
[0076] 参照图1-4所示,本发明具体公开了一种非临床环境下对高血压进行非干预式的监测和评估方法,其步骤包括:
[0077] 步骤S1:获取受试者的心电图数据:
[0078] S11:数据采集终端采集受试者夜间睡眠状态下的心电图数据,所述心电图数据采集时长优选8小时;
[0079] S12:细粒度分片:采用固定时间窗分片的方法将采集的心电图数据切分成96个时间窗,每个时间窗的时长为5min,所述每个时间窗包括若干个心电波;
[0080] 步骤S2:获取心跳间期序列:
[0081] 心跳间期是指相邻两次心跳的时间间隔。血压的变化由交感神经与副交感神经共同控制,而心跳间期序列的变化被公认为是交感神经与副交感神经相互作用的最直观表现。因此分析心跳间期序列可以间接地反推某受试者是否患有高血压疾病,这也是本发明的理论基础
[0082] 本发明实施例采用以下方法进行心跳间期序列的获取:
[0083] S21:利用交叠滑动窗口算法定位每次心跳所发生的时刻,从而计算初级心跳间期序列;
[0084] 具体地:
[0085] 滑动窗口采用矩形窗,高血压患者心电图数据的采样频率是128HZ,则滑动窗口为128个采样点;健康人心电图数据的采样频率是200HZ,则滑动窗口为200个采样点,滑动窗口每次向前移动自身长度的一半,从而保证不遗漏任何可能的心跳信息。
[0086] 每个窗口中最大值所对应的时刻即为该窗口内心跳发生的时刻,并将第i个窗口所对应的时刻记为Ti,则心跳时刻序列T可表示为:T=T1,T2,…Ti…Tn;其中,窗口的个数为n。若将第i个心跳间期记为RRi,则初级心跳间期序列RR可表示为:RR=RR1,RR2,…RRi,…RRn-1;即:RR=T2-T1,T3-T2,…Ti+1-Ti…Tn-Tn-1;
[0087] S22:采用阈值法对获取的初级心跳间期序列进行修正处理,以获得最终的心跳间期序列;
[0088] 具体地:在对心跳间期进行统计分析的基础上,该阈值条件设定为:其中,表示初级心跳间期序列的平均值。不满足该条件的心跳间期使用平均值替代。
[0089] 步骤S3:多维心率变异特征的提取及数据分析:
[0090] S31:多维心率变异特征的提取:从每个时间窗的心跳间期序列中提取出心率变异性特征,组合成原特征集,所述原特征集包括线性域特征、非线性域特征和分布形态特征,所述线性域特征包括时域特征和频域特征,其中,时域特征包括均值(Mean)、最大值(Max)、最小值(Min)、标准差(SD)、差值均方根(RMSSD)、差值标准差(SDSD)、相邻RR间期大于50ms的数量(NN50)和变异系数(VC);频域特征包括高频频段能量值(HF)、低频频段能量值(LF)、低频频段与高频频段能量比值(LF/HF)、归一化的高频频带能量(HFnorm)、归一化的低频频段能量(LFnorm);所述非线性域特征包括散点图的特征,分别是长轴的标准差(SD1)、短轴的标准差(SD2)及长轴短轴标准差的比值(SD1/SD2);所述分布形态特征包括偏度(SKEWNESS)、峰度(KURTOSIS)及高斯混合模型的六个参数;
[0091] S32:对线性域特征和非线性域特征进行相关性分析:
[0092] S321:
[0093] 计算每个人的相关系数矩阵的具体方法为:
[0094] 在特征提取部分,每个时间窗提取的线性域特征和非线性域特征共计16个特征,每个人8小时的数据划分为96个时间窗,从每个时间窗中提取同一维特征,组成特征列向量Fi,即Fi={Fi,1;Fi,2;...;Fi,j...Fi,96},其中Fi,j表示从第j个时间窗中的第i个特征,一共有16个特征,得到96行16列的特征矩阵FMk
[0095]
[0096] 其中,k表示的是第k个人,特征矩阵的行表示每个时间窗口中的特征,列表示每一维特征;
[0097] 分别对特征矩阵FMk中的每两个特征向量计算皮尔逊相关系数,得到16行16列的相关系数矩阵CMk;
[0098]
[0099] 其中,PCCi,j表示表示第i,j这两个特征向量之间的相关系数;
[0100] 皮尔逊相关系数,对于两个特征向量X和Y,X=(X1,X2,...,Xn),F2=(Y1,Y2,...,Yn),这两个特征的相关系数PCC的计算公式如下所示:
[0101]
[0102] 上式中,n是X和Y中特征值的个数,Xi、Yi分别表示特征向量X和Y中的第i个特征值, 分别表示特征向量X、Y的平均值;
[0103] 或
[0104] 计算每一类人的相关系数矩阵的具体方法为:
[0105] a.计算每个人的相关系数矩阵:
[0106] 在特征提取部分,每个时间窗提取的线性域特征和非线性域特征共计16个特征,每个人8小时的数据划分为96个时间窗,从每个时间窗中提取同一维特征,组成特征列向量Fi,即Fi={Fi,1;Fi,2;...;Fi,j...Fi,96},其中Fi,j表示从第j个时间窗中的第i个特征,一共有16个特征,得到96行16列的特征矩阵FMk
[0107]
[0108] 其中,k表示的是第k个人,特征矩阵的行表示每个时间窗口中的特征,列表示每一维特征;
[0109] 分别对特征矩阵FMk中的每两个特征向量计算皮尔逊相关系数,得到16行16列的相关系数矩阵CMk;
[0110]
[0111] 其中,PCCi,j表示表示第i,j这两个特征向量之间的相关系数;
[0112] 皮尔逊相关系数,对于两个特征向量X和Y,X=(X1,X2,...,Xn),F2=(Y1,Y2,...,Yn),这两个特征的相关系数PCC的计算公式如下所示:
[0113]
[0114] 上式中,n是X和Y中特征值的个数,Xi、Yi分别表示特征向量X和Y中的第i个特征值, 分别表示特征向量X、Y的平均值;
[0115] b.计算每类人内所有人的相关系数矩阵中的每一个元素的均值,得到该一类人的相关系数矩阵。
[0116] S322:计算线性域特征和非线性域特征之间的相关强度,当线性域特征和非线性域特征之间的相关系数大于预设的相关强度阈值,其强度阈值范围值为(-1,+1),则判断该线性域特征和非线性域特征强相关,并将该线性域特征和非线性域特征分为一类,如此迭代,得到多组聚合后特征,并计算每组聚合后特征的信息增益,将每组中信息增益最大的特征代替该组的其他特征,完成特征选择,形成新的特征子集;
[0117] S33:所述分布形态特征包括偏度、峰度及高斯混合模型的六个参数,对分布形态特征进行定量评价(峰度及高斯混合模型的六个参数的定量评价过程为公开现有技术,因此在这里不再一一赘述。);
[0118] 偏度系数的计算为例:给定心跳间期序列RR={RR1,RR2,...,RRn},偏度系数s的计算公式为:
[0119]
[0120] 在公式二中, 表示该数据序列的平均值,如图5为偏度系数s<0和s>0的示意图。
[0121] 考虑到每个时间窗内心跳间期序列的分布呈现双峰分布,用高斯混合模型对每个时间窗内心跳间期的分布进行建模:
[0122] 对于给定的心跳间期序列RR={x1,x2,…,xn},该心跳间期序列对应的高斯混合模型的概率密度表达式为
[0123]
[0124]
[0125] 其中,fi(xi|θi)表示第i个高斯分布的密度函数;未知参数θi=(μi,σi),μi和σi分别表示第i个高斯分布的均值和标准差,wi表示每个高斯分布在高斯混合模型中所占的权重系数;满足的约束条件为 为了求解高斯混合模型中的未知参数wi,μi,σi,采用期望最大化算法进行求解。
[0126] 为了求解高斯混合模型中的未知参数wi,μi,σi采用期望最大化算法进行求解,具体包括:
[0127] 高斯混合模型中的参数wi,μi,σi可以通过给定样本来确定,将高斯混合模型中的位置参数标记为ζ={ζ1,ζ2,L,ζK},对于ζi={wi,μi,σi},则表示混合高斯模型中第i个高斯分布的未知参数,分别对应每个高斯分布的权重、均值和标准差,为了得到未知参数的最优解,采用最大似然估计的方法来求解,具体为:先求样本的联合概率密度函数,因各个样本之间符合独立同分布,因此,这些样本的联合概率密度就是单个样本概率密度的乘积,表示为:
[0128]
[0129] 接着,求联合概率密度函数取对数,如下公式所示:
[0130]
[0131] 然后使用最大似然估计确定未知参数θi={μi,σi}的最优值,即:
[0132]
[0133] 具体步骤:
[0134] 第一步,设定高斯混合模型中单个高斯分布的数量K,给每个高斯分布的未知参数wi,μi,σi赋初始值;
[0135] 第二步,根据参数初值或上次迭代的模型参数计算隐变量w的后验概率,作为隐变量当前的估计值;
[0136] 第三步,用上述计算得到的隐变量的值输入,将似然函数最大化计算新的参数wi,μi,σi的值;
[0137] 步骤S4:高血压评估模型构建:将上述步骤S3提取的特征子集进行融合,通过随机森林分类算法构建高血压评估模型;
[0138] 步骤S5:通过特征子集的包含特征指标评价上述高血压评估模型的性能,验证评估模型的有效性,该特征指标包括方差var、心跳间期标准差sdnn、差值均方根rmssd、间期大于50ms的比例pnn50、超低频VLF、低频LF、高频HF、总功率TP、标准差sd1、sd2、采样熵SampEn、近似熵ApEn。
[0139] 在上述步骤S322中,将每个人所有时间窗单个特征的值进行聚合:由于所述时间窗为96个,则每个特征对应96个数值,每个特征对应的96个数值范围相差大,通过min-max归一化方法将每个特征的数值范围变换到(0,1)区间;当需要聚合为一个值时,则采用平方和求根的方法进行特征聚合。
[0140] 受试者的测量评估过程:
[0141] 受试者由医院选择,共138人,均为高血压患者,采集受试者整晚ECG数据,受试者基本信息如下:
[0142] 研究对象实验数据统计信息
[0143]
[0144] 将采用本发明的评估方法与已公开发表的国际同类研究进行比较,其结果如图6所示,可知,采用本发明的评估方法,其确认率远远大于其他的评估方法。
[0145] 上述实施例仅用于说明本发明的技术方案,而非对其限制。本发明并不局限于上面已经描述并在附图中示意的准确结构,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,做出的各种改变和变形,都应当视为属于本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈