技术领域
本发明涉及的是一种信号处理技术领域的方法,具体是一种基于超完备特征 的异常心电识别方法。
背景技术
心电图(ECG)在临床医学上常被用来检测心脏活动情况,具有非常重要 的临床价值。在心电图仪记录纸上记录一个完整的心电图
波形,主要包括:P波 (心电图各波中最先出现的是代表左右两
心房兴奋过程的P波)、QRS波群(代 表两个心室兴奋传播过程的电位变化,典型的QRS波群包括三个相连的
波动, 第一个向下的波为Q波,继Q波后一个狭高向上的波为R波,与R波相连接的 又一个向下的波为S波)、S-T段(由QRS波群结束到T波开始的平线)、T波 (是继QRS波群后的一个波幅较低而波宽较长的电波,反映心室兴奋后再极化 过程)。医学工作者就是根据心电图波形变化来分析、诊断心脏
疾病的。但是人 工诊断受到个人专业知识和临床经验的很大限制,同时诊断速度也慢,不能实时 处理,五十年代末以来,随着计算机技术的发展,人们开始了对心电自动分析 技术的研究。波形检测识别和参数提取是心电自动分析系统的关键,其准确性和 可靠性决定着诊断的效果,乃至涉及挽救病人生命的成败。
心律失常是衡量心脏 电活动
稳定性的一个重要指标。特别地,一些室性心律失常常被认为是生命受 到威胁的前兆。心电自动分析的目标是进行心律失常诊断。目前临床上所用的心 电自动分析系统都是运用磁带等记录介质预先记录下被监护对象在一段时间,如 24小时内的三个
导联心电图,然后由快速回放分析系统进行分析诊断。实际上 是结合节律分析和QRS波形态分析,对每一搏进行模板归类,再依据预先确定 的诊断标准来诊断。由于心律失常形态多样,心电自动波形检测还不完善,目前 还没有统一的诊断标准,可以说心律失常分析尚处于初级阶段。
经对
现有技术的文献检索发现,M.I.Owis等在《Medical and Biological Engineering and Computing》(医学
生物工程与计算)(2003年第1期227-231页) 上发表的“Characterisation of electrocardiogram signals based on blind source separation”(基于
盲源分离的心电特征),该文中提出用
独立分量分析方法提取特 征并对五类心电心跳进行分类,具体为:用独立分量分析方法对心
电信号进行分 解,选择其中的219个分量作为特征,然后使用了贝叶斯最小误差分类器、最近 邻分类器、最小距离分类器三种分类器分别作了比较,最终表明,使用219个分 量,最近邻分类器对5类心电信号得到最好的结果,对正常心跳可达到100%分 类准确度,其他四类分别是68.8%,68.8%,84.4%,87.5%。其不足在于:只能 对正常心跳达到很好的结果,其他四类准确度不高,而且仅仅对5类心电信号分 类,其次由于使用的分量数目太多,使训练阶段计算复杂度非常高,如果采用的
特征向量维数太高,就会影响识别时的性能,从而不能做到实时的心电自动识别。
通常,一个实值信号可以用一组基函数的线性组合来表示,它是一种对高维 数据
空间编码的有效方法,比如,傅立叶或者小波都能提供一种对信号的有效表 示,但是他们不能明确表示欠定信号。此时用所谓的超完备基来表示就成为了一 种更通用的替代方法,它允许基函数的数目超过
输入信号的维数。超完备基通过 组合一系列的完备基(比如,傅立叶,小波)或者在完备基上加入一些基函数来 组成。在超完备基下,信号的分解不是唯一的,但是这能提供一些有利条件,首 先在表示数据的结构中非常灵活,并且在超完备基仅包含单类基函数时能得到更 稀疏表示。另外,超完备表示提高了对信号中噪声表示的稳定性。本发明正是采 用了超完备基的特性来提取心电信号的超完备特征。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于超完备特征提取方法 的心电自动识别方法。使其能对14类心率失常数据快速提取特征并得到很高的分 类
精度,从而能实时对心电进行分类识别,可以用于临床医学和医学监护系统。
本发明是通过以下技术方案实现的,本发明对心电图信号进行自动分类识别 的过程主要包括三部分,数据预处理部分、特征提取部分,模式分类部分。数据 预处理过程首先用二次样条小波对连续的心电图信号中的QRS波群中R点(QRS 波群中R波
顶点)
位置进行检测,根据R点位置对心电数据进行分段和数据预处 理,特征提取过程是关系整个识别效果的最关键部分,也是本发明的主要部分, 分别用独立分量分析方法和离散
小波变换方法对每个心跳进行特征提取得到一 个超完备的特征集,并利用互信息方法进行特征收缩,最后,最后利用支持向量 机方法对提取的特征向量进行训练得到一个
支持向量机模型,利用此支持向量机 模型对新的心跳数据段进行自动分类识别。
所述的数据预处理部分主要分为两个部分,首先是QRS波的R点位置检测, 其次是把连续的心电信号分段,分段是建立在对R点位置准确计算的
基础上的。 由于心电信号是非平稳的随机信号,再加上心电测量过程中容易受各种信号的干 扰,而小波分析方法是典型的时频分析方法,在对R点位置检测中,使用小波多 尺度分析方法可以很容易的检测到R点位置并且准确率非常高。在R点检测中, 使用二次样条小波对连续的心电信号进行多尺度分解,分解后在各个尺度上对应 源信号的R点位置处均有一个模极大值对与之对应,在3、4尺度上
能量最大,模 极大值对也更为明显。利用此原理首先在小波变换的4尺度上找到大于某一域值 (一般选择最大值得2/3)的所有模极大值对,模极大值是成对出现,即存在一 个极大值与一个相邻的极小值对应,由于某些原因可能极大值数目不等于极小值 数目,则根据每一个极大值对应最相邻的一个极小值的方法消除冗余的模极值, 确定了一一对应的模极大值后,分别在1,2,3尺度上找对应得模极大值对,最 后在第1尺度上计算每个模极大值对的中间过零点的位置也就是要找的对应原始 心跳的R点位置。R点检测结束后,在
采样率为360Hz的情况下,为了得到每个完 整的心跳波形,以R点位置为中心,取它之前120点,之后180个点作为一个心跳 数据段,这样通常都包含了一个完整的心跳波形(P波,QRS波,T波)。为了减 少基线漂移对分类的影响,需要对数据进行标准化操作,去均值使每个心跳都是 零均值。从而完成了心电数据的分段与预处理操作。
所述的特征提取部分是心电自动诊断识别的关键部分,也是本发明的主要内 容,特征提取的好坏直接影响到识别的准确率与可靠性。本发明采取的特征提取 方法是同时采用独立分量分析方法和小波分析方法分别提取两个特征集组成了 一个超完备的特征集。然后利用基于互信息的特征收缩
算法找到对分类起重要作 用的一些特征来进行后续的分类,具体说明如下:
(1)独立分量分析方法:提取心电特征时,首先要利用许多样本来训练一 个独立分量特征基,FastICA(快速独立分量分析方法)是基于固定点算法来优 化最大负熵从而找到独立分量,收敛速度快并且容易实现。选取10000个经过数 据预处理分段后的正常心跳数据作为训练样本,每个心跳是一个300维的列向量。 使用FastICA方法计算出18个独立分量基以及每个心跳的独立分量系数,这样原 始心跳数据可以由变换后的独立分量系数来表示,从而达到特征提取的目的,其 实质是经过变换把原来的信号投影到新的独立分量特征基上,最终训练得到一个 解混矩阵W。然后利用矩阵W可以计算任意心跳的独立分量分解从而得到独立分 量特征系数。
(2)小波分析方法特征提取:首先利用离散小波DB8(Daubechies系列小波 基)对分段后的心跳进行多尺度分解,由于心
电能量主要集中在0.5Hz和40Hz之 间,经过小波多
分辨率分解后,第一级分解的高频部分主要是噪声部分,而第四 级低频部分代表了心跳的主要能量,并且由于消除了大部分噪声与基线漂移的影 响,利用第四尺度的低频部分作为原心跳的特征表示能消除相同类型心跳的细微 差异从而达到聚类效果。经过小波变换后原来的300维心跳向量变为32维小波系 数,称为小波特征集。
(3)特征收缩过程:首先把独立分量提取的特征集与小波分析提取的特征 集组合为一个超完备的特征集,由于其中的某些特征对分类的作用很小,事实上 特征集中存在一些不相关或者冗余的特征,为了提高分类性能并且减少计算量, 需要从中选择部分相关度高且对分类贡献大的特征。特征收缩的原则是利用互信 息方法计算每个特征与心跳类型的互信息,然后设定一
阈值选择互信息比较大的 特征,保留原特征集80%的特征子集作为最终特征收缩结果。
所述的模式分类过程是利用上述的特征提取和特征收缩结果进行模式分类 的操作,模式分类方法很多,支持向量机是在样本空间或特征空间中构造出最优
超平面,使得超平面与不同类样本集之间的距离最大,支持向量机结构简单并且 具有全局最优性和较好的泛化能
力。使用基于高斯核的径向基的支持向量机对训 练样本特征提取后的样本空间进行训练,得到一个支持向量机模型。对新的心跳 数据可以利用训练好的支持向量机模型进行分类并给出识别结果。
本发明的有益效果是:能够获得较高的心电心律自动识别准确率。由于利用 小波特征提取方法,能够减少同类型心跳之间的个体差异,从而保证了心跳波形 的识别能力,同时利用独立分量方法能提取隐含的独立分量特征,提取的特征系 数之间是独立的。该发明的方法在MIT-BIH(美国麻省理工学院提供的心律失常
数据库)心律失常的数据库上进行测试,对14类不同的心跳类型识别准确率可达 到98.65%。
附图说明
图1为实时心电识别过程流程示意图。
图中整个识别过程主要包括两部分,第一步:利用MIT-BIH心律失常数据库 中的标准数据进行训练的过程,训练后得到独立分量特征基、特征收缩方式以及 支持向量机训练模型。第二步:首先利用小波变换方法对实时的连续心电信号分 段,然后利用训练过程得到的独立分量特征基、特征收缩方式以及支持向量机模 型对未知的心跳进行识别。
图2为特征收缩方法示意图。
图中表示了在训练过程中,超完备特征集中50个特征分别与心跳类型的互信 息。图中可看出有些特征与心跳类型之间的互信息很小,可认为是冗余的或不相 关的特征,他们对分类的作用也很小,根据互信息的大小,设定一域值,保留其 中互信息较大的80%的特征,并记录下保留的特征位置。
具体实施方式
下面结合附图对本发明的
实施例作详细说明:本实施例在以本发明技术方案 为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于 下述的实施例。
本实施例主要针对14种心律失常心跳数据进行诊断识别,数据采用MIT-BIH 心律失常数据库中的数据,14种类型包括:左束支阻滞、右束支阻滞、房性期前 收缩、室性期前收缩、
变形的心房期外收缩、起搏心跳、房室交界性早搏、心室 与正常心跳融合、心房扑动、房室交界区性逸搏、室性逸搏、起搏与正常融合心 跳、房早未下传、正常心跳。
如图1所示,实现过程详述如下:
1.数据预处理。从MIT-BIH心律失常数据库中取出14种类型的心跳数据, 根据分段方法,每个心跳以R点为中心,前面取120个点,后面取180个点共300 个点作为一个心跳数据,有些异常类型的数据量比较小,而正常心跳的数据量最 大,所以取部分正常心跳。取出后对所有的心跳数据进行去均值操作,使每个心 跳都是零均值。
2.特征提取:
从正常心跳数据集中取出10000个心跳来训练独立分量基,组成一个 300*10000的矩阵X,每一列为一个正常心跳,采用FastICA方法对此矩阵进行独 立分量分解并设置保留18个独立分量,最后得到一个解混矩阵W与独立分量矩阵 S。W矩阵的逆矩阵A即是得到的独立分量基。下面就是把所有需要分类的心跳 投影到此基上来得到独立分量特征系数。把所有类型的心跳数据矩阵X通过与W 矩阵的右乘来得到独立的独立分量系数,得到的矩阵S中每一列即是原心跳数据 矩阵X中对应列的独立分量特征系数,也就是每个心跳由原来的300维变为18维 的独立分量特征。
把所有的心跳数据矩阵X(每一列代表一个心跳)经过离散小波DB8变换并 且得到第四尺度的低频部分,经过小波变换后原来的300维心跳向量变为32维小 波特征。
把独立分量分析方法提取的特征与小波提取的特征组合形成一个超完备的 特征集,特征维数为50维。利用互信息方法计算每个特征与该心跳类型的互信息, 把所有的特征利用互信息的大小从大到小排列,选择保留较大的80%的特征而去 除其余的20%的特征,得到一个新的特征向量,并记录下保留特征的坐标位置, 从而完成了特征收缩过程。
3.训练支持向量机模型
利用所有类型的心跳数据经过特征提取和特征收缩后得到的特征集作为支 持向量机的输入,支持向量机训练前首先经过缩放操作把所有的输入特征都缩放 到-1到1之间,并记录每个特征的缩放比例。支持向量机核函数采用高斯径向基 函数,参数c和g的选择对支持向量机的分类性能影响非常大,为了找到最优的参 数,把训练集数据分为5等分,循环利用其中四份作为
训练数据而剩余的一份作 为测试集,得到平均的交叉验证准确率,分别计算c和g在不同的取值范围内得到 交叉验证结果,从中找到最优的参数c和g,利用找到的最优参数c和g对训练集数 据进行训练并得到支持向量机模型。
4.心电分类
训练好支持向量机模型后,可以对新来的心跳数据进行自动诊断识别,并给 出识别结果,首先从采集到的连续心电数据中利用二次样条小波分解方法得到四 尺度的小波分析结果,在第四尺度上先计算最大值,利用最大值的2/3作为阈值 找到大于此阈值的所有的模极大值对,模极大值应该是成对出现,即存在一个极 大值与一个相邻的极小值对应,由于某些原因可能极大值数目不等于极小值数 目,则根据每一个极大值对应最相邻的一个极小值的方法消除冗余的模极值,确 定了一一对应的模极大值后,分别在1,2,3尺度上找对应的模极大值对,最后 在第1尺度上计算每个模极大值对的中间过零点的位置也就是要找的对应原始心 跳的R点位置。找到R点后,以R点为中心前面取120个点后面取180个点作为一个 心跳数据段。心跳数据段截好后,进行数据去均值操作,利用特征提取过程得到 特征向量,根据训练时特征收缩过程记录的特征位置选择其中的部分特征作为特 征向量,然后把此特征向量按训练时每个特征的缩放比例进行缩放后输入支持向 量机进行分类预测,并得到识别结果。
从以上的实施例可以看出,在MIT-BIH心律失常的数据库上进行测试,对上 述14类不同的心电类型识别准确率可达到98.65%。