首页 / 专利库 / 人工智能 / 特征向量 / 基于特征数据挖掘及神经网络的肿瘤的分类方法

基于特征数据挖掘及神经网络的肿瘤的分类方法

阅读:0发布:2022-06-22

专利汇可以提供基于特征数据挖掘及神经网络的肿瘤的分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于特征 数据挖掘 及神经网络的 肿瘤 分类方法,该方法首先选取肿瘤超声图片的有效病变特征的人工评分数据作为原始特征数据集;之后采用双聚类 算法 从原始 训练数据 集中挖掘出有效的局部诊断模式;其次根据这些诊断模式提取出更高层的特征,形成新的 特征向量 ;接着,新的特征向量作为神经网络的输入进行训练得到有效的多类别分类器;最后,采用同样的方式为测试样本提取特征向量,利用训练得到的多类别分类器对其进行分类,得到肿瘤的具体分类结果。本方法克服传统计算机辅助方法局限于低级图像特征的不足,通过从大量人工评分特征数据集中挖掘出更高层的有效特征,并利用流行的神经网络分类方法训练出最终识别多类别肿瘤的分类器。,下面是基于特征数据挖掘及神经网络的肿瘤的分类方法专利的具体信息内容。

1.一种基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,该方法包括下列步骤:
S1、医生根据已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量
S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,进而提取出N个有效的诊断模式;
S4、利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量;
其中,所述的提取出更高层次的特征具体过程如下:
S41、计算肿瘤病例特征打分与每一个诊断模式之间的相似度;
S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则形成维度为N的一个新的特征向量;
S5、将步骤S4得到的N维特征向量作为输入,利用神经网络模式进行训练,得到肿瘤多类别分类器;
S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
2.根据权利要求1所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述步骤S3中提取的有效诊断模式具有如下要求:
挖掘到的双聚类只有在行数所代表的病例样本数目及列数所代表的特征数目满足一定阈值,才判断为有效的诊断模式。
3.根据权利要求1所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述步骤S5中的神经网络模式包括传统反向传播神经网络模型和深度学习神经网络模型。
4.根据权利要求3所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述相似度的衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差RMSD,其公式如下:
其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud(j)为肿瘤样本的第j个特征值,Vdr(j)为诊断模式的第j个特征值。

说明书全文

基于特征数据挖掘及神经网络的肿瘤的分类方法

技术领域

[0001] 本发明涉及超声肿瘤图片识别诊断领域,具体涉及一种基于特征数据挖掘及神经网络的肿瘤分类方法。

背景技术

[0002] 近几十年来,肿瘤发病率逐年上升,从全球范围内来看,肿瘤癌症已成为居民死亡的首要原因,每年都有好几百万人死于肿瘤癌症。肿瘤癌症严重威胁着人们的生命健康,它的治疗预防也成为了全球医学及相关领域科学家的关注焦点。临床研究表明,早期对肿瘤疾病进行准确的分类是治疗肿瘤的关键。精准的分类不仅有助于提高肿瘤患者的治愈率,而且对患者产生的副作用也更小。当前,超声影像凭借其性价比高、无辐射、快速方便、副作用小的优势,逐渐成为临床医疗中一种常用的成像技术。但是,受成像原理和一些技术上的限制,超图图像不可避免地具有噪声斑点、信噪比低的缺点。医生仅仅通过观察超声图像进行肿瘤疾病的诊断仍然存在一定的困难,容易造成误诊和漏诊。为此,计算机辅助诊断技术作为医生临床诊断的第二参考,对提高医生诊断准确率起到了积极作用,近年来获得越来越多的关注。
[0003] 据调研,目前大多数医学计算机辅助诊断系统主要是先对超声影像进行预处理,结合图像分析技术提取出感兴趣区域的纹理特征,通过特征选择方法筛选出有效特征,最后利用支持向量机机器学习方法进行肿瘤良恶性分类。这些方法存在一些局限性:(1)局限于图像像素灰度、纹理计算出来的低级特征用于分类,与医生临床上描述判断肿瘤的高级语义特征有着较大差异,很难得到医生易于接受和理解的诊断结果;(2)步骤环节过于复杂,数值化特征的准确性严重依赖图像质量、预处理及图像分割效果;(3)只涉及良性、恶性肿瘤大类分类,无法给出更具体分类结果,辅助医生后续进行精准治疗。在模式分类领域,特征选择对最终分类的性能有着至关重要的影响。

发明内容

[0004] 本发明的目的在于克服现有技术的缺点与不足,提供一种基于特征数据挖掘及神经网络的肿瘤分类方法。
[0005] 本发明的目的通过下述技术方案实现:
[0006] 一种基于特征数据挖掘及神经网络的肿瘤分类方法,该方法包括下列步骤:
[0007] S1、医生根据已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量
[0008] S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
[0009] S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,进而提取出N个有效的诊断模式;
[0010] S4、利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量;
[0011] S5、将步骤S4得到的N维特征向量作为输入,利用神经网络模式进行训练,得到肿瘤多类别分类器;
[0012] S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
[0013] 进一步地,所述步骤S3中提取的有效诊断模式具有如下要求:
[0014] 挖掘到的双聚类只有在行数所代表的病例样本数目及列数所代表的特征数目满足一定阈值,才判断为有效的诊断模式。
[0015] 进一步地,所述步骤S4中提取出更高层次的特征具体过程如下:
[0016] S41、计算肿瘤病例特征打分与每一个诊断模式之间的相似度;
[0017] S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则形成维度为N的一个新的特征向量。
[0018] 进一步地,所述步骤S5中的神经网络模式包括传统反向传播神经网络模型和深度学习神经网络模型。
[0019] 进一步地,所述相似度的衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差RMSD,其公式如下:
[0020]
[0021] 其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud(j)为肿瘤样本的第j个特征值,Vdr(j)为诊断模式的第j个特征值。
[0022] 本发明相对于现有技术具有如下的优点及效果:
[0023] 1、克服了传统计算机辅助诊断方法从超声图像提取纹理、形态、灰度等低级特征用于训练分类器的不足,直接采用临床医疗中医生常用的有效病变描述特征人工评分数据特征,实施步骤简单且更易于被医生接受。
[0024] 2、利用双聚类算法挖掘出的有效诊断模式提取出更高层次的特征,使得所产生的特征向量具有更好的识别分类效果,对简化神经网络的复杂度具有积极作用。
[0025] 3、不同于传统分类器仅仅进行良恶性进行分类,本方法利用神经网络模型训练出的多分类分类器,可以识别出患者肿瘤的具体分类类别,从而辅助医生进行精准治疗,具有重要的临床应用价值。附图说明
[0026] 图1是本发明中公开的基于特征数据挖掘及神经网络模型的肿瘤分类方法的流程步骤图;
[0027] 图2是本发明方法中利用诊断模式产生高层次特征方法的示意图;
[0028] 图3是本发明实施例中的一种反向传播神经网络模型的示意图。

具体实施方式

[0029] 为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0030] 实施例
[0031] 请参见图1,图1是本实施例中公开的基于特征数据挖掘及神经网络的肿瘤分类方法的流程步骤图。图1所示的基于特征数据挖掘及神经网络的肿瘤分类方法运用于乳腺肿瘤,具体包括下列步骤:
[0032] S1、医生根据M个已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量;
[0033] S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
[0034] S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,将行数(代表病例样本数目)及列数(代表特征数目)满足一定阈值的双聚类筛选出来,进而提取出N个有效的诊断模式;
[0035] S4、如图2所示,利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量,具体步骤为:
[0036] S41、计算乳腺肿瘤病例特征打分与每一个诊断模式之间的相似度,本实施例中,相似度衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差(RMSD),具体应用中,该相似度的衡量方法可以扩展为其它常用方法,此次举例不构成对本技术方案的限制。
[0037] 均方根误差(RMSD)具体如下:
[0038]
[0039] 其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud(j)为肿瘤样本的第j个特征值,Vdr(j)为诊断模式的第j个特征值。
[0040] S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则可以形成维度为N的一个新的特征向量。
[0041] S5、将步骤S4特征向量作为新的输入,利用神经网络模式进行训练,得到乳腺肿瘤多类别分类器,其中神经网络模式采用如图3所示的四层多分类反向传播神经网络,具体应用中,神经网络模式不局限于传统反向传播神经网络模型,也可以是深度学习神经网络模型。
[0042] S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3中得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
[0043] 综上所述,本实施例中公开的基于特征数据挖掘及神经网络的肿瘤分类方法,首先选取肿瘤超声图片的有效病变特征的人工评分数据作为原始特征数据集;之后采用双聚类算法从原始训练数据集中挖掘出有效的局部诊断模式;其次根据这些诊断模式提取出更高层的特征,形成新的特征向量;接着,这些新的特征向量作为神经网络的输入进行训练得到有效的多类别分类器;最后,采用同样的方式为测试样本提取特征向量,利用训练得到的多类别分类器对其进行分类,得到肿瘤的具体分类结果。
[0044] 本发明方法克服了传统计算机辅助诊断方法从超声图像提取纹理、形态、灰度等低级特征用于训练分类器的不足,直接采用临床医疗中医生常用的有效病变描述特征人工评分数据特征,实施步骤简单且更易于被医生接受;利用双聚类算法挖掘出的有效诊断模式提取出更高层次的特征,使得所产生的特征向量具有更好的识别分类效果,对简化神经网络的复杂度具有积极作用;该发明方法不同于传统分类器仅仅进行良恶性进行分类,本方法利用神经网络模型训练出的多分类分类器,可以识别出患者肿瘤的具体分类类别,从而辅助医生进行精准治疗,具有重要的临床应用价值。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈