首页 / 专利库 / 诊断设备和程序 / 组织学 / 组织病理学 / 基于图论的宫颈癌组织病理学显微图像聚类系统

基于图论的宫颈组织病理学显微图像聚类系统

阅读:978发布:2020-05-14

专利汇可以提供基于图论的宫颈组织病理学显微图像聚类系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于图论的 宫颈 癌 组织病理学 显微图像聚类系统,包括:步骤一,采集 宫颈癌 组织显微图像数据,进行第一阶段聚类;步骤二,通过骨架化的 节点 来近似表示细胞核的分布;步骤三,将每一个连通的骨架作为一个区域,通过每个区域中的骨架节点构造成最小生成树;步骤四:根据最小生成树结构图计算不同的统计值,作为图形特征;步骤五:基于提取的图形特征和全局特征,进行第二阶段的聚类。本发明提供一种基于图论的宫颈癌组织病理学显微图像聚类系统,充分利用骨架化处理中产生的节点来近似表示细胞核的分布,提高聚类效果;通过二次聚类的方式对不同类型的组织进行表达,体现组织中的特殊结构及复杂程度。,下面是基于图论的宫颈组织病理学显微图像聚类系统专利的具体信息内容。

1.一种基于图论的宫颈组织病理学显微图像聚类系统,其特征在于,包括:
步骤一,采集宫颈癌组织显微图像数据,进行第一阶段聚类;
步骤二,对第一阶段聚类的结果进行骨架化处理,以通过骨架化的节点来近似表示细胞核的分布;
步骤三,将节点进行分离处理,将每一个连通的骨架作为一个区域,进而通过每个区域中的骨架节点构造成最小生成树;
步骤四:根据产生的最小生成树结构图,计算不同的统计值,作为图形特征来表示不同的组织;
步骤五:基于提取图形特征和全局特征,进行第二阶段的聚类。
2.如权利要求1所述的基于图论的宫颈癌组织病理学显微图像聚类系统,其特征在于,在步骤一的第一阶段聚类过程中,采用RGB像素值作为颜色特征,通过应用k-means算法将宫颈组织病理学图像进行初次聚类操作;
其中,将k-means算法中的K值设定为2,且聚类结果通过采用白色代表细胞核区域,黑色代表核以外的区域,进而对细胞核与细胞质、细胞间物质进行区分。
3.如权利要求1所述的基于图论的宫颈癌组织病理学显微图像聚类系统,其特征在于,在步骤一中,还包括通过对Sobel边缘检测、Canny边缘检测、Otsu阈值化、分岭变换的结果进行融合,以提高聚类效果,并通过采用形态学操作来增加聚类的精度
4.如权利要求1所述的基于图论的宫颈癌组织病理学显微图像聚类系统,其特征在于,在步骤二中的骨架化处理过程中,需要对骨架化处理中产生的冗余节点进行删除,进而近似表示细胞核的分布。
5.如权利要求1所述的基于图论的宫颈癌组织病理学显微图像聚类系统,其特征在于,在步骤四中,所提取的图形特征被配置为包括每个区域内边长度以及度的均值、方差、偏度、峰度;
在步骤五中,所提取的全局特征被配置为包括组织的周长,以及每个组织内节点的独立拟合的参数值。
6.如权利要求1所述的基于图论的宫颈癌组织病理学显微图像聚类系统,其特征在于,在步骤五中,所述第二阶段聚类被配置为通过采用k-means算法以实现二次聚类;
其中,二次聚类k-means算法中的k值被配置为3,以通过更详细的聚类结果将组织结构分为三级,有效区分了结构的复杂度以及特殊性,进而预测组织的癌症险。
7.如权利要求1所述的基于图论的宫颈癌组织病理学显微图像聚类系统,其特征在于,还包括步骤六,通过剪影值对聚类结果进行分析评估;
其中,剪影值轮廓的范围被设置为负1到1,其值越高,则说明采用的聚类方法越合适,其值较低或为负值,则表明聚类太多或太少。

说明书全文

基于图论的宫颈组织病理学显微图像聚类系统

技术领域

[0001] 本发明涉及图像医疗辅助领域的图像分析技术。更具体地说,本发明涉及一种基于图论的宫颈癌组织病理学显微图像聚类系统。

背景技术

[0002] 现有技术在对宫颈癌组织显微图像进行聚类时,通常使用如图2所示的流程处理方法对对宫颈癌组织的显微图像进行分割,其具体步骤如下:
[0003] (a)获取宫颈癌组织原始显微切片图像;
[0004] (b)将原始图像转变为灰度图像;
[0005] (c)通过算子运算对图像进行重构,突出细胞核与细胞质的差异;
[0006] (d)运用形态学处理,滤掉不需要的部分,使用自动阈值对组织图像中的细胞核进行定位
[0007] (e)以细胞核的位置生成图结构。
[0008] 进一步地对分割后的图像进行基于区域的分析,得到相应的如图3所示聚类结果。从图3中可以看到,(a)是正常组织的图结构,(b)(c)(d)分别代表CIN1、CIN2、CIN3三个阶段,其中黄色标识Y1、Y2、Y3、Y4的团簇代表基底层,绿色标识G1、G2、G3、G4的团簇代表中间层,蓝色标识B1、B2、B3、B4的团簇代表表面层,用于分析CIN的分级和图的变化的关系。
[0009] 而对于采用这样的流程方法进而聚类,通常会存在以下问题:
[0010] (1)在聚类过程中,组织细胞常常会出现大面积粘连和重叠导致难以分割的问题,采用现有分割技术进行处理达不到对于细胞核位置的准确识别,而且会产生过度分割或者分割不足的情况,与细胞实际形态产生一定的差异,影响对于结构的判断。
[0011] (2)现有技术采用的是根据图结构的三形面积进行区分,标记为不同的颜色,用来表示细胞之间的空间结构,这种方法具有特异性,对组织的不同区域以及不同形态的细胞区分度不高,且由于组织图像具有复杂性和特殊性的特征,现有方法仅能表示出细胞空间上的疏密,无法说明结构上的差异,这对于癌症的判别是十分不利。

发明内容

[0012] 本发明的一个目的是解决至少上述问题和/或缺陷,并提供至少后面将说明的优点。
[0013] 本发明还有一个目的是提供一种基于图论的宫颈癌组织病理学显微图像聚类系统,充分利用骨架化处理中产生的节点来近似表示细胞核的分布,对细胞核空间结构的识别更加准确,提高聚类效果;进一步通过二次聚类的方式对不同类型的组织进行表达,其聚类结果能明显看出组织中的特殊结构及复杂程度。
[0014] 为了实现根据本发明的这些目的和其它优点,提供了一种基于图论的宫颈癌组织病理学显微图像聚类系统,包括:
[0015] 步骤一,采集宫颈癌组织显微图像数据,进行第一阶段聚类;
[0016] 步骤二,对第一阶段聚类的结果进行骨架化处理,以通过骨架化的节点来近似表示细胞核的分布;
[0017] 步骤三,将节点进行分离处理,将每一个连通的骨架作为一个区域,进而通过每个区域中的骨架节点构造成最小生成树;
[0018] 步骤四:根据产生的最小生成树结构图,计算不同的统计值,作为图形特征来表示不同的组织;
[0019] 步骤五:基于提取图形特征和全局特征,进行第二阶段的聚类。
[0020] 优选的是,其中,在步骤一的第一阶段聚类过程中,采用RGB像素值作为颜色特征,通过应用k-means算法将宫颈组织病理学图像进行初次聚类操作;
[0021] 其中,将k-means算法中的K值设定为2,且聚类结果通过采用白色代表细胞核区域,黑色代表核以外的区域,进而对细胞核与细胞质、细胞间物质进行区分。
[0022] 优选的是,其中,在步骤一中,还包括通过对Sobel边缘检测、Canny边缘检测、Otsu阈值化、分岭变换的结果进行融合,以提高聚类效果,并通过采用形态学操作来增加聚类的精度
[0023] 优选的是,其中,在步骤二中的骨架化处理过程中,需要对骨架化处理中产生的冗余节点进行删除,进而近似表示细胞核的分布。
[0024] 优选的是,其中,在步骤四中,所提取的图形特征被配置为包括每个区域内边长度以及角度的均值、方差、偏度、峰度;
[0025] 在步骤五中,所提取的全局特征被配置为包括组织的周长,以及每个组织内节点的独立拟合的参数值。
[0026] 优选的是,其中,在步骤五中,所述第二阶段聚类被配置为通过采用k-means算法以实现二次聚类;
[0027] 其中,二次聚类k-means算法中的k值被配置为3,以通过更详细的聚类结果将组织结构分为三级,有效区分了结构的复杂度以及特殊性,进而预测组织的癌症险。
[0028] 优选的是,其中,还包括步骤六,通过剪影值对聚类结果进行分析评估;
[0029] 其中,剪影值轮廓的范围被设置为负1到1,其值越高,则说明采用的聚类方法越合适,其值较低或为负值,则表明聚类太多或太少。
[0030] 本发明至少包括以下有益效果:其一,本发明通过对现有组织聚类技术进行改进,充分利用骨架化处理中产生的节点解决现有技术因为分割技术不足导致的问题,并通过骨架化的节点来近似表示细胞核的分布,对细胞核空间结构的识别更加准确,与细胞实际形态差异明显减小,可利于减少误差,利于后期对其结构的判断,提高聚类效果;
[0031] 其二,本发明通过二次聚类的方式对不同类型的组织进行表达,相对于现有技术中的三角形表达方式来说,其聚类结果能明显看出组织中的特殊结构及复杂程度,能有效地说明结构上的差异,对于癌症的判别是十分有利。
[0032] 本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。附图说明
[0033] 图1为本发明的一个实施例中基于图论的宫颈癌组织病理学显微图像聚类系统的方案流程图
[0034] 图2为现有技术中宫颈癌组织的分割流程图;
[0035] 图3为现有技术中宫颈癌组织的聚类结果图;
[0036] 图4为本发明的一个实施例中基于图论的宫颈癌组织病理学显微图像聚类系统第二次聚类后的组织聚类效果图;
[0037] 图5为本发明的一个实施例中基于图论的宫颈癌组织病理学显微图像聚类系统在进行剪影值评估时的效果图;
[0038] 图6为本发明中原始图像和初次聚类、第二次聚类两个阶段聚类结果的对比示意图。

具体实施方式

[0039] 下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
[0040] 应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。
[0041] 图1示出了根据本发明的一种基于图论的宫颈癌组织病理学显微图像聚类系统的实现形式,包括:
[0042] 步骤一,采集宫颈癌组织显微图像数据,进行第一阶段聚类;
[0043] 步骤二,对第一阶段聚类的结果进行骨架化处理,以通过骨架化的节点来近似表示细胞核的分布,从第一阶段聚类结果可以看出,稀疏的细胞核可以很好地聚类,但是高黏度细胞(重叠细胞和贴壁细胞)的细胞核很难识别。此外,聚类结果受锐度和染色方法的影响较大,故本方案提出了一种生成骨架化的节点的方法来近似表示核的分布;
[0044] 步骤三,将节点进行分离处理,将每一个连通的骨架作为一个区域,这种分离的处理可以促进不同类型组织的区分,进而通过每个区域中的骨架节点构造成最小生成树,其也可以采用三角剖分算法代替最小生成树,计算边长、三角形个数等图特征进行图像的最优化聚类;或采用泰森多边形算法代替最小生成树,计算边个数、面积等图特征进行图像的最优化聚类;
[0045] 步骤四:根据产生的最小生成树结构图,计算不同的统计值,作为图形特征来表示不同的组织,其是种子点用prim算法产生最小生成树,计算生成树的长度、线段的平均距离以及方差分布,按照长度、距离和方差分布来分类;
[0046] 步骤五:基于提取图形特征(统计值)和全局特征(几何值),进行第二阶段的聚类,其用于通第二阶段的聚类过程得到更详细的结果,用来预测组织的癌症风险。本方案使用基于图的监督学习方法来解决宫颈组织病理学图像聚类任务,将组织结构分为三级,有效区分了结构的复杂度以及特殊性。
[0047] 在另一种实施例中,在步骤一的第一阶段聚类过程中,采用RGB像素值作为颜色特征,通过应用k-means算法将宫颈组织病理学图像进行初次聚类操作;
[0048] 其中,将k-means算法中的K值设定为2,且聚类结果通过采用白色代表细胞核区域,黑色代表核以外的区域,进而对细胞核与细胞质、细胞间物质进行区分。在这种方案中聚类结果用黑色和白色来表示,区分了前景对象(细胞核)和背景对象(细胞质和细胞间物质),其算法可通过用GrabCut算法代替融合的聚类算法,进行图像的第一阶段最优化聚类。
[0049] 在另一种实施例中,在步骤一中,还包括通过对Sobel边缘检测、Canny边缘检测、Otsu阈值化、分水岭变换的结果进行融合,以提高聚类效果,k-means算法识别出的细胞核数量很多,接近真实数值,但是杂质会比较多;而sobel边缘检测识别出的轮廓精准,这种算法受噪声影响比较大,对于边界不明显的细胞核识别率低;canny边缘检测得到的部分区域是断续的,不完整的边缘信息,不过检测速度很快,同样受噪声影响大;阈值方法得到的分割图清晰,计算简单并且不受图片亮度对比度变化的影响,应用范围广,但是部分细胞核轮廓不明显,计算效率不高;分水岭方法定位准确,然而识别中存在过度分割的问题。为了得到更好的分割结果,将以上多种方法融和,使得融合后的算法精确更高,细胞核轮廓明显,同时不会产生过度分割,在宫颈癌组织病理学显微图像分析中具有精度高,适用性广泛的优势。
[0050] 并通过采用形态学操作来增加聚类的精度。这种方案中由于阈值分割后得到的细胞二值图像一般会有噪声,且细胞边缘不够圆润,直接用作细胞骨架化处理会产生较大的误差,因此,对阈值分割后得到的二值图像进行形态学处理,进而使得后期骨架化处理的精度更高,其形态学的操作具体操作为:将每一张细胞二值图像中八连通背景区域像素面积小于第一预设值的区域设置为前景区域。由于细胞内的孔洞都为背景元素,可实现细胞内孔洞的填充。对每一张细胞二值图像进行“开”操作,用于去除一些细胞边缘的噪声和一些小的噪点,以及分开一些轻度粘连的细胞,“开”操作为现有技术,此处不再赘述。将每一张细胞二值图像中八连通前景区域像素面积小于第二预设值的区域设置为背景区域。经过上述处理的细胞二值图像依然会存在一些较大的杂质噪点无法去除,由于这些杂质噪点都为前景元素,实现杂质噪点的去除。
[0051] 在另一种实施例中,在步骤二中的骨架化处理过程中,需要对骨架化处理中产生的冗余节点进行删除,进而近似表示细胞核的分布,在这种方案中首先,对第一阶段聚类结果进行骨架化处理。然后,对骨架化结果进行细化处理。具体来说,其是采用Zhang并行快速细化算法,对每一张形态学处理后的细胞二值图像进行细胞骨架化处理;对一张图像中具有46个细胞核的待处理组织病理学图像进行骨架化处理,可细分为首先对该待处理图像进行灰度化处理,接着对该灰度化处理后的图像进行图像分割得到细胞二值图像,再对细胞二值图像进行形态学处理,进一步地对其进行细胞骨架化处理,通过其骨架化的节点分布可知,根据该细胞骨架化处理后的图像中骨架化节点数与细胞个数一致,其正确率可达到93.5%,而在一般情况下,每个细胞的骨架会产生两个节点,骨架节点与细胞核的空间分布相似。最后,删除冗余节点,剩下的节点用来近似表示细胞核的分布。实验表明,实际细胞核与骨架节点位置的重叠率达到90%,故可通过骨架化节点的方式能对细胞核进行近似表达。
[0052] 在另一种实施例中,在步骤四中,所提取的图形特征被配置为包括每个区域内边长度以及角度的均值、方差、偏度、峰度;
[0053] 在步骤五中,所提取的全局特征被配置为包括组织的周长,以及每个组织内节点的独立拟合的参数值,在这种方案中通过全局特征和图形特征的配合,共同对图像中的各组织进行描述表达,以使其二次聚类的精度更高,效果更好。
[0054] 在另一种实施例中,在步骤五中,所述第二阶段聚类被配置为通过采用k-means算法以实现二次聚类;
[0055] 其中,二次聚类k-means算法中的k值被配置为3,以通过更详细的聚类结果将组织结构分为三级,有效区分了结构的复杂度以及特殊性,进而预测组织的癌症风险。本方案中根据图的特征我们将组织聚为三类,因为实验表明k=3时鉴别效果最好。组织细胞的聚类结果如图4所示,三种组织聚类结果在形态结构和复杂性上有明显的差异。从(a)到(c),拓扑结构变化很明显,显示出图特征出色的判别能
[0056] 在另一种实施例中,还包括步骤六,通过剪影值对聚类结果进行分析评估,剪影值是用来衡量分类的好坏,其得到是数据集中每个数据点的一个距离值,这个值是每个样本与同一类别中其它样本的不相似度,以及与其他类别中样本的不相似度的一个关系值,越大越好;
[0057] 其中,剪影值轮廓的范围被设置为负1到1,其值越高,则说明采用的聚类方法越合适,其值较低或为负值,则表明聚类太多或太少。在这种方案中,为了进一步分析聚类结果,通过剪影值的评估用于说明一个集群中的每个数据点与相邻集群中的其他数据点之间的关系,是一种极其有效的数值评价方法。具体来说,如图5所示,给出了本发明剪影值轮廓评估的结果,从其结果可以看出,由于本发明中使用的是实际医学数据,不同类型的组织数量相差较大,聚类的均匀性无法保证,且结构越复杂,数量就越少,差异也就越大。k=3时三种聚类的剪影平均值分别为92%,87%,71%。把第一级聚类和第二级聚类进行比较。如图6所示,(a)代表原始组织图像,(b)代表第一阶段聚类结果,(c)表示相应的第二阶段聚类结果,其中(c)图中蓝色B5、绿色G5、和红色R1分别代表三种类型的组织,故可以根据聚类结果明显看出组织中的特殊结构及复杂程度。
[0058] 和现有技术相比,本发明形成了完整的聚类流程,并且做出了评估。利用图论特征把宫颈癌组织病理图像根据核的空间结构划分为不同类别,这可以应用在组织学家的日常实践中,在癌症风险预测领域显示出巨大的潜力,可以辅助医生做出判断,加快诊断的时间,提高诊断的准确度。不同聚类结果的结构特性与不同等级和不同风险的肿瘤有关,以此作为依据可以用来评估癌症的存在、级别、风险和结果。
[0059] 采用以上方案只是一种较佳实例的说明,但并不局限于此。在实施本发明时,可以根据使用者需求进行适当的替换和/或修改
[0060] 这里说明的设备数量和处理规模是用来简化本发明的说明的。对本发明的基于图论的宫颈癌组织病理学显微图像聚类系统的应用、修改和变化对本领域的技术人员来说是显而易见的。
[0061] 尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用。它完全可以被适用于各种适合本发明的领域。对于熟悉本领域的人员而言,可容易地实现另外的修改。因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈