首页 / 专利库 / 人工智能 / 解码器 / 一种图像分割方法、装置、终端设备及存储介质

一种图像分割方法、装置、终端设备及存储介质

阅读:989发布:2020-05-11

专利汇可以提供一种图像分割方法、装置、终端设备及存储介质专利检索,专利查询,专利分析的服务。并且本 申请 适用于 图像处理 技术领域,提供了 图像分割 方法、装置、终端设备及存储介质,方法包括:获取待识别图像,采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到待识别图像的图像特征;采用图像分割模型对图像特征进行处理,得到待识别图像中每个 像素 对应的图像类别;根据待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。本申请 实施例 提供的图像分割方法可以防止在图像特征提取过程中丢失图像的边缘特征信息和与语义特征对应的二维图像之间的层间信息,保证分割图像边缘的 分辨率 ,提升待识别图像中小目标的分割 精度 。,下面是一种图像分割方法、装置、终端设备及存储介质专利的具体信息内容。

1.一种图像分割方法,其特征在于,包括:
获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
2.如权利要求1所述的图像分割方法,其特征在于,所述图像分割模型包括二维操作模、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征,具体包括:
采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
3.如权利要求2所述的图像分割方法,其特征在于,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别,具体包括:
采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
4.如权利要求2所述的图像分割方法,其特征在于,所述采用所述第三编码器对所述第二下采样数据进行空洞卷积运算,具体包括:
采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
5.如权利要求1所述的图像分割方法,其特征在于,所述采用机器学习算法对分类模型进行训练,具体包括:
根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
LTotal=LFocal+λLAverageDice,
其中,
C表示图像类别的数量,N表示训练批次中的像素数量, 表示训练批次中第n个像素分类为c类的概率, 表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数;
根据所述分类模型的最优参数生成所述图像分割模型。
6.如权利要求1所述的图像分割方法,其特征在于,所述获取待识别图像之前,所述方法还包括:
获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
对应地,所述根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,所述方法还包括:
将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
7.如权利要求6所述的图像分割方法,其特征在于,所述将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像之后,所述方法还包括:
从所述输入图像中提取出所述融合图像的边界对应的像素。
8.一种图像分割装置,其特征在于,包括:
获取模块,用于获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
特征提取模块,用于采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
分类模块,用于采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
分割模块,用于根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

说明书全文

一种图像分割方法、装置、终端设备及存储介质

技术领域

[0001] 本申请属于图像处理技术领域,尤其涉及一种图像分割方法、装置、终端设备及存储介质。

背景技术

[0002] 三维图像的分割方法多应用于医学领域中对器官的解剖,要求有较高的分割精度。现有的对三维图像的分割方法,分割出的图像的边缘的分辨率不高,分割精度不高。发明内容
[0003] 有鉴于此,本申请实施例提供了图像分割方法、装置、终端设备及存储介质,以解决现有技术中三维图像的分割方法中分割精度不高的问题。
[0004] 本申请实施例的第一方面提供了一种图像分割方法,包括:
[0005] 获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
[0006] 采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
[0007] 采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
[0008] 根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
[0009] 在一种可能的实现方式中,所述图像分割模型包括二维操作模、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征,具体包括:
[0010] 采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
[0011] 采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
[0012] 采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
[0013] 在一种可能的实现方式中,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别,具体包括:
[0014] 采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
[0015] 采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
[0016] 采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
[0017] 根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
[0018] 在一种可能的实现方式中,所述采用所述第三编码器对所述第二下采样数据进行空洞卷积运算,具体包括:
[0019] 采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
[0020] 在一种可能的实现方式中,所述采用机器学习算法对分类模型进行训练,具体包括:
[0021] 根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
[0022] LTotal=LFocal+λLAverageDice,
[0023] 其中,
[0024] C表示图像类别的数量,N表示训练批次中的像素数量, 表示训练批次中第n个像素分类为c类的概率, 表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数;
[0025] 根据所述分类模型的最优参数生成所述图像分割模型。
[0026] 在一种可能的实现方式中,所述获取待识别图像之前,所述方法还包括:
[0027] 获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
[0028] 对应地,所述根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,所述方法还包括:
[0029] 将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
[0030] 在一种可能的实现方式中,所述将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像之后,所述方法还包括:
[0031] 从所述输入图像中提取出所述融合图像的边界对应的像素。
[0032] 本申请实施例的第二方面提供了一种图像分割装置,包括:
[0033] 获取模块,用于获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
[0034] 特征提取模块,用于采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
[0035] 分类模块,用于采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
[0036] 分割模块,用于根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
[0037] 在一种可能的实现方式中,所述图像分割模型包括二维操作模块、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述特征提取模块具体包括:
[0038] 第一计算单元,用于采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
[0039] 第二计算单元,用于采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
[0040] 第三计算单元,用于采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
[0041] 在一种可能的实现方式中,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述分类模块具体包括:
[0042] 第四计算单元,用于采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
[0043] 第五计算单元,用于采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
[0044] 第六计算单元,用于采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
[0045] 第七计算单元,用于根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
[0046] 在一种可能的实现方式中,所述第三计算单元具体用于:
[0047] 采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
[0048] 在一种可能的实现方式中,所述特征提取模块还用于:
[0049] 根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
[0050] LTotal=LFocal+λLAverageDice,
[0051] 其中,C表示图像类别的数量,N表示训练批次中的像素数量, 表示训练批次中第n个像素分类为c类的概率, 表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数;
[0052] 根据所述分类模型的最优参数生成所述图像分割模型。
[0053] 在一种可能的实现方式中,所述图像分割模型还包括预处理模块和融合模块,所述预处理模块用于:获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
[0054] 所述融合模块用于:在根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
[0055] 在一种可能的实现方式中,所述图像分割模型还包括提取模块,用于:
[0056] 从所述输入图像中提取出所述融合图像的边界对应的像素。
[0057] 本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述图像分割方法的步骤。
[0058] 本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述图像分割方法的步骤。
[0059] 本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述图像分割方法的步骤。
[0060] 本申请实施例与现有技术相比存在的有益效果是:通过获取待识别图像,采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到待识别图像的图像特征;采用图像分割模型对图像特征进行处理,得到待识别图像中每个像素对应的图像类别;根据待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。由于图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的,具有较高的计算精度。采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,从而可以防止在图像特征提取过程中丢失图像的边缘特征信息和与语义特征对应的二维图像之间的层间信息,且增加图像的感受野,从而保证待识别图像中小目标边缘的分辨率,提高待识别图像的分割精度。附图说明
[0061] 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
[0062] 图1是本申请实施例提供的图像分割方法的实现流程示意图;
[0063] 图2是本申请实施例提供的图像分割模型的结构图;
[0064] 图3是本申请实施例提供的图像分割方法的子步骤的流程图
[0065] 图4是本申请实施例提供的图像分割装置的示意图;
[0066] 图5是本申请实施例提供的终端设备的示意图。

具体实施方式

[0067] 以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0068] 为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
[0069] 应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0070] 还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0071] 还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0072] 如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0073] 下面对本申请实施例提供的图像分割方法进行描述,本申请实施例提供的图像分割方法应用于终端设备,请参阅附图1,本申请实施例提供的图像分割方法包括:
[0074] S101:获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别。
[0075] 其中,所述待识别图像为三维图像数据,例如,三维医学图像数据。三维图像数据由多个子图像组成,例如,三维医学图像数据中每个子图像对应一个器官,每个子图像对应一个图像类别,图像类别包括各器官名称和背景。
[0076] S102:采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征。
[0077] 具体地,待识别图像由多个二维切片叠加组成,每个二维切片对应一个二维图像。边缘特征提取运算为提取每个二维图像的边缘特征的卷积运算,语义特征提取运算为利用二维图像之间的层间信息提取待识别图像的语义特征的卷积运算,感受野增加运算为在特征提取过程中增加感受野的运算。图像分割模型对输入的待识别图像进行上述卷积运算,得到待识别图像的图像特征。
[0078] 在一种可能的实现方式中,如图2所示,图像分割模型包括二维操作模块21、三维操作模块22和高分辨率操作模块23,所述二维操作模块21包括第一编码器,所述三维操作模块22包括第二编码器,所述高分辨率操作模块23包括第三编码器。对应地,如图3所示,S102具体包括S201-S203。
[0079] S201:采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征。
[0080] 在一种可能的实现方式中,第一编码器包括两个输出通道为16、卷积核为1×3×3的卷积层和一个步长为1×2×2、卷积核为1×2×2的最大池化层。将三维图像数据依次经过上述卷积层和最大池化层进行第一卷积运算,得到第一下采样数据。对三维图像数据进行第一卷积运算,可以提取二维图像的边缘特征,防止在后续特征提取过程中丢失边缘特征信息。
[0081] S202:采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征。
[0082] 在一种可能的实现方式中,第二编码器包括依次连接的两个输出通道为32、卷积核为3×3×3的卷积层,第一残差压缩提取块,步长为2×2×2、卷积核为2×2×2的最大池化层,两个输出通道为32、卷积核为3×3×3的卷积层和第二残差压缩提取块。其中,残差压缩提取块是将输入残差网络的数据和残差网络输出的数据进行运算后作为新的数据输出的运算,残差压缩网络的运算过程为现有技术,在此不再赘述。本实施例中,将第一下采样数据依次经过上述卷积层、第一残差压缩提取块、最大池化层、卷积层和第二残差压缩提取块,可以利用二维图像之间的层间信息提取出待识别图像语义特征,即对层间信息进行有效的特征提取,保证图像分割的精度。
[0083] S203:采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
[0084] 在一种可能的实现方式中,第三编码器包括输出通道为128的第一空洞卷积层、第三残差压缩提取块、输出通道为256的第二空洞卷积层和第四残差压缩提取块。其中,第一空洞卷积层和第二空洞卷积层均包括空洞率不同的多个卷积层。将第二下采样数据输入第一空洞卷积层,依次进行空洞率分别为1、2、3的卷积运算,将经过第一空洞卷积层运算的结果输入第三残差压缩提取块,将第三残差压缩提取块的输出输入第二空洞卷积层,依次进行空洞率分别为3、4、5的卷积运算,其中,空洞卷积运算为现有技术,在此不再赘述。本申请实施例将第二下采样数据依次经过上述第一空洞卷积层、第三残差压缩提取块、第二空洞卷积层和第四残差压缩提取块,相对于通过减少池化层以提高分割精度的方法,本申请实施例的方法在保证图像分割精度的情况下,可以增大感受野。
[0085] S103:采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的。
[0086] 具体地,图像分割模型对待识别图像的图像特征进行卷积运算,得到每个像素对应的概率,根据预先设定的概率与图像类别的对应关系,得到每个像素对应的图像类别。
[0087] 在一种可能的实现方式中,如图2所示,所述二维操作模块21还包括与所述第一编码器对应的第一解码器,所述三维操作模块22还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块23还包括与所述第三编码器对应的第三解码器。第三解码器包括依次连接的输出通道为128、卷积核为1×1×1的卷积层,输出通道为128、空洞率依次为1、2、3的卷积层,第五残差压缩提取块,和输出通道为64、卷积核为1×1×1的卷积层,将待识别图像的图像特征经过第三解码器进行处理,得到第一上采样数据;第二解码器包括依次连接的两个输出通道为32、卷积核为3×3×3的卷积层,第六残差压缩提取块,步长为2×
2×2、卷积核为2×2×2的反卷积层,两个输出通道为32、卷积核为3×3×3的卷积层和第七残差压缩提取块,将第一上采样数据经过第二解码器进行处理,得到第二上采样数据;第一编码器包括输出通道为32、步长为1×2×2、卷积核为1×2×2的反卷积层,两个输出通道为
32、卷积核为1×3×3的卷积层,和卷积核为1×1×1的卷积层,将第二上采样数据经过第一解码器进行处理,得到每个像素对应的概率,根据各个图像类别对应的概率得到每个像素对应的图像类别。
[0088] 本申请实施例中,图像分割模型是对分类模型进行训练得到的。分类模型与图像分割模型的结构相同,将训练样本中的三维图像数据输入分类模型,得到每个像素对应的概率,根据每个像素对应的概率与该像素对应的图像类别的差异优化分类模型的参数,每个像素对应的概率与该像素对应的图像类别的差异用损失函数表示,当损失函数达到预设值时,得到分类模型的最优参数,即图像分割模型的参数,从而得到图像分割模型。
[0089] 其中,损失函数为LTotal=LFocal+λLAverageDice,
[0090] 其中,
[0091] C表示图像类别的数量,N表示训练批次中的像素数量, 表示训练批次中第n个像素分类为c类的概率, 表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数。
[0092] 损失函数中, 用于解决目标检测中的前景类与背景类不平衡引起识别精度较低的问题, 通过将像素
级的标记问题转换为最小化类级分布距离来缓解类不平衡问题,通过将两部分结合,保证图像分割模型中的参数的精度。
[0093] S104:根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
[0094] 具体地,根据每个像素对应的图像类别,将相同的图像类别进行相同的标记,例如,每个图像类别对应一个颜色,得到分割图像。在医学图像中,将目标器官对应的像素进行标记,以分割出目标器官对应的像素。
[0095] 在一种可能的实现方式中,训练样本中的三维图像和待识别图像为相同大小的图像块。三维图像数据输入分类模型前,首先进行预处理。具体为:对三维图像数据中的像素进行标准化,对每个标准化后的图像使用随机旋转、随机平移、弹性形变的方法进行数据增强,以扩充训练样本的规模,对所有三维图像数据进行重采样,使得重采样后的图像的像素间距变得一致,在重采样后的图像中随机截取256×256×48×1的图像块作为网络的输入,其中1是通道数,48是层数,256×256是分辨率。对应地,输入图像分类模型的待识别图像为经过预处理后的输入图像。具体为:对输入图像进行重采样,使得重采样后的图像的像素间距变得一致,通过步长为128×128×24的滑动窗从重采样后的图像中截取大小为256×256×48的图像块,即待识别图像。
[0096] 在一种可能的实现方式中,每个待识别图像输入图像分割模型后得到一个对应的分割图像,将每个分割图像的重叠的区域进行融合,得到每个图像类别对应的融合图像。然后使用最近邻插值法将融合图像的分辨率还原为输入图像的分辨率。根据每个图像类别对应的融合图像,得到每个图像类别对应的像素,根据每个图像类别对应的像素可以得出每个图像类别对应的边界的像素,从输入图像中提取出目标图像类别的边界对应的像素,即可根据目标图像类别的边界的像素分割出目标图像类别对应的图像。
[0097] 上述实施例中,通过获取待识别图像,采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到待识别图像的图像特征;采用图像分割模型对图像特征进行处理,得到待识别图像中每个像素对应的图像类别;根据待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,可以防止在图像特征提取过程中丢失图像的边缘特征信息和与语义特征对应的二维图像之间的层间信息,且增加图像的感受野,防止待识别图像中小目标对应的图像特征丢失,从而保证待识别图像中小目标边缘的分辨率,提高图像分割精度。
[0098] 应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
[0099] 对应于上文实施例所述的图像分割方法,图4示出了本申请实施例提供的装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
[0100] 如图4所示,本申请实施例提供的图像分割装置包括,
[0101] 获取模块10,用于获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
[0102] 特征提取模块20,用于采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
[0103] 分类模块30,用于采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
[0104] 分割模块40,用于根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
[0105] 在一种可能的实现方式中,所述图像分割模型包括二维操作模块、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述特征提取模块20具体包括:
[0106] 第一计算单元,用于采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
[0107] 第二计算单元,用于采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
[0108] 第三计算单元,用于采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
[0109] 在一种可能的实现方式中,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述分类模块30具体包括:
[0110] 第四计算单元,用于采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
[0111] 第五计算单元,用于采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
[0112] 第六计算单元,用于采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
[0113] 第七计算单元,用于根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
[0114] 在一种可能的实现方式中,所述第三计算单元具体用于:
[0115] 采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
[0116] 在一种可能的实现方式中,所述特征提取模块20还用于:
[0117] 根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
[0118] LTotal=LFocal+λLAverageDice,
[0119] 其中,C表示图像类别的数量,N表示训练批次中的像素数量, 表示训练批次中第n个像素分类为c类的概率, 表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数。
[0120] 根据所述分类模型的最优参数生成所述图像分割模型。
[0121] 在一种可能的实现方式中,所述图像分割模型还包括预处理模块和融合模块,所述预处理模块用于:获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
[0122] 所述融合模块用于:在根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
[0123] 在一种可能的实现方式中,所述图像分割模型还包括提取模块,用于:
[0124] 从所述输入图像中提取出所述融合图像的边界对应的像素。
[0125] 需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0126] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0127] 图5是本申请实施例提供的终端设备的示意图。如图5所示,该实施例的终端设备包括:处理器11、存储器12以及存储在所述存储器12中并可在所述处理器11上运行的计算机程序13。所述处理器11执行所述计算机程序13时实现上述图像分割方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器11执行所述计算机程序13时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块10至40的功能。
[0128] 示例性的,所述计算机程序13可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器11执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序13在所述终端设备中的执行过程。
[0129] 所述终端设备可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。所述终端设备可包括,但不仅限于,处理器11、存储器12。本领域技术人员可以理解,图5仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
[0130] 所述处理器11可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0131] 所述存储器12可以是所述终端设备的内部存储单元,例如终端设备的硬盘或内存。所述存储器12也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器12还可以既包括所述终端设备的内部存储单元也包括外部存储设备。所述存储器12用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器12还可以用于暂时地存储已经输出或者将要输出的数据。
[0132] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0133] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
[0134] 在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0135] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0136] 另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0137] 集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
[0138] 以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈