首页 / 专利库 / 人工智能 / 机器学习 / 监督学习 / 一种基于图像语义分割的损失函数及其设计方法

一种基于图像语义分割的损失函数及其设计方法

阅读:676发布:2020-05-12

专利汇可以提供一种基于图像语义分割的损失函数及其设计方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于图像语义分割的损失函数及其设计方法。本发明步骤如下:1。参数wi的确立。在网络训练过程中,从标签标注信息中提取此张图片中包含的语义类别个数n以及每个语义类别在图片中所占的面积s。在得到此两种标签信息后,将面积从大到小排列,并分别计算最大面积与各个面积之间的倍数,而后再将这些倍数关系归一化到[1,n]之间,即训练时每个损失函数计算时,不同类别对应的权重取值wi。2.参数Υ的确立。首先确定Υ>0,而后在网络训练过程中通过网格寻优的方式,对Υ的值进行进一步的确立。本发明设计损失带有权重的损失函数进行改进,以使训练的 卷积神经网络 得到更好的 图像分割 效果。,下面是一种基于图像语义分割的损失函数及其设计方法专利的具体信息内容。

1.一种基于图像语义分割的损失函数,其特征在于该损失函数如下所示:
式中,yi为像素点i的类别标签, 为像素点i的yi的预测概率,当 越大,说明输出越接近于正确的预测,此时Loss越接近于0;在损失函数中,加入对每个像素点的计算权重其中Υ>0;参数wi为像素点i属于不同类别时,Loss计算过程中所应分配的权重,其大小由标签数据中,各个类别所占的面积决定,当图片中的某一语义类别在整幅图片中所占面积较小时,wi的数值便会相应增加,以使得网络的学习能够更加关注于这一小的语义对象。
2.根据权利要求1所述的一种基于图像语义分割的损失函数的设计方法,其特征在于该损失函数相关参数的设计方式包括以下步骤:
步骤1:参数wi的确立;在网络训练过程中,通常的监督学习都会有每张图片对应的标签标注信息,可以从标签标注信息中提取此张图片中包含的语义类别个数n以及每个语义类别在图片中所占的面积s;在得到此两种标签信息后,将面积从大到小排列,并分别计算最大面积与各个面积之间的倍数,而后再将这些倍数关系归一化到[1,n]之间,即为训练时,每个损失函数计算时,不同类别对应的权重取值wi;
步骤2:参数Υ的确立;首先确定Υ>0,而后在网络训练过程中,通过网格寻优的方式,对Υ的值进行进一步的确立。

说明书全文

一种基于图像语义分割的损失函数及其设计方法

技术领域

[0001] 本发明涉及计算机视觉人工智能领域,尤其涉及一种基于图像语义分割的损失函数及其设计方法,一种在图像语义分割任务中计算损失的方法。

背景技术

[0002] 图像语义分割问题是计算机视觉任务中的一个长期未解决的问题,同时,也是现实中许多应用的组件之一,比如自动驾驶、地理信息系统、医疗影像分析、机器人等领域。语义分割的重点在于将图像中的区域划分为具有语义信息的几个区域,早期的方法采用人为设计的人工算子提取图像特征进行图像语义分割,近几年卷积神经网络采用自动提起特征的方式,使得图像语义分割问题取得了巨大的进步。
[0003] 卷积神经网络的训练主要分为原始数据通过网络的前向传播和误差的反向传播更新网络的参数两个部分,这其中,损失函数的选择对误差的计算以及网络参数的更新起到关键性的作用,针对不同的任务,不同的误差函数,可以使得神经网络完成不同的任务。因此,设计一个合适的损失函数,使得图像语义分割任务能够达到更好的效果,显得尤为重要。

发明内容

[0004] 本发明提出一种基于图像语义分割的损失函数,该损失函数可以在卷积神经网络训练过程中兼具难识别样本的强化训练和小目标样本的平等训练。
[0005] 本发明的损失函数入下所示:
[0006]
[0007] 式中,yi为像素点i的类别标签, 为像素点i的yi的预测概率,当 越大,说明输出越接近于正确的预测,此时Loss越接近于0。在图像语义分割任务中,一次需要预测的像素点很多,在这其中,网络对每个像素点的预测能不尽相同,为了使网络更加专注于难预测像素点的学习,在损失函数中,加入对每个像素点的计算权重 其中γ>0。参数wi为像素点i属于不同类别时,Loss计算过程中所应分配的权重,其大小由标签数据中,各个类别所占的面积决定,当图片中的某一语义类别在整幅图片中所占面积较小时,wi的数值便会相应增加,以使得网络的学习能够更加关注于这一小的语义对象。
[0008] 一种基于图像语义分割的损失函数的推导方法,该损失函数相关参数的确立方式包括以下步骤:
[0009] 步骤1:参数wi的确立。在网络训练过程中,通常的监督学习都会有每张图片对应的标签标注信息,可以从标签标注信息中提取此张图片中包含的语义类别个数n以及每个语义类别在图片中所占的面积s。在得到此两种标签信息后,将面积从大到小排列,并分别计算最大面积与各个面积之间的倍数,而后,再将这些倍数关系归一化到[1,n]之间,即为训练时,每个损失函数计算时,不同类别对应的权重取值wi。
[0010] 步骤2:参数γ的确立。首先可以确定γ>0,而后在网络训练过程中,可以通过网格寻优的方式,对γ的值进行进一步的确立。
[0011] 本发明的有益效果是:针对图像语义分割问题中存在的难预测样本和小面积语义对象训练不够充分的问题,设计损失带有权重的损失函数进行改进,以使训练的卷积神经网络得到更好的图像分割效果。

具体实施方式

[0012] 本发明提出了一种基于图像语义分割的损失函数,其在卷积神经网络训练过程中,具体实施方式,如下所示:
[0013] 步骤1:在损失函数计算过程中,根据每个像素点的标签信息,确定其属于的类别,从而确定其wi。
[0014] 步骤2:根据每个像素点的预测概率,计算它们的交叉熵损失 对于预测概率更接近于1的像素点,认为其已不需要进行过多训练,通过 对其交叉熵损失进行进一步缩小,而对于预测概率更小点像素点,其 的值相对于预测概率大的像素点便会偏大,从而使网络更加专注于这些像素点的学习。
[0015] 步骤3:对所有像素点计算的损失秩进行加和平均,通过卷积神经网络中的反向传播机制,计算网络中,每个参数的梯度,并通过优化器更新参数值,达到网络训练的目的。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈