首页 / 专利库 / 电脑编程 / 算法 / 置信度传播算法 / 一种铁路货车制动梁梁体折断故障图像识别方法

一种路货车制动梁梁体折断故障图像识别方法

阅读:527发布:2020-05-08

专利汇可以提供一种路货车制动梁梁体折断故障图像识别方法专利检索,专利查询,专利分析的服务。并且一种 铁 路货车 制动 梁梁体折断故障 图像识别 方法,涉及货运列车检测技术领域,针对 现有技术 中采用人工检查图像的方式进行故障检测。由于检车人员在工作过程中极易出现疲劳、遗漏,造成检测效率低的问题,利用图像自动识别的方式代替人工检测,提高检测效率、准确率。将 深度学习 算法 应用到制动梁梁体折断故障自动识别中,提高整体算法的 稳定性 及 精度 。对U-NET模型进行优化,缩短预测时间,提高分割速度。将SSD的特征提取器由VGG16更改为Resnet50与FPN的组合,通过多尺度的目标检测,将整体特征与局部特征相融合,提高单阶段目标检测算法SSD在小尺度目标检测方面精度。,下面是一种路货车制动梁梁体折断故障图像识别方法专利的具体信息内容。

1.一种路货车制动梁梁体折断故障图像识别方法,其特征在于包括以下步骤:
步骤一:获取途径货车的高清线阵图像,并建立样本数据集;
步骤二:对样本数据集进行数据扩增;
步骤三:对数据集中的图像进行标记;
步骤四:将原始图像和标记数据生成数据集,用于模型训练;
步骤五:从图像中裁剪出待识别部件区域;
步骤六:对制动梁梁体部分进行定位,确定识别范围,并利用U-NET网络对图像进行分割;
步骤七:综合先验知识对U-NET网络分割结果进行过滤与图像处理后,对图像进行裁剪和拼接;
步骤八:将裁剪和拼接后的图像输入SSD_FPN网络模型中进行训练,并得到输出结果,根据该输出结果判断是否有折断故障。
2.根据权利要求1所述的一种铁路货车制动梁梁体折断故障图像识别方法,其特征在于所述数据扩增包括:图像的旋转、平移、缩放、平翻转、垂直翻转、对比度、光照调节和增加噪声。
3.根据权利要求1所述的一种铁路货车制动梁梁体折断故障图像识别方法,其特征在于所述对数据集中的图像进行标记的标记结果为原始图像对应的类别的掩码图像。
4.根据权利要求1所述的一种铁路货车制动梁梁体折断故障图像识别方法,其特征在于所述U-NET网络包括:编码单元、解码单元和编码解码单元,所述编码单元采用3个下采样的编码单元,所述解码单元包含3个上采样的解码单元;
第一编码单元包含64个3×3大小的卷积核进行卷积并池化,并与第三解码单元融合;
第二编码单元包含64个3×3大小的卷积核进行卷积并池化,并与第二解码单元融合;
第三编码单元包含128个3×3大小的卷积核进行卷积并池化,并与第一解码单元融合;
编码解码单元包含256个3×3大小的卷积核进行卷积;
第一解码单元包含编码解码单元上采样和第三编码单元融合,然后进行128个3×3大小的卷积核进行卷积;
第二解码单元包含第一解码单元上采样和第二编码单元融合,然后进行64个3×3大小的卷积核进行卷积;
第三解码单元包含第二解码单元上采样和第一编码单元融合,然后进行32个3×3大小的卷积核进行卷积;
最后1×1大小的卷积核进行卷积,输出分割结果。
5.根据权利要求1所述的一种铁路货车制动梁梁体折断故障图像识别方法,其特征在于所述SSD_FPN网络模型的训练过程为:
S1:提取Resnet_FPN特征,拼接高层的语义特征以及底层的空间特征,生成特征Map;
S2:多层特征图生成Anchor;
S3:将多层特征图预测Anchor,同GroundTruth box相匹配,根据匹配结果确定Loss;
S4:Loss反向传播,更新权重,继续下一轮训练。
6.根据权利要求5所述的一种铁路货车制动梁梁体折断故障图像识别方法,其特征在于所述S3中匹配的策略为:对所有的GroundTruth box选择与它IOU最大的Anchor进行匹配;对所有的Anchor,选择任何与其IOU大于0.5的GroundTruth box进行匹配。
7.根据权利要求5所述的一种铁路货车制动梁梁体折断故障图像识别方法,其特征在于所述Loss包括分类损失和回归位置损失,
所述分类损失的确定公式如下:
Pt=labels*sigmoid(predictions)+(1-labels)*(1-sigmoid(predictions))Classification_loss=focal_loss(Pt)=-αt(1-Pt)γlog(Pt)
所述回归位置损失的确定公式如下:
x=labels-predictions
总损失为:
Total_loss=Localization_loss+w×Classification_loss。
8.根据权利要求1所述的一种铁路货车制动梁梁体折断故障图像识别方法,其特征在于所述步骤八的具体步骤为:首先根据类别置信度确定其类别,并过滤掉属于背景的预测框,然后根据置信度阈值,过滤掉阈值较低的预测框,对于留下的预测框进行解码,根据先验框得到其真实的位置参数,解码之后,根据置信度进行降序排列,然后仅保留top-k个预测框,最后进行非极大性抑制算法,过滤掉那些重叠度较大的预测框,得到网络输出的预测结果,综合预测框位置和制动梁梁体定位的二值图像,以及预测框的置信度,判断是否有折断故障,并上传识别结果。

说明书全文

一种路货车制动梁梁体折断故障图像识别方法

技术领域

[0001] 本发明涉及货运列车检测技术领域,具体为一种铁路货车制动梁梁体折断故障图像识别方法。

背景技术

[0002] 制动梁是铁路车辆基础制动装置的最重要部分,车辆制动时,制动通过制动梁传到闸瓦,使车辆停止前进。制动梁梁体折断故障将直接影响行车安全,一旦发现故障,需及时拦停检修处理。传统的制动梁工位,采用人工检查图像的方式进行故障检测。由于检车人员在工作过程中极易出现疲劳、遗漏等情况,造成漏检、错检的出现,影响行车安全。而采用图像处理深度学习的方法进行制动梁折断故障自动识别,人工只需对报警结果进行确认,可有效节约人力成本,并提高检测准确率。

发明内容

[0003] 本发明的目的是:针对现有技术中采用人工检查图像的方式进行故障检测。由于检车人员在工作过程中极易出现疲劳、遗漏,造成检测效率低的问题,提出一种铁路货车制动梁梁体折断故障图像识别方法。
[0004] 本发明为了解决上述技术问题采取的技术方案是:一种铁路货车制动梁梁体折断故障图像识别方法,包括以下步骤:
[0005] 步骤一:获取途径货车的高清线阵图像,并建立样本数据集;
[0006] 步骤二:对样本数据集进行数据扩增;
[0007] 步骤三:对数据集中的图像进行标记;
[0008] 步骤四:将原始图像和标记数据生成数据集,用于模型训练;
[0009] 步骤五:从图像中裁剪出待识别部件区域;
[0010] 步骤六:对制动梁梁体部分进行定位,确定识别范围,并利用U-NET网络对图像进行分割;
[0011] 步骤七:综合先验知识对U-NET网络分割结果进行过滤与图像处理后,对图像进行裁剪和拼接;
[0012] 步骤八:将裁剪和拼接后的图像输入SSD-FPN网络模型中进行训练,并得到输出结果,根据该输出结果判断是否有折断故障。
[0013] 进一步的,所述数据扩增包括:图像的旋转、平移、缩放、平翻转、垂直翻转、对比度、光照调节和增加噪声。
[0014] 进一步的,所述对数据集中的图像进行标记的标记结果为原始图像对应的类别的掩码图像以及故障图像对应的折断故障区域的标记。
[0015] 进一步的,所述U-NET网络包括:编码单元、解码单元和编码解码单元,所述编码单元采用3个下采样的编码单元,所述解码单元包含3个上采样的解码单元;
[0016] 第一编码单元包含64个3×3大小的卷积核进行卷积并池化,并与第三解码单元融合;
[0017] 第二编码单元包含64个3×3大小的卷积核进行卷积并池化,并与第二解码单元融合;
[0018] 第三编码单元包含128个3×3大小的卷积核进行卷积并池化,并与第一解码单元融合;
[0019] 编码解码单元包含256个3×3大小的卷积核进行卷积;
[0020] 第一解码单元包含编码解码单元2*2上采样后和第三编码单元融合,然后进行128个3×3大小的卷积核进行卷积;
[0021] 第二解码单元包含第一解码单元2*2上采样后和第二编码单元融合,然后进行64个3×3大小的卷积核进行卷积;
[0022] 第三解码单元包含第二解码单元2*2上采样后和第一编码单元融合,然后进行32个3×3大小的卷积核进行卷积;
[0023] 最后1×1大小的卷积核进行卷积,输出分割结果。
[0024] 进一步的,所述SSD_FPN网络模型的训练过程为:
[0025] S1:提取Resnet_FPN特征,拼接高层的语义特征以及底层的空间特征,生成特征Map;
[0026] S2:多层特征图生成Anchor;
[0027] S3:将多层特征图预测Anchor,同GroundTruth box相匹配,根据匹配结果确定Loss;
[0028] S4:Loss反向传播,更新权重,继续下一轮训练。
[0029] 进一步的,所述S3中匹配的策略为:对所有的GroundTruth box选择与它IOU最大的Anchor进行匹配;对所有的Anchor,选择任何与其IOU大于0.5的GroundTruth box进行匹配。
[0030] 进一步的,所述Loss包括分类损失和回归位置损失,
[0031] 所述分类损失的确定公式如下:
[0032]
[0033] 所述回归位置损失的确定公式如下:
[0034] x=labels-predictions
[0035]
[0036] 总损失为:
[0037] Total_loss=Localization_loss+w×Classification_loss。
[0038] 进一步的,所述步骤八的具体步骤为:首先根据类别置信度确定其类别,并过滤掉属于背景的预测框,然后根据置信度阈值,过滤掉阈值较低的预测框,对于留下的预测框进行解码,根据先验框得到其真实的位置参数,解码之后,根据置信度进行降序排列,然后仅保留top-k个预测框,最后进行非极大性抑制算法,过滤掉那些重叠度较大的预测框,得到网络输出的预测结果,综合预测框位置和制动梁梁体定位的二值图像,以及预测框的置信度,判断是否有折断故障,并上传识别结果。
[0039] 本发明的有益效果是:
[0040] 1、利用图像自动识别的方式代替人工检测,提高检测效率、准确率。
[0041] 2、将深度学习算法应用到制动梁梁体折断故障自动识别中,提高整体算法的稳定性精度
[0042] 3、对U-NET模型进行优化,缩短预测时间,提高分割速度。
[0043] 4、将SSD的特征提取器由VGG16更改为Resnet50与FPN的组合,通过多尺度的目标检测,将整体特征与局部特征相融合,提高单阶段目标检测算法SSD在小尺度目标检测方面精度。
[0044] 5、传统的FPN每层特征金字塔只有一个尺度的特征表达,各层特征相互独立,没有关联。通过拼接高层的语义特征以及底层的空间特征,使每个预测层含有丰富的多尺度特征,更利于小目标的检测。附图说明
[0045] 图1为本发明故障识别流程图
[0046] 图2为本发明改进的U-NET网络结构图。
[0047] 图3为本发明FPN多层次特征融合示意图。

具体实施方式

[0048] 具体实施方式一:参照图1至图3具体说明本实施方式,本实施方式所述的一种铁路货车制动梁梁体折断故障图像识别方法,包括以下步骤:
[0049] 步骤一:获取途径货车的高清线阵图像,并建立样本数据集;
[0050] 步骤二:对样本数据集进行数据扩增;
[0051] 步骤三:对数据集中的图像进行标记;
[0052] 步骤四:将原始图像和标记数据生成数据集,用于模型训练;
[0053] 步骤五:从图像中裁剪出待识别部件区域;
[0054] 步骤六:对制动梁梁体部分进行定位,确定识别范围,并利用U-NET网络对图像进行分割;
[0055] 步骤七:综合先验知识对U-NET网络分割结果进行过滤与图像处理后,对图像进行裁剪和拼接;
[0056] 步骤八:将裁剪和拼接后的图像输入SSD_FPN网络模型中进行训练,并得到输出结果,根据该输出结果判断是否有折断故障。
[0057] 1、图像预处理
[0058] (1)图像收集
[0059] 通过在货车轨道周围搭建高清设备,获取途径货车的高清线阵图像。由于货车部件可能受到雨水、泥渍、油渍、黑漆等自然条件或者人为条件的影响。不同转向架类型的制动梁有所差异,不同站点拍摄的图像也可能存在差异。因此,制动梁图像之间千差万别。所以,在收集制动梁图像数据的过程中,要保证多样性,尽量将各种条件下的制动梁图像全部收集。
[0060] (2)数据扩增
[0061] 样本数据集的建立虽然包括各种条件下的图像,但为获得更多的训练样本,增加模型的鲁棒性,仍需要对样本数据集进行数据扩增。扩增形式包括图像的旋转、平移、缩放、水平翻转、垂直翻转、对比度、光照调节、增加噪声等操作,每种操作都是在随机条件下进行的,这样可以最大程度的保证样本的多样性和适用性。
[0062] (3)图像标记
[0063] 根据不同模型的需求,对数据集中的图像进行标记。制动梁梁体定位所采用的分割模型的标记结果为原始图像对应的类别(背景-0/制动梁梁体区域-1)的掩码图像。折断故障识别所采用的目标检测模型,通过标记得到包含折断位置的矩形框的XML文件。
[0064] (4)数据集生成
[0065] 将原始图像和标记数据生成数据集,用于模型训练。
[0066] 2、制动梁梁体定位
[0067] (1)利用硬件轴距信息和部件的位置等先验知识,从整列车的大图中裁剪出待识别部件区域。
[0068] (2)因为制动梁梁体较大,在底部图像上占比较大,因此需要先在底部图像上对制动梁梁体部分进行定位,确定识别范围。本发明采用U-NET网络对图像进行分割,得到0为背景,1为制动梁梁体的二值图像。
[0069] U-NET网络能够结合图像的全局与局部细节方面的特征,进行综合的考虑。前几层的卷积结果,会在同高度解码器上的进行信息融合。这样图像的图像高分辨率的细节信息就不会随着网络深度加深而丢失,能帮助最终我们的图像提供精细分割;而经过一次一次卷积池化后,在U-NET的最下层,包含整幅图像的全局信息(故障的总体位置、分布等),因此在医疗图像领域应用十分广泛。
[0070] 区别于高分辨率复杂的医疗图像,货车制动梁图像的分辨率要相对低些,无需提取超高分辨率特征来进行故障识别。因此在不影响分割结果的前提下,对U-NET网络结构进行了优化:减少网络深度,缩减卷积核的数目,进而减少参数数量,提高模型的预测速度。
[0071] 如图2所示,具体如下:
[0072] ①64个3×3大小的卷积核进行卷积并池化;
[0073] ②64个3×3大小的卷积核进行卷积并池化;
[0074] ③128个3×3大小的卷积核进行卷积并池化;
[0075] ④256个3×3大小的卷积核进行卷积;
[0076] ⑤上卷积④同③融合,128个3×3大小的卷积核进行卷积;
[0077] ⑥上卷积⑤同②融合,64个3×3大小的卷积核进行卷积;
[0078] ⑦上卷积⑥同①融合,32个3×3大小的卷积核进行卷积;
[0079] ⑧1×1大小的卷积核进行卷积,输出分割结果;
[0080] (3)综合先验知识(如制动梁梁体为两个对称三形),对U-NET分割结果进行过滤与图像处理后,分别计算两个三角形的外接矩形,以此对图像进行裁剪和拼接,用于下一步的故障检测。
[0081] 3、制动梁折断检测
[0082] (1)结合FPN的网络结构
[0083] 制动梁图像的特点是图像大,折断故障目标较小。而单阶段的SSD的模型,虽然速度满足实时要求,但存在小目标检测准确率不高的问题。为此,本发明提出一种基于SSD模型的多尺度故障识别的方法。该方法采用Resnet50与FPN的组合的金字塔结构作为特征提取器,使对小物体比较敏感的底层特征可以直接影响到目标检测器,进而提高小目标的检测准确性;同时在不同卷积层之间,增加信息的流动性,进而提升基础网络的特征描述能力。可根据故障区域占输入图像的大小,设置合理的多尺度检测层数,在保证识别精度的基础上减少网络宽度,提高速度。如图3所示。
[0084] (2)损失函数定义
[0085] 损失函数由两部分加权组成:分类损失和回归位置损失。本发明采用Sigmoid Focal Loss来计算分类损失,Huber Loss来计算回归位置损失。具体如下:
[0086] 分类损失:
[0087] Focal Loss将重点聚焦于难训练的样本,对于简单的,易于分类的样本,降低相应的Loss权重,而对于较为难训练的样本,增加对应的Loss权重。简单有效的解决了单阶段目标检测前景和背景类别不均衡的问题。计算公式如下:
[0088]
[0089] Pt=labels*sigmoid(predictions)+(1-labels)*(1-sigmoid(predictions))[0090] Classification_loss=focal_loss(Pt)=-αt(1-Pt)γlog(Pt)
[0091] 回归位置损失:
[0092] 对于分类结果中的正样本,还需计算回归位置损失。Huber Loss是一个用于回归问题的带参损失函数,降低了对离群点的惩罚程度,所以能增强平方误差损失函数对离群点的鲁棒性。计算公式如下:
[0093] x=labels-predictions
[0094]
[0095] 总损失:
[0096] 总损失是①和②加权的结果。因为故障检测问题更注重于对故障检测的正确性,所以应适当提高分类损失占总损失的权重。
[0097] Total_loss=Localization_loss+w×Classification_loss
[0098] (3)训练过程
[0099] a:提取Resnet_FPN特征,生成特征Map
[0100] b:多层特征图生成Anchor(Default box)
[0101] c:将多层特征图预测anchor,同GroundTruth box相匹配,根据匹配结果,按上述公式计算Loss。匹配策略如下:
[0102] 对所有的GroundTruth box选择与它IOU最大的Anchor(Default box)进行匹配;对所有的Anchor,选择任何与其IOU大于0.5的GroundTruth box进行匹配。
[0103] d:Loss反向传播,更新权重,继续下一轮训练。
[0104] 4、制动梁梁体折断故障判别
[0105] 对于输入的制动梁底部图像,计算特征图,对于每个可能预测框,首先根据类别置信度确定其类别(置信度最大者),并过滤掉属于背景的预测框。然后根据置信度阈值,过滤掉阈值较低的预测框。对于留下的预测框进行解码,根据先验框得到其真实的位置参数。解码之后,根据置信度进行降序排列,然后仅保留top-k(如100)个预测框。最后进行非极大性抑制(NMS)算法,过滤掉那些重叠度较大的预测框,得到网络输出的预测结果,[0106] 综合预测框位置和制动梁梁体定位的二值图像,以及预测框的置信度,判断是否有折断故障,并上传识别结果。
[0107] 需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不能以此限定权利保护范围。凡根据本发明权利要求书和说明书所做的仅仅是局部改变的,仍应落入本发明的保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈