首页 / 专利库 / 视听技术与设备 / 深度相机 / 一种铁路货车人力制动机轴链脱落故障图像识别方法

一种路货车人制动机轴链脱落故障图像识别方法

阅读:25发布:2020-05-11

专利汇可以提供一种路货车人制动机轴链脱落故障图像识别方法专利检索,专利查询,专利分析的服务。并且一种 铁 路货车人 力 制动 机轴链脱落故障 图像识别 方法,涉及货运列车检测技术领域,针对 现有技术 中利用人工进行逐一排查人力制动是否发生故障时,检测效率和准确率低的问题,包括:步骤一:通过高清线阵相机采集待测目标的灰度图像,并建立样本数据集;步骤二:对样本数据集进行数据扩增;步骤三:对样本数据集中的图像进行标记;步骤四:将原始图像和标记数据作为训练集;步骤五:将训练集中训练样本及标记图像中 像素 转化为0~1之间;步骤六:构建U-Net网络模型,利用步骤五处理后的训练集对构建的U-Net网络模型进行训练,获得训练好的 深度学习 模型;步骤七:将待测图像输入训练好的U-Net网络模型,进行人力制动机轴链脱落故障检测。,下面是一种路货车人制动机轴链脱落故障图像识别方法专利的具体信息内容。

1.一种路货车人制动机轴链脱落故障图像识别方法,其特征在于包括以下步骤:
步骤一:通过高清线阵相机采集待测目标的灰度图像,并建立样本数据集;
步骤二:对样本数据集进行数据扩增;
步骤三:对样本数据集中的图像进行标记;
步骤四:将原始图像和标记数据作为训练集;
步骤五:将训练集中训练样本及标记图像中像素转化为0~1之间;
步骤六:构建U-Net网络模型,利用步骤五处理后的训练集对构建的U-Net网络模型进行训练,获得训练好的深度学习模型;
步骤七:将待测图像输入训练好的U-Net网络模型,进行人力制动机轴链脱落故障检测。
2.根据权利要求1所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,其特征在于:所述数据扩增包括图像平移、旋转和加噪声。
3.根据权利要求1所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,其特征在于:所述U-Net网络模型为两个U-Net之间桥接架构。
4.根据权利要求3所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,其特征在于:所述两个U-Net之间桥接架构的具体结构为:将第一个U-Net网络的每个解码器层与U-Net的相应的编码器层连接,直接将先前成的特征输入到后一层中。
5.根据权利要求4所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,其特征在于:所述U-Net采用传统的U-Net网络结构,其结构为:
第一步、编码:
利用编码器对图像进行特征提取,获取不同感受野下的特征图,并利用两个卷积模连接一个池化层的结构进行四次下采样,输入原始图像大小为384*640*1,经过第一个下采样变为192*320*32,经过第二个下采样变为96*160*64,第三个下采样为48*80*128,第四个下采样变为24*40*256,接着连接两个卷积层变为32*16*256,后加上一个dropout层,特征提取完毕;
第二步、解码:
利用解码器进行四次上采样,每个上采样后与编码器对应层进行concatenate方式连接,每个上采样后接concatenate以及两个卷积层并与编码器结构相对应,经过一个上采样后特征图为48*80*128,经过两个上采样为96*160*64,经过三个上采样为192*320*32,经过四个上采样特征图为384*640*32。
6.根据权利要求4所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,其特征在于:所述编码器浅层使用ELU激活函数,其公式为:
其中,f(x)代表ELU激活函数,其中x为函数输入,α取值为(0,1)。
7.根据权利要求1所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,其特征在于所述深度学习模型的损失函数为:
其中,y表示真实标记的分布,则为预测分布。
8.根据权利要求1所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,其特征在于所述步骤七中检测的具体步骤为:
首先将途径货车图像利用深度学习网络进行数据变换,然后使用训练好的网络模型完成人力制动机轴链图像预测,并使预测结果的灰度值在0~1之间,并针对预测图像乘以
255,然后采用图像处理算法得到滑轮、铁链、管的位置,最后判断滑轮是否向下倾斜,如果向下倾斜则输出报警,再判断管和铁链位置的差值是否超出设定阈值,若超出设定阈值则输出报警,若未超出设定阈值,则判断下一张图像。

说明书全文

一种路货车人制动机轴链脱落故障图像识别方法

技术领域

[0001] 本发明涉及货运列车检测技术领域,具体为一种铁路货车人力制动机轴链脱落故障图像识别方法。

背景技术

[0002] 货车人力制动机主要是用以调速或停车,提高调车效率,保证调车作业安全;在货车运行途中,当空气制动机发生故障,失去作用时,用以代替空气制动机。因此人力制动发生故障将会危及行车安全。传统的检测方法是通过轨边的采集的图像利用人工进行逐一排查。由于检车人员在工作过程中极易出现疏忽、遗漏的现象,因此造成误判、漏判,从而影响行车安全。随着深度学习技术不断发展,采用深度学习进行货车地板故障识别,可以有效提高检测准确率,较大程度的节约人工成本,可实现减员增效。

发明内容

[0003] 本发明的目的是:针对现有技术中利用人工进行逐一排查人力制动是否发生故障时,检测效率低的问题,提出一种铁路货车人力制动机轴链脱落故障图像识别方法。
[0004] 本发明为了解决上述技术问题采取的技术方案是:一种铁路货车人力制动机轴链脱落故障图像识别方法,包括以下步骤:
[0005] 步骤一:通过高清线阵相机采集待测目标的灰度图像,并建立样本数据集;
[0006] 步骤二:对样本数据集进行数据扩增;
[0007] 步骤三:对样本数据集中的图像进行标记;
[0008] 步骤四:将原始图像和标记数据作为训练集;
[0009] 步骤五:将训练集中训练样本及标记图像中像素转化为0~1之间;
[0010] 步骤六:构建U-Net网络模型,利用步骤五处理后的训练集对构建的U-Net网络模型进行训练,获得训练好的深度学习模型;
[0011] 步骤七:将待测图像输入训练好的U-Net网络模型,进行人力制动机轴链脱落故障检测。
[0012] 进一步的,所述数据扩增包括图像平移、旋转和加噪声。
[0013] 进一步的,所述U-Net网络模型为两个U-Net之间桥接架构。
[0014] 进一步的,所述两个U-Net之间桥接架构的具体结构为:将第一个U-Net网络的每个解码器层与U-Net的相应的编码器层连接,直接将先前成的特征输入到后一层中。
[0015] 进一步的,所述U-Net采用传统的U-Net网络结构,其结构为:
[0016] 第一步、编码:
[0017] 利用编码器对图像进行特征提取,获取不同感受野下的特征图,并利用两个卷积模连接一个池化层的结构进行四次下采样,输入原始图像大小为384*640*1,经过第一个下采样变为192*320*32,经过第二个下采样变为96*160*64,第三个下采样为48*80*128,第四个下采样变为24*40*256,接着连接两个卷积层变为32*16*256,后加上一个dropout层,特征提取完毕;
[0018] 第二步、解码:
[0019] 利用解码器进行四次上采样,每个上采样后与编码器对应层进行concatenate方式连接,每个上采样后接concatenate以及两个卷积层并与编码器结构相对应,经过一个上采样后特征图为48*80*128,经过两个上采样为96*160*64,经过三个上采样为192*320*32,经过四个上采样特征图为384*640*32。
[0020] 进一步的,所述编码器浅层使用ELU激活函数,其公式为:
[0021]
[0022] 其中,f(x)代表ELU激活函数,其中x为函数输入,α取值为(0,1)。
[0023] 进一步的,所述深度学习模型的损失函数为:
[0024]
[0025] 其中,y表示真实标记的分布,则为预测分布。
[0026] 进一步的,所述步骤七中检测的具体步骤为:
[0027] 首先将途径货车图像利用深度学习网络进行数据变换,然后使用训练好的网络模型完成人力制动机轴链图像预测,并使预测结果的灰度值在0~1之间,并针对预测图像乘以255,然后采用图像处理算法得到滑轮、铁链、管的位置,最后判断滑轮是否向下倾斜,如果向下倾斜则输出报警,再判断管和铁链位置的差值是否超出设定阈值,若超出设定阈值则输出报警,若未超出设定阈值,则判断下一张图像。
[0028] 本发明的有益效果是:
[0029] 1、使用深度学习技术代替人工检测,提高故障检测的效率、准确率。
[0030] 2、深度学习自学习特征的特点可解决传统图像算法中特征手工提取、设计鲁棒算法困难、需要大量调试试验等缺点。附图说明
[0031] 图1为本发明的整体结构图。
[0032] 图2为本发明的网络结构图。

具体实施方式

[0033] 具体实施方式一:参照图1和图2具体说明本实施方式,本实施方式所述的一种铁路货车人力制动机轴链脱落故障图像识别方法,包括以下步骤:
[0034] 步骤一:通过高清线阵相机采集待测目标的灰度图像,并建立样本数据集;
[0035] 步骤二:对样本数据集进行数据扩增;
[0036] 步骤三:对样本数据集中的图像进行标记;
[0037] 步骤四:将原始图像和标记数据作为训练集;
[0038] 步骤五:将训练集中训练样本及标记图像中像素转化为0~1之间;
[0039] 步骤六:构建U-Net网络模型,利用步骤五处理后的训练集对构建的U-Net网络模型进行训练,获得训练好的深度学习模型;
[0040] 步骤七:将待测图像输入训练好的U-Net网络模型,进行人力制动机轴链脱落故障检测。
[0041] 1、建立原始数据集
[0042] 通过高清线阵相机采集的灰度图像对所需原始数据集图像进行收集,收集的原则是尽量要保证数据的多样性,因为在图像采集时,可能会遇到天气的变化(如:下雨天气),以及车自身存在油渍、泥渍、黑漆等。还有需要完成不同时间图像采集,因为采集图像是在露天的环境下进行,不同时间阳光的干扰程度是不同的。通过原始数据集的多样性可以增强模型的鲁棒性以及模型的泛化能力。同时为了能够满足模型能够适应在不同的站点上,因此也需要收集不同站点采集过来的图像。
[0043] 2、数据扩增
[0044] 在网络训练过程中,神经网络都是需要大量的参数,许许多多的神经网路的参数都是数以百万计,而使得这些参数可以正确工作则需要大量的数据进行训练,而实际情况中数据并没有我们想象中的那么多,因此在前期数据准备阶段,仍需对数据样本进行数据增强工作包括图像平移、旋转、加噪声等,这样不仅增加训练的数据量,提高模型的泛化能力,而且通过增加噪声数据,还可以提升模型的鲁棒性。
[0045] 3、网络模型搭建、训练以及预测
[0046] 在训练前期,首先将训练样本以及标签图像中像素转化为0~1之间,目的是为了减小输入特征的尺度。
[0047] 传统的U-Net网络模型对于人力制动机轴链这种形态多变、多样的样本来说,浅型网络结构是很难具有泛化能力的,但是对于原有U-Net网络在卷积层增加时很难训练达到满意的效果,除非样本中有更好,更多可学习的参数。因此针对个人需求有人完成了堆叠的U-Net网络。然而,由于堆叠的U形网络更加的复杂,因此这种网络可能陷入次优的解决方案。在本发明中,提出了两个U-Net之间桥接架构,将第一个U-Net网络的每个解码器层与U-Net的相应的编码器层连接,直接将先前成的特征输入到后一层中。与单个U-Net相比,该过程降低了训练成本,并且能够表现出更好的性能。
[0048] 传统的U-Net网络结构为:
[0049] 第一步:编码
[0050] 编码器,即对图像进行特征提取,获取不同感受野下的特征图。采用两个卷积模块连接一个池化层的结构,减少特征图的维度加快计算速度。输入原始图像大小为384*640*1,经过第一个下采样变为192*320*32,经过第二个下采样变为96*160*64,第三个下采样为
48*80*128,第四个下采样变为24*40*256,共采用四次下采样,下采样可以扩大感受野,减少网络参数以及不容易过拟合。接着连接两个卷积层变为32*16*256,后加上一个dropout层,防止过拟合,特征提取完毕。
[0051] 第二步:解码
[0052] 与编码器四个下采样相对应,解码器采用四个上采样,每个上采样后与编码器对应层实现concatenate连接方式,特征图维度不变,计算量要小很多,所以速度增加。每个上采样后接concatenate以及两个卷积层,与编码器结构相对应。经过一个上采样,后特征图为48*80*128,经过两个上采样为96*160*64,经过三个上采样为192*320*32,经过四个上采样特征图为384*640*32。
[0053] 传统的U-Net网络当中使用ReLU激活函数,但是ReLU是在负轴上饱和的,并且在大的学习率将会“杀死”一些神经元,因为在编码器浅层使用ELU激活函数,公式下所示:
[0054]
[0055] 其中,f(x)代表ELU激活函数,其中x为函数输入,α取值为(0,1)。
[0056] ELU不会立即在负轴上饱和。但是,当网络变得更深时,仍然会发生饱和。当ELU饱和时,它与ReLU没有任何不同。因此,我们可以用ReLU替换一些ELU层。以此减少参数的计算量。
[0057] 在网络中由向下卷积部分和向上卷积部分组成。向下卷积部分旨在提取用于将每个体素分类为一个或零的特征。它包括重复应用两个3*3卷积。在每个下采样步骤中,特征通道的数量加倍。上卷积部分旨在更精确地定位感兴趣区域(ROI)。上卷积部分中的每一步都包括对特征映射的上采样通过2*2卷积,其将特征通道的数量减半,与来自收缩路径的相应裁剪的特征映射以及3*3卷积串联。并且在每个激活函数后连接最大池化层。网络如图1所示。
[0058] 最后采用交叉熵损失函数进行模型选择,通过5折交叉验证进行模型训练,求取Mask中ground truth和预测值的交叉熵均值,公式如下:
[0059]
[0060] 其中,y表示真实标记的分布,则为预测分布。
[0061] 采用adam优化进行反向传播,设定梯度衰减率,通过early stopping加快模型训练过程。
[0062] 网络桥接使用添加(add)方法。此方法都广泛用于计算机视觉。例如,FPN使用了将低级别特征与更高级别语义特征相结合的附加功能。虽然从权重初始化的度来看,连接更有效,但添加有其自身的优点会更适合于特征融合,不使用串联的原因是它会导致冗余。
[0063] 4、人力制动机轴链脱落故障判断
[0064] 将真实过车图像使用深度学习网络进行数据变换后,使用训练好的模型完成人力制动机轴链图像预测,预测结果灰度值在0~1之间,为了方便处理针对预测图像乘以255,这样对图像中滑轮、铁链、管呈现出对比度明显的3个灰度值区域。分别采用图像处理算法得到滑轮、铁链、管的位置,首先判断滑轮是否向下倾斜,如果向下倾斜则输出报警。再通过判断管和铁链位置的差值超出设定阈值则输出报警。如果两项均满足要求则判断下一张图像。
[0065] 需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不能以此限定权利保护范围。凡根据本发明权利要求书和说明书所做的仅仅是局部改变的,仍应落入本发明的保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈