基于图像语义分割的电梯轿厢闲置物品检测的方法专利检索-倾点油，脂肪和蜡专利检索查询-专利查询网

基于图像语义分割的 电梯轿厢闲置物品检测的方法

阅读：708发布：2024-02-23

专利汇可以提供基于图像语义分割的电梯轿厢闲置物品检测的方法专利检索，专利查询，专利分析的服务。并且本发明公开了一种基于图像语义分割的电梯轿厢闲置物品检测的方法，包括以下步骤：电梯轿厢中的摄像头初次安装完成或后期摄像头角度调整时，通过工具标记出该电梯轿厢地面区域；当电梯门完全关闭时，通过轿厢顶部的摄像头抓取一张图片，获得电梯轿厢地面区域；当门继续保持关闭，设定时间间隔，每隔一段时间进行一次抓图和分析，对轿厢地面区域面积持续测量，并将结果进行保存；利用保存的多次测量结果，比较图像语义分割所得的轿厢地面面积与维保人员标定的地面面积，如果其平均值大于设定阈值，则表示电梯轿厢中存在闲置物品，小于设定阈值，则表示不存在物品；根据检测结果和开关门情况，获得持续关门期间，物品出现的时长。，下面是基于图像语义分割的电梯轿厢闲置物品检测的方法专利的具体信息内容。

权利要求

1.一种基于图像语义分割的电梯轿厢闲置物品检测的方法，其特征在于，包括以下步骤：
电梯轿厢中的摄像头初次安装完成或后期摄像头角度调整时，通过工具标记出该电梯轿厢地面区域；
当电梯门完全关闭时，通过轿厢顶部的摄像头抓取一张图片，检测图片中是否有人，如果有人，则隔一段时间再利用摄像头抓图来分析是否有人，如果没有人，对抓取的图片进行图像语义分割，获得电梯轿厢地面区域；当门继续保持关闭，设定时间间隔，每隔一段时间进行一次抓图和分析，对轿厢地面区域面积持续测量，并将结果进行保存；
利用保存的多次测量结果，比较图像语义分割所得的轿厢地面面积与维保人员标定的地面面积，根据面积的差值，取其绝对值的平均值，如果其平均值大于设定阈值，则表示电梯轿厢中存在闲置物品，小于设定阈值，则表示不存在物品；根据检测结果和开关门情况，获得持续关门期间，物品出现的时长；设定闲置时长，时长大于设定阈值，则被最终认定为物品被闲置。
2.如权利要求1所述的基于图像语义分割的电梯轿厢闲置物品检测的方法，其特征在于，通过控制阈值区分对物品的定义，阈值越大，则物品越大，阈值越小，则物品越小，多次测量取平均值，确保测量准确。
3.如权利要求1所述的基于图像语义分割的电梯轿厢闲置物品检测的方法，其特征在于，后期摄像头角度调整时包括电梯摄像头安装角度的偏离预警，其中电梯摄像头安装角度的偏离预警进一步包括：门状态检测，轿厢顶部摄像头采集图像序列，首次运行需要从整张图像中检测出告警提示标签位置，根据其位置划定后续检测的局部区域，之后对后续图像序列分析划定的局部区域，根据标签之间的距离判断门的开合状态，包括开门、开门中、关门与关门中四个状态，每200ms判断一次状态，门状态改变指由关门到开门，反之也是，当门状态由开门变为关门时输出关门信号，其他状态改变不再输出信号；
抓图，利用轿厢顶部摄像头抓取一张电梯图像；
有无人检测，利用yolov3检测模型对所抓取图片进行检测，如果能够检测到图像中的人头和遮挡人体的目标框，则说明有人，反之则无人，当输出无人信号时，进行图像分析流程，当输出有人信号时，则需等待下次电梯关门信号；
图像语义分割，对抓取的图片进行图像语义分割，获得电梯轿厢地面区域；语义分割网络输出这里定义为两类，分别是轿厢地面和背景。通过收集不同电梯轿厢有无杂物时的数据，通过人工标定出轿厢地面所占像素区域。利用标定后的数据对语义分割网络进行训练，完成训练后，获得语义分割网络模型；由于目标输出两类，这里使用sigmod交叉熵损失函数引导训练，安装部署语义分割模型即可实现输入原始图片，输出对应的mask掩模区域；
矩形顶点估计，针对分割得到的电梯轿厢地面区域拟合外接矩形，获得外接矩形的四个顶点位置；
倾斜与覆盖率度量，其中，倾斜度量为根据相机安装位置和外接矩形与图片的位置关系，判定使用哪几个顶点与对应的图像边界来测量，如果相机安装在角落，外接矩形与图像边界相交角度大；如果相机安装在中间，外接矩形与图像边界相交角度小，如果外接矩形顶点在图像边界外边，这定义其到对应图像边界的距离为负，反之为正；对于摄像头安装在轿厢顶部内部的一角，通过轿厢底部左右两个点到图像边界的距离以及轿厢底部下部顶点到图像下部边界的距离，来判断电梯摄像头安装是否合适；对于摄像头安装在轿厢顶部内部一边的中间，需要分别利用底部两个顶点到图像底边的距离，以及顶部两个顶点到图像两边的距离来判断摄像头安装是否合适；覆盖率度量定义分割后轿厢底部面积与外接矩形面积占比，获得摄像头对轿厢底部视角的覆盖情况。
4.如权利要求1所述的基于图像语义分割的电梯轿厢闲置物品检测的方法，其特征在于，以上门状态检测、抓图、有无人检测、定时抓图、图像语义分割、面积比较步骤，通过设定的阈值判断时是否有闲置物品。
5.如权利要求3或4所述的基于图像语义分割的电梯轿厢闲置物品检测的方法，其特征在于，对抓取的轿厢内的图片判断是否有人过程中，目标定义为人头和遮挡人体，通过目标检测识别出图片中是否有人头和人体；图像语义分割区域为轿厢底部地面，通过语义分割图片出轿厢地面区域，进而获得其外界矩形，得到四个顶点；门状态识别也利用目标检测的方式，电梯门较高位置会贴有相应告警提示标签，通过检测告警提示标签之间的位置来实现门状态检测。
6.如权利要求4所述的基于图像语义分割的电梯轿厢闲置物品检测的方法，其特征在于，语义分割是在像素级别上的分类，属于同一类的像素都要被归为一类，采用U-net的encoder-decoder架构同时借用PSPnet中的spatial pyramid pooling模块组成语义分割网络，采用单模型单尺度的方法，编码部分Encoder输入图片通过4个卷积块，进行4次降采样，然后对16×16的特征图做spatial pyramid pooling操作，将新产生的特征图与之前16×16特征图进行拼接，解码部分Decoder利用1×1的通道卷积，进行通道压缩。利用双线性插值进行上采样，上采样得到特征图与之前32×32特征图进行加和操作，如果之前32×32特征图通道数不一致时，通过1×1的通道卷积调整到一致，后续反复两次这样操作，得到
128×128的特征图，之后再做最后一次上采样得到256×256的特征图，通过若干卷积层最终得到2×256×256的预测模板，与标定模板值进行比较，2代表两个类别，分别是轿厢地面和背景。

说明书全文

基于图像语义分割的电梯轿厢闲置物品检测的方法

技术领域

[0001] 本发明属于数据分析技术领域，具体涉及一种基于图像语义分割的电梯轿厢闲置物品检测的方法。

背景技术

[0002] 随着电梯的大范围使用，人们对乘梯安全性和舒适性都有越来越高的要求。电梯轿厢内的闲置物品，不仅降低乘梯舒适度，也带来安全隐患。

发明内容

[0003] 鉴于以上存在的技术问题，本发明用于提供一种基于图像语义分割的电梯轿厢闲置物品的检测的方法。

[0004] 为解决上述技术问题，本发明采用如下的技术方案：

[0005] 一种基于图像语义分割的电梯轿厢闲置物品检测的方法，包括以下步骤：

[0006] 电梯轿厢中的摄像头初次安装完成或后期摄像头角度调整时，通过工具标记出该电梯轿厢地面区域；

[0007] 当电梯门完全关闭时，通过轿厢顶部的摄像头抓取一张图片，检测图片中是否有人，如果有人，则隔一段时间再利用摄像头抓图来分析是否有人，如果没有人，对抓取的图片进行图像语义分割，获得电梯轿厢地面区域；当门继续保持关闭，设定时间间隔，每隔一段时间进行一次抓图和分析，对轿厢地面区域面积持续测量，并将结果进行保存；

[0008] 利用保存的多次测量结果，比较图像语义分割所得的轿厢地面面积与维保人员标定的地面面积，根据面积的差值，取其绝对值的平均值，如果其平均值大于设定阈值，则表示电梯轿厢中存在闲置物品，小于设定阈值，则表示不存在物品；根据检测结果和开关门情况，获得持续关门期间，物品出现的时长；设定闲置时长，时长大于设定阈值，则被最终认定为物品被闲置。

[0009] 优选地，通过控制阈值区分对物品的定义，阈值越大，则物品越大，阈值越小，则物品越小，多次测量取平均值，确保测量准确。

[0010] 优选地，后期摄像头角度调整时包括电梯摄像头安装角度的偏离预警，进一步包括：门状态检测，轿厢顶部摄像头采集图像序列，首次运行需要从整张图像中检测出告警提示标签位置，根据其位置划定后续检测的局部区域，之后对后续图像序列分析划定的局部区域，根据标签之间的距离判断门的开合状态，包括开门、开门中、关门与关门中四个状态，每200ms判断一次状态，门状态改变指由关门到开门，反之也是，当门状态由开门变为关门时输出关门信号，其他状态改变不再输出信号；

[0011] 抓图，利用轿厢顶部摄像头抓取一张电梯图像；

[0012] 有无人检测，利用yolov3检测模型对所抓取图片进行检测，如果能够检测到图像中的人头和遮挡人体的目标框，则说明有人，反之则无人，当输出无人信号时，进行图像分析流程，当输出有人信号时，则需等待下次电梯关门信号；

[0013] 图像语义分割，对抓取的图片进行图像语义分割，获得电梯轿厢地面区域；语义分割网络输出这里定义为两类，分别是轿厢地面和背景。通过收集不同电梯轿厢有无杂物时的数据，通过人工标定出轿厢地面所占像素区域。利用标定后的数据对语义分割网络进行训练，完成训练后，获得语义分割网络模型；由于目标输出两类，这里使用sigmod交叉熵损失函数引导训练，安装部署语义分割模型即可实现输入原始图片，输出对应的mask掩模区域；

[0014] 矩形顶点估计，针对分割得到的电梯轿厢地面区域拟合外接矩形，获得外接矩形的四个顶点位置；

[0015] 倾斜与覆盖率度量，其中，倾斜度量为根据相机安装位置和外接矩形与图片的位置关系，判定使用哪几个顶点与对应的图像边界来测量，如果相机安装在角落，外接矩形与图像边界相交角度大；如果相机安装在中间，外接矩形与图像边界相交角度小，如果外接矩形顶点在图像边界外边，这定义其到对应图像边界的距离为负，反之为正；对于摄像头安装在轿厢顶部内部的一角，通过轿厢底部左右两个点到图像边界的距离以及轿厢底部下部顶点到图像下部边界的距离，来判断电梯摄像头安装是否合适；对于摄像头安装在轿厢顶部内部一边的中间，需要分别利用底部两个顶点到图像底边的距离，以及顶部两个顶点到图像两边的距离来判断摄像头安装是否合适；覆盖率度量定义分割后轿厢底部面积与外接矩形面积占比，获得摄像头对轿厢底部视角的覆盖情况。

[0016] 优选地，以上门状态检测、抓图、有无人检测、图像语义分割、矩形顶点估计和倾斜与覆盖率度量步骤每隔一段时间检测一次，根据每次计算结果判断电梯摄像头角度是否发生改变。

[0017] 优选地，对抓取的轿厢内的图片判断是否有人过程中，目标定义为人头和遮挡人体，通过目标检测识别出图片中是否有人头和人体；图像语义分割区域为轿厢底部地面，通过语义分割图片出轿厢地面区域，进而获得其外界矩形，得到四个顶点；门状态识别也利用目标检测的方式，电梯门较高位置会贴有相应告警提示标签，通过检测告警提示标签之间的位置来实现门状态检测。

[0018] 优选地，语义分割是在像素级别上的分类，属于同一类的像素都要被归为一类，采用U-net的encoder-decoder架构同时借用PSPnet中的spatial pyramid pooling模块组成语义分割网络，采用单模型单尺度的方法，编码部分Encoder输入图片通过4个卷积块，进行4次降采样，然后对16×16的特征图做spatial pyramid pooling操作，将新产生的特征图与之前16×16特征图进行拼接，解码部分Decoder利用1×1的通道卷积，进行通道压缩。利用双线性插值进行上采样，上采样得到特征图与之前32×32特征图进行加和操作，如果之前32×32特征图通道数不一致时，通过1×1的通道卷积调整到一致，后续反复两次这样操作，得到128×128的特征图，之后再做最后一次上采样得到256×256的特征图，通过若干卷积层最终得到2×256×256的预测模板，与标定模板值进行比较，2代表两个类别，分别是轿厢地面和背景。

[0019] 采用本发明具有如下的有益效果：解决了自动检测当电梯无人时轿厢中是否有闲置物品，由于闲置物品会带来乘梯隐患，降低其他乘客乘梯舒适度，当检测出轿厢中含有闲置物品时，可以通知物业等相关人员及时清理电梯轿厢中的闲置物品。附图说明

[0020] 图1为本发明实施例的基于图像语义分割的电梯轿厢闲置物品检测的方法的步骤流程图；

[0021] 图2为本发明实施例中电梯摄像头安装角度的矫正方法的步骤流程图；

[0022] 图3为本发明一具体应用实例中相机安装在角落，外接矩形与图像边界相交角度大的示意图；

[0023] 图4为本发明实施例中摄像头角度偏离较大时，轿厢地面区域会被遮挡，这时与外接矩形面积相比较小的示意图；

[0024] 图5为本发明实施例中监测摄像头角度偏离预警的流程示意图。

具体实施方式

[0025] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0026] 参照图1，所示为本发明实施例的基于图像语义分割的电梯轿厢闲置物品检测的方法，包括以下步骤：

[0027] 电梯轿厢中的摄像头初次安装完成或后期摄像头角度调整时，通过工具标记出该电梯轿厢地面区域；

[0028] 当电梯门完全关闭时，通过轿厢顶部的摄像头抓取一张图片，检测图片中是否有人，如果有人，则隔一段时间再利用摄像头抓图来分析是否有人，如果没有人，对抓取的图片进行图像语义分割，获得电梯轿厢地面区域；当门继续保持关闭，设定时间间隔，每隔一段时间进行一次抓图和分析，对轿厢地面区域面积持续测量，并将结果进行保存；通过控制阈值区分对物品的定义，阈值越大，则物品越大，阈值越小，则物品越小，多次测量取平均值，确保测量准确。

[0029] 利用保存的多次测量结果，比较图像语义分割所得的轿厢地面面积与维保人员标定的地面面积，根据面积的差值，取其绝对值的平均值，如果其平均值大于设定阈值，则表示电梯轿厢中存在闲置物品，小于设定阈值，则表示不存在物品；根据检测结果和开关门情况，获得持续关门期间，物品出现的时长；设定闲置时长，时长大于设定阈值，则被最终认定为物品被闲置。具体应用实例中，可采用多边形的方法相对准确的标记出电梯轿厢地面。

[0030] 上述流程能够测量在持续关门期间是否存在闲置物品，闲置物品存在的时间由关门持续时间计算。对每次获得闲置物品时间与设定闲置时间阈值比较，如果大于，则闲置，如果小于，则观察后续关门期间时间是否累加。时间累加原则为：如果存在相邻两次关门期间，都存在闲置物品，则闲置物品存在时长为两次独立时长相加。如果相邻两次关门期间，一个存在闲置物品，一个不存在，则闲置物品时长不再累加。最终通过合并获得闲置物品存在的时长，并与闲置时间阈值比较判断是否闲置。

[0031] 在电梯轿厢内，当摄像头角度发生变化时，抓取的图像将发生变化，需要重新标定电梯轿厢地面区域。故在图片抓取过程中，需要实时监测摄像头角度偏离预警。参见图2，电梯摄像头安装角度的偏离预警进一步包括：门状态检测，轿厢顶部摄像头采集图像序列，首次运行需要从整张图像中检测出告警提示标签位置，根据其位置划定后续检测的局部区域，之后对后续图像序列分析划定的局部区域，根据标签之间的距离判断门的开合状态，包括开门、开门中、关门与关门中四个状态，每200ms判断一次状态，门状态改变指由关门到开门，反之也是，当门状态由开门变为关门时输出关门信号，其他状态改变不再输出信号；

[0032] 抓图，利用轿厢顶部摄像头抓取一张电梯图像；

[0033] 有无人检测，利用yolov3检测模型对所抓取图片进行检测，如果能够检测到图像中的人头和遮挡人体的目标框，则说明有人，反之则无人，当输出无人信号时，进行图像分析流程，当输出有人信号时，则需等待下次电梯关门信号；

[0034] 图像语义分割，对抓取的图片进行图像语义分割，获得电梯轿厢地面区域；语义分割网络输出这里定义为两类，分别是轿厢地面和背景。通过收集不同电梯轿厢有无杂物时的数据，通过人工标定出轿厢地面所占像素区域。利用标定后的数据对语义分割网络进行训练，完成训练后，获得语义分割网络模型；由于目标输出两类，这里使用sigmod交叉熵损失函数引导训练，安装部署语义分割模型即可实现输入原始图片，输出对应的mask掩模区域；

[0035] 矩形顶点估计，针对分割得到的电梯轿厢地面区域拟合外接矩形，获得外接矩形的四个顶点位置；

[0036] 倾斜与覆盖率度量，其中，倾斜度量为根据相机安装位置和外接矩形与图片的位置关系，判定使用哪几个顶点与对应的图像边界来测量，即h1、h2和h3。如果相机安装在角落，外接矩形与图像边界相交角度大，如图3所示；如果相机安装在中间，外接矩形与图像边界相交角度小。如果外接矩形顶点在图像边界外边，则定义其到对应图像边界的距离为负，反之为正。对于摄像头安装在轿厢顶部内部的一角，通过轿厢底部左右两个点到图像边界的距离，即h1与h2(原则要求左右距离符号相同大小相等)以及轿厢底部下部顶点到图像下部边界的距离，即h3(原则要求距离较小接近零且符号为正)，来判断电梯摄像头安装是否合适。对于摄像头安装在轿厢顶部内部一边的中间，需要分别利用底部两个顶点到图像底边的距离，以及顶部两个顶点到图像两边的距离(原则要求距离较小接近零且符号为正)来判断摄像头安装是否合适；覆盖率度量定义分割后轿厢底部面积与外接矩形面积占比，获得摄像头对轿厢视角的覆盖情况。例如当摄像头角度偏离较大时，轿厢地面区域会被遮挡，这时与外接矩形面积相比较小，如图4所示。分析电梯摄像头安装角度是否合适，有助于电梯视频监控能够最大化拍到关注的区域，也有助于由于震动或者被人为引起的角度变化实时通知云端管理平台安排人员及时维修。

[0037] 实际应用场景中，利用检测轿厢底部的四个顶点，可以分析电梯摄像头的角度安装是否合适。这里需要说明，大部分摄像头安装在轿厢顶部内部的一角，所以通过上述方法获得的外接矩形应该是一个竖立起来的菱形；当然也有部分摄像头安装在轿厢顶部内部一边的中间，这时获得外界矩形就是个一边平行于图像底边的矩形。对于这两种情况，可以通过安装人员输入系统标识出相机安装位置，也可以通过程序分析出相机安装的位置。本发明实施例中定义为安装人员标识出相机安装位置。

[0038] 具体应用实例中，以上门状态检测、抓图、有无人检测、图像语义分割、矩形顶点估计和倾斜与覆盖率度量步骤每隔一段时间检测一次，根据每次计算结果判断电梯摄像头角度是否发生改变，当摄像头角度改变较大影响图片采集时，进行预警输出，人工根据预警进行摄像头角度调整后可再次通过工具标记出该电梯轿厢地面区域。

[0039] 具体应用实例中，对抓取的轿厢内的图片判断是否有人过程中，目标定义为人头和遮挡人体，通过目标检测识别出图片中是否有人头和人体；图像语义分割区域为轿厢底部地面，通过语义分割图片出轿厢地面区域，进而获得其外界矩形，得到四个顶点；门状态识别也利用目标检测的方式，电梯门较高位置会贴有相应告警提示标签，通过检测告警提示标签之间的位置来实现门状态检测。

[0040] 进一步的，参见图5，语义分割是在像素级别上的分类，属于同一类的像素都要被归为一类，采用U-net的encoder-decoder架构同时借用PSPnet中的spatial pyramid pooling模块组成语义分割网络，采用单模型单尺度的方法，编码部分Encoder输入图片通过4个卷积块，进行4次降采样，然后对16×16的特征图做spatial pyramid pooling操作，将新产生的特征图与之前16×16特征图进行拼接，解码部分Decoder利用1×1的通道卷积，进行通道压缩。利用双线性插值进行上采样，上采样得到特征图与之前32×32特征图进行加和操作，如果之前32×32特征图通道数不一致时，通过1×1的通道卷积调整到一致，后续反复两次这样操作，得到128×128的特征图，之后再做最后一次上采样得到256×256的特征图，通过若干卷积层最终得到2×256×256的预测模板，与标定模板值进行比较，2代表两个类别，分别是轿厢地面和背景。

[0041] 应当理解，本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例，本领域普通技术人员应当理解，在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下，可以做出各种形式和细节的改变。

标题	发布/更新时间	阅读量
一种用于山区风场模拟的过渡曲线的确定方法	2022-10-07	2
小口径管全位置焊接方法	2020-08-22	2
线性马达及其支撑件	2020-11-18	0
喂纱器和带有喂纱器的系统	2021-04-02	0
调节装置	2021-01-13	2
杨桃酵素的发酵方法及发酵装置	2021-02-14	1
一种基于编网算法的岩体结构面优势产状聚类分析方法	2020-05-28	1
一种玻璃升降器	2023-06-20	0
一种带筛分功能的倾斜螺旋输送装置	2023-01-12	1
多功能摇篮	2021-10-27	1

基于图像语义分割的电梯轿厢闲置物品检测的方法

基于图像语义分割的电梯轿厢闲置物品检测的方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：