首页 / 专利库 / 广播 / 帧内预测 / 一种柜面助手履职监控装置和方法

一种柜面助手履职监控装置和方法

阅读:867发布:2020-05-08

专利汇可以提供一种柜面助手履职监控装置和方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种柜面助手履职监控装置和方法,包括 视频 帧 子系统,其特征在于:所述视频帧子系统电性连接目标检测子系统,所述目标检测子系统电性连接目标过滤子系统,所述目标过滤子系统分别电性连接睡觉判别子系统、玩手机判别子系统、离岗判别子系统和 聊天 判别子系统,所述睡觉判别子系统、所述玩手机判别子系统、所述离岗判别子系统和所述聊天判别子系统分别电性连接异常报警子系统。本发明涉及柜面助手设备领域,具体地讲,涉及一种柜面助手履职监控装置和方法。本发明能够精确的 定位 异常行为的 位置 ,为行为判断提供了良好的评价标准。,下面是一种柜面助手履职监控装置和方法专利的具体信息内容。

1.一种柜面助手履职监控装置,包括视频子系统(1),其特征在于:
所述视频帧子系统(1)电性连接目标检测子系统(3);
所述目标检测子系统(3)电性连接目标过滤子系统(5);
所述目标过滤子系统(5)分别电性连接睡觉判别子系统(7)、玩手机判别子系统(8)、离岗判别子系统(9)和聊天判别子系统(10);
所述睡觉判别子系统(7)、所述玩手机判别子系统(8)、所述离岗判别子系统(9)和所述聊天判别子系统(10)分别电性连接异常报警子系统(11)。
2.一种柜面助手履职监控装置的使用方法,其特征在于,包括以下步骤:
步骤一:所述视频帧子系统(1)将视频帧数据处理成JPG数据集合(2),所述视频帧子系统(1)将所述JPG数据集合(2)输入到所述目标检测子系统(3);
步骤二:所述目标检测子系统(3)根据所述JPG数据集合(2)生成此张图片中的目标集
(4),每个所述目标集(4)内包括以下信息:每个目标的左上坐标(x1,y1)和右下角坐标(x2,y2),以及目标类别标号;
步骤三:所述目标检测子系统(3)将所述目标集(4)输入到所述目标过滤子系统(5)中,所述目标过滤子系统(5)将所述目标集(4)进行目标的滤除输出新的目标集(6),利用面积公式(y2-y1)*(x2-x1)计算出每个目标框的面积大小,因为该设备主要针对近距离目标检测异常行为,因此对于画面背景中出现的距离较远的目标必须滤除掉,降低对检测结果的影响,根据图片分辨率大小640x480,分别对每个目标设置阈值,例如对于目标类别人设置阈值为7000,对于目标类别头设置阈值为5000;
步骤四:所述目标过滤子系统(5)将所述新的目标集(6)输入到所述睡觉判别子系统
(7)中,所述睡觉判别子系统(7)依据所述目标集(6)中类别人的左上角(x1person,y1person)坐标和右下角(x2person,y2person)坐标,计算人这类别的目标框的宽度w和高度h,令wperson=x2person-x1person,hperson=y2person-y1person得到该类别目标框的wperson和hperson,根据wperson和hperson的比例关系判断该目标是否处在坐立状态还是可能趴着睡觉的状态,如果是前者判断该张图片为无睡觉行为,如果是后者则进一步判断是否处于睡觉状态,判定规则如下:对目标类别人中的宽度wperson进行十等分点的划分,计算二等分点和八等分点的坐标的横坐标轴x的大小,令xLeftperson=x1person+0.2*wperson,xRightperson=x1person+0.8*wperson,同样的方法计算目标类别头部的xLeftHead和xRightHead分别比较xLeftHead与xLeftperson和xRightperson与xRightHead的值的大小,当x1person步骤五:所述目标过滤子系统(5)将所述新的目标集(6)输入到所述玩手机判别子系统
(8)中,所述玩手机判别子系统(8)依据所述目标集(6)中目标类别,应该首先判定是否同时出现了人、手、手机,三个类别,如果出现了利用判定规则进行判定,判定规则如下:规定人的两个坐标为(x1person,y1person),(x2person,y2person),手机的两个坐标为(x1phone,y1phone),(x2phone,y2phone);
步骤五一:计算手机区域面积Areaphone=(y2person-y1person)*(x2person-x1person);
步骤五二:计算类别人和手机的交集面积,计算交集区域左上角和右下角的坐标(x1,
y1),(x2,y2),令x1=max(x1person,x1phone),y1=max(y1person,y1phone),x2=min(x2person,x2phone),y2=min(y2person,y2phone),判断x2-x1和y2-y1值的正负,如果有一个值为负,说明类别人和手机没有交集,判断为正常状态,否则计算交集面积Areaiou=(y2-y1)*(x2-x1),计算交集面积占手机面积的比例p=Areaiou/Areaphone,设定阈值thresh=0.2的大小,当p>thresh的时候,判定为玩手机的状态;
步骤六:所述目标过滤子系统(5)将所述新的目标集(6)输入到所述离岗判别子系统
(9)中,所述离岗判别子系统(9)依据所述目标集(6)中目标类别,应该首先判定是否检测到了类别人,如果没有人则进行判断,判定规则如下:连续检测n次,如果出现有n/2次以上存在无人状态,则判定为离岗,否则为正常状态;
步骤七:所述目标过滤子系统(5)将所述新的目标集(6)输入到所述聊天判别子系统
(10)中,所述聊天判别子系统(10)依据所述目标集(6)中目标类别,应该首先判定是否检测到了类别人和头,如果同时出现多个人和头进行判断,判定之前需要对检测到的头和人的图像特征进行相似性对比,筛选出图片的前景是否真出现了两个人而不是背景中出现的人,定义 表示图像特征相似性结果,则:
如果确定图片前景中存在两个人,则进行判定,判定规则如下:连续检测n次,如果出现n/2次以上存在多个人和头的状态,则判定为聊天,否则正常状态;
步骤八:如果所述睡觉判别子系统(7)、所述玩手机判别子系统(8)、所述离岗判别子系统(9)和所述聊天判别子系统(10)任意子系统出现异常行为状态,所述异常报警子系统(11)将报警信息传输到所述上层应用端,报警信息包括:异常行为图片、异常行为坐标信息,所述上层应用端将报警信息传输到web服务端,由管理员自行登录查看操作。
3.根据权利要求2所述的柜面助手履职监控装置使用方法,其特征在于:所述目标检测子系统(3)需要对整张图片进行检测,分类并定位图片中的目标,其过程如下:
目标定位原理:首先定义输入的图片的集合为{(Pi,Gi)}i=1,..,N,
i
其中: P表示第i个带预测的候选目标检测框即region proposal;
Gi表示第i个真实目标检测框即ground-truth;
在本目标检测算法中,Pi是根据真实训练集的对所有的ground-truth利用K-means算法计算得到的;
在Pi中, 表示候选的目标框的中心点在原始图像中的x坐标;
表示候选的目标框的中心点在原始图像中的y坐标;
表示候选目标框的长度;
表示候选目标框的宽度;
i i i i
G表示的是ground-truth四维特征,其含义与P一样,则P与G的映射关系为:
其映射关系表示要找到一种映射函数f,当输入Pi时,得到的 能够无限接近Gi;
边界框的回归是利用平移变换和尺度变换来实现映射的,平移变换的计算公式如下:
尺度变换的计算公式如下:
其中:d*(P)(*代表x,y,w,h),接下来将图像的特征输入到线性函数里求解这4个变化;
令特征为 则
利用最小二乘法或者梯度下降算法求解,其公式为:
其中:
定义预测边框时cx,cy是相对于图片Px左上角的位置,每个小格的长度为1,σ(tx),σ(ty)分别是经过sigmoid输出的0-1之间的偏移量,所以预测的目标框的(x,y,w,h)为:
生成此张图片中的所述目标集(4),目标集内包括以下信息:每个目标的左上角坐标
(x1,y1)和右下角坐标(x2,y2),坐标计算过程为:
此外目标集内信息能够表示出每个目标框的目标类别。

说明书全文

一种柜面助手履职监控装置和方法

技术领域

[0001] 本发明涉及柜面助手设备领域,具体地讲,涉及一种柜面助手履职监控装置和方法。

背景技术

[0002] 截至目前,我国大部分政府服务中心对办公人员的履职行为判定评估依赖于大厅的监控摄像头,当异常行为已经发生时只能从对应的硬盘录像机按时间段进行查找,效率极低。
[0003] 履职监控系统通过分析监控获取的文本数据或者视频数据分析有无发生异常行为并发出报警,其本质是将获取到的数据通过一种行为识别方法能够精确的识别动作生的类型并定位出动作发生的位置。实际的应用场景比较广泛,现有的行为识别方法一是基于传统方法的机器学习来实现行为识别,识别精度较低,二是基于深度学习通过神经网络学习实现的,识别精度较高,但是计算量较大,无法部署到嵌入式终端设备上运行,满足不了实时的要求。
[0004] 专利《一种机构履职监控系统》(申请公布号CN 106682797A)公开了一种方法,该方法的优点是提供了一种量化手段方法对履职情况进行指标化、自动化的体系评估,验证履职现状,构建统一的、公平合理的机构履职评估指标体系和人为干预较小的履职情况判断方法,规范约束与推进机构人员业务工作的正常开展。该方法的不足之处在于装置的数据采集单元只是采集到的只限于文本数据,无视频数据作为异常行为判定依据,无法对办公人员进行行为识别,仅限于从工作的完成度判定识别是否为正常履职状态。
[0005] 专利《行为识别系统》(申请公布号CN 101622652 A)提供了一种行为识别方法,该发明实例提供基于所获得的视频流来分析和学习行为识别的方法和系统,基于对视频的分析来确定该流中所描述的对象,每个对象可以具有用来逐帧地跟踪对象的运动的相应的搜索模型。确定对象的分类并且生成对象的语义表示。语义表示被用来确定对象的行为并且学习由所获得的视频流描述的环境中发生的行为。这样,系统通过分析环境中对象的移动、活动或者不存在来迅速并且实时地学习正常和异常的行为,并且基于已经习得的来识别和预测异常和可疑的行为,该专利的优点提供了一套基于机器学习的行为识别系统,能够基于随时间获得的信息来学习行为,通过分析随时间的运动或活动来学习识别区分场景内的正常和异常行为。该专利的不足指出在于提供的行为识别系统是基于传统的机器学习的方法,通过视频流边学习边检测,识别精度低,无法满足当前应用要求,其计算量较大,对硬件的计算能要求较高,目前只是基于计算机平台运行且无法对场景中的具体异常行为做动作定位。
[0006] 专利《行为识别模型的训练方法、行为识别方法、装置及设备》(申请公布号CN 109815881 A)提供了一种涉及人工智能技术领域的行为识别模方法,该方法包括:获取训练集;分别检测每张图像的目标区域;计算训练集对应于目标区域的平均亮度信息;将每张图像的目标区域分割为前景和背景,并将背景标记为黑色;根据平均亮度信息调节每张图像的前景的亮度,得到预处理后的图像;将预处理后的图像输入神经网络进行训练,直至神经网络收敛,将收敛情况下的神经网络作为行为识别模型。该专利提供的方法可以消除背景的影响,增强对复杂场景识别的鲁棒性,可以应用在现实光线复杂的场景中,提高了识别准确率,避免过度曝光或光线不足产生的准确度下降问题。但是该专利实现的方法缺点在于事先需要根据应用场景获取大量数据,再输入到神经网络前需要对样本数据进行数据处理,等到神经网络收敛后才能记载训练好的模型使用,所述图像检测区域仅仅限于人脸区域而非整张图像,因此能够识别的动作仅仅限制于吸烟打电话等发生在与人脸相关的行
为。
[0007] 目前常见的行为识别方法大都涉及人工智能领域,需要根据实际的应用场景预先采集大量的视频,然后对视频进行处理,如:视频分割,去背景化处理等操作,最后输入到神经网络进行训练,直至神经网络收敛,理想状态下能够精确的识别行为片段,但是实际的应用中受场景限制,误报和漏报严重,无法实现很好的落地应用,目前行为识别算法也无法同时做到动作定位和动作识别,对嵌入式设备性能要求较高,因此很难做到实时的检测发现异常行为并发出报警信息。此为现有技术的不足之处。

发明内容

[0008] 本发明要解决的技术问题是提供一种柜面助手履职监控装置和方法,要解决履职行为识别分析异常行为精确定位问题,当异常行为发生时能够检测并能发出报警信息。
[0009] 本发明采用如下技术方案实现发明目的:
[0010] 一种柜面助手履职监控装置,包括视频帧子系统,其特征在于:所述视频帧子系统电性连接目标检测子系统,所述目标检测子系统电性连接目标过滤子系统,所述目标过滤子系统分别电性连接睡觉判别子系统、玩手机判别子系统、离岗判别子系统和聊天判别子系统,所述睡觉判别子系统、所述玩手机判别子系统、所述离岗判别子系统和所述聊天判别子系统分别电性连接异常报警子系统。
[0011] 一种柜面助手履职监控装置的使用方法,其特征在于,包括以下步骤:
[0012] 步骤一:所述视频帧子系统将视频帧数据处理成JPG数据集合,所述视频帧子系统将所述JPG数据集合输入到所述目标检测子系统;
[0013] 步骤二:所述目标检测子系统根据所述JPG数据集合生成此张图片中的目标集,每个所述目标集内包括以下信息:每个目标的左上坐标(x1,y1)和右下角坐标(x2,y2),以及目标类别标号;
[0014] 步骤三:所述目标检测子系统将所述目标集输入到所述目标过滤子系统中,所述目标过滤子系统将所述目标集进行目标的滤除输出新的目标集,利用面积公式(y2-y1)*(x2-x1)计算出每个目标框的面积大小,因为该设备主要针对近距离目标检测异常行为,因此对于画面背景中出现的距离较远的目标必须滤除掉,降低对检测结果的影响,根据图片分辨率大小x,分别对每个目标设置阈值,例如对于目标类别人设置阈值为,对于目标类别头设置阈值为;
[0015] 步骤四:所述目标过滤子系统将所述新的目标集输入到所述睡觉判别子系统中,所述睡觉判别子系统依据所述目标集中类别人的左上角(x1person,y1person)坐标和右下角(x2person,y2person)坐标,计算人这类别的目标框的宽度w和高度h,令 wperson=x2person-x1person,hperson=y2person-y1person得到该类别目标框的wperson和hperson,根据 wperson和hperson的比例关系判断该目标是否处在坐立状态还是可能趴着睡觉的状态,如果是前者判断该张图片为无睡觉行为,如果是后者则进一步判断是否处于睡觉状态,判定规则如下:对目标类别人中的宽度wperson进行十等分点的划分,计算二等分点和八等分点的坐标的横坐标轴x的大小,令 xLeftperson=x1person+0.2*wperson,xRightperson=x1person+0.8*wperson,同样的方法计算目标类别头部的xLeftHead和xRightHead分别比较xLeftHead与xLeftperson和xRightperson与xRightHead的值的大小,当x1person
[0016] 步骤五:所述目标过滤子系统将所述新的目标集输入到所述玩手机判别子系统中,所述玩手机判别子系统依据所述目标集中目标类别,应该首先判定是否同时出现了人、手、手机,三个类别,如果出现了利用判定规则进行判定,判定规则如下:规定人的两个坐标为(x1person,y1person),(x2person,y2person),手机的两个坐标为(x1phone,y1phone),(x2phone,y2phone);
[0017] 步骤五一:计算手机区域面积Areaphone=(y2person-y1person)*(x2person-x1person);
[0018] 步骤五二:计算类别人和手机的交集面积,计算交集区域左上角和右下角的坐标(x1,y1),(x2,y2),令x1=max(x1person,x1phone),y1=max(y1person,y1phone), x2=min(x2person,x2phone),y2=min(y2person,y2phone),判断x2-x1和y2-y1y-y值的正负,如果有一个值为负,说明类别人和手机没有交集,判断为正常状态,否则计算交集面积Areaiou=(y2-y1)*(x2-x1),计算交集面积占手机面积的比例 p=Areaiou/Areaphone,设定阈值thresh=0.2的大小,当p>thresh的时候,判定为玩手机的状态;
[0019] 步骤六:所述目标过滤子系统将所述新的目标集输入到所述离岗判别子系统中,所述离岗判别子系统依据所述目标集中目标类别,应该首先判定是否检测到了类别人,如果没有人则进行判断,判定规则如下:连续检测n次,如果出现有n/2次以上存在无人状态,则判定为离岗,否则为正常状态;
[0020] 步骤七:所述目标过滤子系统(5)将所述新的目标集(6)输入到所述聊天判别子系统(10)中,所述聊天判别子系统(10)依据所述目标集(6)中目标类别,应该首先判定是否检测到了类别人和头,如果同时出现多个人和头进行判断,判定之前需要对检测到的头和人的图像特征进行相似性对比,筛选出图片的前景是否真出现了两个人而不是背景中出现的人,定义 表示图像特征相似性结果,则:
[0021]
[0022] 如果确定图片前景中存在两个人,则进行判定,判定规则如下:连续检测n 次,如果出现n/2次以上存在多个人和头的状态,则判定为聊天,否则正常状态;
[0023] 步骤八:如果所述睡觉判别子系统、所述玩手机判别子系统、所述离岗判别子系统和所述聊天判别子系统任意子系统出现异常行为状态,所述异常报警子系统将报警信息传输到所述上层应用端,报警信息包括:异常行为图片、异常行为坐标信息,所述上层应用端将报警信息传输到web服务端,由管理员自行登录查看操作。
[0024] 作为本技术方案的进一步限定,所述目标检测子系统需要对整张图片进行检测,分类并定位图片中的目标,其过程如下:
[0025] 目标定位原理:首先定义输入的图片的集合为{(Pi,Gi)}i=1,..,N,
[0026] 其中: Pi表示第i个带预测的候选目标检测框即region proposal;
[0027] Gi表示第i个真实目标检测框即ground-truth;
[0028] 在本目标检测算法中,Pi是根据真实训练集的对所有的ground-truth利用 K-means算法计算得到的;
[0029] 在Pi中, 表示候选的目标框的中心点在原始图像中的x坐标;
[0030] 表示候选的目标框的中心点在原始图像中的y坐标;
[0031] 表示候选目标框的长度;
[0032] 表示候选目标框的宽度;
[0033] Gi表示的是ground-truth四维特征,其含义与Pi一样,则Pi与Gi的映射关系为:
[0034]
[0035] 其映射关系表示要找到一种映射函数f,当输入Pi时,得到的 能够无限接近Gi;
[0036] 边界框的回归是利用平移变换和尺度变换来实现映射的,平移变换的计算公式如下:
[0037]
[0038] 尺度变换的计算公式如下:
[0039]
[0040] 其中:d*(P)*代表x,y,w,h,接下来将图像的特征输入到线性函数里求解这4 个变化;
[0041] 令特征为 则
[0042] 利用最小二乘法或者梯度下降算法求解,其公式为:
[0043]
[0044] 其中:
[0045]
[0046] 定义预测边框时cx,cy是相对于图片Px左上角的位置,每个小格的长度为1,σ(tx),σ(ty)分别是经过sigmoid输出的0-1之间的偏移量,所以预测的目标框的 (x,y,w,h)为:
[0047]
[0048] 生成此张图片中的所述目标集,目标集内包括以下信息:每个目标的左上角坐标(x1,y1)和右下角坐标(x2,y2),坐标计算过程为:
[0049]
[0050] 此外目标集内信息能够表示出每个目标框的目标类别。
[0051] 与现有技术相比,本发明的优点和积极效果是:
[0052] 本发明提供的履职行为识别方法结合目前较为先进的目标检测算法,借助于嵌入式移动平台,将目标检测算法与行为判定算法相结合,不但精度高,速度快,而且能够精确的定位异常行为的位置,为行为判断提供了良好的评价标准。
[0053] 本发明提供的行为识别方法,不需要针对某种行为采集样本数据利用神经网络训练,也不用对图像进行背景的预处理工作,能够将整张图像作为目标区域,检测出某张图片的目标之后通过判断目标之间检测框之间的关系判断是否有异常行为发生,当有异常行为发生时,能够进行异常行为的精确定位及发出报警。附图说明
[0054] 图1为本发明的结构示意图。
[0055] 图中:1、视频帧子系统,2、JPG数据集合,3、目标检测子系统,4、目标集,5、目标过滤子系统,6、新的目标集,7、睡觉判别子系统,8、玩手机判别子系统,9、离岗判别子系统,10、聊天判别子系统,11、异常报警子系统。

具体实施方式

[0056] 下面结合附图,对本发明的一个具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
[0057] 如图1所示,本发明包括视频帧子系统1,所述视频帧子系统1电性连接目标检测子系统3,所述目标检测子系统3电性连接目标过滤子系统5,所述目标过滤子系统5分别电性连接睡觉判别子系统7、玩手机判别子系统8、离岗判别子系统9和聊天判别子系统10,所述睡觉判别子系统7、所述玩手机判别子系统8、所述离岗判别子系统9和所述聊天判别子系统10分别电性连接异常报警子系统11。
[0058] 一种柜面助手履职监控装置的使用方法,包括以下步骤:
[0059] 步骤一:所述视频帧子系统1将视频帧数据处理成JPG数据集合2,所述视频帧子系统1将所述JPG数据集合2输入到所述目标检测子系统3;
[0060] 步骤二:所述目标检测子系统3根据所述JPG数据集合2生成此张图片中的目标集4,每个所述目标集4内包括以下信息:每个目标的左上角坐标(x1,y1)和右下角坐标(x2,y2),以及目标类别标号;
[0061] 步骤三:所述目标检测子系统3将所述目标集4输入到所述目标过滤子系统5中,所述目标过滤子系统5将所述目标集4进行目标的滤除输出新的目标集6,利用面积公式(y2-y1)*(x2-x1)计算出每个目标框的面积大小,因为该设备主要针对近距离目标检测异常行为,因此对于画面背景中出现的距离较远的目标必须滤除掉,降低对检测结果的影响,根据图片分辨率大小640x480,分别对每个目标设置阈值,例如对于目标类别人设置阈值为7000,对于目标类别头设置阈值为5000;
[0062] 步骤四:所述目标过滤子系统5将所述新的目标集6输入到所述睡觉判别子系统7中,所述睡觉判别子系统7依据所述目标集6中类别人的左上角 (x1person,y1person)坐标和右下角(x2person,y2person)坐标,计算人这类别的目标框的宽度w和高度h,令wperson=x2person-x1person,hperson=y2person-y1person得到该类别目标框的wperson和 hperson,根据wperson和hperson的比例关系判断该目标是否处在坐立状态还是可能趴着睡觉的状态,如果是前者判断该张图片为无睡觉行为,如果是后者则进一步判断是否处于睡觉状态,判定规则如下:对目标类别人中的宽度wperson进行十等分点的划分,计算二等分点和八等分点的坐标的横坐标轴x的大小,令 xLeftperson=x1person+0.2*wperson,xRightperson=x1person+0.8*wperson,同样的方法计算目标类别头部的xLeftHead和xRightHead分别比较xLeftHead与xLeftperson和xRightperson与xRightHead的值的大小,当x1person
[0063] 步骤五:所述目标过滤子系统5将所述新的目标集6输入到所述玩手机判别子系统8中,所述玩手机判别子系统8依据所述目标集6中目标类别,应该首先判定是否同时出现了人、手、手机,三个类别,如果出现了利用判定规则进行判定,判定规则如下:规定人的两个坐标为(x1person,y1person),(x2person,y2person),手机的两个坐标为(x1phone,y1phone),(x2phone,y2phone);
[0064] 步骤五一:计算手机区域面积Areaphone=(y2person-y1person)*(x2person-x1person);
[0065] 步骤五二:计算类别人和手机的交集面积,计算交集区域左上角和右下角的坐标(x1,y1),(x2,y2),令x1=max(x1person,x1phone),y1=max(y1person,y1phone), x2=min(x2person,x2phone),y2=min(y2person,y2phone),判断x2-x1和y2-y1y2-y1值的正负,如果有一个值为负,说明类别人和手机没有交集,判断为正常状态,否则计算交集面积Areaiou=(y2-y1)*(x2-x1),计算交集面积占手机面积的比例 p=Areaiou/Areaphone,设定阈值thresh=0.2的大小,当p>thresh的时候,判定为玩手机的状态;
[0066] 步骤六:所述目标过滤子系统5将所述新的目标集6输入到所述离岗判别子系统9中,所述离岗判别子系统9依据所述目标集6中目标类别,应该首先判定是否检测到了类别人,如果没有人则进行判断,判定规则如下:连续检测n 次,如果出现有n/2次以上存在无人状态,则判定为离岗,否则为正常状态;
[0067] 步骤七:所述目标过滤子系统(5)将所述新的目标集(6)输入到所述聊天判别子系统(10)中,所述聊天判别子系统(10)依据所述目标集(6)中目标类别,应该首先判定是否检测到了类别人和头,如果同时出现多个人和头进行判断,判定之前需要对检测到的头和人的图像特征进行相似性对比,筛选出图片的前景是否真出现了两个人而不是背景中出现的人,定义 表示图像特征相似性结果,则:
[0068]
[0069] 如果确定图片前景中存在两个人,则进行判定,判定规则如下:连续检测n 次,如果出现n/2次以上存在多个人和头的状态,则判定为聊天,否则正常状态;
[0070] 步骤八:如果所述睡觉判别子系统7、所述玩手机判别子系统8、所述离岗判别子系统9和所述聊天判别子系统10任意子系统出现异常行为状态,所述异常报警子系统11将报警信息传输到所述上层应用端,报警信息包括:异常行为图片、异常行为坐标信息,所述上层应用端将报警信息传输到web服务端,由管理员自行登录查看操作。
[0071] 所述目标检测子系统3需要对整张图片进行检测,分类并定位图片中的目标,其过程如下:
[0072] 目标定位原理:首先定义输入的图片的集合为{(Pi,Gi)}i=1,..,N,
[0073] 其中: Pi表示第i个带预测的候选目标检测框即region proposal;
[0074] Gi表示第i个真实目标检测框即ground-truth;
[0075] 在本目标检测算法中,Pi是根据真实训练集的对所有的ground-truth利用 K-means算法计算得到的;
[0076] 在Pi中, 表示候选的目标框的中心点在原始图像中的x坐标;
[0077] 表示候选的目标框的中心点在原始图像中的y坐标;
[0078] 表示候选目标框的长度;
[0079] 表示候选目标框的宽度;
[0080] Gi表示的是ground-truth四维特征,其含义与Pi一样,则Pi与Gi的映射关系为:
[0081]
[0082] 其映射关系表示要找到一种映射函数f,当输入Pi时,得到的 能够无限接近Gi;
[0083] 边界框的回归是利用平移变换和尺度变换来实现映射的,平移变换的计算公式如下:
[0084]
[0085] 尺度变换的计算公式如下:
[0086]
[0087] 其中:d*(P)*代表x,y,w,h,接下来将图像的特征输入到线性函数里求解这4 个变化;
[0088] 令特征为 则
[0089] 利用最小二乘法或者梯度下降算法求解,其公式为:
[0090]
[0091] 其中:
[0092]
[0093] 定义预测边框时cx,cy是相对于图片Px左上角的位置,每个小格的长度为1,σ(tx),σ(ty)分别是经过sigmoid输出的0-1之间的偏移量,所以预测的目标框的 (x,y,w,h)为:
[0094]
[0095] 生成此张图片中的所述目标集4,目标集内包括以下信息:每个目标的左上角坐标(x1,y1)和右下角坐标(x2,y2),坐标计算过程为:
[0096]
[0097] 此外目标集内信息能够表示出每个目标框的目标类别。
[0098] 本发明的工作流程为:视频帧子系统1将视频帧数据处理成JPG数据集合2,视频帧子系统1将JPG数据集合2输入到目标检测子系统3。
[0099] 目标检测子系统3根据JPG数据集合2生成此张图片中的目标集4,每个目标集4内包括以下信息:每个目标的左上角坐标(x1,y1)和右下角坐标(x2,y2),以及目标类别标号。
[0100] 目标检测子系统3需要对整张图片进行检测,分类并定位图片中的目标,其过程如下:
[0101] 目标定位原理:首先定义输入的图片的集合为{(Pi,Gi)}i=1,..,N,
[0102] 在本目标检测算法中,Pi是根据真实训练集的对所有的ground-truth利用 K-means算法计算得到的;
[0103] Pi与Gi的映射关系为:
[0104]
[0105] 其映射关系表示要找到一种映射函数f,当输入Pi时,得到的 能够无限接近Gi;
[0106] 边界框的回归是利用平移变换和尺度变换来实现映射的,平移变换的计算公式如下:
[0107]
[0108] 尺度变换的计算公式如下:
[0109]
[0110] 其中,d*(P)*代表x,y,w,h,接下来将图像的特征输入到线性函数里求解这4 个变化;
[0111] 令特征为 则
[0112] 利用最小二乘法或者梯度下降算法求解,其公式为:
[0113]
[0114] 其中:
[0115]
[0116] 定义预测边框时cx,cy是相对于图片Px左上角的位置,每个小格的长度为1,σ(tx),σ(ty)分别是经过sigmoid输出的0-1之间的偏移量,所以预测的目标框的 (x,y,w,h)为:
[0117]
[0118] 生成此张图片中的所述目标集4,目标集内包括以下信息:每个目标的左上角坐标(x1,y1)和右下角坐标(x2,y2),坐标计算过程为:
[0119]
[0120] 此外目标集内信息能够表示出每个目标框的目标类别。
[0121] 目标检测子系统3将目标集4输入到目标过滤子系统5中,目标过滤子系统5将目标集4进行目标的滤除输出新的目标集6,利用面积公式(y2-y1)*(x2-x1) 计算出每个目标框的面积大小,因为该设备主要针对近距离目标检测异常行为,因此对于画面背景中出现的距离较远的目标必须滤除掉,降低对检测结果的影响,根据图片分辨率大小640x480,分别对每个目标设置阈值,例如对于目标类别人设置阈值为7000,对于目标类别头设置阈值为5000。
[0122] 目标过滤子系统5将新的目标集6输入到睡觉判别子系统7中,睡觉判别子系统7依据目标集6中类别人的左上角(x1person,y1person)坐标和右下角(x2person,y2person)坐标,计算人这类别的目标框的宽度w和高度h,令 wperson=x2person-x1person,hperson=y2person-y1person得到该类别目标框的wperson和hperson,根据 wperson和hperson的比例关系判断该目标是否处在坐立状态还是可能趴着睡觉的状态,如果是前者判断该张图片为无睡觉行为,如果是后者则进一步判断是否处于睡觉状态,判定规则如下:对目标类别人中的宽度wperson进行十等分点的划分,计算二等分点和八等分点的坐标的横坐标轴x的大小,令 xLeftperson=x1person+0.2*wperson,xRightperson=x1person+0.8*wperson,同样的方法计算目标类别头部的xLeftHead和xRightHead分别比较xLeftHead与xLeftperson和xRightperson与xRightHead的值的大小,当x1person
[0123] 目标过滤子系统5将新的目标集6输入到玩手机判别子系统8中,玩手机判别子系统8依据目标集6中目标类别,应该首先判定是否同时出现了人、手、手机,三个类别,如果出现了利用判定规则进行判定,判定规则如下:规定人的两个坐标为(x1person,y1person),(x2person,y2person),手机的两个坐标为(x1phone,y1phone), (x2phone,y2phone),计算手机区域面积Areaphone=(y2person-y1person)*(x2person-x1person),计算类别人和手机的交集面积,计算交集区域左上角和右下角的坐标(x1,y1),(x2,y2),令 x1=max(x1person,x1phone),y1=max(y1person,y1phone),x2=min(x2person,x2phone), y2=min(y2person,y2phone),判断x2-x1和y2-y1y2-y1值的正负,如果有一个值为负,说明类别人和手机没有交集,判断为正常状态,否则计算交集面积 Areaiou=(y2-y1)*(x2-x1),计算交集面积占手机面积的比例p=Areaiou/Areaphone,设定阈值thresh=0.2的大小,当p>thresh的时候,判定为玩手机的状态。
[0124] 目标过滤子系统5将新的目标集6输入到离岗判别子系统9中,离岗判别子系统9依据目标集6中目标类别,应该首先判定是否检测到了类别人,如果没有人则进行判断,判定规则如下:连续检测n次,如果出现有n/2次以上存在无人状态,则判定为离岗,否则为正常状态。
[0125] 目标过滤子系统5将新的目标集6输入到聊天判别子系统10中,聊天判别子系统10依据目标集6中目标类别,应该首先判定是否检测到了类别人和头,如果同时出现多个人和头进行判断,判定之前需要对检测到的头和人的图像特征进行相似性对比,筛选出图片的前景是否真出现了两个人而不是背景中出现的人,定义 表示图像特征相似性结果,则:
[0126]
[0127] 如果确定图片前景中存在两个人,则进行判定,判定规则如下:连续检测n 次,如果出现n/2次以上存在多个人和头的状态,则判定为聊天,否则正常状态。
[0128] 如果睡觉判别子系统7、玩手机判别子系统8、离岗判别子系统9和聊天判别子系统10任意子系统出现异常行为状态,异常报警子系统11将报警信息传输到所述上层应用端,报警信息包括:异常行为图片、异常行为坐标信息,所述上层应用端将报警信息传输到web服务端,由管理员自行登录查看操作。
[0129] 以上公开的仅为本发明的具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈