首页 / 专利库 / 视听技术与设备 / / 一种基于聚类分析自主再学习的人脸识别方法

一种基于聚类分析自主再学习的人脸识别方法

阅读:245发布:2021-06-14

专利汇可以提供一种基于聚类分析自主再学习的人脸识别方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及 人脸识别 技术,公开了一种基于 聚类分析 自主再学习的人脸识别方法。后台 数据库 中存储注册照及其人脸 特征向量 ,人脸识别时抓拍人脸特征向量与后台数据库中人脸特征向量比较,并计算每个抓拍人脸特征向量与后台数据库中的人脸特征向量组综合相似度。采用聚类 算法 分析一段时间内的抓拍图,依据抓拍时的天气、时间及匹配到人的综合相似度,更新到后台数据库。当人脸特征向量达到10个时,则后台数据库的对应人脸特征向量达到饱和;用最新的人脸特征向量替换最老的人脸特征向量。通过该发明设计的人脸识别方法能识别外界变化,完成自主学习,保证人脸识别系统随时间推移准确率和召回率越来越高。,下面是一种基于聚类分析自主再学习的人脸识别方法专利的具体信息内容。

1.一种基于聚类分析自主再学习的人脸识别方法,其特征在于,包括以下步骤:
步骤1:注册照入库;人脸检测算法对注册照进行人脸检测,获得人脸检测的信息;人脸特征提取算法对人脸检测的信息进行人脸特征向量提取,获得人脸特征向量,并将人脸特征向量储存至后台数据库
步骤2:摄像头输入视频流信息;
步骤3:根据步骤2输入的视频流信息截取一图像,对截取一帧图像进行人脸检测,并获取检测的人脸信息;
步骤4:将步骤3检测的人脸信息输送至人脸特征提取模,人脸特征提取模块依据人脸特征提取算法获得人脸特征向量;将人脸图像和人脸特征算法提取的人脸特征向量保存至存储设备;
步骤5:根据相似度获取备选匹配组;
抓拍视频图像并根据步骤3和步骤4获得抓拍图像对应的人脸特征向量;依据公式1计算抓拍的人脸特征向量与后台数据库的人脸特征向量相似度similarity;当计算出的人脸特征向量相似度similarity大于等于第一阈值,则该抓拍的人脸特征向量所对应的组为备选匹配组;
公式1中xρ为抓拍人脸特征向量矩阵, 为后台数据库人脸特征向量矩阵;
步骤6:综合相似度计算;①TOP-N的相似度为相似度similarity最大的前N个,记为simij(j=1,2,3…N),取TOP-N的相似度中对应的N个特征向量;②确定每个特征向量对应的ID;③根据对应的ID对特征向量进行分组,相同的ID为一组;④统计每个特征向量组对应的成员数量,数量为mi(i=1,2,3…K);⑤依据公式2计算抓拍的人脸特征向量与每个组对应的特征向量的综合相似度;⑥当综合相似度大于等于设置的第二阈值,其最大的综合相似度特征向量对应的人脸即为需要识别的人脸;
公式2中,为成员个数增益常熟;member_simil为抓拍特征向量与特征组成员的相似度,l为(1,2,…mi);
步骤7:后台数据库更新,自主再学习;
①依据步骤1将后台数据库的人脸特征向量分为P个组,记为第一项;将存储设备中抓拍的人脸特征向量在设置时间阈值内通过聚类分组分为q个组,记为第二项;
②依据公式3计算第二项中的每一组与第一项中的每一组的平均相似度Aveij(i=1,
2,…p;j=1,2,…q);
③获取第二项中的每一组与第一项的最大相似度,及第二项中的每一组与第一项的最大相似度对应的组,记最大相似度为max[(Aveij)]j(i=1,2,…p),最大相似度对应的组为imax(i=1,2,…p);
④当最大相似度max[(Aveij)]j(i=1,2,…p)大于等于设置的第三阈值,则聚类分组中的j组与后台数据库中imax组为同一个人;
⑤将j(j=1,2,3…q)组中的每个人脸特征向量与后台数据库分组的imax组的人脸特征向量,依据公式2求点面综合相似度;
⑥当点面综合相似度大于等于设置的第二阈值,依据摄像头抓拍时时间差异和天气差异,当时间差异大或气候差异大,则将点面综合相似度大的人脸特征向量更新至后台数据库;当时间差异不大且天气差异不大,则无需更新后台数据库;当点面综合相似度小于设置的第二阈值,无需更新后台数据库;
公式3中,mem_similarityij表示第一组特征向量中第i个特征向量与第二组特征向量中第j个特征向量的余弦相似度。
2.依据权利要求1所述的一种基于聚类分析自主再学习的人脸识别方法,其特征在于:
步骤7中的聚类分组采用密度峰值快速聚类算法,密度峰值快速聚类算法步骤为:
第一步,输入存储设备上抓拍的特征向量;
第二步,计算所有输入的特征向量两两之间的相似度;
第三步,创建所有输入的特征向量相似度矩阵;
第四步,基于相似度矩阵计算出所有特征向量的局部密度;
第五步,对计算的所有特征向量的局部密度进行排序排列;
第六步,对降序排列的所有特征向量的局部密度进行聚类分组;
第七步,输出聚类分组后的所有特征向量。
3.依据权利要求1所述的一种基于聚类分析自主再学习的人脸识别方法,其特征在于:
步骤1中的后台数据库中储存P个人对应的注册照及人脸特征向量,后台数据库每个人的注册照大于等于1,每个人对应的人脸特征向量大于等于1个且小于等于10个。
4.依据权利要求1所述的一种基于聚类分析自主再学习的人脸识别方法,其特征在于:
步骤4中的存储设备储存抓拍的人脸特征向量、人脸关键点、抓拍的时间点和抓拍时的气候,存储设备为硬盘和数据库。
5.依据权利要求1所述的一种基于聚类分析自主再学习的人脸识别方法,其特征在于:
步骤7中的时间阈值为一周。

说明书全文

一种基于聚类分析自主再学习的人脸识别方法

技术领域

[0001] 本发明涉及人脸识别技术,尤其涉及了一种基于聚类分析自主再学习的人脸识别方法。

背景技术

[0002] 传统人脸识别算法中抓拍人脸提取特征向量后与后台数据库进行匹配,后台数据库中每个人只有一个特征向量,进行单个特征向量与单个特征向量的匹配,点与点的匹配。
[0003] 这种的人脸识别算法很难同时保证高召回率、高准确率,并且随时间推移、环境变化和人员容貌变化,识别系统召回率和准确率都会下降,造成体验效果越来越差,维护成本越来越高。
[0004] 例如专利标题:人脸识别打卡系统,申请号:CN201811395897.7,申请日:2018-11-22的发明专利申请中记载,本发明提供一种人脸识别系统及用于打卡用途的控制系统。本发明对现有技术中存在的人脸识别系统的样本图像更新时操作繁琐的问题,在人脸识别系统的运行时间满足预定条件时,采集人脸的脸部图像作为更新图像;利用更新图像更新样本数据库,其中,样本数据库用于存储样本图像,样本图像是作为人脸识别系统识别样本的脸部图像;采集人脸的脸部图像作为识别图像;以及匹配识别图像与样本数据库中的样本图像进行人脸识别,解决了现有技术中技术问题。
[0005] 现有技术提供了利用采集人脸的脸部图像作为识别图像,采用的每一个人脸对应一个特征向量,虽然解决了人脸识别的问题,但是其召回率低准确率低,而且不能自主学习,随着时间的推移人脸识别的准确率和召回率会越来越低。

发明内容

[0006] 本发明针对现有技术人脸识别技术中召回率低准确率低,而且不能自主学习,随着时间的推移人脸识别的准确率和召回率会越来越低的问题,提供了一种基于聚类分析自主再学习的人脸识别方法。
[0007] 为了解决上述技术问题,本发明通过下述技术方案得以解决。
[0008] 一种基于聚类分析自主再学习的人脸识别方法,包括以下步骤:
[0009] 步骤1:注册照入库;人脸检测算法对注册照进行人脸检测,获得人脸检测的信息;人脸特征提取算法对人脸检测的信息进行人脸特征向量提取,获得人脸特征向量,并将人脸特征向量储存至后台数据库;
[0010] 步骤2:摄像头输入视频流信息;
[0011] 步骤3:根据步骤2输入的视频流信息截取一图像,对截取一帧图像进行人脸检测,并获取检测的人脸信息;
[0012] 步骤4:将步骤3检测的人脸信息输送至人脸特征提取模,人脸特征提取模块依据人脸特征提取算法获得人脸特征向量;将人脸图像和人脸特征算法提取的人脸特征向量保存至存储设备;
[0013] 步骤5:根据相似度获取备选匹配组;
[0014] ①抓拍视频图像并根据步骤3和步骤4获得抓拍图像对应的人脸特征向量;②依据公式1计算抓拍的人脸特征向量与后台数据库的人脸特征向量相似度;③当计算出的人脸特征向量相似度大于等于第一阈值,则该抓拍的人脸特征向量所对应的组为预选匹配组;
[0015]
[0016] 公式1中xρ为抓拍人脸特征向量矩阵, 为后台数据库人脸特征向量矩阵;
[0017] 步骤6:综合相似度计算;①TOP-N的相似度为相似度similarity最大的前N个,记为simij(j=1,2,3…N),取TOP-N的相似度中对应的N个特征向量;②确定每个特征向量对应的ID;③根据对应的ID对特征向量进行分组,相同的ID为一组;④统计每个特征向量组对应的成员数量,数量为mi(i=1,2,3…K);⑤依据公式2计算抓拍的人脸特征向量与每个组对应的特征向量的综合相似度;⑥当综合相似度大于等于设置的第二阈值,其特征向量对应的人脸即为需要识别的人脸;
[0018]
[0019] 公式2中, 为成员个数增益常数;member_simil为抓拍特征向量与特征组成员的相似度,l为(1,2,…mi);
[0020] 步骤7:后台数据库更新,自主再学习;
[0021] ①依据步骤1将后台数据库的人脸特征向量分为P个组,记为第一项;将存储设备中抓拍的人脸特征向量在设置时间阈值内通过聚类分组分为q个组,记为第二项;
[0022] ②依据公式3计算第二项中的每一组与第一项中的每一组的平均相似度Aveij(i=1,2,…p;j=1,2,…q),
[0023] ③获取第二项中的每一组与第一项的最大相似度,及第二项中的每一组与第一项的最大相似度对应的组,记最大相似度为max[(Aveij)]j(i=1,2,…p),最大相似度对应的组为imax(i=1,2,…p);
[0024] ④当最大相似度max[(Aveij)]j(i=1,2,…p)大于等于设置的第三阈值,则聚类分组中的j组与后台数据库中imax组为同一个人;
[0025] ⑤将j(j=1,2,3…q)组中的每个人脸特征向量与后台数据库分组的imax组人脸特征向量,依据公式2求点面综合相似度;
[0026] ⑥当点面综合相似度大于等于设置的第二阈值,依据摄像头抓拍时时间差异和天气差异,当时间差异大或气候差异大,则将点面综合相似度大的人脸特征向量更新至后台数据库;当时间差异不大且天气差异不大,则无需更新后台数据库;当点面综合相似度小于设置的第二阈值,无需更新后台数据库;
[0027]
[0028] 公式3中,mem_similarityij表示第一组特征向量中第i个特征向量与第二组特征向量中第j个特征向量的余弦相似度。
[0029] 作为优选,步骤7中的聚类分组采用密度峰值快速聚类算法,密度峰值快速聚类算法步骤为:
[0030] 第一步,输入存储设备上抓拍的特征向量;
[0031] 第二步,计算所有输入的特征向量两两之间的相似度;
[0032] 第三步,创建所有输入的特征向量相似度矩阵;
[0033] 第四步,基于相似度矩阵计算出所有特征向量的局部密度;
[0034] 第五步,对计算的所有特征向量的局部密度进行排序排列;
[0035] 第六步,对降序排列的所有特征向量的局部密度进行聚类分组;
[0036] 第七步,输出聚类分组后的所有特征向量。
[0037] 作为优选,存储设备储存抓拍的人脸特征向量、人脸关键点、抓拍的时间点和抓拍时的气候,存储设备为硬盘和数据库。
[0038] 作为优选,步骤1中的后台数据库中储存P个人对应的注册照及人脸特征向量,后台数据库每个人的注册照大于等于1,每个人对应的人脸特征向量大于等于1且小于等于10。
[0039] 作为优选,步骤7中的时间阈值为一周。
[0040] 本发明由于采用了以上技术方案,具有显著的技术效果:后台数据库中每个人包含多个特征向量,人脸识别时,抓拍人脸与后台数据库中每个人的多个特征向量综合比较,求每个抓拍人脸特征向量与后台数据库中每个人的人脸特征向量组的综合相似度。
[0041] 采用密度峰值快速聚类算法分析一段时间内的抓拍图。根据抓拍时的天气、时间以及与匹配到人的综合相似度,选择有代表性的抓拍人脸提取特征向量,更新到后台数据库对应人的后台数据库中,后台数据库每个人最多保存10个特征向量,后台数据库中某个特征向量组的特征向量数达到10个时,则该组特征向量数达到饱和。当特征向量更新到后台数据库时,若对应后台数据库的特征向量组没有达到饱和,则该组直接新增更新的特征向量;反之则最新的特征向量替换最老的特征向量。
[0042] 基于聚类分析自主再学习的人脸识别方法学习到外界变化过程,完成自主学习,可保证人脸识别系统随时间推移准确率和召回率越来越高。附图说明
[0043] 图1是本发明的流程图
[0044] 图2是本发明的密度峰值快速聚类算法流程图。
[0045] 图3是本发明的聚类分组目录图。
[0046] 图4是本发明的聚类组内第一成员图像。
[0047] 图5是本发明的聚类组内第二成员图像。

具体实施方式

[0048] 下面结合附图与实施例对本发明作进一步详细描述。
[0049] 实施例1
[0050] 一种基于聚类分析自主再学习的人脸识别方法,依据附图1所示其包括以下步骤:
[0051] 步骤1:注册照入库;人脸检测算法对注册照进行人脸检测,获得人脸检测的信息;人脸特征提取算法对人脸检测的信息进行人脸特征向量提取,获得人脸特征向量,并将人脸特征向量储存至后台数据库;
[0052] 步骤2:摄像头输入视频流信息;
[0053] 步骤3:根据步骤2输入的视频流信息截取一帧图像,对截取一帧图像进行人脸检测,并获取检测的人脸信息;
[0054] 步骤4:将步骤3检测的人脸信息输送至人脸特征提取模块,人脸特征提取模块依据人脸特征提取算法获得人脸特征向量;将人脸图像和人脸特征算法提取的人脸特征向量保存至存储设备;
[0055] 步骤5:根据相似度获取备选匹配组;
[0056] ①抓拍视频图像并根据步骤3和步骤4获得抓拍图像对应的人脸特征向量;②依据公式1计算抓拍的人脸特征向量与后台数据库的人脸特征向量相似度;③当计算出的人脸特征向量相似度大于等于第一阈值,第一阈值为0.5则该抓拍的人脸特征向量所对应的组为匹配组;
[0057]
[0058] 公式1中xρ为抓拍人脸特征向量矩阵, 为后台数据库人脸特征向量矩阵;
[0059] 第一阈值设置为相似度阈值范围0.5至0.53之间,具体应用的阈值依据测试的情况进行设置。
[0060] 步骤6:综合相似度计算;①TOP-N的相似度为相似度similarity最大的前N个,记为simij(j=1,2,3…N),取TOP-N的相似度中对应的N个特征向量;②确定每个特征向量对应的ID;③根据对应的ID对特征向量进行分组,相同的ID为一组;④统计每个特征向量组对应的成员数量,数量为mi(i=1,2,3…K);⑤依据公式2计算抓拍的人脸特征向量与每个组对应的特征向量的综合相似度;⑥当综合相似度大于等于设置的第二阈值,其最高的综合相似度特征向量对应的人脸即为需要识别的人脸;
[0061]
[0062] 公式2中, 为成员个数增益常数;member_simil为抓拍特征向量与特征组成员的相似度,l为(1,2,…mi);
[0063] 第二阈值为综合相似度阈值范围为0.48至0.53之间,具体应用的阈值依据实际测试结果进行设置。
[0064] 步骤7:后台数据库更新,自主再学习;
[0065] ①依据步骤1将后台数据库的人脸特征向量分为P个组,记为第一项;将存储设备中抓拍的人脸特征向量在设置时间阈值内通过聚类分组分为q个组,记为第二项;
[0066] ②依据公式3计算第二项中的每一组与第一项中的每一组的平均相似度Aveij(i=1,2,…p;j=1,2,…q),
[0067] ③获取第二项中的每一组与第一项的最大相似度,及第二项中的每一组与第一项的最大相似度对应的组,记最大相似度为max[(Aveij)]j(i=1,2,…p),最大相似度对应的组为imax(i=1,2,…p);
[0068] ④当最大相似度max[(Aveij)]j(i=1,2,…p)大于等于设置的第三阈值,则聚类分组中的j组与后台数据库中imax组为同一个人;
[0069] ⑤将j(j=1,2,3…q)组中的每个人脸特征向量与后台数据库分组的imax组人脸特征向量,依据公式2求点面综合相似度;
[0070] ⑥当点面综合相似度大于等于设置的第二阈值,依据摄像头抓拍时时间差异和天气差异,当时间差异大或气候差异大,则将点面综合相似度大的人脸特征向量更新至后台数据库;当时间差异不大且天气差异不大,则无需更新后台数据库;当点面综合相似度小于设置的第二阈值,无需更新后台数据库;
[0071]
[0072] 公式3中,mem_similarityij表示第一组特征向量中第i个特征向量与第二组特征向量中第j个特征向量的余弦相似度。
[0073] 第三阈值为平均相似度阈值范围为0.45至0.53之间,具体应用的阈值依据实际测试结果进行设置。
[0074] 存储设备储存抓拍的人脸特征向量、人脸关键点、抓拍的时间点和抓拍时的气候,存储设备为硬盘和数据库。
[0075] 步骤1中的后台数据库中每个人的注册照大于等于1,后台数据库中人脸特征向量大于等于1个且小于等于10个。
[0076] 人脸检测算法和人脸特征提取算法均为现有技术中关于人脸识别的算法。
[0077] 步骤7中的时间阈值为一周。
[0078] 实施例2
[0079] 在实施例1基础上,依据附图2所示,步骤7中的聚类分组采用密度峰值快速聚类算法,密度峰值快速聚类算法步骤为:
[0080] 第一步,输入存储设备上抓拍的特征向量;假设输入的总特征向量个数为M,则特征向量矩阵为A,A为M*512的矩阵;
[0081] 第二步,计算所有输入的特征向量两两之间的相似度;两两之间的相似度记为simi,则simi=A*AT,AT为A转置向量,得到simi,simi为M*M的相似度矩阵;
[0082] 第三步,创建所有输入的特征向量相似度矩阵;
[0083] 第四步,基于相似度矩阵计算出所有特征向量的局部密度;假设特征向量为i,依据公式4计算局部密度rhoi;
[0084]
[0085] 公式4中,δ为经验常数,设置范围0.2至0.4之间,simiij相似度矩阵;
[0086] 第五步,对计算的所有特征向量的局部密度进行排序排列;每一个特征向量均有对应的局部密度,对特征向量对应的局部密度进行降序排列;
[0087] 第六步,对降序排列的所有特征向量的局部密度进行聚类分组;在降序排列中找相似度最大的,当相似度大于设置的阈值,则该相似度所对应的特征向量设为一组;
[0088] 第七步,输出聚类分组后的所有特征向量。
[0089] 实施例3
[0090] 在实施例2基础上,依据附图3所示,聚类分组的目录用于聚类组与后台数据库组之间的匹配,依据附图4所示,聚类组内第一成员图像为不同时刻截取的同一个人员的人脸图像备份,依据附图5所示为聚类组内第二成员图像为不同时刻截取的同一个人员的人脸图像备份。依据图像可以实时的记录时间,空气及光线的情况。
[0091] 总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈