首页 / 专利库 / 信号处理 / 尺度图 / 一种基于感知哈希的相似图像搜索方法和装置

一种基于感知哈希的相似图像搜索方法和装置

阅读:264发布:2023-03-06

专利汇可以提供一种基于感知哈希的相似图像搜索方法和装置专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种基于 感知 哈希的相似图像搜索方法和装置,该装置包括输入单元、差分单元、寻找单元、截图单元、感知哈希 算法 单元、对比单元和输出单元。本发明的有益效果在于,将输入的初始图像和所述初始图像的截图图像都用感知 哈希算法 进行处理后,分别与搜索库中的图像进行比较,解决了在输入图像是某图像的截图图像的情况下,也能找到原图的出处,提高了感知哈希算法的准备率,为搜索相似图像提供了一种新的思路。,下面是一种基于感知哈希的相似图像搜索方法和装置专利的具体信息内容。

1.一种基于感知哈希的相似图像搜索装置,其特征在于,包括输入单元、差分单元、寻找单元、截图单元、感知哈希算法单元、对比单元和输出单元;
所述输入单元,用于输入初始图像;
所述差分单元,用于构造所述初始图像的尺度空间,得到高斯金字塔,并将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔;
所述寻找单元,用于寻找所述高斯差分金字塔空间的稳定关键点;
所述截图单元,用于选取所述稳定关键点的最密集区域,确定能包含所述最密集区域中所有稳定关键点的最小矩形区域作为所述初始图像的截图图像;
所述感知哈希算法单元,用于分别处理所述初始图像和所述截图图像,得到所述初始图像的字符串和所述截图图像的字符串;
所述对比单元,用于分别将所述初始图像的字符串和所述截图图像的字符串与搜索库中图像的字符串进行对比;
所述输出单元,用于输出搜索结果。
2.根据权利要求1所述的一种基于感知哈希的相似图像搜索装置,其特征在于,所述差分单元包括分组模、分层模块和差分模块;
所述分组模块,用于将所述初始图像与一个可变尺度的二维高斯函数G作卷积运算:
L(x,y,σ)=G(x,y,σ)*I(x,y)
其中,高斯函数G为
式中,I表示所述初始图像,(x,y)表示所述初始图像的空间坐标,σ大小决定卷积运算后得到的图像的平滑程度,通过对σ取一系列的值,所述初始图像产生多组图像,得到高斯金字塔;
所述分层模块,用于对所述高斯金字塔加入高斯滤波,使所述初始图像的每一组图像包含多层图像,其中,所述高斯金字塔的组内尺度和组间尺度之间的递推关系是:
式中,i和n为组数,s为每组的层数;
所述差分模块,用于将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔:
G(x,y,kσ)-G(x,y,σ)≈(k-1)σ2▽2G
式中,k表示所述初始图像的第k组,(x,y)表示所述初始图像的空间坐标,σ大小决定运算后得到的图像的平滑程度,G表示高斯函数。
3.根据权利要求2所述的一种基于感知哈希的相似图像搜索装置,其特征在于,所述寻找单元包括选取模块、第一删除模块和第二删除模块;
所述选取模块,用于将所述高斯差分金字塔空间的每一个像素点与其所有的相邻点进行比较,得到极值点;
所述第一删除模块,用于去除对比度低的所述极值点,利用高斯差分函数在尺度空间Taylor展开式分别对所述高斯差分金字塔空间的多层图像的行、列及尺度三个分量进行修正,Taylor展开式为:
对所述Taylor展开式进行求导并令其为0,得到:
将结果代入所述Taylor展开式中得:
式中,x表示所述极值点,D表示所述极值点处的Harris响应值,T表示转秩,若 则所述极值点保留,否则删除所述极值点;
所述第二删除模块,用于去除边缘不稳定的所述极值点,所述高斯差分函数的极值点在横跨边缘的方向有较大的主曲率,在垂直边缘的方向有较小的主曲率,主曲率通过计算所述极值点位置尺度的二阶Hessian矩阵求出:
式中,D表示所述极值点处的Harris响应值,H表示二阶Hessian矩阵,所述D的主曲率和所述H的特征值成正比,令α为较大的所述特征值,β为较小的所述特征值,则Tr(H)=Dxx+Dyy=α+β
Det(H)=DxxDyy-(Dxy)2=αβ
令α=rβ得, 由于 在所述α、β相等的时候最小,随着r的增大
而增大,因此当不满足下式时,所述极值点删除,反之保留,保留下来的所述极值点是稳定关键点:
式中,H表示Hessian矩阵,Tr(H)代表Hessian矩阵的对线元素之和,Det(H)代表Hessian矩阵的行列式。
4.根据权利要求3所述的一种基于感知哈希的相似图像搜索装置,其特征在于,所述截图单元包括第一选取模块、第二选取模块和截图模块;
所述第一选取模块,用于选取所述稳定关键点的最密集区域;
所述第二选取模块,用于找出所述最密集区域中上下左右四个方向最远的点,以上下两个方向的所述点所在的平线和左右两个方向所述的点所在的垂直线围成的区域为最小矩形区域;
所述截图模块,用于截取所述最小矩形区域为所述初始图像的截图图像。
5.根据权利要求4所述的一种基于感知哈希的相似图像搜索装置,其特征在于,所述感知哈希算法单元包括预处理模块、变换模块、计算模块、比较模块和结合模块;
所述预处理模块,用于分别将所述初始图像和所述截图图像压缩为32x32像素并分别转化为256阶的灰度图;
所述变换模块,用于分别对转化后的所述初始图像和所述截图图像的灰度图进行离散余弦变换,并分别保留离散余弦变换矩阵中左上角的8x8个像素点;
所述计算模块,用于分别计算所述初始图像和所述截图图像中的所述8x8个像素点的平均值;
所述比较模块,用于分别将所述初始图像和所述截图图像中的所述8x8个像素点中的每个像素点的灰度值与其相对应的所述平均值进行比较,大于或等于所述平均值的记为1,小于所述平均值的记为0;
所述结合模块,用于分别将所述初始图像和所述截图图像比较后的64个结果结合在一起,得到所述初始图像的字符串和所述截图图像的字符串。
6.一种基于感知哈希的相似图像搜索方法,其特征在于,包括以下步骤:
步骤S1:输入初始图像;
步骤S2:构造所述初始图像的尺度空间,得到高斯金字塔,并将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔;
步骤S3:寻找所述高斯差分金字塔空间的稳定关键点;
步骤S4:选取所述稳定关键点的最密集区域,确定能包含所述最密集区域中所有稳定关键点的最小矩形区域作为所述初始图像的截图图像;
步骤S5:使用感知哈希算法分别处理所述初始图像和所述截图图像,得到所述初始图像的字符串和所述截图图像的字符串;
步骤S6:分别将所述初始图像的字符串和所述截图图像的字符串与搜索库中图像的字符串进行对比;
步骤S7:输出搜索结果。
7.根据权利要求6所述的一种基于感知哈希的相似图像搜索方法,其特征在于,所述步骤S2具体包括:
步骤S21:将所述初始图像与一个可变尺度的二维高斯函数G作卷积运算:
L(x,y,σ)=G(x,y,σ)*I(x,y)
其中,高斯函数G为
式中,I表示所述初始图像,(x,y)表示所述初始图像的空间坐标,σ大小决定卷积运算后得到的图像的平滑程度,通过对σ取一系列的值,所述初始图像产生多组图像,得到高斯金字塔;
步骤S22:对所述高斯金字塔加入高斯滤波,使所述初始图像的每一组图像包含多层图像,其中,所述高斯金字塔的组内尺度和组间尺度之间的递推关系是:
式中,i和n为组数,s为每组的层数;
步骤S23:用于将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔:
G(x,y,kσ)-G(x,y,σ)≈(k-1)σ2▽2G
式中,k表示所述初始图像的第k组,(x,y)表示所述初始图像的空间坐标,σ大小决定运算后得到的图像的平滑程度,G表示高斯函数。
8.根据权利要求7所述的一种基于感知哈希的相似图像搜索方法,其特征在于,所述步骤S3具体包括:
步骤S31:将所述高斯差分金字塔空间的每一个像素点与其所有的相邻点进行比较,得到极值点;
步骤S32:去除对比度低的所述极值点,利用高斯差分函数在尺度空间Taylor展开式分别对所述高斯差分金字塔空间的多层图像的行、列及尺度三个分量进行修正,Taylor展开式为:
对所述Taylor展开式进行求导并令其为0,得到:
将结果代入所述Taylor展开式中得:
式中,x表示所述极值点,D表示所述极值点处的Harris响应值,T表示转秩,若 则所述极值点保留,否则删除所述极值点;
步骤S33:去除边缘不稳定的所述极值点,所述高斯差分函数的极值点在横跨边缘的方向有较大的主曲率,在垂直边缘的方向有较小的主曲率,主曲率通过计算所述极值点位置尺度的二阶Hessian矩阵求出:
式中,D表示所述极值点处的Harris响应值,H表示二阶Hessian矩阵,所述D的主曲率和所述H的特征值成正比,令α为较大的所述特征值,β为较小的所述特征值,则Tr(H)=Dxx+Dyy=α+β
Det(H)=DxxDyy-(Dxy)2=αβ
令α=rβ得, 由于 在所述α、β相等的时候最小,随着r的增
大而增大,因此当不满足下式时,所述极值点删除,反之保留,保留下来的所述极值点是稳定关键点:
式中,H表示Hessian矩阵,Tr(H)代表Hessian矩阵的对角线元素之和,Det(H)代表Hessian矩阵的行列式。
9.根据权利要求8所述的一种基于感知哈希的相似图像搜索方法,其特征在于,所述步骤S4具体包括:
步骤S41:选取所述稳定关键点的最密集区域;
步骤S42:找出所述最密集区域中上下左右四个方向最远的点,以上下两个方向的所述点所在的水平线和左右两个方向所述的点所在的垂直线围成的区域为最小矩形区域;
步骤S43:截取所述最小矩形区域为所述初始图像的截图图像。
10.根据权利要求9所述的一种基于感知哈希的相似图像搜索方法,其特征在于,所述步骤S5具体包括:
步骤S51:分别将所述初始图像和所述截图图像压缩为32x32像素并分别转化为256阶的灰度图;
步骤S52:分别对转化后的所述初始图像和所述截图图像的灰度图进行离散余弦变换,并分别保留离散余弦变换矩阵中左上角的8x8个像素点;
步骤S53:分别计算所述初始图像和所述截图图像中的所述8x8个像素点的平均值;
步骤S54:分别将所述初始图像和所述截图图像中的所述8x8个像素点中的每个像素点的灰度值与其相对应的所述平均值进行比较,大于或等于所述平均值的记为1,小于所述平均值的记为0;
步骤S55:分别将所述初始图像和所述截图图像比较后的64个结果结合在一起,得到所述初始图像的字符串和所述截图图像的字符串。

说明书全文

一种基于感知哈希的相似图像搜索方法和装置

技术领域

[0001] 本发明涉及一种相似图像搜索方法,尤其涉及一种基于感知哈希的相似图像搜索方法和装置。

背景技术

[0002] 互联网的普及以及搜索引擎技术的巨大发展为人们的生活带来了极大的便利,人们可以快速、准确地在互联网上找到所需要的东西。图像搜索是一个新兴的搜索模式,而互联网上有数以百亿的图像,要快速有效地识别所搜索的图像,其相关技术条件不是非常成熟。
[0003] 现有的相似图像搜索方法是利用感知哈希算法对原始图像进行处理,生成相对应的哈希字符串,继而将原始图像的哈希字符串与搜索库中的图像的哈希字符串进行比较,最终得到相似图像,虽然此方法处理的速度快,且能在改变图像尺寸、亮度甚至颜色的情况下,都不会改变图像的哈希值,但是如果输入图像是某图像的截图的情况下,利用这种方法搜索到的图像存在找不到出处或者搜索不全面的问题,这样搜索到的结果无法满足用户的要求。
[0004] 鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本发明。

发明内容

[0005] 为解决上述问题,本发明采用的技术方案在于,一方面提供一种基于感知哈希的相似图像搜索装置,包括输入单元、差分单元、寻找单元、截图单元、感知哈希算法单元、对比单元、输出单元;所述输入单元,用于输入初始图像;
[0006] 所述差分单元,用于构造所述初始图像的尺度空间,得到高斯金字塔,并将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔;所述寻找单元,用于寻找所述高斯差分金字塔空间的稳定关键点;所述截图单元,用于选取所述稳定关键点的最密集区域,确定能包含所述最密集区域中所有稳定关键点的最小矩形区域作为所述初始图像的截图图像;所述感知哈希算法单元,用于分别处理所述初始图像和所述截图图像,得到所述初始图像的字符串和所述截图图像的字符串;所述对比单元,用于分别将所述初始图像的字符串和所述截图图像的字符串与搜索库中图像的字符串进行对比;所述输出单元,用于输出搜索结果。
[0007] 进一步,所述差分单元包括分组模、分层模块、差分模块;
[0008] 所述分组模块,用于将所述初始图像与一个可变尺度的二维高斯函数G作卷积运算:
[0009] L(x,y,σ)=G(x,y,σ)*I(x,y)
[0010] 其中,高斯函数G为
[0011]
[0012] 式中,I表示所述初始图像,(x,y)表示所述初始图像的空间坐标,σ大小决定卷积运算后得到的图像的平滑程度,通过对σ取一系列的值,所述初始图像产生多组图像,得到高斯金字塔;
[0013] 所述分层模块,用于对所述高斯金字塔加入高斯滤波,使所述初始图像的每一组图像包含多层图像,其中,所述高斯金字塔的组内尺度和组间尺度之间的递推关系是:
[0014]
[0015] 式中,i和n为组数,s为每组的层数;
[0016] 所述差分模块,用于将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔:
[0017]
[0018] G(x,y,kσ)-G(x,y,σ)≈(k-1)σ2▽2G
[0019] 式中,k表示所述初始图像的第k组,(x,y)表示所述初始图像的空间坐标,σ大小决定运算后得到的图像的平滑程度,G表示高斯函数。
[0020] 进一步,所述寻找单元包括选取模块、第一删除模块、第二删除模块;
[0021] 所述选取模块,用于将所述高斯差分金字塔空间的每一个像素点与其所有的相邻点进行比较,得到极值点;
[0022] 所述第一删除模块,用于去除对比度低的所述极值点,利用高斯差分函数在尺度空间Taylor展开式分别对所述高斯差分金字塔空间的多层图像的行、列及尺度三个分量进行修正,Taylor展开式为:
[0023]
[0024] 对所述Taylor展开式进行求导并令其为0,得到:
[0025]
[0026] 将结果代入所述Taylor展开式中得:
[0027]
[0028] 式中,x表示所述极值点,D表示所述极值点处的Harris响应值,T表示转秩,[0029] 若 则所述极值点保留,否则删除所述极值点;
[0030] 所述第二删除模块,用于去除边缘不稳定的所述极值点,所述高斯差分函数的极值点在横跨边缘的方向有较大的主曲率,在垂直边缘的方向有较小的主曲率,主曲率通过计算所述极值点位置尺度的二阶Hessian矩阵求出:
[0031]
[0032] 式中,D表示所述极值点处的Harris响应值,H表示二阶Hessian矩阵,所述D的主曲率和所述H的特征值成正比,令α为较大的所述特征值,β为较小的所述特征值,则[0033] Tr(H)=Dxx+Dyy=α+β
[0034] Det(H)=DxxDyy-(Dxy)2=αβ
[0035] 令α=rβ得, 由于 在所述α、β相等的时候最小,随着r的增大而增大,因此当不满足下式时,所述极值点删除,反之保留,保留下来的所述极值点是稳定关键点:
[0036]
[0037] 式中,H表示Hessian矩阵,Tr(H)代表Hessian矩阵的对线元素之和,Det(H)代表Hessian矩阵的行列式。
[0038] 进一步,所述截图单元包括第一选取模块、第二选取模块和截图模块;
[0039] 所述第一选取模块用于选取所述稳定关键点的最密集区域;
[0040] 所述第二选取模块用于找出所述最密集区域中上下左右四个方向最远的点,以上下两个方向的所述点所在的平线和左右两个方向所述的点所在的垂直线围成的区域为最小矩形区域;
[0041] 所述截图模块用于截取所述最小矩形区域为所述初始图像的截图图像。
[0042] 进一步,所述感知哈希算法单元包括预处理模块、变换模块、计算模块、比较模块、结合模块;
[0043] 所述预处理模块用于分别将所述初始图像和所述截图图像压缩为32x32像素并分别转化为256阶的灰度图;
[0044] 所述变换模块用于分别对转化后的所述初始图像和所述截图图像的灰度图进行离散余弦变换,并分别保留离散余弦变换矩阵中左上角的8x8个像素点;
[0045] 所述计算模块用于分别计算所述初始图像和所述截图图像中的所述8x8个像素点的平均值;
[0046] 所述比较模块用于分别将所述初始图像和所述截图图像中的所述8x8个像素点中的每个像素点的灰度值与相对应的所述平均值进行比较,大于或等于所述平均值的记为1,小于所述平均值的记为0;
[0047] 所述结合模块用于分别将所述初始图像和所述截图图像比较后的64个结果结合在一起,得到所述初始图像的字符串和所述截图图像的字符串。
[0048] 另一方面,提供一种基于感知哈希的相似图像搜索方法,包括以下步骤:
[0049] 步骤S1:输入初始图像;
[0050] 步骤S2:构造所述初始图像的尺度空间,得到高斯金字塔,并将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔;
[0051] 步骤S3:寻找所述高斯差分金字塔空间的稳定关键点;
[0052] 步骤S4:选取所述稳定关键点的最密集区域,确定能包含所述最密集区域中所有稳定关键点的最小矩形区域作为所述初始图像的截图图像;
[0053] 步骤S5:使用感知哈希算法分别处理所述初始图像和所述截图图像,得到所述初始图像的字符串和所述截图图像的字符串;
[0054] 步骤S6:将所述初始图像的字符串和所述截图图像的字符串分别与搜索库中图像的字符串进行对比;
[0055] 步骤S7:输出搜索结果。
[0056] 进一步,所述步骤S2具体包括:
[0057] 步骤S21:将所述初始图像与一个可变尺度的二维高斯函数G作卷积运算:
[0058] L(x,y,σ)=G(x,y,σ)*I(x,y)
[0059] 其中,高斯函数G为
[0060]
[0061] 式中,I表示所述初始图像,(x,y)表示所述初始图像的空间坐标,σ大小决定卷积运算后得到的图像的平滑程度,通过对σ取一系列的值,所述初始图像产生多组图像,得到高斯金字塔;
[0062] 步骤S22:对所述高斯金字塔加入高斯滤波,使所述初始图像的每一组图像包含多层图像,其中,所述高斯金字塔的组内尺度和组间尺度之间的递推关系是:
[0063]
[0064] 式中,i和n为组数,s为每组的层数;
[0065] 步骤S23:用于将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔:
[0066]
[0067] G(x,y,kσ)-G(x,y,σ)≈(k-1)σ2▽2G
[0068] 式中,k表示所述初始图像的第k组,(x,y)表示所述初始图像的空间坐标,σ大小决定运算后得到的图像的平滑程度,G表示高斯函数。
[0069] 进一步,所述步骤S3具体包括:
[0070] 步骤S31:将所述高斯差分金字塔空间的每一个像素点与其所有的相邻点进行比较,得到极值点;
[0071] 步骤S32:去除对比度低的所述极值点,利用高斯差分函数在尺度空间Taylor展开式分别对所述高斯差分金字塔空间的多层图像的行、列及尺度三个分量进行修正,Taylor展开式为:
[0072]
[0073] 对所述Taylor展开式进行求导并令其为0,得到:
[0074]
[0075] 将结果代入所述Taylor展开式中得:
[0076]
[0077] 式中,x表示所述极值点,D表示所述极值点处的Harris响应值,T表示转秩,[0078] 若 则所述极值点保留,否则删除所述极值点;
[0079] 步骤S33:去除边缘不稳定的所述极值点,所述高斯差分函数的极值点在横跨边缘的方向有较大的主曲率,在垂直边缘的方向有较小的主曲率,主曲率通过计算所述极值点位置尺度的二阶Hessian矩阵求出:
[0080]
[0081] 式中,D表示所述极值点处的Harris响应值,H表示二阶Hessian矩阵,所述D的主曲率和所述H的特征值成正比,令α为较大的所述特征值,β为较小的所述特征值,则[0082] Tr(H)=Dxx+Dyy=α+β
[0083] Det(H)=DxxDyy-(Dxy)2=αβ
[0084] 令α=rβ得, 由于 在所述α、β相等的时候最小,随着r的增大而增大,因此当不满足下式时,所述极值点删除,反之保留,保留下来的所述极值点是稳定关键点:
[0085]
[0086] 式中,H表示Hessian矩阵,Tr(H)代表Hessian矩阵的对角线元素之和,Det(H)代表Hessian矩阵的行列式。
[0087] 进一步,所述步骤S4具体包括:
[0088] 步骤S41:选取所述稳定关键点的最密集区域;
[0089] 步骤S42:找出所述最密集区域中上下左右四个方向最远的点,以上下两个方向的所述点所在的水平线和左右两个方向所述的点所在的垂直线围成的区域为最小矩形区域;
[0090] 步骤S43:截取所述最小矩形区域为所述初始图像的截图图像。
[0091] 进一步,所述步骤S5具体包括:
[0092] 步骤S51:分别将所述初始图像和所述截图图像压缩为32x32像素并分别转化为256阶的灰度图;
[0093] 步骤S52:分别对转化后的所述初始图像和所述截图图像的灰度图进行离散余弦变换,并分别保留离散余弦变换矩阵中左上角的8x8个像素点;
[0094] 步骤S53:分别计算所述初始图像和所述截图图像中的所述8x8个像素点的平均值;
[0095] 步骤S54:分别将所述初始图像和所述截图图像中的所述8x8个像素点中的每个像素点的灰度值与相对应的所述平均值进行比较,大于或等于所述平均值的记为1,小于所述平均值的记为0;
[0096] 步骤S55:分别将所述初始图像和所述截图图像比较后的64个结果结合在一起,得到所述初始图像的字符串和所述截图图像的字符串。
[0097] 与现有技术比较本发明的有益效果在于:1、不仅将所述初始图像用感知哈希算法处理后与搜索库的图像进行比较,而且将所述初始图像的截图图像也用感知哈希算法进行处理后与搜索库的图像进行比较,弥补了感知哈希算法压缩尺寸、忽略轮廓特征后造成的误差;2、将所述初始图像的截图图像也加入对比,解决了在输入某图像的截图图像的情况下,也能找到原图的出处,提高了感知哈希算法的准备率。附图说明
[0098] 图1为本发明的一种基于感知哈希的相似图像搜索装置的功能框图
[0099] 图2为本发明差分单元的功能框图;
[0100] 图3为本发明寻找单元的功能框图;
[0101] 图4为本发明截图单元的功能框图;
[0102] 图5为本发明感知哈希算法单元的功能框图;
[0103] 图6为本发明的一种基于感知哈希的相似图像搜索方法的流程图
[0104] 图7为步骤S2的流程图;
[0105] 图8为步骤S3的流程图;
[0106] 图9为步骤S4的流程图;
[0107] 图10为步骤S5的流程图。

具体实施方式

[0108] 以下结合附图,对本发明上述的和另外的技术特征和优点作更详细的说明。
[0109] 如图1所示,为本发明提供的一种基于感知哈希的相似图像搜索装置的功能框图,包括输入单元1、差分单元2、寻找单元3、截图单元4、感知哈希算法单元5、对比单元6、输出单元7。
[0110] 所述输入单元1,用于输入初始图像;所述差分单元2,用于构造所述初始图像的尺度空间,得到高斯金字塔,并将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔;所述寻找单元3,用于寻找所述高斯差分金字塔空间的稳定关键点;所述截图单元4,用于选取所述稳定关键点的最密集区域,确定能包含所述最密集区域中所有稳定关键点的最小矩形区域作为所述初始图像的截图图像;所述感知哈希算法单元5,用于分别处理所述初始图像和所述截图图像,得到所述初始图像的字符串和所述截图图像的字符串;所述对比单元6,用于分别将所述初始图像的字符串和所述截图图像的字符串与搜索库中图像的字符串进行对比,若其中至少有一对字符串的汉明距离小于5,则判定所述初始图像与搜索库中的图像为相似图像;所述输出单元6,用于输出搜索结果。
[0111] 如图2所示,为本发明差分单元的功能框图,所述差分单元2包括分组模块21、分层模块22和差分模块23;
[0112] 所述分组模块21,用于将所述初始图像与一个可变尺度的二维高斯函数G作卷积运算:
[0113] L(x,y,σ)=G(x,y,σ)*I(x,y)
[0114] 其中,高斯函数G为
[0115]
[0116] 式中,I表示所述初始图像,(x,y)表示所述初始图像的空间坐标,σ大小决定卷积运算后得到的图像的平滑程度,通过对σ取一系列的值,所述初始图像产生多组图像,得到高斯金字塔;
[0117] 所述分层模块22,用于对所述高斯金字塔加入高斯滤波,使所述初始图像的每一组图像包含多层图像,其中,所述高斯金字塔的组内尺度和组间尺度之间的递推关系是:
[0118]
[0119] 式中,i和n为组数,s为每组的层数;
[0120] 所述差分模块,用于将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔,具体为,利用LoG算子的尺度不变性将所述高斯金字塔中同一组图像内相邻的两层作差分:
[0121]
[0122] G(x,y,kσ)-G(x,y,σ)≈(k-1)σ2▽2G
[0123] 式中,k表示所述初始图像的第k组,(x,y)表示所述初始图像的空间坐标,σ大小决定运算后得到的图像的平滑程度,G表示高斯函数。
[0124]
[0125] G(x,y,kσ)-G(x,y,σ)≈(k-1)σ2▽2G
[0126] 如图3所示,为本发明寻找单元的功能框图,所述寻找单元3包括选取模块31、第一删除模块32和第二删除模块33;
[0127] 所述选取模块31,用于将所述高斯差分金字塔空间的每一个像素点与其所有的相邻点进行比较,所述相邻点为图像域中与每一个所述像素点相邻的点和尺度域中与每一个所述像素点相邻的点,其中,所述图像域为每一个所述像素点所在的层面,所述尺度域为与所述图像域相邻上下两层所在的层面,若每一个所述像素点比其图像域和尺度域中的相邻点都大或都小,那该所述像素点则为所述高斯差分金字塔空间的极值点;
[0128] 所述第一删除模块32,用于去除对比度低的所述极值点,利用高斯差分函数在尺度空间Taylor展开式分别对所述高斯差分金字塔空间的多层图像的行、列及尺度三个分量进行修正,Taylor展开式为:
[0129]
[0130] 对所述Taylor展开式进行求导并令其为0,得到:
[0131]
[0132] 将结果代入所述Taylor展开式中得:
[0133]
[0134] 式中,x表示所述极值点,D表示所述极值点处的Harris响应值,T表示转秩,[0135] 若 则所述极值点保留,否则删除所述极值点;
[0136] 所述第二删除模块32,用于去除边缘不稳定的所述极值点,所述高斯差分函数的极值点在横跨边缘的方向有较大的主曲率,在垂直边缘的方向有较小的主曲率,主曲率通过计算所述极值点位置尺度的二阶Hessian矩阵求出:
[0137]
[0138] 式中,D表示所述极值点处的Harris响应值,H表示二阶Hessian矩阵,所述D的主曲率和所述H的特征值成正比,令α为较大的所述特征值,β为较小的所述特征值,则[0139] Tr(H)=Dxx+Dyy=α+β
[0140] Det(H)=DxxDyy-(Dxy)2=αβ
[0141] 令α=rβ得, 由于 在所述α、β相等的时候最小,随着r的增大而增大,因此当不满足下式时,所述极值点删除,反之保留,保留下来的所述极值点是稳定关键点:
[0142]
[0143] 式中,H表示Hessian矩阵,Tr(H)代表Hessian矩阵的对角线元素之和,Det(H)代表Hessian矩阵的行列式。
[0144] 如图4所示,为本发明截图单元的功能框图,所述截图单元4包括第一选取模块41、第二选取模块42和截图模块43;
[0145] 所述第一选取模块41,用于选取所述稳定关键点的最密集区域,具体为:将所述初始图像分割为大小相同的20个矩形区域,统计每个所述矩形区域中所包含的稳定关键点,去除包含点数少的所述矩形区域,并将保留下来的相邻的所述矩形区域合并,将合并后的区域作为所述稳定关键点的最密集区域;
[0146] 所述第二选取模块42,用于找出所述最密集区域中上下左右四个方向最远的点,以上下两个方向的所述点所在的水平线和左右两个方向所述的点所在的垂直线围成的区域为最小矩形区域;
[0147] 所述截图模块43,用于截取所述最小矩形区域为所述初始图像的截图图像。
[0148] 如图5所示,为本发明感知哈希算法单元的功能框图,所述感知哈希算法单元5包括预处理模块51、变换模块52、计算模块53、比较模块54和结合模块55;
[0149] 所述预处理模块51,用于分别将所述初始图像和所述截图图像压缩为32x32像素并分别转化为256阶的灰度图;
[0150] 所述变换模52,用于分别对转化后的所述初始图像和所述截图图像的灰度图进行离散余弦变换,并分别保留离散余弦变换矩阵中左上角的8x8个像素点;
[0151] 所述计算模53,用于分别计算所述初始图像和所述截图图像中的所述8x8个像素点的平均值;
[0152] 所述比较模54,用于分别将所述初始图像和所述截图图像中的所述8x8个像素点中的每个像素点的灰度值与相对应的所述平均值进行比较,大于或等于所述平均值的记为1,小于所述平均值的记为0;
[0153] 所述结合模块55,用于分别将所述初始图像和所述截图图像比较后的64个结果结合在一起,得到所述初始图像的字符串和所述截图图像的字符串。
[0154] 本发明不仅将所述初始图像用感知哈希算法处理后与搜索库的图像进行比较,而且将所述初始图像的截图图像也用感知哈希算法进行处理后与搜索库的图像进行比较,弥补了感知哈希算法压缩尺寸、忽略轮廓特征后造成的误差;除此之外,将所述初始图像的截图图像也加入对比,解决了在输入某图像的截图图像的情况下,也能找到原图的出处,提高了感知哈希算法的准备率,为搜索相似图像提供了一种新的思路。
[0155] 实施例
[0156] 如图6所示,其为本发明的一种基于感知哈希的相似图像搜索方法的流程图,所述一种基于感知哈希的相似图像搜索方法,具体包括以下步骤:
[0157] 步骤S1:输入初始图像;
[0158] 步骤S2:构造所述初始图像的尺度空间,得到高斯金字塔,并将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔;
[0159] 步骤S3:寻找所述高斯差分金字塔空间的稳定关键点;
[0160] 步骤S4:选取所述稳定关键点的最密集区域,确定能包含所述最密集区域中所有稳定关键点的最小矩形区域作为所述初始图像的截图图像;
[0161] 步骤S5:使用感知哈希算法分别处理所述初始图像和所述截图图像,得到所述初始图像的字符串和所述截图图像的字符串;
[0162] 步骤S6:将所述初始图像的字符串和所述截图图像的字符串分别与搜索库中图像的字符串进行对比,若其中至少有一对字符串的汉明距离小于5,则判定所述初始图像与搜索库中的图像为相似图像;
[0163] 步骤S7:输出搜索结果。
[0164] 如图7所示,其为所述步骤S2的流程图,所述步骤S2具体包括:
[0165] 步骤S21:将所述初始图像与一个可变尺度的二维高斯函数G作卷积运算:
[0166] L(x,y,σ)=G(x,y,σ)*I(x,y)
[0167] 其中,高斯函数G为
[0168]
[0169] 式中,I表示所述初始图像,(x,y)表示所述初始图像的空间坐标,σ大小决定卷积运算后得到的图像的平滑程度,通过对σ取一系列的值,所述初始图像产生多组图像,得到高斯金字塔;
[0170] 步骤S22:对所述高斯金字塔加入高斯滤波,使所述初始图像的每一组图像包含多层图像,其中,所述高斯金字塔的组内尺度和组间尺度之间的递推关系是:
[0171]
[0172] 式中,i和n为组数,s为每组的层数;
[0173] 步骤S23:用于将所述高斯金字塔中同一组图像内相邻的两层作差分,得到高斯差分金字塔,具体为,利用LoG算子的尺度不变性将所述高斯金字塔中同一组图像内相邻的两层作差分:
[0174]
[0175] G(x,y,kσ)-G(x,y,σ)≈(k-1)σ2▽2G
[0176] 式中,k表示所述初始图像的第k组,(x,y)表示所述初始图像的空间坐标,σ大小决定运算后得到的图像的平滑程度,G表示高斯函数。
[0177] 如图8所示,其为所述步骤S3的流程图,所述步骤S3具体包括:
[0178] 步骤S31:将所述高斯差分金字塔空间的每一个像素点与其所有的相邻点进行比较,所述相邻点为图像域中与每一个所述像素点相邻的点和尺度域中与每一个所述像素点相邻的点,其中,所述图像域为每一个所述像素点所在的层面,所述尺度域为与所述图像域相邻上下两层所在的层面,若每一个所述像素点比其图像域和尺度域中的相邻点都大或都小,那该所述像素点则为所述高斯差分金字塔空间的极值点;
[0179] 步骤S32:去除对比度低的所述极值点,利用高斯差分函数在尺度空间Taylor展开式分别对所述高斯差分金字塔空间的多层图像的行、列及尺度三个分量进行修正,Taylor展开式为:
[0180]
[0181] 对所述Taylor展开式进行求导并令其为0,得到:
[0182]
[0183] 将结果代入所述Taylor展开式中得:
[0184]
[0185] 式中,x表示所述极值点,D表示所述极值点处的Harris响应值,T表示转秩,[0186] 若 则所述极值点保留,否则删除所述极值点;
[0187] 步骤S33:去除边缘不稳定的所述极值点,所述高斯差分函数的极值点在横跨边缘的方向有较大的主曲率,在垂直边缘的方向有较小的主曲率,主曲率通过计算所述极值点位置尺度的二阶Hessian矩阵求出:
[0188]
[0189] 式中,D表示所述极值点处的Harris响应值,H表示二阶Hessian矩阵,所述D的主曲率和所述H的特征值成正比,令α为较大的所述特征值,β为较小的所述特征值,则[0190] Tr(H)=Dxx+Dyy=α+β
[0191] Det(H)=DxxDyy-(Dxy)2=αβ
[0192] 令α=rβ得, 由于 在所述α、β相等的时候最小,随着r的增大而增大,因此当不满足下式时,所述极值点删除,反之保留,保留下来的所述极值点是稳定关键点:
[0193]
[0194] 式中,H表示Hessian矩阵,Tr(H)代表Hessian矩阵的对角线元素之和,Det(H)代表Hessian矩阵的行列式。
[0195] 如图9所示,其为所述步骤S4的流程图,所述步骤S4具体包括:
[0196] 步骤S41:选取所述稳定关键点的最密集区域,具体为:将所述初始图像分割为大小相同的20个矩形区域,统计每个所述矩形区域中所包含的稳定关键点,去除包含点数少的所述矩形区域,并将保留下来的相邻的所述矩形区域合并,将合并后的区域作为所述稳定关键点的最密集区域;
[0197] 步骤S42:找出所述最密集区域中上下左右四个方向最远的点,以上下两个方向的所述点所在的水平线和左右两个方向所述的点所在的垂直线围成的区域为最小矩形区域;
[0198] 步骤S43:截取所述最小矩形区域为所述初始图像的截图图像。
[0199] 如图10所示,其为所述步骤S5的流程图,所述步骤S5具体包括:
[0200] 步骤S51:分别将所述初始图像和所述截图图像压缩为32x32像素并分别转化为256阶的灰度图;
[0201] 步骤S52:分别对转化后的所述初始图像和所述截图图像的灰度图进行离散余弦变换,并分别保留离散余弦变换矩阵中左上角的8x8个像素点;
[0202] 步骤S53:分别计算所述初始图像和所述截图图像中的所述8x8个像素点的平均值;
[0203] 步骤S54:分别将所述初始图像和所述截图图像中的所述8x8个像素点中的每个像素点的灰度值与相对应的所述平均值进行比较,大于或等于所述平均值的记为1,小于所述平均值的记为0;
[0204] 步骤S55:分别将所述初始图像和所述截图图像比较后的64个结果结合在一起,得到所述初始图像的字符串和所述截图图像的字符串。
[0205] 本发明不仅将所述初始图像用感知哈希算法处理后与搜索库的图像进行比较,而且将所述初始图像的截图图像也用感知哈希算法进行处理后与搜索库的图像进行比较,弥补了感知哈希算法压缩尺寸、忽略轮廓特征后造成的误差;除此之外,将所述初始图像的截图图像也加入对比,解决了在输入某图像的截图图像的情况下,也能找到原图的出处,提高了感知哈希算法的准备率,为搜索相似图像提供了一种新的思路。
[0206] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈