首页 / 专利库 / 软件 / 服务粒度 / 一种人员密度制导的自适应k匿名栅格化方法

一种人员密度制导的自适应k匿名栅格化方法

阅读:430发布:2020-05-13

专利汇可以提供一种人员密度制导的自适应k匿名栅格化方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种人员 密度 制导的自适应k匿名 栅格化 方法,首先根据待栅格化区域的 位置 数据点的数量、区域的面积和匿名系数K对待栅格化区域进行单元划分和转换;然后对划分单元区域位置点数量的粒度级别进行划分;最后根据待匿名用户位置点所在的单元区域的粒度级别和其周边区域的粒度级别进行自适应k匿名栅格化。本发明对待栅格化区域的人口密度特征进行预分析并将该区域划分为多个小单元,通过划分后的不同密度的单元区域的结合与拆分动态形成匿名区,实现了人员密度制导的自适应k匿名栅格化 算法 以适应不同密度场景的位置隐私保护。本发明通过地理中点进行位置置换实现位置匿名,在位置隐私程度不变的情况下能够提高匿名的服务 质量 。,下面是一种人员密度制导的自适应k匿名栅格化方法专利的具体信息内容。

1.一种人员密度制导的栅格化k匿名方法,其特征在于,包括以下步骤:
A.基于人员密度进行栅格化:根据目标区域中位置点数量多少、目标区域面积大小和匿名系数K的大小,计算得出目标区域的栅格大小,并以此将目标区域栅格化;
B.计算目标区域人员密度分布:根据栅格中位置点的数量多少和匿名系数K的大小,计算得到每个栅格的粒度级别,并将目标区域所有栅格的粒度级别形式化为粒度矩阵;
C.人员密度制导的k匿名:根据栅格的粒度级别,对每一个栅格进行合并、拆分自适应处理后形成匿名区域,对匿名区域中的位置点进行k匿名。
2.根据权利要求1所述的一种人员密度制导的栅格化k匿名方法,其特征在于,步骤A具体包括以下步骤:
采集待栅格化的区域包含的位置数据点Ncount和区域的总体面积Sarea,通过下式计算得到该区域的划分粒度ρ:
将待栅格化的区域从左到右、从上到下分割成由正方形小单元构成的二维平面;这些小单元即为划分单元,其面积Smin为划分粒度ρ与K值的乘积:
Smin=K*ρ
其中,K值为给定的k匿名模型中的输入参数K值;
将区域中的位置数据点映射到二维平面,统计每个划分单元中位置数据点的数量,将目标区域用单元矩阵表示,单元矩阵形如:
矩阵的元素在矩阵中的相对位置与划分单元在区域中的相对位置相同;每个元素mij代表了每个划分单元中位置数据点的数量。
3.根据权利要求1所述的一种人员密度制导的栅格化k匿名方法,其特征在于,步骤B具体包括以下步骤:
对任意划分单元,设其内含有数据点数为ncount,其实际面积sarea与划分单元面积Smin的比值为s′area,通过以下公式计算其粒度级别:
利用该公式将单元矩阵中的数值进行替代,将单元矩阵转化为粒度矩阵:
粒度矩阵的每个元素rij代表了对应单元区域的粒度级别。
4.根据权利要求1所述的一种人员密度制导的栅格化k匿名方法,其特征在于,步骤C具体包括以下步骤:
对待匿名用户位置点所在的划分单元,根据其粒度级别和其周边划分单元的粒度级别按照以下规则进行处理:
若待匿名用户位置点所在的划分单元粒度级别为-1,扫描与其相邻的划分单元,如有粒度级别大于等于1的区域,则选取其中粒度级别最大的划分单元,若多个划分单元粒度级别均为最大,则选取包含数据点个数最多的划分单元;将含匿名用户位置点的划分单元和选取的划分单元进行合并,合并后更新粒度级别;如果更新后的粒度级别仍小于0,则继续对合并后多个划分单元的相邻划分单元进行扫描,进行相邻划分单元的合并,直到合并后的粒度级别大于-1;
若待匿名用户位置点所在的划分单元粒度级别大于-1,则表明该区域人数已经达到了k匿名的参数要求,直接进行匿名操作。
5.根据权利要求4所述的一种人员密度制导的栅格化k匿名方法,其特征在于,若待匿名用户位置点所在的单元粒度级别大于1,表明该区域人数超过k匿名的参数要求,采用基于地理中线的平衡划分方法对其进行拆分为多个子匿名区域,并对子区域进行匿名操作。
6.根据权利要求5所述的一种人员密度制导的栅格化k匿名方法,其特征在于,对于级别大于1的待匿名单元区域中的每一个位置点ai用(x,y)表示,x为纬度数据,y为经度数据;
该区域可采用一个位置矩阵P表示,它是一个|P|×2的矩阵,|P|表示P中含有的位置点数量,形如:
位置矩阵P中的每行数据xi,yi分别表示位置点ai的纬度数据和经度数据;
分别对位置矩阵的x列、y列进行排序,得到最大纬度值xmax、最小纬度值xmin、最大经度值ymax、最小经度值ymin;比较(xmax-xmin)与(ymax-ymin)的关系;若(xmax-xmin)≥(ymax-ymin),则以纬度值等于(xmax+xmin)/2的纬线为分割线,将P分为P1、P2;若(ymax-ymin)>(xmax-xmin),则以经度值等于(ymax+ymin)/2的经线为分割线,将P划分为子区域P1、P2;处于分割线上的点均划分到P1中;重复上述过程,对P不断进行划分,直至其子区域均满足k-匿名要求。
7.根据权利要求6所述的一种人员密度制导的栅格化k匿名方法,其特征在于,通过地理中线对区域P进行划分可能导致划分出的子区域P1、P2中,某一子区域的位置点数少于K,则采用平衡算法对子区域的位置点数量进行平衡,使得最终每个子区域均满足k-匿名要求;设P1点数|P1|<K;选取P2中最靠近划分线的(K-|P1|)个点,将其从P2划分至P1中;具体地,若划分线为经线,则选取P2中经度值和经线最接近的(K-|P1|)个点,若划分线为纬线,则选取P2中纬度值和纬线最接近的(K-|P1|)个点;若处于划分线上的位置点的数量超过(K-|P1|)个,则从这些点中随机选取(K-|P1|)个点;将这(K-|P1|)个点,加入至P1中,并从P2中删去;通过该平衡算法使得每个子区域的位置点数均满足k-匿名要求。

说明书全文

一种人员密度制导的自适应k匿名栅格化方法

技术领域

[0001] 本发明涉及信息安全领域,特别涉及一种位置服务中的支持位置隐私的k匿名栅格化方法。

背景技术

[0002] 基于位置的服务已经成为了最受人们青睐的移动服务之一,移动用户在使用智能终端享受各种位置服务过程中,服务提供商的位置服务器上留下了大量的用户位置信息,而且附着在这些位置信息上的上下文信息能够暴露用户的生活习惯、兴趣爱好、日常活动、社会关系和身体状况等个人敏感信息。当这些信息不断增加且泄露给不可信第三方(如服务提供商)时,将会打开滥用个人隐私数据的大。而个人对位置隐私的担忧势必会阻碍移动互联网位置服务产业的健康发展。因此,如何在保护用户隐私的同时又能为用户提供高质量的服务,是移动互联网环境下位置隐私保护技术必须解决的科学问题。
[0003] 国内外学者在基于位置的服务中的位置隐私保护方面已进行了许多有益的研究,大多的位置隐私保护方案都是基于K匿名模型。包括:Bamba等提出了PrivacyGrid方法,将空间划分成网格,并使用网格进行K匿名,提高了用户的隐私保护程度。Deutsch等针对部分K匿名方法仅能防御没有匿名政策背景知识的攻击者,提出了政策感知K匿名方法,可以抵御更多现实中知道匿名框生成策略的恶意攻击者。Pan等针对连续查询中位置相关性攻击,提出了增量ICliqueCloak方法。Wang等提出了位置感知位置隐私保护问题,实现了连续查询中的隐私多样、动态性问题。Ghinita等人利用k匿名的思想,通过用空间匿名区域的位置代替用户精确位置达到隐私保护的目的。但是,现有位置数据发布中的k匿名隐私保护方法中的k值敏感度很低,无法根据不同场景下的位置数据进行自适应的k匿名栅格化处理,需要提出新的方法来保证较高隐私程度和服务质量的同时提升k匿名隐私保护方法的自适应性。

发明内容

[0004] 本发明的目的在于提供一种人员密度制导的自适应k匿名栅格化方法,以解决上述技术问题。本发明,首先根据待栅格化区域的位置数据点的数量、区域的面积和匿名系数K对待栅格化区域进行单元划分和转换;然后对划分单元区域位置点数量的粒度级别进行划分;最后根据待匿名用户位置点所在的单元区域的粒度级别和其周边区域的粒度级别进行自适应k匿名栅格化。
[0005] 为了实现上述目的,本发明采用如下技术方案:
[0006] 一种人员密度制导的栅格化k匿名方法,包括以下步骤:
[0007] A.基于人员密度进行栅格化:根据目标区域中位置点数量多少、目标区域面积大小和匿名系数K的大小,计算得出目标区域的栅格大小,并以此将目标区域栅格化;
[0008] B.计算目标区域人员密度分布:根据栅格中位置点的数量多少和匿名系数K的大小,计算得到每个栅格的粒度级别,并将目标区域所有栅格的粒度级别形式化为粒度矩阵;
[0009] C.人员密度制导的k匿名:根据栅格的粒度级别,对每一个栅格进行合并、拆分自适应处理后形成匿名区域,对匿名区域中的位置点进行k匿名。
[0010] 进一步的,步骤A具体包括以下步骤:
[0011] 采集待栅格化的区域包含的个位置数据点Ncount和区域的总体面积Sarea,对于给定的k匿名模型中的输入参数K值,通过下式计算得到该区域的划分粒度ρ:
[0012]
[0013] 将待栅格化的区域从左到右、从上到下分割成由正方形小单元构成的二维平面;这些小单元即为划分单元,其面积Smin为划分粒度ρ与K值的乘积:
[0014] Smin=K*ρ
[0015] 将区域中的位置数据点映射到二维平面,统计每个划分单元中位置数据点的数量,将目标区域用单元矩阵表示,单元矩阵形如:
[0016]
[0017] 矩阵的元素在矩阵中的相对位置与划分单元在区域中的相对位置相同;每个元素mij代表了每个划分单元中位置数据点的数量。
[0018] 进一步的,步骤B具体包括以下步骤:
[0019] 对任意划分单元,设其内含有数据点数为ncount,其实际面积sarea与划分单元面积Smin的比值为s′area,通过以下公式计算其粒度级别:
[0020]
[0021] 利用该公式将单元矩阵中的数值进行替代,将单元矩阵转化为粒度矩阵:
[0022]
[0023] 粒度矩阵的每个元素rij代表了对应单元区域的粒度级别。
[0024] 进一步的,步骤C具体包括以下步骤:
[0025] 对待匿名用户位置点所在的划分单元,根据其粒度级别和其周边划分单元的粒度级别按照以下规则进行处理:
[0026] 若待匿名用户位置点所在的划分单元粒度级别为-1,扫描与其相邻的划分单元,如有粒度级别大于等于1的区域,则选取其中粒度级别最大的划分单元,若多个划分单元粒度级别均为最大,则选取包含数据点个数最多的划分单元;将含匿名用户位置点的划分单元和选取的划分单元进行合并,合并后更新粒度级别;如果更新后的粒度级别仍小于0,则继续对合并后多个划分单元的相邻划分单元进行扫描,进行相邻划分单元的合并,直到合并后的粒度级别大于-1;
[0027] 若待匿名用户位置点所在的划分单元粒度级别大于-1,则表明该区域人数已经达到了k匿名的参数要求,直接进行匿名操作。
[0028] 进一步的,若待匿名用户位置点所在的单元区域级别大于1,表明该区域人数超过k匿名的参数要求,采用基于地理中线的平衡划分方法对其进行拆分为多个子匿名区域,并对子区域进行匿名操作。
[0029] 进一步的,对于级别大于1的待匿名单元区域中的每一个位置点ai用(x,y)表示,x为纬度数据,y为经度数据;该区域可采用一个位置矩阵P表示,它是一个|P|×2的矩阵,|P|表示P中含有的位置点数量,形如:
[0030]
[0031] 位置矩阵中P中的每行数据xi,yi分别表示位置点ai的纬度数据和经度数据;
[0032] 分别对位置矩阵的x列、y列进行排序,得到最大纬度值xmax、最小纬度值xmin、最大经度值ymax、最小经度值ymin;比较(xmax-xmin)与(ymax-ymin)的关系;若(xmax-xmin)≥(ymax-ymin),则以纬度值等于(xmax+xmin)/2的纬线为分割线,将P分为P1、P2;若(ymax-ymin)>(xmax-xmin),则以经度值等于(ymax+ymin)/2的经线为分割线,将P划分为子区域P1、P2;处于分割线上的点均划分到P1中;重复上述过程,对P不断进行划分,直至其子区域均满足k-匿名要求。
[0033] 进一步的,通过地理中线对区域P进行划分可能导致划分出的子区域P1、P2中,某一子区域的位置点数少于K,则采用平衡算法对子区域的位置点数量进行平衡,使得最终每个子区域均满足k-匿名要求;设P1点数|P1|<K;选取P2中最靠近划分线的(K-|P1|)个点,将其从P2划分至P1中;具体地,若划分线为经线,则选取P2中经度值和经线最接近的(K-|P1|)个点,若划分线为纬线,则选取P2中纬度值和纬线最接近的(K-|P1|)个点;若处于划分线上的位置点的数量超过(K-|P1|)个,则从这些点中随机选取(K-|P1|)个点;将这(K-|P1|)个点,加入至P1中,并从P2中删去;通过该平衡算法使得每个子区域的位置点数均满足k-匿名要求。
[0034] 最终对处于栅格化后的匿名单元区域或子匿名区域的所有位置数据点,将其坐标用同一特征点——该区域的地理中点am(xm,ym)替换,其中:
[0035]
[0036] 相对于现有技术,本发明具有以下有益效果:
[0037] 本发明对待栅格化区域的人口密度特征进行预分析并将该区域划分为多个小单元,通过划分后的不同密度的单元区域的结合与拆分动态形成匿名区,实现了人员密度制导的自适应k匿名栅格化算法以适应不同密度场景的位置隐私保护。本发明通过地理中点进行位置置换实现位置匿名,在位置隐私程度不变的情况下能够提高匿名的服务质量。

具体实施方式

[0038] 下面对本发明的实施过程做进一步详细说明。
[0039] 本发明一种人员密度制导的自适应k匿名栅格化方法,包括以下步骤:
[0040] 步骤A.基于人员密度进行栅格化:根据目标区域中位置点数量多少、目标区域面积大小和匿名系数k的大小,计算得出目标区域的栅格大小,并以此将目标区域栅格化。
[0041] 采集待栅格化的区域包含的个位置数据点Ncount和区域的总体面积Sarea,对于给定的K匿名模型中的输入参数K值,通过下式计算得到该区域的划分粒度ρ:
[0042]
[0043] 将待栅格化的区域从左到右、从上到下分割成由正方形小单元构成的二维平面。这些小单元即为划分单元(或称为栅格),其面积为划分粒度与K值的乘积:
[0044] Smin=K*ρ
[0045] 将区域中的位置数据点映射到二维平面,统计每个划分单元中位置数据点的数量,将待栅格化的区域用单元矩阵表示。单元矩阵形如:
[0046]
[0047] 矩阵的元素代表划分单元。元素在矩阵中的相对位置与划分单元在区域中的相对位置相同。每个元素mij代表了每个划分单元中位置数据点的数量。
[0048] 步骤B.计算目标区域人员密度分布:根据栅格中位置点的数量多少和匿名系数k的大小,计算得到每个栅格的粒度级别,并将目标区域所有栅格的粒度级别形式化为粒度矩阵。
[0049] 为了处理更加简便,将单元矩阵转换为粒度矩阵。对任意划分单元,设其内含有数据点数为ncount,其实际面积sarea与划分单元面积Smin的比值为sa′rea,通过以下公式计算其粒度级别:
[0050]
[0051] 利用该公式将单元矩阵中的数值进行替代,将单元矩阵转化为粒度矩阵:
[0052]
[0053] 粒度矩阵的每个元素rij代表了对应单元区域的粒度级别,取值范围为-2,-1,0,……,N。
[0054] 步骤C.人员密度制导的自适应k匿名:根据栅格的粒度级别,对每一个栅格进行合并(合并后的多个栅格作为一个整体可能需要再划分)、基于地理中线划分等自适应处理后形成匿名区域,对匿名区域中的位置点进行k匿名。
[0055] 对待匿名用户位置点所在的单元区域根据其粒度级别和其周边区域的粒度级别按照以下规则进行栅格化处理:
[0056] 由于待匿名用户位置点所在的单元区域至少有一个位置点,因此级别为-2的无需讨论。
[0057] 若待匿名用户位置点所在的单元区域级别为-1,扫描与其相邻的区域,若有粒度级别大于等于1的区域,则选取其中的级别最大的区域,若多个区域级别均为最大级别,则选取其中区域对应划分单元中数据点个数最多的区域。将待匿名的单元区域和选取出的区域进行合并,合并后更新粒度级别;若没有则首先将该区域与具有最多的位置数据点的相邻区域进行合并,并更新合并后粒度级别,判断更新的粒度级别是否大于等于0,如果不大于等于0则继续扫描合并后的区域的相邻区域,按照前述原则进行相邻区域的合并,直到合并后的区域级别大于等于0,则停止扫描合并。最后根据合并后的区域级别再进行后续处理。
[0058] 若待匿名用户位置点所在的单元区域级别为0,则表明该区域人数已经达到了k匿名的参数要求,该单元区域无需进行合并或拆分,直接进行匿名操作。
[0059] 若待匿名用户位置点所在的单元区域级别大于1,表明该区域人数超过k匿名的参数要求,但是为了进一步提高匿名服务的质量,需要采用基于地理中线的平衡划分方法对其进行拆分为多个子匿名区域,并对子区域进行匿名操作。对于级别大于1的待匿名单元区域中的每一个位置点ai用(x,y)表示,x为纬度数据,y为经度数据。因此该区域可采用一个位置矩阵P表示,它是一个|P|×2(|P|表示P中含有的位置点数量)的矩阵,形如:
[0060]
[0061] 位置矩阵中P中的每行数据xi,yi分别表示位置点ai的纬度数据和经度数据。
[0062] 分别对位置矩阵的x列、y列进行排序,得到最大纬度值xmax、最小纬度值xmin、最大经度值ymax、最小经度值ymin。比较(xmax-xmin)与(ymax-ymin)的关系。若(xmax-xmin)≥(ymax-ymin),则以纬度值等于(xmax+xmin)/2的纬线为分割线,将P分为P1、P2。同理若(ymax-ymin)>(xmax-xmin),则以经度值等于(ymax+ymin)/2的经线为分割线,将P划分为子区域P1、P2。处于分割线上的点均划分到P1中。重复上述过程,对P不断进行划分,直至其子区域均满足k-匿名要求。
[0063] 通过地理中线对区域P进行划分可能导致划分出的子区域P1、P2中,某一子区域的位置点数少于K,则采用平衡算法对子区域的位置点数量进行平衡,使得最终每个子区域均满足k-匿名要求。设P1点数|P1|<K。选取P2中最靠近划分线的(K-|P1|)个点,将其从P2划分至P1中。具体地,若划分线为经线,则选取P2中经度值和经线最接近的(K-|P1|)个点,若划分线为纬线,则选取P2中纬度值和纬线最接近的(K-|P1|)个点。若处于划分线上的位置点的数量超过(K-|P1|)个,则从这些点中随机选取(K-|P1|)个点。将这(K-|P1|)个点,加入至P1中,并从P2中删去。通过该平衡算法使得每个子区域的位置点数均满足k-匿名要求。
[0064] 最终对处于栅格化后的匿名单元区域或子匿名区域的所有位置数据点,将其坐标用同一特征点——该区域的地理中点am(xm,ym)替换,其中:
[0065]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈