首页 / 专利库 / 电脑安全 / 安全分析 / 图数据发布隐私保护的聚类匿名方法及系统

图数据发布隐私保护的聚类匿名方法及系统

阅读:500发布:2024-01-12

专利汇可以提供图数据发布隐私保护的聚类匿名方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了图数据发布隐私保护的聚类匿名方法及系统,以图数据群体内每个用户为一个 节点 ,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明将 聚类分析 技术应用于图数据发布的隐私保护中,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的 属性信息 和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。,下面是图数据发布隐私保护的聚类匿名方法及系统专利的具体信息内容。

1.一种图数据发布隐私保护的聚类匿名方法,其特征在于,包括:
获取步骤,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算步骤,计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类步骤,根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名步骤,根据划分得到的聚类对每个聚类内的节点进行匿名处理。
2.根据权利要求1所述的图数据发布隐私保护的聚类匿名方法,其特征在于,所述聚类步骤,具体为:
根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
所述匿名步骤,具体为:
根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
3.根据权利要求1或2所述的图数据发布隐私保护的聚类匿名方法,其特征在于,还包括:
调用步骤,在图数据的某一节点被调用时,返回匿名处理后的结果。
4.根据权利要求1或2所述的图数据发布隐私保护的聚类匿名方法,其特征在于,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
5.根据权利要求1或2所述的图数据发布隐私保护的聚类匿名方法,其特征在于,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
6.一种图数据发布隐私保护的聚类匿名系统,其特征在于,包括:
获取模,用于以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算模块,用于计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类模块,用于根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名模块,用于根据划分得到的聚类对每个聚类内的节点进行匿名处理。
7.根据权利要求6所述的图数据发布隐私保护的聚类匿名系统,其特征在于,所述聚类模块用于:
根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
所述匿名模块用于:
根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
8.根据权利要求6或7所述的图数据发布隐私保护的聚类匿名系统,其特征在于,还包括:
调用模块,用于在图数据的某一节点被调用时,返回匿名处理后的结果。
9.根据权利要求6或7所述的图数据发布隐私保护的聚类匿名系统,其特征在于,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
10.根据权利要求6或7所述的图数据发布隐私保护的聚类匿名系统,其特征在于,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。

说明书全文

图数据发布隐私保护的聚类匿名方法及系统

技术领域

[0001] 本发明涉及信息技术和数据挖掘的技术领域,尤其涉及图数据发布隐私保护的聚类匿名方法及系统。

背景技术

[0002] 当前,如何对图数据发布形式的隐私进行保护是研究话题之一。在社交网络图中,个体节点或边蕴含的隐私信息可能因遭受到恶意盗取而泄露。隐私保护技术通常来说不能够对攻击者所能获得的数据背景知识做定义,因此在处理复杂多变的攻击模型中,随着攻击者掌握背景知识的增加,往往会生成很多攻击变体。攻击者通过将用户的出生日期、性别、邮编等准标识符数据进行组合,常常能推断并定特定个体,进而获取该个体其他重要的隐私信息。隐私保护算法在通用性上的限制,使数据管理者不得不针对个性化的攻击模式设计出新的隐私保护算法。
[0003] 聚类分析是对于统计数据分析的一技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性。
[0004] 如果能够将聚类分析技术应用于对图数据形式发布的隐私进行保护,则可以一定程度上改善社交网络中个性化隐私保护不足的问题。

发明内容

[0005] 为了克服现有技术的不足,本发明的目的在于提供图数据发布隐私保护的聚类匿名方法及系统,旨在将聚类分析技术应用于对图数据形式发布的隐私进行保护,解决目前社交网络中个性化隐私保护不足的问题。
[0006] 本发明的目的采用以下技术方案实现:
[0007] 一种图数据发布隐私保护的聚类匿名方法,包括:
[0008] 获取步骤,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
[0009] 计算步骤,计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
[0010] 聚类步骤,根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
[0011] 匿名步骤,根据划分得到的聚类对每个聚类内的节点进行匿名处理。
[0012] 在上述实施例基础上,优选的,所述聚类步骤,具体为:
[0013] 根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
[0014] 所述匿名步骤,具体为:
[0015] 根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
[0016] 在上述任意实施例的基础上,优选的,还包括:
[0017] 调用步骤,在图数据的某一节点被调用时,返回匿名处理后的结果。
[0018] 在上述任意实施例的基础上,优选的,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
[0019] 在上述任意实施例的基础上,优选的,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
[0020] 一种图数据发布隐私保护的聚类匿名系统,包括:
[0021] 获取模,用于以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
[0022] 计算模块,用于计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
[0023] 聚类模块,用于根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
[0024] 匿名模块,用于根据划分得到的聚类对每个聚类内的节点进行匿名处理。
[0025] 在上述实施例的基础上,优选的,所述聚类模块用于:
[0026] 根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
[0027] 所述匿名模块用于:
[0028] 根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
[0029] 在上述任意实施例的基础上,优选的,还包括:
[0030] 调用模块,用于在图数据的某一节点被调用时,返回匿名处理后的结果。
[0031] 在上述任意实施例的基础上,优选的,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
[0032] 在上述任意实施例的基础上,优选的,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
[0033] 相比现有技术,本发明的有益效果在于:
[0034] 本发明公开了图数据发布隐私保护的聚类匿名方法及系统,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明将聚类分析技术应用于图数据发布的隐私保护中,提出一种基于结构相似度和属性相似度的图聚类匿名方式,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的属性信息和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。附图说明
[0035] 下面结合附图和实施例对本发明进一步说明。
[0036] 图1示出了本发明实施例提供的一种图数据发布隐私保护的聚类匿名方法的流程示意图;
[0037] 图2示出了本发明实施例提供的一种图数据发布隐私保护的聚类匿名系统的结构示意图。

具体实施方式

[0038] 下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
[0039] 具体实施例一
[0040] 如图1所示,本发明实施例提供了一种图数据发布隐私保护的聚类匿名方法,包括:
[0041] 获取步骤S101,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
[0042] 计算步骤S102,计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
[0043] 聚类步骤S103,根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
[0044] 匿名步骤S104,根据划分得到的聚类对每个聚类内的节点进行匿名处理。
[0045] 本发明实施例以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明实施例将聚类分析技术应用于图数据发布的隐私保护中,提出一种基于结构相似度和属性相似度的图聚类匿名方式,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的属性信息和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。
[0046] 优选的,所述聚类步骤S103,可以具体为:根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;所述匿名步骤S104,可以具体为:根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。这样做的好处是,对图数据依次进行图属性聚类划分和图结构聚类划分。
[0047] 优选的,本发明实施例还可以包括:调用步骤S105,在图数据的某一节点被调用时,返回匿名处理后的结果。这样做的好处是,在图数据被调用时,返回匿名处理后的结果,保障用户社交网络图数据发布的隐私安全。
[0048] 本发明实施例对用户属性不做限定,优选的,所述用户属性可以包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
[0049] 本发明实施例对用户间相互关系不做限定,优选的,所述用户间相互关系可以包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
[0050] 在上述的具体实施例一中,提供了图数据发布隐私保护的聚类匿名方法,与之相对应的,本申请还提供图数据发布隐私保护的聚类匿名系统。由于系统实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
[0051] 具体实施例二
[0052] 如图2所示,本发明实施例提供了一种图数据发布隐私保护的聚类匿名系统,包括:
[0053] 获取模块201,用于以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
[0054] 计算模块202,用于计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
[0055] 聚类模块203,用于根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
[0056] 匿名模块204,用于根据划分得到的聚类对每个聚类内的节点进行匿名处理。
[0057] 本发明实施例以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明实施例将聚类分析技术应用于图数据发布的隐私保护中,提出一种基于结构相似度和属性相似度的图聚类匿名方式,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的属性信息和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。
[0058] 优选的,所述聚类模块203可以用于:根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;所述匿名模块204可以用于:根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
[0059] 优选的,本发明实施例还可以包括:调用模块205,用于在图数据的某一节点被调用时,返回匿名处理后的结果。
[0060] 本发明实施例对用户属性不做限定,优选的,所述用户属性可以包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
[0061] 本发明实施例对用户间相互关系不做限定,优选的,所述用户间相互关系可以包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
[0062] 本发明从使用目的上,效能上,进步及新颖性等观点进行阐述,其具有的实用进步性,己符合专利法所强调的功能增进及使用要件,本发明以上的说明及附图,仅为本发明的较佳实施例而己,并非以此局限本发明,因此,凡一切与本发明构造,装置,待征等近似、雷同的,即凡依本发明专利申请范围所作的等同替换或修饰等,皆应属本发明的专利申请保护的范围之内。
[0063] 需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈