首页 / 专利库 / 专利权 / 代理人 / 可定制依赖语义的高效用起源过滤方法

可定制依赖语义的高效用起源过滤方法

阅读:107发布:2020-12-12

专利汇可以提供可定制依赖语义的高效用起源过滤方法专利检索,专利查询,专利分析的服务。并且本 发明 提出一种可定制依赖语义的高效用起源过滤方法,包含以下步骤:步骤1:检查待过滤的起源图,确保其为符合标准化起源模型及其模型约束的有向无环图;步骤2: 声明 起源过滤需求,即待过滤的起源元素、直接或间接起源依赖关系;步骤3:按照起源过滤机制中的过滤规则和修复规则处理待过滤的 节点 和节点对;步骤4:按照起源图 整理 规则整理并更新起源图,得到起源过滤视图;步骤5:按照起源过滤视图评估模型定量地评估起源过滤视图的效用,生成起源过滤报告。本发明的方法,能够选择性地过滤或保持起源元素之间的依赖语义,能够在实现过滤需求的同时有效地保持所发布起源数据的效用。,下面是可定制依赖语义的高效用起源过滤方法专利的具体信息内容。

1.一种可定制依赖语义的高效用起源过滤方法,其特征在于,包括以下步骤:
步骤1:检查待过滤的起源图,确保其为符合标准化起源模型及其模型约束的有向无环图;
步骤2:声明起源过滤需求,即待过滤的起源元素、直接及间接起源依赖关系;其中,过滤需求中待过滤的起源元素用起源图中的节点表示,过滤需求中待过滤的直接或间接依赖关系用起源图中的节点对表示;
步骤3:按照起源过滤机制中的过滤规则和修复规则处理待过滤的起源元素和依赖关系;
步骤4:按照起源过滤机制中的整理规则整理并更新步骤3的处理结果,得到起源过滤视图;
步骤5:按照起源过滤视图评估模型定量地评估起源过滤视图的效用,生成起源过滤报告。
2.根据权利要求1所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述起源图具有可追溯的依赖语义,即,若任意节点v可以追溯到另一节点u,则u是v发生的部分起因在起源图中,每个节点v表示一个起源元素,根据起源元素的类型,将起源元素集合分为三个互不相交的子集:实体集、活动集和代理集,所述实体集中,一个实体节点描述某个数据对象过去某个时间段或时间点的状态,所述活动集中,一个活动节点表示在一段时间内作用在实体节点上的过程或者会引起状态发生变化的一系列操作,所述代理集中,一个代理节点表示为一个活动的发生、一个实体的存在或另一个代理的活动承担某种责任的代理人或组织;
所述直接依赖关系表述如下:
若v是u的直接后果,u是v的直接起因,记为,称v到u的直接依赖关系,或称v直接依赖于u,直接依赖关系包括如下类型:
(1)Usage(使用依赖):活动节点使用实体节点;
(2)Generation(产生依赖),实体节点由活动节点产生;
(3)Association(关联依赖),代理节点在活动节点中承担责任;
(4)Attribution(归属依赖),代理节点对实体节点承担责任;
(5)Derivation(派生依赖),某实体节点由另一实体节点派生而来;
(6)Communication(通信依赖),某活动节点v通信依赖于另一活动节点u,v使用了u所产生的某个实体节点;
(7)Delegation(代理依赖),某代理节点代表另一代理节点;
所述间接依赖关系表述如下:
若v是u的间接后果,u是v的间接起因,则节点v对u有间接依赖关系;
通过如下定理表示相关起源依赖关系的传递性和可推理性:
(1)负责活动节点一的代理节点一对该活动产生的实体节点一负责,即实体节点一对代理节点一的归属依赖具有可推理性;
(2)负责代理节点二的上级代理节点一对该代理负责的实体节点一负责,即实体节点一对代理节点一的归属依赖具有可推理性;
(3)负责代理节点二的上级代理节点一对该代理负责的活动节点一负责,即活动节点一对代理节点一的关联依赖具有可推理性;
(4)活动节点一产生的某个实体节点一是活动节点二开始并随后产生其它实体的必要条件,则活动节点二通信依赖于活动节点一,即活动节点二对活动节点一的通信依赖关系具有可推理性;
(5)活动节点一通信依赖于活动节点二,活动节点二通信依赖于活动节点三,则活动节点一通信依赖于活动节点三,即活动节点之间的通信依赖关系具有传递性;
(6)代理节点三代表上级代理节点二,代理节点二代表其上级代理节点一,则代理节点三在一定程度上可以代表上级代理节点一,即代理节点之间的代理依赖关系具有传递性;
(7)若实体节点一派生依赖于实体节点二,实体节点二派生依赖于实体节点三,则实体节点一派生依赖于实体节点三,即实体节点之间的派生依赖关系具有传递性。
3.根据权利要求1所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述步骤
3,过滤顺序为表示元素的节点、表示直接依赖关系的节点对、表示间接依赖关系的节点对,依据过滤对象的类型及其直接前因节点和直接后果节点的类型组合选择并进行过滤和修复操作。
4.根据权利要求1所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述步骤
3,处理待过滤的起源元素和依赖关系包含以下子步骤:
步骤31:依次取待过滤的节点v,并根据该节点及其直接前因节点和直接后果节点的类型,选取并应用过滤和修复规则,删除节点以及与节点相关的边,修复被破坏的起源依赖关系,更新起源图;
步骤32:取未经处理的待过滤节点对,若无则进入步骤34,否则检查u,v两点在起源图中是否存在且连通,若不存在或不连通则无需处理;若两点存在且连通则进一步判断u、v是否相邻,若二者相邻则进入步骤33,否则标记为待过滤连通路径节点对,回到步骤32;
步骤33:删除u、v之间的边,并根据u、v两点的类型以及u的直接前因节点和v的直接后果节点的类型,选取并应用修复规则,修复被破坏起源依赖关系,更新起源图,回到步骤32;
步骤34:依次取待过滤连通路径节点对,依次获取u、v之间的连通路径p,采用最小代价决策的方法过滤p,即通过代价函数分别计算路径p上每条边的过滤代价和修复代价和,删除总代价Cost值最小的边;根据u、v两点的类型以及u的直接前因节点和v的直接后果节点的类型,选取并应用修复规则,修复被破坏的起源间接依赖关系;若s的直接前因节点和t的直接后果节点不同时在路径p上,则还须根据s、t两点的类型以及s的直接前因节点和t的直接后果节点的类型,选择并应用修复规则,修复被破坏的起源图。
5.根据权利要求4所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述代价函数为: 其中VP为原起源图中的连通节点对数,VPS为过滤视图中的连
通节点对数、VPSC为过滤视图中路径变化的连通节点对数。
6.根据权利要求4所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述各类过滤和修复规则为:
实体类节点过滤和修复规则如下:
(1)当直接前因节点是空且直接后果节点是实体类或活动类时,过滤规则:删除该节点及其与直接后果节点之间的边;该情况不用修复;
(2)当直接后果节点是空且直接前因节点是实体类、活动类或代理类时,过滤规则:删除该节点及其与直接前因节点之间的边;该情况不用修复;
(3)当直接前因节点是代理类且直接后果节点是实体类或活动类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;该情况无法修复;
(4)当直接前因节点是实体类且直接后果节点是活动类时,过滤规则:删除该节点及与其直接前因节点和直接后果节点之间的边;修复规则:首先在起源图中查找直接前因节点的最近前因活动节点,若存在则增加直接后果节点到最近前因活动节点的通信依赖关系;
(5)当直接前因节点是活动类且直接后果节点是实体类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则:首先在起源图中查找直接后果节点的最近后果活动节点,若存在则增加最近后果活动节点到直接前因节点的通信依赖关系;
(6)当直接前因节点和直接后果节点都是活动类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则:增加从直接后果节点到直接前因节点的通信依赖关系;
(7)当直接前因节点和直接后果节点都是实体类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则:增加从直接后果节点到直接前因节点的派生依赖关系;
活动类节点过滤和修复规则如下:
(1)当直接前因节点是空且直接后果节点是实体类或活动类时,过滤规则:删除该节点及其与直接后果节点之间的边;该情况不用修复;
(2)当直接后果节点是空且直接前因节点是实体类、活动类或代理类时,过滤规则:删除该节点及其与直接前因节点之间的边;该情况不用修复;
(3)当直接前因节点是代理且直接后果节点是活动类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;该情况无法修复;
(4)当直接前因节点是代理且直接后果节点是实体类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则:增加直接后果节点到直接前因节点的归属依赖关系;
(5)当直接前因节点是实体类且直接后果节点是活动类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则:首先在起源图中查找直接前因节点的最近前因活动节点,若存在则增加从直接后果节点到最近前因活动节点的通信依赖关系;
(6)当直接前因节点是活动类且直接后果节点是实体类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则:首先在起源图中查找直接后果节点的最近后果活动节点,若存在则增加从最近后果活动节点到直接前因节点的通信依赖关系;
(7)当直接前因节点和直接后果节点都是活动类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则:增加从直接后果节点到直接前因节点的通信依赖关系;
(8)当直接前因节点和直接后果节点都是实体类时,过滤规则:删除该节点及其与直接前因节点和直接后果节点之间的边;修复规则需分情况讨论:当直接后果节点派生依赖于直接前因节点时,不用修复;否则在起源图中分别查找直接前因节点的最近前因活动节点以及直接后果节点的最近后果活动节点,若均存在则增加从最近后果节点到最近前因节点的通信依赖关系;
代理类节点过滤和修复规则如下:
(1)当直接前因节点是空且直接后果节点是实体类、活动类或代理类时,过滤规则:删除该节点及其与直接后果节点之间的边;该情况不用修复;
(2)当直接后果节点是空且直接前因节点是代理类时,过滤规则:删除该节点及其与直接后果节点之间的边;该情况不用修复;
(3)当直接前因节点是代理类且直接后果节点是代理类时,过滤规则:删除该节点及其与直接后果节点之间的边;修复规则:增加从直接后果节点到直接前因节点的代理依赖关系;
(4)当直接前因节点是代理类且直接后果节点是实体类时,过滤规则:删除该节点及其与直接后果节点之间的边;修复规则:增加直接后果节点到直接前因节点的归属依赖关系;
(5)当直接前因节点是代理类且直接后果节点是活动类时,过滤规则:删除该节点及其与直接后果节点之间的边;修复规则:增加直接后果节点到直接前因节点的关联依赖关系;
删除Usage类边后可用的起源依赖修复规则如下:
(1)当u的直接前因节点是空或代理类时,该情况无法修复;
(2)当u的直接前因节点是实体类时,首先在起源图中u的直接前因节点的最近前因活动节点,若存在则增加从v到该最近前因活动节点的通信依赖关系;
(3)当u的直接前因节点是活动类时,则增加从v到u的直接前因节点的通信依赖关系;
删除Generation类边后可用的起源依赖修复规则如下:
(1)当u的直接前因节点是代理类时,则可增加从v到u的直接前因节点的归属依赖关系;
(2)当v的直接后果节点是空且u的直接前因节点不是代理类时,无法修复;
(3)当v的直接后果节点是实体类时,首先在起源图中查找v的最近后果活动节点,若存在则增加从该节点到u之间的通信依赖关系;
(4)当v的直接后果节点是活动类时,则增加从该节点到u的通信依赖关系;
删除Derivation类边后可用的起源依赖关系修复规则如下:
(1)当u的直接前因节点是空或代理类时,该情况无法修复;
(2)u的直接前因节点是活动类且v的直接后果节点是实体类时,首先在起源图中查找v的最近后果活动节点,若存在则增加从该节点到u的直接前因节点的通信依赖关系;
(3)当u的直接前因节点是实体类且v的直接后果节点是活动类时,首先在起源图中查找u的最近前因活动节点,若存在则增加从v的直接后果节点到该节点的通信依赖关系;
(4)当u的直接前因节点和v的直接后果节点都是实体类时,首先在起源图中查找u的最近前因活动节点和v的最近后果活动节点,若均存在则增加从最近后果活动节点到最近前因活动节点的通信依赖关系;
(5)当u的直接前因节点和v的直接后果节点都是活动类时,则增加从v的直接后果节点到u的直接前因节点的通信依赖关系;
删除Communication类边后可用的起源依赖修复规则如下:
(1)当u的直接前因节点是空或代理类时,该情况无法修复;
(2)当u的直接前因节点是实体类且v的直接后果节点是活动类时,则增加从v的直接后果节点到u的通信依赖关系;
(3)当u的直接前因节点是活动类且v的直接后果节点是实体类时,则增加从v到u的直接前因节点的通信依赖关系;
(4)当u的直接前因节点和v的直接后果节点都是实体类时有两种可选的修复规则:第一种首先在起源图中查找u的最近前因活动节点,若存在则增加从v到该节点的通信依赖关系;第二种首先查找v的最近后果活动节点,若存在则增加从该节点到u的通信依赖关系;
(5)当u的直接前因节点和v的直接后果节点都是活动类时有两种可选的修复规则:第一种增加从v到u的直接前因节点的通信依赖关系;第二种增加从v的直接后果节点到u的通信依赖关系;
删除Association类边后可用的起源依赖修复规则如下:
(1)当v的直接后果节点是空时,该情况无法修复;
(2)当v的直接后果节点是实体类时,增加从v的直接后果节点到u的归属依赖关系;
(3)当u的直接前因节点是代理类且v的直接后果节点是活动类时,增加从v到u的直接前因节点的关联依赖关系;
删除Attribution类边后可用的起源依赖修复规则如下:
(1)当u的直接前因节点是代理类时,增加从v到u的直接前因节点的归属依赖关系;
删除Delegation类边后可用的起源依赖修复规则如下:
(1)当u的直接前因节点和v的直接后果节点都是空时,该情况无法修复;
(2)当u的直接前因节点是空或代理类且v的直接后果节点是实体类时,增加从v的直接后果节点到u的归属依赖关系;
(3)当u的直接前因节点是空或代理类且v的直接后果节点是活动类时,增加从v的直接后果节点到u的关联依赖关系;
(4)当u的直接前因节点是空且v的直接后果节点是代理类时,增加从v的直接后果节点到u的代理依赖关系;
(5)当u的直接前因节点是代理类且v的直接后果节点是代理类时,有两种可选的修复规则:第一种增加从v的直接后果节点到u的代理依赖关系;第二种增加从v到u的直接前因节点的代理依赖关系。
7.根据权利要求1所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述步骤
4,根据整理规则整理步骤3所得的起源图、得到起源过滤视图包含以下子步骤:
步骤41:检查起源图中的代理类节点和活动类节点,若节点独立则删除;
步骤42:检查起源图中的边,若边所依附的顶点之一已被删除,则删除该边;
步骤43:检查起源图中的边,若该边所表示的依赖关系可由其它边推理得到,则删除该边;
步骤44:更新起源图,得到最终的起源过滤视图。
8.根据权利要求1所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述步骤
5,生成起源过滤报告,包含以下子步骤:
步骤51:计算待过滤的节点数VR、待过滤的边数ER、待过滤的连通路径数VPR;
步骤52:深度遍历原起源图,计算总节点数V、边数E、连通路径数VP;
步骤53:深度遍历起源过滤视图,计算过滤后保留的节点数VS、边数ES、连通路径数VPS、与原起源图相比路径变化的连通节点对数VPSC;
步骤54:计算起源过滤视图的效用评估值:
其中,ω1、ω2、ω3、ω4分
别赋值为30%、30%、30%、10%;需要说明的是,依据需求,ω1、ω2、ω3、ω4的赋值可选择其他组合,但需满足ω1+ω2+ω3+ω4=100%;
步骤55:生成起源过滤报告。
9.根据权利要求8所述可定制依赖语义的高效用起源过滤方法,其特征在于,所述起源过滤报告内容包括原始起源图、过滤需求、起源过滤视图、过滤需求的满足情况、多过滤的起源元素及依赖关系、为修复起源依赖语义而改变的可推理起源依赖关系以及起源过滤视图的效用值。

说明书全文

可定制依赖语义的高效用起源过滤方法

技术领域

[0001] 本发明属于数据分享技术领域,涉及实现起源数据安全分享的起源过滤技术领域,特别涉及一种可定制依赖语义的高效用起源过滤方法。

背景技术

[0002] 数据起源(Data Provenance,简称起源)也称为数据溯源、数据世系等,记录数据的来源、数据所经历的处理过程以及时间、地点、工具、方法、策略、组织和人员等相关信息,是描述数据演化历史的元数据。起源是评估数据真实性、可信性以及可重现性的重要基础。为实现跨组织的起源数据的发布和共享,W3C相继发布了起源数据模型标准OPM和PROV-DM,用带标注的有向无环图表示起源信息,如图1所示。起源图的核心结构包括实体、活动、代理等三类起源元素以及它们之间的多种依赖关系。
[0003] 起源数据记录描述数据演变历史,可能蕴含各种敏感信息。如公开法律文档起源信息,如其制定者信息及其成形之前有争议的草案内容等可能是敏感的。直接发布和共享原始的起源信息可能造成敏感信息泄露,并进而造成严重的后果。原始的起源还往往包含一些用户不需要的冗余细节信息。起源过滤(Provenance Sanitization)也称为起源校订、起源抽象,是一种改造起源图,在起源数据发布之前,选择性地过滤起源图中的敏感或冗余信息,得到安全、可用的起源过滤视图(sanitized provenance view)的新技术。
[0004] 现有的起源过滤技术能过滤起源图中具体的节点和边乃至子图,但仍存在如下不足。首先,现有的技术无法制起源依赖语义,不能灵活地按需增减起源图所蕴含的起源依赖语义,特别是起源间接依赖语义,过滤对象覆盖不全面。其次,现有的技术侧重于实现起源安全,在过滤敏感信息的时候,往往采用分组抽象的方式聚合相关节点,造成一部分本应公开的节点和相关的边被过度抽象和隐藏,导致脱敏后的起源过滤视图效用偏低。而起源效用是起源用户获得并利用起源满足其业务需要的程度。效用太低的数据起源将失去价值。

发明内容

[0005] 为克服现有技术的缺点,本发明的目的在于提供一种可定制依赖语义的高效用起源过滤方法,以解决现有起源过滤技术中过滤对象覆盖不全面、脱敏后起源效用偏低等问题;能够选择性地过滤或保持起源元素之间的依赖语义,过滤对象不仅包括现有起源过滤技术可以处理的起源元素和直接依赖关系,还包括蕴含丰富语义的起源间接依赖关系;本发明的过滤机制包含过滤规则及与之相配套的修复规则,能在实现过滤需求的同时有效地保持起源数据的效用。
[0006] 为了实现上述目的,本发明采用的技术方案是:
[0007] 一种可定制依赖语义的高效用起源过滤方法,包括以下步骤:
[0008] 步骤1:检查待过滤的起源图,确保其为符合标准化起源模型及其模型约束的有向无环图;
[0009] 步骤2:声明起源过滤需求,即待过滤的起源元素、直接及间接起源依赖关系。其中,起源元素用起源图中的节点表示,直接或间接依赖关系用起源图中的节点对表示;
[0010] 步骤3:按照起源过滤机制中的过滤规则和修复规则处理待过滤的节点和节点对。过滤顺序为节点、表示直接依赖关系的节点对、表示间接依赖关系的节点对。依据过滤对象的类型及其直接前因节点和直接后果节点的类型组合选择并应用适当的过滤和修复操作;
特别地,依据最小代价决策法选择适用于间接依赖关系的过滤和修复操作,代价包括过滤代价和修复代价。
[0011] 步骤4:按照起源图整理规则整理并更新起源图,得到起源过滤视图;检查起源图中的代理类节点和活动类节点,若节点独立则删除之;检查起源图中的边,若边所依附的顶点之一已被删除,则删除该边;检查起源图中的边,若该边所表示的依赖关系可由其它边推理得到,则删除该边;更新起源图,得到最终的起源过滤视图。
[0012] 步骤5:按照起源过滤视图评估模型定量地评估起源过滤视图的效用,生成起源过滤报告。其中,起源效用是如下测量值的综合:(1)除待过滤节点外,过滤视图中的节点保留率;(2)除待过滤边之外,过滤视图中的边的保留率;(3)除待过滤连通路径节点对之外,过滤视图中的连通路径节点对保留率;(4)路径未变化的连通节点对数占过滤视图的中连通节点对总数的比率;起源过滤报告内容包括原始起源图、过滤需求、起源过滤视图、过滤需求的满足情况、多过滤的起源元素及依赖关系、为修复起源依赖语义而改变的可推理起源依赖关系以及起源过滤视图的效用值。
[0013] 与现有技术相比,本发明的有益效果是:
[0014] 1.解决了现有方法无法定制起源依赖语义的问题,实现了过滤对象全面覆盖,不仅支持按需过滤起源元素和直接依赖关系,还支持按需过滤或保持间接依赖关系;
[0015] 2.设计了起源效用保持机制,即根据起源依赖语义的固有性质,在起源过滤机制中设计了修复规则,在实现过滤需求的同时有效地保持起源效用,减少起源消费者对起源的使用障碍,方便其利用起源实现相关数据的真实性评估、可信性验证等业务目标。
[0016] 3.设计了起源过滤视图评估模型,定量地评估起源过滤视图的效用,并生成起源过滤报告,为进一步利用起源制定各类业务决策提供科学的依据。附图说明
[0017] 图1为本发明参考的标准起源模型PROV-DM的核心结构图。
[0018] 图2为本发明的起源过滤方法流程图
[0019] 图3为实体类节点过滤规则及修复规则(表1)的可视化示意图。
[0020] 图4为活动类节点过滤规则及修复规则(表2)的可视化示意图。
[0021] 图5为代理类节点过滤规则及修复规则(表3)的可视化示意图。
[0022] 图6为过滤前的原起源图实例。
[0023] 图7为在过滤需求R1的情况下,使用本发明的方法处理图6得到的起源过滤视图。
[0024] 图8为在过滤需求R1的情况下,使用其它方法处理图6得到的起源过滤视图。
[0025] 图9为在过滤需求R2的情况下,使用本发明的方法处理图6得到的起源过滤视图。

具体实施方式

[0026] 下面结合附图和具体实施例进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
[0027] 本发明假定待过滤的起源图具有可追溯的依赖语义,即若任意节点v可以追溯到另一节点u,则u是v发生的部分起因。实施例参考标准起源模型PROV-DM,本发明方法所涉及的相关概念定义如下:
[0028] 定义1起源图ProvGraph=(V,E):
[0029] 节点集V={v1,v2,…,vn},在起源图中,每个节点v表示一个起源元素,起源元素分为实体(EN),活动(AC)和代理(AG)等三种类型,分别表示数据演化过程中的中间形态制品、所经历的操作活动以及实施相关操作活动的人或组织;
[0030] 映射τ:V→{EN,AC,AG}将节点v映射为其类型,即对节点v∈V,其类型τ(v)∈{EN,AC,AG};
[0031] 边集E={ei=|u∈V;v∈V;i=1,2,…,m},在起源图中,边e=是从v到u的有向弧,表示v到u的直接依赖关系,即v是u的直接后果,而u是v的直接起因。
[0032] 定义2起源元素子集:实体集(Entity)、活动集(Activity)和代理集(Agent):
[0033] 根据起源元素的类型可将起源元素集合V可分为三个互不相交的子集:实体集(Entity),活动集(Activity)和代理集(Agent),有V=Entity∪Activity∪Agent。
[0034] 实体集:Entity={ent|ent(id,attributes),τ(ent)=EN},一个实体节点e描述某个数据对象过去某个时间段或时间点的状态,e具有唯一标识符(id)和一系列属性;
[0035] 活动集:Activity={act|act(id,startTime,endTime,attributes),τ(act)=AC},一个活动节点a表示在一段时间内作用在实体节点上的过程或者会引起状态发生变化的一系列操作;
[0036] 代理集:Agent={ag|ag(id,attributes),τ(ag)=AG},一个代理节点ag表示为一个活动的发生、一个实体的存在或另一个代理的活动承担某种责任的代理人或组织。
[0037] 不同类型的起源元素之间的依赖关系具有不同的语义,可根据相互依赖的起源元素的类型,将起源图中的边划分为不同的子类。
[0038] 定义3直接依赖关系子集:Usage,Generation,Association,Attribution,Derivation,Communication,Delegation:
[0039] 起源图中的边表示相邻两节点间的因果关系,边集E可分为七个互不相交的子集,E=Usage∪Generation∪Association∪Attribution∪Derivation∪Communication∪Delegation,其中:
[0040] Usage(使用依赖)={|ent∈Entity,act∈Activity,表示活动act使用实体ent};
[0041] Generation(产生依赖)={|act∈Activity,ent∈Entity,表示实体ent由活动act产生};
[0042] Association(关联依赖)={|ag∈Agent,act∈Activity,表示代理ag在活动act中承担责任};
[0043] Attribution(归属依赖)={|ag∈Agent,ent∈Entity,表示代理ag对实体ent承担责任};
[0044] Derivation(派生依赖)={|ent1,ent2∈Entity,表示实体ent2由实体ent1派生而来};
[0045] Communication(通信依赖)={|act1,act2∈Activity,表示活动act2使用了由活动act1产生的实体};
[0046] Delegation(代理依赖)={|ag1,ag2∈Agent,表示代理ag2代表代理ag1,称ag1为ag2的上级代理}。
[0047] 定义4起源间接依赖关系集PathSet:
[0048] 连通路径P(u,v)={vi|v0=u;vk=v;∈E;i=0,1,…,k-1;k>2},是起源图中的节点序列,表示节点v对u的间接依赖关系,即v是u的间接后果,u是v的间接起因;
[0049] 连通路径集PathSet(u,v)={P(u,v)|u∈V,v∈V},是节点对u,v之间所有连通路径构成的集合,表示节点v对节点u的间接依赖语义。
[0050] 在起源图ProvGraph中,若ent1、ent2、ent3∈Entity,act1、act2、act3∈Activity,ag1、ag2∈Agent,则如下定理表示相关起源依赖关系的传递性和可推理性:
[0051] 定理1Attribution关系具有可推理性:
[0052] (1)负责活动act1的代理ag1对该活动产生的实体ent1负责;即,若∈E且∈E,则成立;
[0053] (2)负责代理ag2的上级代理ag1对该代理负责的实体ent1负责;即,若∈E且∈E,则成立。
[0054] 定理2Association关系具有可推理性:
[0055] 负责代理ag2的上级代理ag1对该代理负责的活动act1负责;即,若∈E且∈E,则成立。
[0056] 定理3Communication关系具有可推理性:
[0057] 活动act1产生的某个实体ent1是活动act2开始并随后产生其它实体的必要条件,则表示这两个实体间存在通信关系;即,若∈E且∈E,则成立。
[0058] 定理4Communication关系具有传递性:
[0059] 活动act1与活动act2间存在通信关系,活动act2与活动act3间存在通信关系,则活动act3与活动act1间也存在通信关系;即,若∈E且∈E,则成立。
[0060] 定理5Delegation关系具有传递性:
[0061] 代理ag2的上级代理是ag1,ag3的上级代理是ag2,则可以说ag1是ag3的上级代理;即,若∈E且∈E,则成立。
[0062] 定理6Derivation关系具有传递性:
[0063] 若实体ent1由实体ent2派生而来,实体ent2由实体ent3派生而来,则从一定程度上可以认为ent1由ent3派生而来;即,若∈E且∈E,则成立。
[0064] 为准确地表达过滤操作,下面定义起源过滤的基本操作。
[0065] 定义5起源过滤基本操作:
[0066] (1)GetNumVex(ProvGraph):获取起源图ProvGraph节点的个数;
[0067] (2)GetNumVexPair(ProvGraph):获取起源图ProvGraph连通节点对的个数;
[0068] (3)GetPre(v):获取节点v的直接前因节点集合,若u∈GetPre(v),则存在e=∈E,即u是v发生的直接起因之一;
[0069] (3)GetSub(v):获取节点v的直接后果节点集合,若u∈GetSub(v),则存在边e=∈E,即u是v的发生的直接后果之一;
[0070] (4)GetPreAct(v):获取节点v的最近前因活动节点集合,若u∈GetPreAct(v),则存在P(u,v)∈PathSet(u,v),u是距离v最近的直接或间接前因活动节点,即任意s∈P(u,v),若s≠u且s≠v,则τ(s)≠AC;
[0071] (5)GetSubAct(v):获取节点v的最近后果活动节点集合,若u∈GetSubAct(v),则存在P(v,u)∈PathSet(u,v),u是距离v最近的直接或间接后果活动节点,即任意s∈P(v,u),若s≠u且s≠v,则τ(s)≠AC;
[0072] (6)AddEdge(u,v):增加边e=
[0073] (7)DeleteVex(v):删除节点v;
[0074] (8)DeleteEdge(u,v):删除边e=
[0075] 本发明的一种可定制依赖语义的高效用起源过滤方法,处理符合起源标准模型及其约束的有向无环起源图,根据包括待过滤节点和节点对的过滤需求,按照所提出的起源过滤机制中的过滤规则和修复规则处理起源图,最后采用所提出的起源过滤视图评估模型评估过滤视图的效用,生成起源过滤报告。
[0076] 步骤1:检查待过滤的起源数据,确保其为符合标准化起源模型及其模型约束的有向无环图。
[0077] 模型约束1:起源中不存在单独的活动和代理;
[0078] 模型约束2:一个实体不能由两个以上的活动产生;
[0079] 模型约束3:当一个直接依赖关系可由其它直接依赖关系推理得到时,应在起源图中省略相应的边;
[0080] 模型约束4:起源图中不能包含环,可利用拓扑排序算法检测起源图中是否有环。
[0081] 步骤2:声明起源过滤需求,即待过滤的起源元素、直接及间接起源依赖关系;其中,起源元素用起源图中的节点表示,直接或间接依赖关系用起源图中的节点对表示。
[0082] 声明过滤需求时应注意:(1)声明起源元素时,需要说明元素的标识符或部分属性(attributes),当元素类型是活动时,还可以指出活动发生的起止时间(startTime和endTime);(2)声明起源依赖关系时,无论直接依赖关系还是间接依赖关系,均需指明该依赖关系所依附的两个起源元素的标识符或部分属性。
[0083] 步骤3:按照如下过滤规则和修复规则处理待过滤的节点和节点对。
[0084] 本发明方法按照元素、直接依赖关系、间接依赖关系即节点、边、路径的顺序依次处理待过滤对象,具体流程如图2所示。
[0085] 首先,依次取待过滤的节点v,判断节点v及其直接前因节点和直接后果节点的类型,选取并应用适当的过滤和修复规则删除节点v以及与节点v相关的边,修复被破坏的起源依赖关系,更新起源图;节点类型不同,相应的过滤和修复规则也不同:当节点类型是实体(EN)时,规则如表1所示;当节点类型是活动(AC)时,规则如表2所示;当节点类型是代理(AG)时,规则如表3所示。其中,sv∈GetSub(v)表示v的直接后果节点,pv∈GetPre(v)表示v的直接前因节点,sav∈GetSubAct(v)表示v的最近后果活动节点,pav∈GetPreAct(v)表示v的最近前因活动节点,表格中“—”表示该情况不用或无法修复。其中,实体类过滤规则及修复规则的可视化示意图如图3所示,活动类节点过滤规则及修复规则的可视化示意图如图4所示,代理类节点过滤规则及修复规则的可视化示意图如图5所示。
[0086] 表1实体节点v的过滤及修复规则
[0087]
[0088]
[0089] 表2活动节点v的过滤及修复规则
[0090]
[0091] 表3代理节点v的过滤及修复规则
[0092]
[0093] 然后,依次取待过滤的节点对(u,v),检查两点在当前起源图中是否存在且连通,若不存在或不连通则无需处理;若两点存在且连通判断u、v是否相邻,若不相邻则标记为待过滤连通路径节点对,否则删除u、v之间的边,并判断u、v两点的类型以及u的直接前因节点和v的直接后果节点类型,在依赖关系修复规则中选取适合的修复操作,修复被破坏的起源依赖关系,更新起源图。修复规则如表4和表5所示,其中,sv∈GetSub(v)表示v的直接后果节点,pu∈GetPre(u)表示u的直接前因节点,sav∈GetSubAct(v)表示v的最近后果活动节点,pau∈GetPreAct(u)表示u的最近前因活动节点,表格中“—”表示该情况不用修复或无法修复,“×”表示不存在该情况。
[0094] 表4边(u,v)以及路径p(u,v)的修复规则
[0095]
[0096] 表5边(u,v)以及路径p(u,v)的修复规则
[0097]
[0098] 最后,依次取待过滤连通路径节点对(u,v),遍历起源图,依次获取u、v之间的连通路径p,并采用最小代价决策的方法过滤路径p,即通过代价函数分别计算删除路径p上每一条边的过滤代价和修复代价和,选取并删除总代价最小的边;根据u、v两点的类型以及u的直接前因节点和v的直接后果节点的类型,选取并应用适当的修复规则,修复被破坏的起源间接依赖关系;若s的直接前因节点和t的直接后果节点不同时在路径p上,则还须根据s、t两点的类型以及s的直接前因节点和t的直接后果节点的类型,选择并应用适当的修复规则,修复被破坏的起源图。修复规则如表4和表5所示。
[0099] 最小代价决策方法中过滤代价为起源过滤视图连通节点对数减少率,修复代价预估为修复后路径变化的连通节点对数的比率。设原起源图中的连通节点对数为VP、过滤视图中的连通节点对数为VPS、过滤视图中路径变化的连通节点对数为VPSC,则过滤代价最小代价决策法过滤节点对(u,v)之间的连通路径的算法如下:
[0100]
[0101] 步骤4:按照如下整理规则整理并更新起源图,得到起源过滤视图。
[0102] 对得到的过滤视图进一步整理:(1)检查起源图中的代理节点和活动节点,若节点独立则删除之;(2)检查起源图中的边,若边所依附的顶点之一已被删除,则删除该边;(3)检查起源图中的边,若该边所表示的依赖关系可由其它边推理得到,则删除该边;(4)更新起源图,得到最终的起源过滤视图。
[0103] 步骤5:按照如下起源过滤视图评估模型定量地评估起源过滤视图的效用,生成起源过滤报告。
[0104] 首先,对上一步骤中得到的起源过滤视图进行效用评估。其中,评估计算值包括:(1)除待过滤节点外,过滤视图中的节点保留率;(2)除待过滤边之外,过滤视图中的边的保留率;(3)除待过滤连通路径节点对之外,过滤视图中的连通路径节点对保留率;(4)路径未变化的连通节点对数占过滤视图的中连通节点对总数的比率;(5)按照各个起源图结构的重要性分别给(1)(2)(3)(4)赋权值ω1、ω2、ω3、ω4,其中ω1+ω2+ω3+ω4=100%。
[0105] 设待过滤的节点数为VR、边数为ER、连通路径数为VPR,原起源图中的节点数为V、边数E、连通路径数为VP,过滤视图中的节点数为VS、边数为ES、连通路径数为VPS、路径变化的连通节点对数为VPSC,则起源过滤视图效用计算公式如下:
[0106]
[0107] 实施例中起源原图符合标准化起源模型PROV-DM,如图6所示。声明两个不同安全需求:
[0108] R1:待过滤的节点包括E2、Act3、Ag1,待过滤的节点对包括(E1,Act1);
[0109] R2:待过滤的节点包括E2、Ag1,待过滤的节点对包括(E3,E5)。
[0110] 采用所提出的起源过滤机制对图6所示的起源图进行处理,实现需求R1得到的起源过滤视图如图7所示,实现需求R2得到的起源过滤视图如图9所示。作为实验效果对比,选用一个现有起源过滤方法对起源图6进行过滤,实现过滤需求R1,得到的起源过滤视图如图8所示。
[0111] 利用起源过滤视图评估模型对实施例中各起源过滤视图进行效用量化评估,为了保证可比性,各起源视图均赋值ω1=ω2=ω3=30%,ω4=10%,需要指出的是,对ω1、ω2、ω3、ω4的其它赋值组合也落入本专利范围内。
[0112] 图8所示的起源过滤视图效用为65.78%;图7所示的起源过滤视图效用为81.04%,与图8所示的起源过滤视图相比,效用提高了15.26%,说明本发明的起源过滤方法与其它方法相比较,起源过滤视图的效用有明显的提升;图9所示的起源过滤视图效用为
81.11%,说明本发明的起源过滤方法不仅可以处理复杂的起源依赖关系,也能保证较高的效用。
[0113] 最后,对起源过滤相关内容进行汇总,生成起源过滤报告,报告内容包括原始起源图、过滤需求、起源过滤视图、过滤需求的满足情况、多过滤的起源元素及依赖关系、为修复起源依赖语义而改变的可推理起源依赖关系、起源过滤视图的效用评估值。实施例中由图6得到图9所示的起源过滤视图的报告如表6所示。
[0114] 表6起源过滤报告摘要
[0115]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈