首页 / 专利库 / 电脑编程 / 别名 / 一种基于配置的对象属性元数据抽取系统

一种基于配置的对象属性元数据抽取系统

阅读:1078发布:2020-05-12

专利汇可以提供一种基于配置的对象属性元数据抽取系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于配置的对象属性元数据 抽取 系统。包括如下模 块 :对象属性管理模块,对象属性配置模块和对象属性元数据抽取模块,三个模块都与 数据库 相连接。其中,用户首先 访问 对象属性管理模块,实现对对象属性的增加、删除、编辑和查询;然后用户访问对象属性配置模块,实现对属性的“表级联路径”和对应属性字段的配置;最后对象属性元数据抽取模块根据配置模块配置的模型实现对元数据的抽取。本发明实现了优化复杂数据表中的级联问题,并且通过“级联关系树”实现多个查询的合并优化,加快查询效率,实现了对数据的灵活抽取。,下面是一种基于配置的对象属性元数据抽取系统专利的具体信息内容。

1.一种基于配置的对象属性元数据抽取系统,其特征在于,包括如下模:对象属性管理模块,用以实现对对象属性的增加、删除、编辑和查询;对象属性配置模块,用以实现属性的“表级联路径”和对应属性字段的配置;对象属性元数据抽取模块,用以实现元数据的抽取;
所述对象属性管理模块在客户端提供一个操作界面,用以实现对对象分类的增加、删除、编辑和查询;对象分类节点数据包括:对象名称、对象编码和对象父类信息;通过对象分类查询功能提供以网站和WebService的形式查询各个对象节点的属性数据信息;
所述对象属性配置模块用以实现对象分类的属性配置;对象属性配置模块包括:对象属性的路径配置和对应属性字段的配置;对象属性配置模块,以四元组的形式配置对象属性,四元组连接形成“表级联路径”,用以构建对象属性元数据模型;“表级联路径”的四元组表示为:,其中pTb表示主表名,pFd主表关联字段,fTb表示从表名,fFd表示从表关联字段;
所述对象属性元数据抽取模块用以实现对象属性的抽取;对象属性包括:测验属性和描述属性;根据对象属性配置模块提供的对象属性元数据模型,对于测验属性,用“表级联路径”对属性数据进行统计形成测验数据;对于描述属性,将“表级联路径”归纳形成一棵“级联关系树”,用“级联关系树”对多条描述属性进行抽取,形成一条完整的描述数据;对象的测验数据和描述数据抽取后均保存在数据库中。
2.一种基于配置的对象属性元数据抽取方法,其特征在于,包括以下步骤:
S-1对象属性管理模块根据用户需求为每个对象分类管理对象属性,其中包括属性的增删改查;
S-2对象属性配置模块根据用户需求为每个属性配置“表级联路径”和属性字段信息,保存所有属性的“表级联路径”和属性字段信息到数据库中;
S-3对象属性元数据抽取模块判断属性的类型,若属性的类型为测验属性,将该属性加入到测验属性待抽取队列中,若属性的类型为描述属性,则将该属性加入到描述属性待抽取队列中,待所有的属性分类好之后跳至步骤S-4;
S-4判断测验属性待抽取队列中是否为空,若为空,则表示所有测验属性已经抽取完全,跳至步骤S-6,否则队首属性出队,跳至步骤S-5;
S-5根据对象属性配置模型的“表级联路径”和属性字段信息抽取测验数据;
S-6判断描述属性待抽取队列中是否为空,若为空,则表示所有描述属性已经抽取完全,跳至步骤S-8,否则队首属性出队,跳至步骤3-7;
S-7根据对象属性配置模型的“表级联路径”和属性字段信息抽取描述数据;
S-8结束;
S-5中抽取测验数据具体步骤如下:
S-5-1读取该属性的“表级联路径”,针对每一段路径,用一个四元组表示,对应于sql语句中的:“pTb ti LEFT JOIN fTb ti+1 ON ti.pFd = ti+1.fFd”,ti和ti+1表示pTb和fTb的别名
S-5-2将所有路径信息用“AND”连接,形成一张大表T;
S-5-3根据“表级联路径”中起点表t1的对象标识字段oID和“表级联路径”中终点表tn的属性字段attfd,生成一条完整的sql语句L:“SELECT t1.oID,max(tn.attfd),min(tn.attfd) FROM T GROUP BY t1.oID”;
S-5-4根据语句L实现一个测验属性的抽取,将结果保存在数据库中,跳至S-4;
S-7中抽取测验数据具体步骤如下:
S-7-1判断该描述属性的“表级联路径”是否完全包含在“级联关系树”中,若完全包含,跳至S-7-4,否则跳至S-7-2;
S-7-2读取该属性的“表级联路径”和属性字段信息,取“表级联关系树”的根节点r和属性的“表级联路径”的起始节点t1,判断t2节点是否是r的子节点,且连接条件是否也相同,若两者均相同,则说明子路径t1-t2已经被包含,若两者不完全相同,则在r添加子节点,并添加连接条件;
S-7-3取“表级联路径”中的某一节点ti,其中t1到ti-1的路径均已包括在“级联关系树”中,且ti-1对应树中的节点nj,判断ti是否是nj的子节点,且连接条件也相同,若两者均相同,则说明子路径ti-1-ti已经被包含,若两者不完全相同,则在nj添加子节点,并添加连接条件,跳至S-7-1;
S-7-4将生成的“级联关系树”映射成一条sql语句:select r_1.a,r_1_1.b from TABLE_A r_1 left join TABLE_B r_1_1 on r_1_1.c=r_1.c,这里对表的别名的命名规则做了新的设定,假定根节点对应的表别名为r,则r的子节点的表别名为r_1,r_2…r_i,而节点表r_i的子节点的表别名为r_i_1,r_i_2…r_i_k;
S-7-5根据S-7-4生成的sql语句实现一个描述属性的抽取;
S-7-6对S-7-5抽取的描述属性前面加上相应的标注完成描述属性的扩充,通过特定的分隔符,将所有的描述属性连接在一起,形成完整的对象描述信息,跳至步骤S-6。

说明书全文

一种基于配置的对象属性元数据抽取系统

技术领域

[0001] 本发明涉及一种基于配置的对象属性元数据抽取系统,属于信息技术处理技术领域。

背景技术

[0002] 信息系统作为一种抽象的社会系统,因为它能够及时、可靠、方便地管理海量信息,所以在许多应用领域中起着不可替代的作用,并且成为人们认识和研究客观世界的重要手段。在国民经济建设中,信息系统为国家和各级政府部的宏观决策提供了有的帮助,产生了巨大的社会效益。在各个领域,信息系统正逐渐被纳入部门产业化的应用日程,与传统的业务技术相结合,使相关业务工作做得更加科学、准确和快捷。为了更合理地建设信息系统,将面向对象的思想引进到信息系统。
[0003] 在数据库设计层面,面向对象的思想将众多数据分成对象标识数据和围绕着这些标识数据展开的一系列属性数据。因为不同的信息系统有不同的功能,所以数据库表设计也不相同。随着信息系统需求的不断提高,不仅要求能够对业务数据进行基本查询,而且要求能够对业务数据进行元描述的抽取,以便在宏观层面进行更好的调控和决策。然而数据库表设计一般都是有利于常规的业务数据查询,元描述的抽取涉及多表的级联问题,多表的复杂级联问题一直是个不容易解决的问题。
[0004] 目前对于这种情况,常用的做法是在进行每一项查询任务时,首先将查询涉及到的表级联成一张大表,然后对这张大表进行查询。当进行多表级联时,可能存在不同系统之间的库表设计结构完全不同的情况,这样可能使得常规的查询方案中的多表级联无法进行。当查询任务多,查询数据量大时,查询任务很难满足,而元描述的抽取就具备查询任务密集、查询对象集庞大的特征,所以常规的方案无法满足元描述的抽取。

发明内容

[0005] 目的:为了克服现有技术中存在的不足,本发明提供一种基于配置的对象属性元数据抽取系统,通过建立“级联关系树”对数据表进行管理,实现级联查询优化,使得查询的效率有明显提升,并且易实现、可复用性高。
[0006] 技术方案:为解决上述技术问题,本发明采用的技术方案为:
[0007] 一种基于配置的对象属性元数据抽取系统,包括如下模:对象属性管理模块,用以实现对对象属性的增加、删除、编辑和查询;对象属性配置模块,用以实现属性的“表级联路径”和对应属性字段的配置;对象属性元数据抽取模块,用以实现元数据的抽取。
[0008] 作为优选方案,所述对象属性管理模块在客户端提供一个操作界面,用以实现对对象分类的增加、删除、编辑和查询;对象分类节点数据包括:对象名称、对象编码和对象父类信息;通过对象分类查询功能提供以门户网站和WebService的形式查询各个对象节点的属性数据信息。
[0009] 作为优选方案,所述对象属性配置模块用以实现对象分类的属性配置;对象属性配置模块包括:对象属性的路径配置和对应属性字段的配置;对象属性配置模块,以四元组的形式配置对象属性,四元组连接形成“表级联路径”,用以构建对象属性元数据模型;“表级联路径”的四元组表示为:,其中pTb表示主表名,pFd主表关联字段,fTb表示从表名,fFd表示从表关联字段。
[0010] 作为优选方案,所述对象属性元数据抽取模块用以实现对象属性的抽取;对象属性包括:测验属性和描述属性;根据对象属性配置模块提供的对象属性元数据模型,对于测验属性,用“表级联路径”对属性数据进行统计形成测验数据;对于描述属性,将“表级联路径”归纳形成一棵“级联关系树”,用“级联关系树”对多条描述属性进行抽取,形成一条完整的描述数据;对象的测验数据和描述数据抽取后均保存在数据库中。
[0011] 一种基于配置的对象属性元数据抽取方法,包括以下步骤:
[0012] S-1对象属性管理模块根据用户需求为每个对象分类管理对象属性,其中包括属性的增删改查;
[0013] S-2对象属性配置模块根据用户需求为每个属性配置“表级联路径”和属性字段信息,保存所有属性的“表级联路径”和属性字段信息到数据库中;
[0014] S-3对象属性元数据抽取模块判断属性的类型,若属性的类型为测验属性,将该属性加入到测验属性待抽取队列中,若属性的类型为描述属性,则将该属性加入到描述属性待抽取队列中,待所有的属性分类好之后跳至步骤S-4;
[0015] S-4判断测验属性待抽取队列中是否为空,若为空,则表示所有测验属性已经抽取完全,跳至步骤S-6,否则队首属性出队,跳至步骤S-5;
[0016] S-5根据对象属性配置模型的“表级联路径”和属性字段信息抽取测验数据;
[0017] S-6判断描述属性待抽取队列中是否为空,若为空,则表示所有描述属性已经抽取完全,跳至步骤S-8,否则队首属性出队,跳至步骤3-7;
[0018] S-7根据对象属性配置模型的“表级联路径”和属性字段信息抽取描述数据;
[0019] S-8结束。
[0020] 作为优选方案,S-5中抽取测验数据具体步骤如下:
[0021] S-5-1读取该属性的“表级联路径”,针对每一段路径,用一个四元组表示,对应于sql语句中的:“pTb ti LEFT JOIN fTb ti+1 ON ti.pFd = ti+1.fFd”,ti和ti+1表示pTb和fTb的别名
[0022] S-5-2将所有路径信息用“AND”连接,形成一张大表T;
[0023] S-5-3根据“表级联路径”中起点表t1的对象标识字段oID和“表级联路径”中终点表tn的属性字段attfd,生成一条完整的sql语句L:“SELECT t1.oID,max(tn.attfd),min(tn.attfd) FROM T GROUP BY t1.oID”;
[0024] S-5-4根据语句L实现一个测验属性的抽取,将结果保存在数据库中,跳至S-4。
[0025] 作为优选方案,S-7中抽取测验数据具体步骤如下:
[0026] S-7-1判断该描述属性的“表级联路径”是否完全包含在“级联关系树”中,若完全包含,跳至S-7-4,否则跳至S-7-2;
[0027] S-7-2读取该属性的“表级联路径”和属性字段信息,取“表级联关系树”的根节点r和属性的“表级联路径”的起始节点t1,判断t2节点是否是r的子节点,且连接条件是否也相同,若两者均相同,则说明子路径t1-t2已经被包含,若两者不完全相同,则在r添加子节点,并添加连接条件;
[0028] S-7-3取“表级联路径”中的某一节点ti,其中t1到ti-1的路径均已包括在“级联关系树”中,且ti-1对应树中的节点nj,判断ti是否是nj的子节点,且连接条件也相同,若两者均相同,则说明子路径ti-1-ti已经被包含,若两者不完全相同,则在nj添加子节点,并添加连接条件,跳至S-7-1;
[0029] S-7-4将生成的“级联关系树”映射成一条sql语句:select r_1.a,r_1_1.b from TABLE_A r_1 left join TABLE_B r_1_1 on r_1_1.c=r_1.c,这里对表的别名的命名规则做了新的设定,假定根节点对应的表别名为r,则r的子节点的表别名为r_1,r_2…r_i,而节点表r_i的子节点的表别名为r_i_1,r_i_2…r_i_k;
[0030] S-7-5根据S-7-4生成的sql语句实现一个描述属性的抽取;
[0031] S-7-6对S-7-5抽取的描述属性前面加上相应的标注完成描述属性的扩充,通过特定的分隔符,将所有的描述属性连接在一起,形成完整的对象描述信息,跳至步骤S-6。
[0032] 有益效果:本发明提供的一种基于配置的对象属性元数据抽取系统,通过“表级联路径”实现优化复杂数据表中的级联问题;通过“级联关系树”实现多个查询的合并优化,加快查询效率;通过配置的方式,实现灵活的数据抽取,且“表级联路径”的信息保存在数据库中,可多次重复使用。附图说明
[0033] 图1 对象属性配置模型;
[0034] 图2 基于配置的对象属性元数据抽取系统的流程示意图;
[0035] 图3 对象属性抽取过程中“级联关系树”生成流程图

具体实施方式

[0036] 下面结合附图对本发明作更进一步的说明。
[0037] 下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
[0038] 如图1所示,一种基于配置的对象属性元数据抽取系统,包括依次连接的对象属性管理模块、对象属性配置模块、对象属性元数据抽取模块以及客户端交互界面,其中对象属性管理模块、对象属性配置模块和对象属性元数据抽取模块分别和数据库进行交互。
[0039] 对象属性管理模块在客户端提供一个操作界面,用以实现对对象分类的增加、删除、编辑和查询;对象分类节点数据包括:对象名称、对象编码和对象父类等信息;通过对象分类查询功能提供以门户网站和WebService的形式查询各个对象节点的属性数据信息。
[0040] 对象属性配置模块用以实现对象分类的属性配置。对象属性配置模块包括对象属性的路径配置和对应属性字段的配置。对象属性配置模块,以四元组的形式配置对象属性,四元组连接形成“表级联路径”,用以构建对象属性元数据模型;“表级联路径”的四元组表示为:,其中pTb表示主表名,pFd主表关联字段,fTb表示从表名,fFd表示从表关联字段。
[0041] 所述对象属性元数据抽取模块用以实现对象属性的抽取。对象属性包括测验属性和描述属性;根据对象属性配置模块提供的对象属性元数据模型,对于测验属性,用“表级联路径”对属性数据进行统计形成测验数据;对于描述属性,将“表级联路径”归纳形成一棵“级联关系树”,用“级联关系树”对多条描述属性进行抽取,形成一条完整的描述数据;对象的测验数据和描述数据抽取后均保存在数据库中。
[0042] 如图2所示,基于配置的对象描述属性元数据抽取方法,包含如下步骤:
[0043] 步骤1,对象属性管理模块根据用户需求为每个对象分类管理对象属性,其中包括属性的增删改查;
[0044] 步骤2,对象属性配置模块根据用户需求为每个属性配置“表级联路径”和属性字段信息,保存所有属性的“表级联路径”和属性字段信息到数据库中;
[0045] 步骤3,对象属性元数据抽取模块判断属性的类型,若属性的类型为测验属性,将该属性加入到测验属性待抽取队列中,若属性的类型为描述属性,则将该属性加入到描述属性待抽取队列中,待所有的属性分类好之后跳至步骤4;
[0046] 步骤4,判断测验属性待抽取队列中是否为空,若为空,则表示所有测验属性已经抽取完全,跳至步骤6,否则队首属性出队,跳至步骤5;
[0047] 步骤5,根据对象属性配置模型的“表级联路径”和属性字段信息抽取测验数据;
[0048] 步骤5-1,读取该属性的“表级联路径”,针对每一段路径,用一个四元组表示,其中pTb表示主表名,pFd主表关联字段,fTb表示从表名,fFd表示从表关联字段,对应于sql语句中的:“pTb ti LEFT JOIN fTb ti+1 ON ti.pFd = ti+1.fFd”,ti和ti+1表示pTb和fTb的别名;
[0049] 步骤5-2,将所有路径信息用“AND”连接,形成一张大表T;
[0050] 步骤5-3,根据“表级联路径”中起点表t1的对象标识字段oID和“表级联路径”中终点表tn的属性字段attfd,生成一条完整的sql语句L:“SELECT t1.oID,max(tn.attfd),min(tn.attfd) FROM T GROUP BY t1.oID”;
[0051] 步骤5-4,根据语句L实现一个测验属性的抽取,将结果保存在数据库中,跳至步骤4;
[0052] 步骤6,判断描述属性待抽取队列中是否为空,若为空,则表示所有描述属性已经抽取完全,跳至步骤8,否则队首属性出队,跳至步骤7;
[0053] 步骤7,根据对象属性配置模型的“表级联路径”和属性字段信息,形成“表级联关系树”,抽取描述数据;
[0054] 步骤8,结束。
[0055] 如图3所示,是“表级联关系树”的生成过程。读取某属性的“表级联路径”和属性字段信息,取“表级联关系树”的根节点r和属性的“表级联路径”的起始节点t1,判断t2节点是否是r的子节点,且连接条件是否也相同,若两者均相同,则说明子路径t1-t2已经被包含,若两者不完全相同,则在r添加子节点,并添加连接条件;将生成的“级联关系树”映射成一条sql语句:select r_1.a,r_1_1.b from TABLE_A r_1 left join TABLE_B r_1_1 on r_1_1.c=r_1.c,且对表的别名的命名规则做了新的设定,假定根节点对应的表别名为r,则r的子节点的表别名为r_1,r_2…r_i,而节点表r_i的子节点的表别名为r_i_1,r_i_2…r_i_k;
根据生成的sql语句实现一个描述属性的抽取。
[0056] 以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈