专利汇可以提供一种基于配置的对象属性元数据抽取系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于配置的对象属性元数据 抽取 系统。包括如下模 块 :对象属性管理模块,对象属性配置模块和对象属性元数据抽取模块,三个模块都与 数据库 相连接。其中,用户首先 访问 对象属性管理模块,实现对对象属性的增加、删除、编辑和查询;然后用户访问对象属性配置模块,实现对属性的“表级联路径”和对应属性字段的配置;最后对象属性元数据抽取模块根据配置模块配置的模型实现对元数据的抽取。本发明实现了优化复杂数据表中的级联问题,并且通过“级联关系树”实现多个查询的合并优化,加快查询效率,实现了对数据的灵活抽取。,下面是一种基于配置的对象属性元数据抽取系统专利的具体信息内容。
1.一种基于配置的对象属性元数据抽取系统,其特征在于,包括如下模块:对象属性管理模块,用以实现对对象属性的增加、删除、编辑和查询;对象属性配置模块,用以实现属性的“表级联路径”和对应属性字段的配置;对象属性元数据抽取模块,用以实现元数据的抽取;
所述对象属性管理模块在客户端提供一个操作界面,用以实现对对象分类的增加、删除、编辑和查询;对象分类节点数据包括:对象名称、对象编码和对象父类信息;通过对象分类查询功能提供以门户网站和WebService的形式查询各个对象节点的属性数据信息;
所述对象属性配置模块用以实现对象分类的属性配置;对象属性配置模块包括:对象属性的路径配置和对应属性字段的配置;对象属性配置模块,以四元组的形式配置对象属性,四元组连接形成“表级联路径”,用以构建对象属性元数据模型;“表级联路径”的四元组表示为:
所述对象属性元数据抽取模块用以实现对象属性的抽取;对象属性包括:测验属性和描述属性;根据对象属性配置模块提供的对象属性元数据模型,对于测验属性,用“表级联路径”对属性数据进行统计形成测验数据;对于描述属性,将“表级联路径”归纳形成一棵“级联关系树”,用“级联关系树”对多条描述属性进行抽取,形成一条完整的描述数据;对象的测验数据和描述数据抽取后均保存在数据库中。
2.一种基于配置的对象属性元数据抽取方法,其特征在于,包括以下步骤:
S-1对象属性管理模块根据用户需求为每个对象分类管理对象属性,其中包括属性的增删改查;
S-2对象属性配置模块根据用户需求为每个属性配置“表级联路径”和属性字段信息,保存所有属性的“表级联路径”和属性字段信息到数据库中;
S-3对象属性元数据抽取模块判断属性的类型,若属性的类型为测验属性,将该属性加入到测验属性待抽取队列中,若属性的类型为描述属性,则将该属性加入到描述属性待抽取队列中,待所有的属性分类好之后跳至步骤S-4;
S-4判断测验属性待抽取队列中是否为空,若为空,则表示所有测验属性已经抽取完全,跳至步骤S-6,否则队首属性出队,跳至步骤S-5;
S-5根据对象属性配置模型的“表级联路径”和属性字段信息抽取测验数据;
S-6判断描述属性待抽取队列中是否为空,若为空,则表示所有描述属性已经抽取完全,跳至步骤S-8,否则队首属性出队,跳至步骤3-7;
S-7根据对象属性配置模型的“表级联路径”和属性字段信息抽取描述数据;
S-8结束;
S-5中抽取测验数据具体步骤如下:
S-5-1读取该属性的“表级联路径”,针对每一段路径,用一个四元组
S-5-2将所有路径信息用“AND”连接,形成一张大表T;
S-5-3根据“表级联路径”中起点表t1的对象标识字段oID和“表级联路径”中终点表tn的属性字段attfd,生成一条完整的sql语句L:“SELECT t1.oID,max(tn.attfd),min(tn.attfd) FROM T GROUP BY t1.oID”;
S-5-4根据语句L实现一个测验属性的抽取,将结果保存在数据库中,跳至S-4;
S-7中抽取测验数据具体步骤如下:
S-7-1判断该描述属性的“表级联路径”是否完全包含在“级联关系树”中,若完全包含,跳至S-7-4,否则跳至S-7-2;
S-7-2读取该属性的“表级联路径”和属性字段信息,取“表级联关系树”的根节点r和属性的“表级联路径”的起始节点t1,判断t2节点是否是r的子节点,且连接条件是否也相同,若两者均相同,则说明子路径t1-t2已经被包含,若两者不完全相同,则在r添加子节点,并添加连接条件;
S-7-3取“表级联路径”中的某一节点ti,其中t1到ti-1的路径均已包括在“级联关系树”中,且ti-1对应树中的节点nj,判断ti是否是nj的子节点,且连接条件也相同,若两者均相同,则说明子路径ti-1-ti已经被包含,若两者不完全相同,则在nj添加子节点,并添加连接条件,跳至S-7-1;
S-7-4将生成的“级联关系树”映射成一条sql语句:select r_1.a,r_1_1.b from TABLE_A r_1 left join TABLE_B r_1_1 on r_1_1.c=r_1.c,这里对表的别名的命名规则做了新的设定,假定根节点对应的表别名为r,则r的子节点的表别名为r_1,r_2…r_i,而节点表r_i的子节点的表别名为r_i_1,r_i_2…r_i_k;
S-7-5根据S-7-4生成的sql语句实现一个描述属性的抽取;
S-7-6对S-7-5抽取的描述属性前面加上相应的标注完成描述属性的扩充,通过特定的分隔符,将所有的描述属性连接在一起,形成完整的对象描述信息,跳至步骤S-6。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于别名规约树的流规则冲突检测方法及系统 | 2020-05-08 | 397 |
可编程逻辑开关和系统 | 2020-05-08 | 393 |
智能语音系统及利用智能语音系统控制投影机的方法 | 2020-05-11 | 698 |
一种知识图谱驱动型的法律智能咨询系统 | 2020-05-12 | 820 |
一种融合电网运行环境及设备信息的跨系统数据转换方法 | 2020-05-14 | 335 |
一种域名配置方法及设备 | 2020-05-13 | 465 |
一种基于OpenCL的FPGA图处理加速方法和系统 | 2020-05-13 | 413 |
一种SQL语句分类管理及统一查询方法和装置 | 2020-05-08 | 266 |
程序向量化过程中动静结合的内存别名分析处理方法及装置 | 2020-05-14 | 351 |
物流订单的自动分配方法及装置、电子设备、存储介质 | 2020-05-13 | 353 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。