专利汇可以提供一种面向大数据的关系型数据库混合异构查询模型与方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种面向 大数据 的关系型 数据库 混合异构查询模型,其结构如下:最底层为中心数据库,用来存放要查询的数据; 中间层 为Hadoop分布式文件系统HDFS,存放元数据和中间结果,同时,添加数据缓存层和全局索引层用来存放所有的数据字典表及其结果缓冲和所有数据表的全局索引信息、索引目录和索引缓存;顶层采用MapReduce编程模型,提供对HDFS中数据并行处理和保证容错性; 中间件 设计数据库连接器、数据加载器、索引生成器和查询引擎四个功能模 块 。该模型支持原数据动态划分,提高预处理效率,在保持原数据完整的 基础 上,提高大规模用户下查询 请求 的响应时间。,下面是一种面向大数据的关系型数据库混合异构查询模型与方法专利的具体信息内容。
1.一种面向大数据的关系型数据库混合异构查询模型,其特征在于,包括最底层的中心数据库的数据层、Hadoop分布式文件系统HDFS、MapReduce编程模型和中间件,最底层的中心数据库的数据层,用来存放要查询的数据,通过建立全局索引机制和分类查询机制提高数据表查询效率;数据层包括多个数据库节点,中间层为Hadoop分布式文件系统HDFS,存放元数据和中间结果,同时,添加数据缓存层和全局索引层用来存放所有的数据字典表、结果缓冲以及所有数据表的全局索引信息、索引目录和索引缓存;顶层采用MapReduce编程模型,提供对HDFS中数据并行处理和确保容错性;中间件包括数据库连接器、数据加载器、中间件的索引生成器和查询引擎四个功能模块,全局索引层包括索引生成器、LRU算法、索引生成缓存、索引目录。
2.如权利要求1所述的一种面向大数据的关系型数据库混合异构查询模型,其特征在于:中间件设计数据库连接器,将Hadoop文件系统与数据库连接起来,使MapReduce直接访问Oracle数据库,利用Hadoop提供的DBInptuFormat类访问数据库,把数据库表数据读入到HDFS;再利用TextOutpuFormat类将得到的结果写入数据库表中。
3.如权利要求1所述的一种面向大数据的关系型数据库混合异构查询模型,其特征在于:中间件设计数据加载器,将数据字典表和数据表的本地索引从数据库中加载进HDFS的数据节点,对数据字典表,将所有的数据字典表都加载进HDFS的数据缓存层;对数据表,只将其本地索引加载进的全局索引层。
4.如权利要求1所述的一种面向大数据的关系型数据库混合异构查询模型,其特征在于:中间件索引生成器,利用MapReduce编程模型,将加载进的本地索引合并为全局索引,存放在HDFS的数据节点,当全局索引生成后,将释放HDFS中的本地索引以减少空间,如果全局索引过大,将被自动划分成合适的大小,并用索引目录来记录每块的位置,索引目录采用格式,存放在HDFS的名字节点中,索引缓冲采用LRU算法,将最常使用的全局索引块从HDFS的数据节点移至名字节点中。
5.如权利要求1所述的一种面向大数据的关系型数据库混合异构查询模型,其特征在于:中间件设计查询引擎,对不同的查询请求提供不同的执行策略,对数据字典表查询时,将直接访问HDFS,对数据表中没有建立索引的字段查询时,将直接访问底层的数据库;对数据表中已经建立索引的字段查询时,将先访问中的全局索引层获得哪些数据库应该被访问,再并行访问这些数据库,每个数据库完成部分查询,最后将得到的结果合并返回。
6.如权利要求1所述的一种面向大数据的关系型数据库混合异构查询模型,其特征在于:数据层建立本地索引和全局索引,对数据库表中物理位置字段建立的目录;对每一个数据库节点,数据库连接器用于连接Hadoop和数据库,使MapReduce可以直接访问数据库,数据加载器通过数据库连接器,用MapReduce将数据表的本地索引加载进HDFS文件系统中的数据节点;索引生成器根据索引字段,利用MapReduce将加载进HDFS的本地索引合并为全局索引,存放在HDFS的数据节点;如果全局索引过大,索引生成器将根据HDFS文件格式要求将其划分成合适的数据块N块,N为大于1的自然数,并更新索引口录来记录每块的位置;释放数据节点中的本地索引HDFS文件,以节约空间。
7.如权利要求1所述的一种面向大数据的关系型数据库混合异构查询模型,其特征在于:通过在数据节点的全局索引层建立索引树来访问全局索引文件,以获得满足用户查询条件的全局索引记录,全局索引机制访问步骤如下:
步骤1,生成索引树叶子节点,扫描全局索引文件中的一块或多块,当某行记录中索引字段的值满足查询条件时,标记该行并建立指针,将指针根据各自行的标记字段分配到相应的叶子节点上,叶子节点数为n即每个叶子节点都有非空的指针列表;
步骤2,生成索引树的中间节点和根节点,根据系统的拓扑图,将每个叶子节点对应的中间节点和根节点插入索引树,中间节点和根节点的指针列表暂时为空;
步骤3,更新所有节点上的指针列表,记索引树的节点数为nindex(nindex<=n,n为叶子节点数)记所有叶子节点中的指计数为wpointer那么每个节点应该平均拥有p=wpointer/nindex个指针,如果叶子节点的指计列表中有超过p个指针,那么保留前p个指针不动,将其余指针移入该叶子节点对应的中间节点的指针列表中;
步骤4,生成所有节点上的位置信息字段表,对每个节点i,扫描指针列表,根据节点属性找到每个指针在全局索引文件中指向行的位置信息字段,生成位置信息列表。
8.如权利要求1所述的一种面向大数据的关系型数据库混合异构查询方法,其特征在于,包括以如下步骤:
步骤1,通过模型查询引擎,提交SQL查询语句;
步骤2,根据中间件索引生成器生成的全局索引查找数据位置,将MapReduce编程模型的Map函数调度到相应的节点;
步骤3,如果全局索引有要查询的数据,则通过数据加载器加载数据;如果查询字段没有建立索引,则直接访问HDFS;
步骤4,Map函数将SQL查询推入底层数据节点的数据库中执行,每个数据库返回的中间结果再由MapReduce编程模型Reduce函数进行归约;
步骤5,将归约后的结果写入HDFS中。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
用于油气二次运移的大规模高分辨率模拟的侵入渗流的并行处理 | 2020-05-08 | 296 |
用于大规模并行处理的基于代价的动态计算节点分组优化 | 2020-05-14 | 737 |
基于分布式并行数据库的实时数据存储方法和系统 | 2020-05-17 | 439 |
一种数据驱动的用户透明的可扩展编程方法 | 2020-05-16 | 15 |
利用机器学习估计MPPDB中的查询资源消耗 | 2020-05-12 | 493 |
MPP环境下数据库查询方法、装置、服务器及存储介质 | 2020-05-12 | 276 |
基于FPGA-CPU异构环境的大规模数据查询加速装置及方法 | 2020-05-08 | 882 |
一种图形处理器的设计模型及设计方法 | 2020-05-11 | 842 |
一种大规模并行处理系统及数据处理方法 | 2020-05-17 | 889 |
一种基于金融数据处理的时间调节系统 | 2020-05-11 | 174 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。