专利汇可以提供一种基于数仓工具HIVE的非更新方式的增量拉链实现方法专利检索,专利查询,专利分析的服务。并且本 发明 属于计算机领域技术领域,尤其为一种基于数仓工具HIVE的非更新方式的增量 拉链 实现方法,包括数仓工具HIVE,所述数仓工具HIVE包括拉链表和增量表,所述拉链表和增量表设置有若干个分区表,所述分区表内建立具有不同属性的分区;所述非更新方式的增量拉链实现方法,包括以下步骤:步骤一:获取当前的拉链表数据T0;本发明,通过设置获取当前的拉链表数据T0,并解析出时点T时的增量数据;过滤拉链表中增量时点之后的数据,并关联增量数据,获取历史数据的实效时点针等方法能够结合 大数据 HIVE工具特性,在不更新数据的情况下实现增量拉链 算法 ,并能够支持大 数据仓库 HIVE工具,最大程度的降低存储容量。,下面是一种基于数仓工具HIVE的非更新方式的增量拉链实现方法专利的具体信息内容。
1.一种基于数仓工具HIVE的非更新方式的增量拉链实现方法,包括数仓工具HIVE,其特征在于:所述数仓工具HIVE包括拉链表和增量表,所述拉链表和增量表设置有若干个分区表,所述分区表内建立具有不同属性的分区;所述非更新方式的增量拉链实现方法,包括以下步骤:
步骤一:获取当前的拉链表数据T0,并解析出时点T时的增量数据;
步骤二:过滤拉链表中增量时点之后的数据,并关联增量数据,获取历史数据的实效时点;
步骤三:然后生成新表T1;
步骤四:解析出增量数据T1,将其插入到拉链表T1中;
步骤五:删除旧表T0,重命名新表T1->T0。
2.根据权利要求1所述的一种基于数仓工具HIVE的非更新方式的增量拉链实现方法,其特征在于:所述获取拉链表数据T0步骤之前,在解析出时点T时的增量数据时,包括:获取增量数据,并将所述增量数据进行去重处理;将去重后的增量数据制成时点T时的增量表。
3.根据权利要求1所述的一种基于数仓工具HIVE的非更新方式的增量拉链实现方法,其特征在于:所述生成新表T1时,在插入增量数据T1之前,包括:获取增量数据,判断增量数据是否存在重复,若存在重复数据,则只保留一组重复的数据。
4.根据权利要求1所述的一种基于数仓工具HIVE的非更新方式的增量拉链实现方法,其特征在于:所述拉链表和增量表内确定未建立分区表时,所述方法还包括:基于设定的更新周期,将所有所述拉链表和增量表的分区信息更新至分布式缓存。
5.根据权利要求1所述的一种基于数仓工具HIVE的非更新方式的增量拉链实现方法,其特征在于:所述数仓工具HIVE包括处理器和存储器,所述处理器用于执行存储器中存储的拉链表数据和增量表数据,以实现非更新方式增量拉链的方法的步骤。
6.根据权利要求1所述的一种基于数仓工具HIVE的非更新方式的增量拉链实现方法,其特征在于:所述存储器能够存储一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种柔性直流受端电网强度的评价方法、装置及存储介质 | 2020-05-08 | 978 |
一种晶圆的清洗方法、装置、设备、介质及电子设备 | 2020-05-08 | 411 |
运算方法、系统及相关产品 | 2020-05-08 | 644 |
运算方法、装置及相关产品 | 2020-05-11 | 492 |
运算方法、系统及相关产品 | 2020-05-08 | 522 |
运算方法、装置及相关产品 | 2020-05-08 | 51 |
内存分配方法、装置、存储介质及电子设备 | 2020-05-08 | 86 |
基于SOH的均衡方法、电路及存储介质 | 2020-05-08 | 717 |
标识号的生成方法、装置和电子设备 | 2020-05-08 | 639 |
一种基于云平台的云硬盘创建方法和装置 | 2020-05-11 | 791 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。