一种温数据存储方法专利检索-风地球科学专利检索查询-专利查询网

一种温数据存储方法

阅读：680发布：2021-06-15

专利汇可以提供一种温数据存储方法专利检索，专利查询，专利分析的服务。并且本发明属于温数据存储领域，尤其时涉及一种温数据存储方法，包括：每日通过服务器以及相关平台录入数据；根据录入数据时的日期对数据赋值n；对当日日期进行赋值，设置成m，通过算法算出(m-n)的值，即为数据关联的关键词，将关键词关联数据；设置阈值 a；将数据关联的关键词(m-n)与阈值a进行大小比较，当出现(m-n)较大时，对数据进行清除处理，当出现a较大时，不对数据进行处理；通过Spark从HDFS通过不同的查询条件读取大规模的数据进行分析计算。本发明使用Parquet格式和Snappy压缩算法在提升大范围数据的读取速度的同时，能够减少住数据存储的用量。，下面是一种温数据存储方法专利的具体信息内容。

权利要求

1.一种温数据存储方法，其特征在于，具体包括以下步骤：
S1、每日通过服务器以及相关平台录入数据；
S2、根据录入数据时的日期对数据赋值n；
S3、将数据以Parquet格式存入HDFS；
S4、对当日日期进行赋值，设置成m，通过算法算出(m-n)的值，即为数据关联的关键词，将关键词关联数据；
S5、设置阈值a；
S6、将数据关联的关键词(m-n)与阈值a进行大小比较，当出现(m-n)较大时，对数据进行清除处理，当出现a较大时，不对数据进行处理；
S7、通过Spark从HDFS通过不同的查询条件读取大规模的数据进行分析计算。
2.根据权利要求1所述的一种温数据存储方法，其特征在于，在进行所述S1步骤前先对数据进行检测，检测数据中是否有与现有数据相重复的，检测到重复的数据不予录入。
3.根据权利要求2所述的一种温数据存储方法，其特征在于，在检测到重复数据后，根据当日的日期重新对存储中的现有数据进行m的赋值。
4.根据权利要求1所述的一种温数据存储方法，其特征在于，在进行所述S8步骤时，根据数据的索引次数得出数据的得分值，将数据的得分值进行加权处理，得到每个物品排序权重值，根据权重值对数据进行分组。

说明书全文

一种温数据存储方法

技术领域

[0001] 本发明涉及温数据存储领域，尤其涉及一种温数据存储方法。

背景技术

[0002] 当前架构的存储方案下，是将全部数据存储在单一的数据库中，然而传统的数据库为了满足一些特定的需求，比如：强一致性，事务性，大数据量下的高性能读写等等，往往对于大范围大批量的分析处理无法得到很好的优化，从而导致数据库会需要进行全表扫描的操作，从而耗费大量的时间。

[0003] 另外根据业务场景，大部分的离线分析计算不会需要使用到全部的数据量，往往时间跨度在半年至一年之间，所以只保存需要范围内的数据，也可以提升分析计算的效率并且控制硬件的使用成本。

[0004] 为此，我们提出一种温数据存储方法来解决上述问题。

发明内容

[0005] 1、发明目的。

[0006] 本发明提出了一种温数据存储方法，可以定期对数据进行清理，同时便于对数据进行索引和分组，对于硬件的需求较低。

[0007] 2、本发明所采用的技术方案。

[0008] 一种温数据存储方法，具体包括以下步骤：

[0009] S1、每日通过服务器以及相关平台录入数据；

[0010] S2、根据录入数据时的日期对数据赋值n；

[0011] S3、将数据以Parquet格式存入HDFS；

[0012] S4、对当日日期进行赋值，设置成m，通过算法算出(m-n)的值，即为数据关联的关键词，将关键词关联数据；

[0013] S5、设置阈值a；

[0014] S6、将数据关联的关键词(m-n)与阈值a进行大小比较，当出现(m-n)较大时，对数据进行清除处理，当出现a较大时，不对数据进行处理；

[0015] S7、通过Spark从HDFS通过不同的查询条件读取大规模的数据进行分析计算。

[0016] 在上述的一种温数据存储方法中，在进行所述S1步骤前先对数据进行检测，检测数据中是否有与现有数据相重复的，检测到重复的数据不予录入。

[0017] 在上述的一种温数据存储方法中，在检测到重复数据后，根据当日的日期重新对存储中的现有数据进行m的赋值。

[0018] 在上述的一种温数据存储方法中，在进行所述S8步骤时，根据数据的索引次数得出数据的得分值，将数据的得分值进行加权处理，得到每个物品排序权重值，根据权重值对数据进行分组。

[0019] 3、本发明所产生的技术效果。

[0020] 通过将开源的集群运算框架Spark和开源的面向列的格式Parquet进行配合，再将数据以一定的方式进行索引分组，让大范围的数据读取的性能得到大幅度的提升；与此同时，数据只保存业务需求的时间长度，如半年，那么数据规模相对适中，所以使用价格和性能都相对适中的混合硬盘进行存储，从而控制成本。附图说明

[0021] 图1为本发明提出的一种温数据存储方法的步骤图。

具体实施方式

[0022] 以下实施例仅处于说明性目的，而不是想要限制本发明的范围。

[0023] 实施例

[0024] 一种温数据存储方法，具体包括以下步骤：

[0025] S1、每日通过服务器以及相关平台录入数据；

[0026] S2、根据录入数据时的日期对数据赋值n；

[0027] S3、将数据以Parquet格式存入HDFS；

[0028] S4、对当日日期进行赋值，设置成m，通过算法算出(m-n)的值，即为数据关联的关键词，将关键词关联数据；

[0029] S5、设置阈值a；

[0030] S6、将数据关联的关键词(m-n)与阈值a进行大小比较，当出现(m-n)较大时，对数据进行清除处理，当出现a较大时，不对数据进行处理；

[0031] S7、通过Spark从HDFS通过不同的查询条件读取大规模的数据进行分析计算。

[0032] 其中，在进行S1步骤前先对数据进行检测，检测数据中是否有与现有数据相重复的，检测到重复的数据不予录入。

[0033] 其中，在检测到重复数据后，根据当日的日期重新对存储中的现有数据进行m的赋值。

[0034] 其中，在进行S8步骤时，根据数据的索引次数得出数据的得分值，将数据的得分值进行加权处理，得到每个物品排序权重值，根据权重值对数据进行分组。

[0035] 上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

标题	发布/更新时间	阅读量
固化修复树脂	2020-05-08	520
经修饰的膜型丝氨酸蛋白酶1（MTSP-1）多肽及其使用方法	2020-05-08	573
一种钓鱼网站检测方法、装置和存储介质	2020-05-08	814
麦克风组件及电子设备	2020-05-08	656
船舶用柴油发动机	2020-05-08	722
一种电子设备用散热装置	2020-05-08	231
修改音频对象的风格的方法、以及对应电子装置、计算机可读程序产品和计算机可读存储介质	2020-05-08	578
使用横向推进和垂直移动控制飞行器的系统和方法	2020-05-08	575
暖通空调系统及其控制方法	2020-05-08	223
激光电视的滤网固定结构及激光电视机	2020-05-08	246

一种温数据存储方法

一种温数据存储方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：