专利汇可以提供一种电网海量数据管理方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种 电网 海量数据管理方法,该方法包括:构建电网用户数据管理系统,将各个电网子系统采集到的数据进行整合,并利用并行计算 框架 对电网用户的数据进行挖掘和分析;基于所述数据管理系统,利用分布式负载预测 算法 实现并行负载预测。本发明提出了一种电网海量数据管理方法,将电网用户各系统的数据进行融合和集成,并将传统数据计算方法迁移到分布式平台中,满足海量数据的运算要求。,下面是一种电网海量数据管理方法专利的具体信息内容。
1.一种电网海量数据管理方法,其特征在于,包括:
构建电网用户数据管理系统,将各个电网子系统采集到的数据进行整合,并利用并行计算框架对电网用户的数据进行挖掘和分析;基于所述数据管理系统,利用分布式负载预测算法实现并行负载预测;
所述电网用户数据管理系统的架构分为应用层、数据分析计算层、数据管理层,利用Hadoop构建电网用户数据管理系统,在平台上采用HDFS、HBase建立数据存储系统,在平台上构建MapReduce并行计算框架和Storm内存并行计算框架作为海量数据计算分析系统,对电网用户的海量数据进行分析;所述数据管理层对数据进行采集和集成;所述数据采集包括从智能电表、数据采集监控系统和各种传感器中采集的数据,对这些数据的集成包括将数据迁移至集群服务器进行管理;在数据的集成过程中,采用数据转移工具对数据进行抽取和整合工作,将各个独立的系统产生的数据及历史数据利用数据转移工具抽取整合到HBase中,并使用java持久化工具对列存储数据库进行操作,将基于分布式计算的应用产生的在线数据写入到HBase中;所述数据分析计算层用于海量数据的存储和计算分析;利用HBase存储电力负载数据和相关数据;利用并行计算模块MapReduce对海量数据进行并行批量计算分析,而对数据密集型的迭代计算采用基于内存的并行计算模块Storm,将业务所需数据读入内存,需要数据时直接从内存中查询;
所述基于所述数据管理系统,利用分布式负载预测算法实现并行负载预测,进一步包括:
利用3个MapReduce业务类执行算法的训练过程,每一个MapReduce的输出作为其后一个的输入,训练结束后得到的决策模块保存在Hadoop的分布式集群中,其分为三部分:生成数据字典;生成判定树;形成判定树集合;
其中所述生成数据字典包括对进行训练的样本数据进行描述,产生一个文件来描述样本中条件属性和决策属性,记录条件属性值的类型和决策属性的位置,以及要创建的模块是进行分类还是回归运算,这个过程由第一个MapReduce完成,每个Map过程读取实验数据的一部分,记录数据的属性类型和负载值或者类型标识;产生的描述文件以键/值的形式存储在Hadoop的文件系统HDFS中;
其中所述生成判定树过程包括以下并行过程:
1)对原数据集进行随机有放回的抽取K个与原样本数据集大小一样的样本数据TS1,2,…,k;一个样本数据对应一个判定树的训练集,每个样本数据都不同,并且与原数据集大小一样;
2)根据样本数据中属性的个数M确定每个节点随机选择的属性个数m,其中m<
所述形成判定树集合包括把每个判定树分类器组合起来,每个判定树产生一个结果,如果判定树集合用来分类其最终结果为投票选取,当它用来回归预测时,K个树给出K个值,最终值为各树的平均值,此过程由第三个MapReduce完成。
2.根据权利要求1所述的方法,其特征在于,在所述HBase系统的部署架构中,将调度中心作为整个分布式实时数据库的管理者,存储元数据信息,包括各节点分工、节点状态、数据分区方式、数据块位置、任务调度、安全管理的关键信息;所述调度中心相互间通过同步机制保持元数据的一致性,数据分析计算层逻辑上是对等的,部署相同进程完成同样的逻辑运算,数据分析计算层采用基于事务的冗余备份机制,电网用户数据管理系统采用HDFS作为底层存储的分布式文件系统,构建面向电网海量数据的时序控制组件来存储电网业务中的时序数据,由时序控制组件来构建时序数据模块,按照特有模块统一接收存储采集的时序数据,并对外提供统一的查询接口;
在存储方式上,采用键-值的形式来存储数据,即面向列进行存储,以列族为基本的存储和权限控制单元,对于为空的列,在实际存储中不占用实际空间,使用稀疏表的设计方式,在数据架构部署上放弃了传统的C/S多客户端、单服务器的模式;采用分布式的多服务器的集群模式,所有数据根据复制因子分散存储于集群中的多台计算机上;时序控制组件底层依赖于列存储数据库,在具体处理时序数据时抽象为对HBase数据库的读、写、增加、删除、修改的基本操作,软件最上层为时序控制组件的客户端及第三方应用客户端,所有客户端通过Java的API进行具体操作,所有API通过类型解析模块解析分解为一个数据库操作或多个数据库操作的序列集合,这些数据库操作集合通过控制组件内部的RPC调用,最后统一使用异步的HBase操作API完成数据操作。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种智能火花塞外观缺陷检测系统 | 2020-05-08 | 250 |
网络视图的内存优化方法、装置、电子设备及计算机可读存储介质 | 2020-05-08 | 373 |
加热控制方法、设备、家用电器和计算机可读存储介质 | 2020-05-08 | 97 |
一种燃气灶的智能食谱控制系统以及控制方法 | 2020-05-08 | 25 |
一种程控和传输跨专业告警关联方法及系统 | 2020-05-08 | 959 |
应用程序优化方法、装置、存储介质及电子设备 | 2020-05-08 | 224 |
一种定位转运床 | 2020-05-08 | 435 |
烹饪控制方法、装置、烹饪器具和计算机可读存储介质 | 2020-05-08 | 987 |
一种高分子生物降解材料的动态降解装置 | 2020-05-11 | 878 |
收线架 | 2020-05-11 | 186 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。