专利汇可以提供基于Hadoop的数据采集优先级判定及处理方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于Hadoop的 数据采集 优先级判定及处理方法,该方法利用Hadoop分布式文件系统来处理海量数据,所述的Hadoop分布式文件系统包括用户 节点 、命名节点、扫描模 块 和 子节点 ,所述的用户节点包括JAVA 虚拟机 ,所述的JAVA虚拟机包括Hadoop用户端,该Hadoop用户端分别与分布式文件子系统和数据输出流交互;所述命名节点储存调用 频率 检测信息,调用频率检测信息包括各调用子节点的频率次数,所述命名节点根据所述子节点的频率次数依次将所述子节点进行优先权划分,所述子节点的频率次数越高,优先权越大。,下面是基于Hadoop的数据采集优先级判定及处理方法专利的具体信息内容。
1.一种基于Hadoop的数据采集优先级判定及处理方法,其特征在于,该方法利用Hadoop分布式文件系统来处理海量数据,所述的Hadoop分布式文件系统包括用户节点、命名节点、扫描模块和子节点,所述的用户节点包括JAVA虚拟机,所述的JAVA虚拟机包括Hadoop用户端,该Hadoop用户端分别与分布式文件子系统和数据输出流交互;所述命名节点储存调用频率检测信息,调用频率检测信息包括各调用子节点的频率次数,所述命名节点根据所述子节点的频率次数依次将所述子节点进行优先权划分,所述子节点的频率次数越高,优先权越大;
所述处理分析方法还包括优先域,所述命名节点从用户端获取调用信息并对命名节点的优先权划分信息生成后,所述命名节点对各所述子节点进行重新命名;所述优先域部分子节点划分到所述优先块内,同时,所述优先域将信息发送给所述命名节点,所述命名节点将所述优先域中的节点信息命名为优先节点;所述扫描模块优先扫描所述优先域中的所述优先节点。
2.根据权利要求1所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,当所述子节点认定为二类或三类优先权时,所述优先域将所述子节点划分到所述优先块内,同时,所述优先域将信息发送到所述命名节点,所述命名节点将所述优先域外的节点信息命名为优先节点;所述扫描模块优先扫描所述优先域外的优先节点。
3.根据权利要求1所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,优先权包括一类优先权、二类优先权和三类优先权,优先权的判定方式包括:在预定时间内全部子节点的调用频率为P,当子节点在预定时间内的被调用次数超过P/2,所述子节点认定具有一类优先权,当子节点在预定时间内的被调用次数超过P/4,所述子节点认定具有二类优先权,其它子节点认定具有三类优先权。
4.根据权利要求1所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,当所述子节点在预定时间内的调用频率大于任意四个其它所述子节点被调用的频率之和时,所述字节点认定为具有一类优先权,当所述子节点在预定时间内的调用频率大于任意两个其它所述子节点被调用的频率,所述字节点认定为具有二类优先权。
5.根据权利要求3或4任一项所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,所述命名节点在收到附加命令后将生成的优先权判定类型信息发送到所述扫描模块,所述扫描模块接收到优先权判定类型后开始对各扫描节点进行扫描工作;所述扫描模块在初次接收到优先权判定类型后依然开始逐个对各所述子节点进行扫描,以标记和分类认定为一类优先权、二类优先权和三类优先权的子节点;在所述扫描模块进行初次扫描后,所述命名节点生成优先块规则,优先块规则包括将所有一类优先权子节点标记的第一优先扫描块;将所有二类优先权子节点标记的第二优先扫描块和将所有三类优先权子节点标记的第三优先扫描块;所述扫描模块接下来的扫描程序中,依次对所述第一优先扫描块、所述第二优先扫描块和所述第三优先扫描块进行扫描,并扫寻找需要的文件,获得文件块的块位置,然后根据扫描内容填充所述元数据。
6.根据权利要求1所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,所述的命名节点用定位块数据结构响应Hadoop用户端,该定位块数据结构包括所有将数据块的副本附加到现有文件的数据节点标识符,Hadoop用户端通过将包括数据块的ID和数据的扩展块数据结构的一部分发送到所识别的数据节点,直接请求所识别的数据节点将数据块附加到现有文件。
7.根据权利要求6所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,接收扩展块数据结构的数据节点使用所接收的扩展块数据结构中的数据块的ID来访问现有文件的相应块和所接收的扩展块数据结构中的数据,以将数据写入所访问的块。
8.根据权利要求7所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,所述的文件放置优化模块用于调整能够存储在单个数据节点或单个服务器上的数据量。
9.根据权利要求7所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,所述的块扫描模块扫描数据节点以寻找需要的文件,获得文件块的块位置,然后根据扫描内容填充元数据,从而使元数据反映块的位置和副本的数量,所述的块扫描模块从单个数据节点返回连续的块文件的位置,以向Hadoop用户端提供该块文件被放置的错觉。
10.根据权利要求7所述的基于Hadoop的数据采集优先级判定及处理方法,其特征在于,所述的块扫描模块获得数据节点的名称和数据块的地址,创建数据块的块ID并将该块ID存储在元数据中,命名节点使用从块扫描模块接收的信息来更新块列表和每个块的每个副本的位置。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于物流调配算法的物流调配方法 | 2020-05-08 | 735 |
SAGD双水平井钻完井控制方法及装置 | 2020-05-08 | 951 |
轴承螺栓对准设备、螺栓对准控制方法、装置和系统 | 2020-05-08 | 792 |
一种飞秒激光即时显色及调控方法 | 2020-05-08 | 344 |
一种Cu表面激光增材制造梯度复合材料的方法 | 2020-05-08 | 379 |
显示屏的检测区域定位方法和装置 | 2020-05-08 | 287 |
一种基于干涉仪复合测量的射流抛光去除函数提取方法 | 2020-05-08 | 574 |
智能后勤平台管理系统 | 2020-05-08 | 458 |
一种特征权重自学习的睡眠质量检测关键脑区判定方法 | 2020-05-08 | 926 |
用于处理视频信号的方法 | 2020-05-11 | 170 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。