首页 / 专利库 / 资料储存系统 / 数据库管理系统 / 一种分布式数据库负载均衡预测方法和预测分析器

一种分布式数据库负载均衡预测方法和预测分析

阅读:222发布:2020-05-08

专利汇可以提供一种分布式数据库负载均衡预测方法和预测分析专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种分布式 数据库 负载均衡预测方法和 预测分析 器,采集每个本地数据 节点 上的负载指标,构成训练集数据;初始化多层循环神经网络模型;从训练集数据中提取一段时间数据作为多层循环神经网络模型的输入,从训练集数据中提取该一段时间数据后同等时间段的数据作为多层循环神经网络模型的输出,训练所述多层循环神经网络模型;从训练集数据中提取该同等时间段的数据之后且相同时间段的数据,作为多层循环神经网络模型的输入,预测该本地数据节点的负载指标。因此,所述分布式数据库负载均衡预测方法和预测分析器能够更为精确地描述负载均衡数据的结构并对其进行有效预测。,下面是一种分布式数据库负载均衡预测方法和预测分析专利的具体信息内容。

1.一种分布式数据库负载均衡预测方法,其特征在于,包括步骤:
采集每个本地数据节点上的负载指标,构成训练集数据;其中,所述负载指标包括CPU利用率Rc、内存利用率Rm、网络下行速度Sd以及网络上行速度Su;并且,每一秒采集一次所述的负载指标,共采集2T秒,构成训练集数据L=[Rc,Rm,Sd,Su];
初始化多层循环神经网络模型:确定多层循环神经网络模型的隐藏层个数以及多层循环神经网络模型每层的神经元个数nm;将多层循环神经网络模型输入层和每个隐藏层的神经元之间的网络连接权重 随机初始化,并记做
从训练集数据中提取第1条至第T条数据,并且将每组数据通过如下公式进行映射:
xi=[1,sin(L(i)),cos(L(i))]
将映射后的数据作为多层循环神经网络模型的输入xi;
从训练集数据中提取第T+1条至第2T条数据作为多层循环神经网络模型的输出yi,训练所述多层循环神经网络模型;
通过如下公式计算多层循环神经网络模型每个隐含层的输出:
其中,xi为网络输入, 为网络输出,和 分别代表第一层隐含层和第二层隐含层的输出, 为h1层与输入之间的权重矩阵, 为h1层不同时间序列之间的权重矩阵, 为h1层与h2层之间的权重矩阵, 为h2层不同时间序列之间的权重矩阵, 为h1层的偏置,为h2层的偏置,by为输出层的偏置,tanh为激活函数;
计算多层循环神经网络模型每个隐含层的输出误差,根据如下公式:
根据计算获得的输出误差,通过对多层循环神经网络模型的全部权重进行更新,直至所述输出误差在预设的允许范围内,多层循环神经网络模型训练结束;
从训练集数据中提取第T+1条至第2T条数据,并将第T+1条到第2T条数据作为多层循环神经网络模型的输入,多层循环神经网络模型的输出为预测2T+1至3T时间段的本地数据节点的负载指标。
2.一种多层循环神经网络预测分析器,其特征在于,包括:
数据采集单元,用于采集每个本地数据节点上的负载指标,构成训练集数据;其中,所述数据采集单元的负载指标包括CPU利用率Rc、内存利用率Rm、网络下行速度Sd以及网络上行速度Su;并且,所述数据采集单元每一秒采集一次所述的负载指标,共采集2T秒,构成训练集数据L=[Rc,Rm,Sd,Su];
模型初始化单元,用于初始化多层循环神经网络模型:确定多层循环神经网络模型的隐藏层个数以及多层循环神经网络模型每层的神经元个数nm;将多层循环神经网络模型输入层和每个隐藏层的神经元之间的网络连接权重 随机初始化,并记做
模型训练单元,用于从训练集数据中提取第1条至第T条数据,并且将每组数据通过如下公式进行映射:
xi=[1,sin(L(i)),cos(L(i))]
将映射后的数据作为多层循环神经网络模型的输入xi;
从训练集数据中提取第T+1条至第2T条数据作为多层循环神经网络模型的输出yi,训练所述多层循环神经网络模型;
所述模型训练单元还用于通过如下公式计算多层循环神经网络模型每个隐含层的输出:
其中,xi为网络输入, 为网络输出, 和 分别代表第一层隐含层和第二层隐含层的输出, 为h1层与输入之间的权重矩阵, 为h1层不同时间序列之间的权重矩阵, 为h1层与h2层之间的权重矩阵, 为h2层不同时间序列之间的权重矩阵, 为h1层的偏置,为h2层的偏置,by为输出层的偏置,tanh为激活函数;
计算多层循环神经网络模型每个隐含层的输出误差,根据如下公式:
根据计算获得的输出误差,通过对多层循环神经网络模型的全部权重进行更新,直至所述输出误差在预设的允许范围内,多层循环神经网络模型训练结束;
负载预测单元,用于从训练集数据中提取第T+1条至第2T条数据,并将第T+1条到第2T条数据作为多层循环神经网络模型的输入,多层循环神经网络模型的输出为预测2T+1至3T时间段的本地数据节点的负载指标。
3.一种分布式数据库,其特征在于,包括:分布式数据库管理系统、与该分布式数据库管理系统连接的至少一个数据节点,并且在每个数据节点上安装有多层循环神经网络预测分析器;
其中,分布式数据库管理系统包括有资源管理模和作业调度模块,资源管理模块针对至少一个数据节点的数据资源进行管理;而作业调度模块根据资源管理模块管理的每个数据节点的数据资源情况,针对客户端的数据请求向数据节点进行作业调度;还有,在每个数据节点上分别包括本地资源管理模块和本地作业调度模块;本地资源管理模块对本地的数据资源进行管理,而本地作业调度模块根据分布式数据库管理系统的作业调度模块的调度指令对本地资源管理模块中的数据资源进行处理;
另外,所述的多层循环神经网络预测分析器对应于每个数据节点的本地资源管理模块,本地资源管理模块向对应的多层循环神经网络预测分析器报告当前本地负载量;该多层循环神经网络预测分析器根据所述当前本地负载量,利用如权利要求1所述的分布式数据库负载均衡预测方法对所对应的本地资源管理模块的负载进行预测并将预测结果反馈给该本地资源管理模块;
之后,本地资源管理模块分别将获得的预测结果以及当前的负载情况一起发送给分布式数据库管理系统的资源管理模块,并且资源管理模块会将获得的所有预测结果和当前的负载情况传送给作业调度模块;作业调度模块会根据每个数据节点的预测结果和当前的负载情况向对应的数据节点的本地作业调度模块发送作业调度指令。

说明书全文

一种分布式数据库负载均衡预测方法和预测分析

技术领域

[0001] 本发明涉及计算机领域,特别是指一种分布式数据库负载均衡预测方法和预测分析器。

背景技术

[0002] 目前,为了提高分布式数据库的资源利用率和性能,采用预测技术对分布式数据库资源使用状况进行实时预测具有重要意义。
[0003] 一般的BP网络负载均衡预测方法仍存在一些不足之处,在分布式预测分析器中,负载平衡通过把任务从负载过重的服务器转移到负载较轻的服务器,以使得任务能够利用那里的计算能,从而提高整个分布式预测分析器的性能和稳定性。当预测分析器中某些服务器的工作负载经常保持较重,或者某些服务器执行任务的速度比其它服务器要慢许多时,负载分布不均的情况很明显将会经常发生。即使在一个完全同构的分布式预测分析器中,由于任务到达服务器的时间以及任务完成所需的服务时间存在的差异,同样会出现在整个预测分析器中服务器之间负载平衡问题;此外还存在查询频率远高于数据改写频率等问题。
[0004] BP网络具有原理清晰、简单实用等优点,但当需要大规模数据下网络模型训练期间进行实时负载预测,但是由于采用了神经网络的梯度法,收敛速度慢,容易收敛到局部最小。此外,学习因子和惯性因子的选取对神经网络的收敛性影响通常只能由个人经验来选定。因此,BP网络并不适合高输入高输出预测分析器的负载预测,尤其是需要处理突变实时负载的情况。

发明内容

[0005] 有鉴于此,本发明的目的在于提出一种分布式数据库负载均衡预测方法和预测分析器,能够更为精确地描述负载均衡数据的结构并对其进行有效预测。
[0006] 基于上述目的本发明提供的分布式数据库负载均衡预测方法,包括步 骤:
[0007] 采集每个本地数据节点上的负载指标,构成训练集数据;
[0008] 初始化多层循环神经网络模型;
[0009] 从训练集数据中提取一段时间数据作为多层循环神经网络模型的输入,从训练集数据中提取该一段时间数据后同等时间段的数据作为多层循环神经网络模型的输出,训练所述多层循环神经网络模型;
[0010] 从训练集数据中提取该同等时间段的数据之后且相同时间段的数据,作为多层循环神经网络模型的输入,预测该本地数据节点的负载指标。
[0011] 在一些实施例中,所述负载指标包括CPU利用率Rc、内存利用率Rm、网络下行速度Sd以及网络上行速度Su;并且,每一秒采集一次所述的负载指标,共采集2T秒,构成训练集数据
[0012] L=[Rc,Rm,Sd,Su];
[0013] 还有,所述初始化多层循环神经网络模型包括:
[0014] 确定多层循环神经网络模型的隐藏层个数以及多层循环神经网络模型每层的神经元个数nm;将多层循环神经网络模型输入层和每个隐藏层的神经元之间的网络连接权重随机初始化,并记做
[0015] 在一些实施例中,所述训练多层循环神经网络模型时,从训练集数据中提取第1条至第T条数据,并且将每组数据通过如下公式进行映射:
[0016] xi=[1,sin(L(i)),cos(L(i))]
[0017] 将映射后的数据作为多层循环神经网络模型的输入xi;
[0018] 从训练集数据中提取第T+1条至第2T条数据作为多层循环神经网络模型的输出yi,训练所述多层循环神经网络模型。
[0019] 在一些实施例中,在所述从训练集数据中提取该同等时间段的数据之后且相同时间段的数据之前,还包括:
[0020] 通过如下公式计算多层循环神经网络模型每个隐含层的输出:
[0021]
[0022]
[0023]
[0024] 其中,xi为网络输入, 为网络输出, 和 分别代表第一层隐含层和第二层隐含层的输出, 为h1层与输入之间的权重矩阵, 为h1层不同时 间序列之间的权重矩阵,为h1层与h2层之间的权重矩阵, 为h2层不同时间序列之间的权重矩阵, 为h1层的偏置, 为h2层的偏置,by为输出层的偏置,tanh为激活函数;
[0025] 计算多层循环神经网络模型每个隐含层的输出误差,根据如下公式:
[0026]
[0027] 根据计算获得的输出误差,通过对多层循环神经网络模型的全部权重进行更新,直至所述输出误差在预设的允许范围内,多层循环神经网络模型训练结束。
[0028] 在一些实施例中,从训练集数据中提取第T+1条至第2T条数据,并将第T+1条到第2T条数据作为多层循环神经网络模型的输入,多层循环神经网络模型的输出为预测2T+1至
3T时间段的本地数据节点的负载指标。
[0029] 在本发明的另一个方面,还提供了一种多层循环神经网络预测分析器,包括:
[0030] 数据采集单元,用于采集每个本地数据节点上的负载指标,构成训练集数据;
[0031] 模型初始化单元,用于初始化多层循环神经网络模型;
[0032] 模型训练单元,用于从训练集数据中提取一段时间数据作为多层循环神经网络模型的输入,从训练集数据中提取该一段时间数据后同等时间段的数据作为多层循环神经网络模型的输出,训练所述多层循环神经网络模型;
[0033] 负载预测单元,用于从训练集数据中提取该同等时间段的数据之后且相同时间段的数据,作为多层循环神经网络模型的输入,预测该本地数据节点的负载指标。
[0034] 在一些实施例中,所述数据采集单元的负载指标包括CPU利用率Rc、内存利用率Rm、网络下行速度Sd以及网络上行速度Su;并且,所述数据采集单元每一秒采集一次所述的负载指标,共采集2T秒,构成训练集数据L=[Rc,Rm,Sd,Su;]
[0035] 另外,所述模型初始化单元在初始化多层循环神经网络模型时,包括确定多层循环神经网络模型的隐藏层个数以及多层循环神经网络模型每层的神经元个数nm;将多层循环神经网络模型输入层和每个隐藏层的神经元之间的 网络连接权重 随机初始化,并记做
[0036] 在一些实施例中,所述模型训练单元从训练集数据中提取第1条至第T条数据,并且将每组数据通过如下公式进行映射:
[0037] xi=[1,sin(L(i)),cos(L(i))]
[0038] 将映射后的数据作为多层循环神经网络模型的输入xi;
[0039] 从训练集数据中提取第T+1条至第2T条数据作为多层循环神经网络模型的输出yi,训练所述多层循环神经网络模型;
[0040] 另外,所述负载预测单元从训练集数据中提取第T+1条至第2T条数据,并将第T+1条到第2T条数据作为多层循环神经网络模型的输入,多层循环神经网络模型的输出为预测2T+1至3T时间段的本地数据节点的负载指标。
[0041] 在一些实施例中,所述模型训练单元还用于通过如下公式计算多层循环神经网络模型每个隐含层的输出:
[0042]
[0043]
[0044]
[0045] 其中,xi为网络输入, 为网络输出, 和 分别代表第一层隐含层和第二层隐含层的输出, 为h1层与输入之间的权重矩阵, 为h1层不同时间序列之间的权重矩阵,1 2 2 1
为h层与h层之间的权重矩阵, 为h层不同时间序列之间的权重矩阵, 为h层的偏置, 为h2层的偏置,by为输出层的偏置,tanh为激活函数;
[0046] 计算多层循环神经网络模型每个隐含层的输出误差,根据如下公式:
[0047]
[0048] 根据计算获得的输出误差,通过对多层循环神经网络模型的全部权重进行更新,直至所述输出误差在预设的允许范围内,多层循环神经网络模型训练结束。
[0049] 在本发明的另一个方面,还提供了一种分布式数据库,包括:分布式数据库管理系统、与该分布式数据库管理系统连接的至少一个数据节点,并且在每个数据节点上安装有多层循环神经网络预测分析器;
[0050] 其中,分布式数据库管理系统包括有资源管理模和作业调度模块,资源管理模块针对至少一个数据节点的数据资源进行管理;而作业调度模块根据资源管理模块管理的每个数据节点的数据资源情况,针对客户端的数据请求向数据节点进行作业调度;还有,在每个数据节点上分别包括本地资源管理模块和本地作业调度模块;本地资源管理模块对本地的数据资源进行管理,而本地作业调度模块根据分布式数据库管理系统的作业调度模块的调度指令对本地资源管理模块中的数据资源进行处理;
[0051] 另外,所述的多层循环神经网络预测分析器对应于每个数据节点的本地资源管理模块,本地资源管理模块向对应的多层循环神经网络预测分析器报告当前本地负载量;该多层循环神经网络预测分析器根据所述当前本地负载量,对所对应的本地资源管理模块的负载进行预测并将预测结果反馈给该本地资源管理模块;
[0052] 之后,本地资源管理模块分别将获得的预测结果以及当前的负载情况一起发送给分布式数据库管理系统的资源管理模块,并且资源管理模块会将获得的所有预测结果和当前的负载情况传送给作业调度模块;作业调度模块会根据每个数据节点的预测结果和当前的负载情况向对应的数据节点的本地作业调度模块发送作业调度指令。
[0053] 从上面所述可以看出,本发明提供的分布式数据库负载均衡预测方法和预测分析器,实现了一套简便易行,同时与一般的BP神经网络预测方法相比,更适合于处理大规模数据下网络模型训练期间进行实时负载预测,更有效的处理突变实时负载的情况,更适合高输入高输出的负载预测场景的方法和预测分析器。附图说明
[0054] 图1为本发明实施例中分布式数据库负载均衡预测方法的流程示意图;
[0055] 图2为本发明可参考实施例中分布式数据库负载均衡预测方法的流程示意图;
[0056] 图3为本发明可参考实施例中多层循环神经网络的结构示意图;
[0057] 图4为本发明实施例中多层循环神经网络预测分析器的结构示意图;
[0058] 图5为本发明实施例中分布式数据库的结构示意图;
[0059] 图6为本发明实施例中分布式数据库的指令执行示意图。

具体实施方式

[0060] 为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0061] 作为本发明的一个实施例,参阅图1所示,为本发明实施例中分布式数据库负载均衡预测方法的流程示意图。所述分布式数据库负载均衡预测方法包括:
[0062] 步骤101,采集每个本地数据节点上的负载指标,构成训练集数据。
[0063] 其中,负载指标包括CPU利用率Rc、内存利用率Rm、网络下行速度Sd以及网络上行速度Su。较佳地,每一秒采集一次所述的负载指标,共采集2T秒。然后,构成训练集数据L=[Rc,Rm,Sd,Su]。
[0064] 步骤102,初始化多层循环神经网络模型。
[0065] 较佳地,初始化多层循环神经网络模型包括:确定多层循环神经网络模型的隐藏层个数以及多层循环神经网络模型每层的神经元个数nm。并且,将多层循环神经网络模型输入层和每个隐藏层的神经元之间的网络连接权重 随机初始化,并记做
[0066] 步骤103,从训练集数据中提取一段时间数据作为多层循环神经网络模型的输入,从训练集数据中提取该一段时间数据后同等时间段的数据作为多层循环神经网络模型的输出,训练所述多层循环神经网络模型。
[0067] 在实施例中,从训练集数据中提取第1条至第T条数据,并且将每组数据通过如下公式进行映射:
[0068] xi=[1,sin(L(i)),cos(L(i))]
[0069] 将映射后的数据作为多层循环神经网络模型的输入xi;
[0070] 从训练集数据中提取第T+1条至第2T条数据作为多层循环神经网络模型的输出yi,训练所述多层循环神经网络模型。
[0071] 优选地,通过如下公式计算多层循环神经网络模型每个隐含层的输出:
[0072]
[0073]
[0074]
[0075] 其中,xi为网络输入, 为网络输出, 和 分别代表第一层隐含层和第二层隐含层的输出, 为h1层与输入之间的权重矩阵, 为h1层不同时间序列之间的权重矩阵,为h1层与h2层之间的权重矩阵, 为h2层不同时间序列之间的权重矩阵, 为h1层的偏置, 为h2层的偏置,by为输出层的偏置,tanh为激活函数。
[0076] 然后,计算多层循环神经网络模型每个隐含层的输出误差,根据如下公式:
[0077]
[0078] 根据计算获得的输出误差,通过对多层循环神经网络模型的全部权重进行更新,直至所述输出误差在预设的允许范围内,多层循环神经网络模型训练结束。
[0079] 步骤104,从训练集数据中提取该同等时间段的数据之后且相同时间段的数据,作为多层循环神经网络模型的输入,预测该本地数据节点的负载指标。
[0080] 作为实施例,从训练集数据中提取第T+1条至第2T条数据,并将第T+1条到第2T条数据作为多层循环神经网络模型的输入,多层循环神经网络模型的输出为预测2T+1至3T时间段的本地数据节点的负载指标。
[0081] 作为本发明另一可参考的实施例,参阅图2所示,所述的分布式数据库负载均衡预测方法可以是如下过程:
[0082] 步骤201,采集每个本地数据节点上的负载指标。其中,负载指标包括CPU利用率、内存利用率、网络下行速度以及网络上行速度。较佳地,对所述的负载指标每一秒采集一次。优选地,可以采集2T秒。
[0083] 步骤202,将采集的负载指标构成训练集数据L=[Rc,Rm,Sd,Su]。其中,Rc为CPU利用率、Rm为内存利用率、Sd为网络下行速度、Su为上行速度。
[0084] 步骤203,初始化多层循环神经网络模型,包括确定多层循环神经网络模型的隐藏层个数以及多层循环神经网络模型每层的神经元个数;将多层循环神经网络模型输入层和每个隐藏层的神经元之间的网络连接权重 随机初 始化,并记做
[0085] 较佳地,多层循环神经网络模型的隐藏层个数2。多层循环神经网络模型每层的神经元个数为nm。
[0086] 步骤204,从训练集数据中提取第1条至第T条数据,并且将每组数据通过如下公式进行映射:
[0087] xi=[1,sin(L(i)),cos(L(i))]
[0088] 将映射后的数据作为多层循环神经网络模型的输入xi。
[0089] 步骤205,从训练集数据中提取第T+1条至第2T条数据作为多层循环神经网络模型的输出yi。
[0090] 步骤206,计算多层循环神经网络模型每个隐含层的输出,其具体公式如下(如图3所示):
[0091]
[0092]
[0093]
[0094] 其中,xi为网络输入, 为网络输出, 和 分别代表第一层隐含层和第二层隐含层的输出, 为h1层与输入之间的权重矩阵, 为h1层不同时间序列之间的权重矩阵,为h1层与h2层之间的权重矩阵, 为h2层不同时间序列之间的权重矩阵, 为h1层的2
偏置, 为h层的偏置,by为输出层的偏置,tanh为激活函数。
[0095] 步骤207,计算多层循环神经网络模型每个隐含层的输出误差,根据如下公式:
[0096]
[0097] 步骤208,根据步骤207计算获得的输出误差,通过梯度下降法对多层循环神经网络模型的全部权重进行更新,直至所述误差在允许范围内,多层循环神经网络模型训练结束。
[0098] 较佳地,所述误差的允许范围是多层循环神经网络模型输入值的正负5%。
[0099] 步骤209,从训练集数据中提取第T+1条至第2T条数据,并将第T+1条 到第2T条数据作为多层循环神经网络模型的输入,预测2T+1至3T时间段的本地数据节点的负载指标。
[0100] 在本发明的另一方面,提供了一种多层循环神经网络预测分析器,参阅图4所示,所述的多层循环神经网络预测分析器依次包括数据采集单元401,用于采集每个本地数据节点上的负载指标,构成训练集数据。模型初始化单元402,用于初始化多层循环神经网络模型。模型训练单元403,用于从训练集数据中提取一段时间数据作为多层循环神经网络模型的输入,从训练集数据中提取该一段时间数据后同等时间段的数据作为多层循环神经网络模型的输出,训练所述多层循环神经网络模型。负载预测单元404,用于从训练集数据中提取该同等时间段的数据之后且相同时间段的数据,作为多层循环神经网络模型的输入,预测该本地数据节点的负载指标。
[0101] 其中,数据采集单元401的负载指标包括CPU利用率Rc、内存利用率Rm、网络下行速度Sd以及网络上行速度Su。较佳地,所述数据采集单元每一秒采集一次所述的负载指标,共采集2T秒,构成训练集数据L=[Rc,Rm,Sd,。]
[0102] 作为实施例,所述模型初始化单元402在初始化多层循环神经网络模型时,需要确定多层循环神经网络模型的隐藏层个数以及多层循环神经网络模型每层的神经元个数nm。另外,将多层循环神经网络模型输入层和每个隐藏层的神经元之间的网络连接权重 随机初始化,并记做
[0103] 作为一个较佳地实施例,模型训练单元403从训练集数据中提取第1条至第T条数据,并且将每组数据通过如下公式进行映射。
[0104] xi=[1,sin(L(i)),cos(L(i))]
[0105] 将映射后的数据作为多层循环神经网络模型的输入xi;
[0106] 然后,从训练集数据中提取第T+1条至第2T条数据作为多层循环神经网络模型的输出yi,训练所述多层循环神经网络模型。
[0107] 最后,负载预测单元404从训练集数据中提取第T+1条至第2T条数据,并将第T+1条到第2T条数据作为多层循环神经网络模型的输入,多层循环神经网络模型的输出为预测2T+1至3T时间段的本地数据节点的负载指标。
[0108] 作为一个优选地实施例,模型训练单元403还可以通过如下公式计算多 层循环神经网络模型每个隐含层的输出:
[0109]
[0110]
[0111]
[0112] 其中,xi为网络输入, 为网络输出, 和 分别代表第一层隐含层和第二层隐含层的输出, 为h1层与输入之间的权重矩阵, 为h1层不同时间序列之间的权重矩阵,1 2 2 1
为h层与h层之间的权重矩阵, 为h 层不同时间序列之间的权重矩阵, 为h 层的偏置, 为h2层的偏置,by为输出层的偏置,tanh为激活函数。
[0113] 然后,计算多层循环神经网络模型每个隐含层的输出误差,根据如下公式:
[0114]
[0115] 根据计算获得的输出误差,通过对多层循环神经网络模型的全部权重进行更新,直至所述输出误差在预设的允许范围内,多层循环神经网络模型训练结束。
[0116] 需要说明的是,在本发明所述的分布式数据库负载均衡预测分析器的具体实施内容,在上面所述的分布式数据库负载均衡预测方法中已经详细说明了,故在此重复内容不再说明。
[0117] 作为本发明又一方面,提供了一种分布式数据库可以包括分布式数据库管理系统、与该分布式数据库管理系统连接的n个数据节点,并且在每个数据节点上安装有多层循环神经网络预测分析器,即有n个多层循环神经网络预测分析器。如图5所示,客户端通过数据I/O将数据请求发送到分布式数据库管理系统上。较佳地,分布式数据库管理系统包括有资源管理模块和作业调度模块。其中,资源管理模块可以针对n个数据节点的数据资源进行管理;而作业调度模块可以根据资源管理模块管理的每个数据节点的数据资源情况,针对客户端的数据请求向数据节点进行作业调度。优选地,在每个数据节点上分别包括本地资源管理模块和本地作业调度模块。本地资源管理模块可以对本地的数据资源进行管理,而本地作业调度模块可以根据分布式数据库管理系统的作业调度模块的调度指令对本地资源管理模块中的数据资源 进行处理。
[0118] 参阅图6所示,n个多层循环神经网络预测分析器对应于n个数据节点的本地资源管理模块,本地资源管理模块向对应的多层循环神经网络预测分析器报告当前本地负载量。该多层循环神经网络预测分析器根据所述当前本地负载量,利用上面所述的分布式数据库负载均衡预测方法对所对应的本地资源管理模块的负载进行预测并将预测结果反馈给该本地资源管理模块。
[0119] 较佳地,n个本地资源管理模块分别将获得的预测结果以及当前的负载情况一起发送给分布式数据库管理系统的资源管理模块,并且所述的资源管理模块会将获得的所有预测结果和当前的负载情况传送给作业调度模块。然后,所述作业调度模块会根据每个数据节点的预测结果和当前的负载情况向对应的数据节点的本地作业调度模块发送作业调度指令,并将当前所有的作业调度情况发送给资源管理模块。从而,实现了分布式数据库管理系统对n个数据节点之间负载均衡的作业调度。
[0120] 综上所述,本发明提供的分布式数据库负载均衡预测方法和预测分析器、以及分布式数据库,创造性地基于多层循环神经网络的分布式数据库负载均衡预测;相对于一般的BP神经网络算法,避免了神经网络梯度法导致的收敛速度慢和容易收敛到局部最小的缺陷;通过多隐含层神经网络的信息循环传递,使得训练模型能够更为精确的描述负载均衡数据的结构并对其进行有效预测;而且,所述的分布式数据库负载均衡预测方法和预测分析器应对突变实时负载时的损失较少;在大多数情况下使得各节点的负载情况更为均衡;较少出现过重负载或过轻负载的节点;与此同时,本发明采用预测技术对分布式数据库资源使用状况进行实时预测具有重要意义,提高分布式数据库的资源利用率和性能;最后,整个所述的分布式数据库负载均衡预测方法和预测分析器简便、紧凑,易于实现。
[0121] 所属领域的普通技术人员应当理解:以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈