首页 / 专利库 / 计算机网络 / 环境网络 / 服务器、预测系统调用量的方法及存储介质

服务器、预测系统调用量的方法及存储介质

阅读:63发布:2024-01-10

专利汇可以提供服务器、预测系统调用量的方法及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种 服务器 、预测系统调用量的方法及存储介质,该方法包括:分别获取待接入系统与各已接入系统的系统参数,基于系统参数计算两系统的系统相似度;若有系统相似度大于预设相似度 阈值 ,则获取该已接入系统的因子数据作为该待接入系统的待训练因子数据;若系统相似度均小于或等于预设相似度阈值,则获取待接入系统在预设时间内的系统调用数据,对系统调用数据进行预处理,得到待用的系统调用数据;基于待用的系统调用数据获取系统特征因子及基本因子作为该待接入系统的待训练因子数据;基于待训练因子数据对预设的模型进行训练,得到预测调用量的第一模型。本发明能够对待接入系统未来的调用量进行准确的预测,以应对系统异常问题。,下面是服务器、预测系统调用量的方法及存储介质专利的具体信息内容。

1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
分别获取待接入系统与各已接入系统的系统参数,基于所述系统参数计算待接入系统与各已接入系统的系统相似度;
若有待接入系统与已接入系统的系统相似度大于预设相似度阈值,则获取该已接入系统的因子数据,以该因子数据作为该待接入系统的待训练因子数据,所述因子数据包括时间、网络类型、主机数量、注册用户数量、系统调用量、业务类型、节假日因素;
若待接入系统与各已接入系统的系统相似度均小于或等于预设相似度阈值,则获取待接入系统在预设时间内的系统调用数据,对待接入系统的系统调用数据进行预处理,得到待用的系统调用数据;
基于所述待用的系统调用数据获取该待接入系统的系统特征因子及基本因子,以该系统特征因子及基本因子作为该待接入系统的待训练因子数据;
基于待接入系统的待训练因子数据对预设的模型进行训练,得到训练后用于预测该待接入系统的调用量的第一模型。
2.根据权利要求1所述的服务器,其特征在于,所述系统参数包括业务类型、系统架构类型、部署环境类型、业务量及用户量,所述基于所述系统参数计算待接入系统与各已接入系统的系统相似度的步骤,具体包括:
基于所述系统参数分别获取待接入系统与各已接入系统的业务类型的相似值a1、系统架构的相似值a2、部署环境的相似值a3、业务量的相似值a4及用户量的相似值a5,并获取业务类型预设的权重W1、系统架构类型预设的权重W2、部署环境类型预设的权重W3、业务量预设的权重W4及用户量预设的权重W5,计算系统相似度R=a1*W1+a2*W2+a3*W3+a4*W4+a5*W5。
3.根据权利要求1或2所述的服务器,其特征在于,所述系统调用数据包括系统调用量,所述对待接入系统的系统调用数据进行预处理的步骤,具体包括:
获取所述待接入系统在第一预设时间内的系统调用量,计算所述系统调用量在该第一预设时间内的标准方差;
若所述标准方差为0,则过滤该第一预设时间内的系统调用量,并获取该待接入系统在第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差,直至所述标准方差不为0,所述第一预设时间与所述第二预设时间为过去时间,所述第一预设时间不等于所述第二预设时间;
若所述标准方差不为0,则过滤系统调用数据中为空的数据及不符合预定格式的数据,将过滤后得到的系统调用数据作为所述待用的系统调用数据。
4.根据权利要求1或2所述的服务器,其特征在于,所述处理系统被所述处理器执行时,还实现如下步骤:
按照预设的剔除规则依次剔除待训练因子数据,在每次剔除待训练因子数据后,利用剔除后剩余的待训练因子数据对所述模型进行训练,得到训练后用于预测该待接入系统的调用量的各个第二模型;
分别获取各个第二模型预测该待接入系统的调用量对应的各个准确率,根据所述各个准确率对所剔除的待训练因子数据进行评价。
5.一种预测系统调用量的方法,其特征在于,所述预测系统调用量的方法包括:
S1,分别获取待接入系统与各已接入系统的系统参数,基于所述系统参数计算待接入系统与各已接入系统的系统相似度;
S2,若有待接入系统与已接入系统的系统相似度大于预设相似度阈值,则获取该已接入系统的因子数据,以该因子数据作为该待接入系统的待训练因子数据,所述因子数据包括时间、网络类型、主机数量、注册用户数量、系统调用量、业务类型、节假日因素;
S3,若待接入系统与各已接入系统的系统相似度均小于或等于预设相似度阈值,则获取待接入系统在预设时间内的系统调用数据,对待接入系统的系统调用数据进行预处理,得到待用的系统调用数据;
S4,基于所述待用的系统调用数据获取该待接入系统的系统特征因子及基本因子,以该系统特征因子及基本因子作为该待接入系统的待训练因子数据;
S5,基于待接入系统的待训练因子数据对预设的模型进行训练,得到训练后用于预测该待接入系统的调用量的第一模型。
6.根据权利要求5所述的预测系统调用量的方法,其特征在于,所述系统参数包括业务类型、系统架构类型、部署环境类型、业务量及用户量,所述步骤S1,具体包括:
基于所述系统参数分别获取待接入系统与各已接入系统的业务类型的相似值a1、系统架构的相似值a2、部署环境的相似值a3、业务量的相似值a4及用户量的相似值a5,并获取业务类型预设的权重W1、系统架构类型预设的权重W2、部署环境类型预设的权重W3、业务量预设的权重W4及用户量预设的权重W5,计算系统相似度R=a1*W1+a2*W2+a3*W3+a4*W4+a5*W5。
7.根据权利要求5或6所述的预测系统调用量的方法,其特征在于,所述系统调用数据包括系统调用量,所述步骤S3,具体包括:
获取所述待接入系统在第一预设时间内的系统调用量,计算所述系统调用量在该第一预设时间内的标准方差;
若所述标准方差为0,则过滤该第一预设时间内的系统调用量,并获取该待接入系统在第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差,直至所述标准方差不为0,所述第一预设时间与所述第二预设时间为过去时间,所述第一预设时间不等于所述第二预设时间;
若所述标准方差不为0,则过滤系统调用数据中为空的数据及不符合预定格式的数据,将过滤后得到的系统调用数据作为待用的系统调用数据。
8.根据权利要求5或6所述的预测系统调用量的方法,其特征在于,所述步骤S5之后,还包括:
S6,按照预设的剔除规则依次剔除待训练因子数据,在每次剔除待训练因子数据后,利用剔除后剩余的待训练因子数据对所述模型进行训练,得到训练后用于预测该待接入系统的调用量的各个第二模型;
S7,分别获取各个第二模型预测该待接入系统的调用量对应的各个准确率,根据所述各个准确率对所剔除的待训练因子数据进行评价。
9.根据权利要求8所述的预测系统调用量的方法,其特征在于,所述步骤S7之后,还包括:
若有第二模型对应的准确率小于预设预设的数值,则将训练该第二模型中所剔除的待训练因子数据作为重要因子数据进行推荐;
建立该待接入系统与对应的重要因子数据的关联关系并保存。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现如权利要求5至9中任一项所述的预测系统调用量的方法的步骤。

说明书全文

服务器、预测系统调用量的方法及存储介质

技术领域

[0001] 本发明涉及通信技术领域,尤其涉及一种服务器、预测系统调用量的方法及存储介质。

背景技术

[0002] 目前,在大型的互联网金融企业旗下有大量的重要的系统,这些系统经常出现由于系统调用量激增,导致系统崩溃的问题。现有技术中通常采用监控系统调用量的方法为系统监控方式,但是这种系统监控方式具有以下不足:采用系统监控方式时效性较差,在出现问题再采用补救措施已经来不及,且系统调用量缺乏系统的管理,不利于数据的积累和长期的分析。

发明内容

[0003] 本发明的目的在于提供一种服务器、预测系统调用量的方法及存储介质,旨在对待接入系统的调用量进行准确的预测。
[0004] 为实现上述目的,本发明提供一种服务器,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
[0005] 分别获取待接入系统与各已接入系统的系统参数,基于所述系统参数计算待接入系统与各已接入系统的系统相似度;
[0006] 若有待接入系统与已接入系统的系统相似度大于预设相似度阈值,则获取该已接入系统的因子数据,以该因子数据作为该待接入系统的待训练因子数据,所述因子数据包括时间、网络类型、主机数量、注册用户数量、系统调用量、业务类型、节假日因素;
[0007] 若待接入系统与各已接入系统的系统相似度均小于或等于预设相似度阈值,则获取待接入系统在预设时间内的系统调用数据,对待接入系统的系统调用数据进行预处理,得到待用的系统调用数据;
[0008] 基于所述待用的系统调用数据获取该待接入系统的系统特征因子及基本因子,以该系统特征因子及基本因子作为该待接入系统的待训练因子数据;
[0009] 基于待接入系统的待训练因子数据对预设的模型进行训练,得到训练后用于预测该待接入系统的调用量的第一模型。
[0010] 优选地,所述系统参数包括业务类型、系统架构类型、部署环境类型、业务量及用户量,所述基于所述系统参数计算待接入系统与各已接入系统的系统相似度的步骤,具体包括:
[0011] 基于所述系统参数分别获取待接入系统与各已接入系统的业务类型的相似值a1、系统架构的相似值a2、部署环境的相似值a3、业务量的相似值a4及用户量的相似值a5,并获取业务类型预设的权重W1、系统架构类型预设的权重W2、部署环境类型预设的权重W3、业务量预设的权重W4及用户量预设的权重W5,计算系统相似度R=a1*W1+a2*W2+a3*W3+a4*W4+a5*W5。
[0012] 优选地,所述系统调用数据包括系统调用量,所述对待接入系统的系统调用数据进行预处理的步骤,具体包括:
[0013] 获取所述待接入系统在第一预设时间内的系统调用量,计算所述系统调用量在该第一预设时间内的标准方差;
[0014] 若所述标准方差为0,则过滤该第一预设时间内的系统调用量,并获取该待接入系统在第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差,直至所述标准方差不为0,所述第一预设时间与所述第二预设时间为过去时间,所述第一预设时间不等于所述第二预设时间;
[0015] 若所述标准方差不为0,则过滤系统调用数据中为空的数据及不符合预定格式的数据,将过滤后得到的系统调用数据作为待用的系统调用数据。
[0016] 优选地,所述处理系统被所述处理器执行时,还实现如下步骤:
[0017] 按照预设的剔除规则依次剔除待训练因子数据,在每次剔除待训练因子数据后,利用剔除后剩余的待训练因子数据对所述模型进行训练,得到训练后用于预测该待接入系统的调用量的各个第二模型;
[0018] 分别获取各个第二模型预测该待接入系统的调用量对应的各个准确率,根据所述各个准确率对所剔除的待训练因子数据进行评价。
[0019] 为实现上述目的,本发明还提供一种预测系统调用量的方法,所述预测系统调用量的方法包括:
[0020] S1,分别获取待接入系统与各已接入系统的系统参数,基于所述系统参数计算待接入系统与各已接入系统的系统相似度;
[0021] S2,若有待接入系统与已接入系统的系统相似度大于预设相似度阈值,则获取该已接入系统的因子数据,以该因子数据作为该待接入系统的待训练因子数据,所述因子数据包括时间、网络类型、主机数量、注册用户数量、系统调用量、业务类型、节假日因素;
[0022] S3,若待接入系统与各已接入系统的系统相似度均小于或等于预设相似度阈值,则获取待接入系统在预设时间内的系统调用数据,对待接入系统的系统调用数据进行预处理,得到待用的系统调用数据;
[0023] S4,基于所述待用的系统调用数据获取该待接入系统的系统特征因子及基本因子,以该系统特征因子及基本因子作为该待接入系统的待训练因子数据;
[0024] S5,基于待接入系统的待训练因子数据对预设的模型进行训练,得到训练后用于预测该待接入系统的调用量的第一模型。
[0025] 优选地,所述系统参数包括业务类型、系统架构类型、部署环境类型、业务量及用户量,所述步骤S1,具体包括:
[0026] 基于所述系统参数分别获取待接入系统与各已接入系统的业务类型的相似值a1、系统架构的相似值a2、部署环境的相似值a3、业务量的相似值a4及用户量的相似值a5,并获取业务类型预设的权重W1、系统架构类型预设的权重W2、部署环境类型预设的权重W3、业务量预设的权重W4及用户量预设的权重W5,计算系统相似度R=a1*W1+a2*W2+a3*W3+a4*W4+a5*W5。
[0027] 优选地,所述系统调用数据包括系统调用量,所述步骤S3,具体包括:
[0028] 获取所述待接入系统在第一预设时间内的系统调用量,计算所述系统调用量在该第一预设时间内的标准方差;
[0029] 若所述标准方差为0,则过滤该第一预设时间内的系统调用量,并获取该待接入系统在第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差,直至所述标准方差不为0,所述第一预设时间与所述第二预设时间为过去时间,所述第一预设时间不等于所述第二预设时间;
[0030] 若所述标准方差不为0,则过滤系统调用数据中为空的数据及不符合预定格式的数据,将过滤后得到的系统调用数据作为待用的系统调用数据。
[0031] 优选地,所述步骤S5之后,还包括:
[0032] S6,按照预设的剔除规则依次剔除待训练因子数据,在每次剔除待训练因子数据后,利用剔除后剩余的待训练因子数据对所述模型进行训练,得到训练后用于预测该待接入系统的调用量的各个第二模型;
[0033] S7,分别获取各个第二模型预测该待接入系统的调用量对应的各个准确率,根据所述各个准确率对所剔除的待训练因子数据进行评价。
[0034] 优选地,所述步骤S7之后,还包括:
[0035] 若有第二模型对应的准确率小于预设预设的数值,则将训练该第二模型中所剔除的待训练因子数据作为重要因子数据进行推荐;
[0036] 建立该待接入系统与对应的重要因子数据的关联关系并保存。
[0037] 本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的预测系统调用量的方法的步骤。
[0038] 本发明的有益效果是:本发明在对系统的调用量进行预测之前,首先计算待接入系统与各已接入系统的系统相似度,如果待接入系统与各已接入系统均不是相似的系统,则对待接入系统的历史系统调用数据进行筛选等预处理操作,得到待用的系统调用数据,然后从待用的系统调用数据中获取该待接入系统的系统特征因子及基本因子作为该待接入系统的待训练因子数据,利用待训练因子数据训练模型以构建得到用于预测该待接入系统未来的调用量的模型,通过这种方式,利用大数据分析的方法构建预测模型,以对待接入系统未来的调用量进行准确的预测,以应对系统异常问题;对系统的调用量数据进行统一管理,有利于数据的积累和长期的分析。附图说明
[0039] 图1为本发明各个实施例一可选的应用环境示意图;
[0040] 图2为本发明预测系统调用量的方法第一实施例的流程示意图;
[0041] 图3为本发明预测系统调用量的方法第二实施例的流程示意图。

具体实施方式

[0042] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0043] 需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
[0044] 参阅图1所示,是本发明预测系统调用量的方法的较佳实施例的应用环境示意图。该应用环境示意图包括服务器1及多个待接入系统2。服务器1可以通过网络、近场通信技术等适合的技术与待接入系统2所在的终端进行数据交互。
[0045] 所述服务器1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述服务器1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
[0046] 在本实施例中,服务器1可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的处理系统。需要指出的是,图1仅示出了具有组件11-13的服务器1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
[0047] 其中,存储器11包括内存及至少一种类型的可读存储介质。内存为服务器1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是服务器1的内部存储单元,例如该服务器1的硬盘;在另一些实施例中,该非易失性存储介质也可以是服务器1的外部存储设备,例如服务器1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于服务器1的操作系统和各类应用软件,例如本发明一实施例中的处理系统的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0048] 所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器微控制器微处理器、或其他数据处理芯片。该处理器12通常用于控制所述服务器1的总体操作,例如执行与其他终端进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行处理系统等。
[0049] 所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述服务器1与其他电子设备之间建立通信连接。本实施例中,网络接口13主要用于将服务器1与一个或多个终端设备2相连,在服务器1与一个或多个终端设备2之间建立数据传输通道和通信连接。
[0050] 所述处理系统存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器器12执行,以实现本申请各实施例的方法;以及,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被划为不同的逻辑模
[0051] 在一实施例中,上述处理系统被所述处理器12执行时实现如下步骤:
[0052] 分别获取待接入系统与各已接入系统的系统参数,基于所述系统参数计算待接入系统与各已接入系统的系统相似度;
[0053] 其中,服务器给待接入系统提供接入接口,接收待接入系统的系统参数及系统调用数据,分别用于计算系统相似度及训练模型。系统参数包括业务类型、系统架构类型、部署环境类型、业务量及用户量。例如,业务类型包括保险、产险、寿险、车险等;系统架构类型包括移动端架构、PC端架构等;部署环境类型为部署的区域,包括北上广深等;业务量及用户量为数量级别。
[0054] 在一实施例中,基于系统参数计算待接入系统与各已接入系统的系统相似度包括:基于所述系统参数分别获取待接入系统与各已接入系统的业务类型的相似值a1、系统架构的相似值a2、部署环境的相似值a3、业务量的相似值a4及用户量的相似值a5,并获取业务类型预设的权重W1、系统架构类型预设的权重W2、部署环境类型预设的权重W3、业务量预设的权重W4及用户量预设的权重W5,计算系统相似度R=a1*W1+a2*W2+a3*W3+a4*W4+a5*W5,其中,权重代表该系统参数对于系统的重要程度,如果权重越大,则该系统参数越重要。
[0055] 在一具体的实例中,对于业务类型,如果待接入系统与某个已接入系统的业务类型全部相同,则该待接入系统与该已接入系统对应的相似值为1,如果业务类型有3种相同,例如,待接入系统与该已接入系统都有保险、产险、寿险3种业务,则对应的相似值为0.8,如果业务类型有2种相同,例如,待接入系统与该已接入系统都有保险、产险,则对应的相似值为0.6。对于系统架构,如果待接入系统与某个已接入系统的系统架构全部相同,则该待接入系统与该已接入系统对应的相似值为1,如果系统架构有一种相同,例如,待接入系统与该已接入系统的系统架构类型仅包括移动端架构,则对应的相似值为0.8。对于部署环境,待接入系统与某个已接入系统的部署环境全部相同,则该待接入系统与该已接入系统对应的相似值为1,如果部署环境有3个相同,例如,部署的区域都包括北上广地区,则对应的相似值为0.8,如果部署环境有2个相同,例如,部署的区域都包括北京及上海,则对应的相似值为0.6。对于业务量,如果待接入系统与某个已接入系统的业务量的数量级别相同,例如,均为千万级别,则该待接入系统与该已接入系统对应的相似值为1,如果业务量的数量级别不相同,例如,待接入系统为千万级别,已接入系统为百万级别,则对应的相似值为0.6。对于用户量,如果待接入系统与某个已接入系统的用户量的数量级别相同,则该待接入系统与该已接入系统对应的相似值为1,如果用户量的数量级别不相同,例如,待接入系统为千万级别,已接入系统为百万级别,则对应的相似值为0.6。
[0056] 若有待接入系统与已接入系统的系统相似度大于预设相似度阈值,则获取该已接入系统的因子数据,以该因子数据作为该待接入系统的待训练因子数据;
[0057] 其中,预设相似度阈值例如为0.85。已接入系统使用与已接入系统相同的方法来预测未来的调用量,如果有已接入系统与该待接入系统的系统相似度大于预设相似度阈值,则可以认为两系统较相似,可以直接采用已接入系统使用的因子数据作为该待接入系统的待训练因子数据。
[0058] 其中,因子数据包括时间、网络类型、主机数量、注册用户数量、系统调用量、业务类型、节假日因素等,该因子数据可以直接用于训练模型。
[0059] 若待接入系统与各已接入系统的系统相似度均小于或等于预设相似度阈值,则获取待接入系统在预设时间内的系统调用数据,对待接入系统的系统调用数据进行预处理,得到待用的系统调用数据;
[0060] 其中,如果在各已接入系统中,均与待接入系统的系统相似度小于或等于预设相似度阈值,则认为该待接入系统与各已接入系统均不相似,这时,需要获取待接入系统中的历史系统调用数据,通过对系统调用数据进行预处理得到待用的系统调用数据。
[0061] 在一实施例中,对待接入系统的系统调用数据进行预处理包括:获取所述待接入系统在第一预设时间内的系统调用量,计算所述系统调用量在该第一预设时间内的标准方差;若所述标准方差为0,则过滤该第一预设时间内的系统调用量,并获取该待接入系统在第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差;若所述标准方差不为0,则过滤系统调用数据中为空的数据及不符合预定格式的数据,将过滤后得到的系统调用数据作为待用的系统调用数据。
[0062] 其中,系统调用数据为未经预处理的数据,包括:系统调用量、时间、网络类型、主机数量、注册用户数量、业务类型、节假日因素等,第一预设时间为过去的一段时间,例如为过去的一个月或者两个月,第二预设时间与第一预设时间不同,例如,第一预设时间为过去的两个月,则第二预设时间为过去的一个月。通过计算待接入系统在过去一段时间内的系统调用量的标准方差,通过标准方差判定该待接入系统的稳定性,即是否出现异常情况。
[0063] 若待接入系统的标准方差为0,则判定在该段时间内所有的系统调用量相等,不能作为考虑范围内的因子数据。例如,对于12306订票系统,如果过去一个月内每天买票的数量均相等,则视为异常的情况,该一个月内的系统调用数据不能作为考虑范围内的因子数据,可过滤该一个月内的系统调用数据。另外取第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差,并再次分析该标准方差是否为0,若标准方差为0则过滤该第二预设时间内的系统调用数据,再取其他时间段内的系统调用量计算标准方差,依此类推,直至能够获取标准方差不为0的系统调用量。
[0064] 如果待接入系统在第一预设时间内的系统调用量的标准方差不为0,则对于该第一预设时间内的系统调用数据进行处理,包括:过滤系统调用数据中为空的数据,过滤不符合预定格式的数据,例如,日期格式不符合预定格式的数据进行过滤,数值类型不是预定数值类型的数据进行过滤,经过上述的过滤处理后,得到待用的系统调用数据。
[0065] 基于所述待用的系统调用数据获取该待接入系统的系统特征因子及基本因子,以该系统特征因子及基本因子作为该待接入系统的待训练因子数据;
[0066] 其中,从待用的系统调用数据中获取该待接入系统的系统特征因子及基本因子,基本因子为基本上均会影响每个待接入系统的调用量的因子,其包括时间、网络类型、主机数量、注册用户数量、系统调用量等;系统特征因子为该待接入系统特有的影响该待接入系统的调用量的因子,其包括业务类型、节假日因素等。本实施例并不限定于上述系统特征因子及基本因子,可以根据待接入系统的实际情况选择系统特征因子及基本因子。
[0067] 在一具体的实例中,若待接入系统为寿险系统,则基本因子包括时间、网络类型、主机数量、注册用户数量、系统调用量中的至少几种,在系统特征因子中,若业务类型包括寿险、养老险,则节假日因素例如为双12是否有寿险及养老险的秒杀活动、重阳节当天是否推出寿险及养老险的折扣及折扣的多少等等,这些节假日因素很大程度上影响系统调用量。
[0068] 基于待接入系统的待训练因子数据对预设的模型进行训练,得到训练后用于预测该待接入系统的调用量的第一模型。
[0069] 其中,预设的模型优选为RNN神经网络模型。在一实施例中,在利用上述待接入系统的待训练因子数据对RNN神经网络模型进行训练的过程中,首先确定该RNN神经网络模型的训练的次数,如果有已接入系统与该待接入系统相似(例如,系统相似度大于某一预设的阈值),则可以使用已接入系统的模型对应的训练次数,如果已接入系统与该待接入系统都不相似,则根据待接入系统提供的待用的系统调用数据的数据量确定训练的次数,如果待用的系统调用数据的数据量较多,则训练的次数可以相对少,如果待用的系统调用数据的数据量较少,则训练的次数可以相对多。
[0070] 在一实施例中,利用上述待接入系统的待训练因子数据对RNN神经网络模型进行训练包括:将待训练因子数据的75%数据作为训练集,将剩余的20%或者25%作为验证集,在用训练集训练了RNN神经网络模型之后,利用验证集对训练后的RNN神经网络模型进行验证,如果模型的准确率大于预设阈值(例如0.985),则训练后的RNN神经网络模型可以用于预测,如果准确率不大于预设阈值,则可增加待训练因子数据再进行训练,直至训练后的RNN神经网络模型的准确率大于预设阈值。在训练后得到第一模型后,可以对该待接入系统未来的调用量作出预测。例如,对于12306系统,给出1-19号的历史系统调用数据来训练模型,然后利用训练后的模型预测20号的调用量,以利用该调用量预测20号买票的用户的数量。
[0071] 与现有技术相比,本实施例在对系统的调用量进行预测之前,首先计算待接入系统与各已接入系统的系统相似度,如果待接入系统与各已接入系统均不是相似的系统,则对待接入系统的历史系统调用数据进行筛选等预处理操作,得到待用的系统调用数据,然后从待用的系统调用数据中获取该待接入系统的系统特征因子及基本因子作为该待接入系统的待训练因子数据,利用待训练因子数据训练模型以构建得到用于预测该待接入系统未来的调用量的模型,通过这种方式,利用大数据分析的方法构建预测模型,以对待接入系统未来的调用量进行准确的预测,以应对系统异常问题;对系统的调用量数据进行统一管理,有利于数据的积累和长期的分析。
[0072] 在一优选的实施例中,为了对待接入系统的待训练因子数据及时进行调整,需要对预测结果进行跟进及评价,根据预测结果及实际情况对待接入系统的待训练因子数据进行评价及调整,上述处理系统被所述处理器执行时,还实现如下步骤:
[0073] 按照预设的剔除规则依次剔除待训练因子数据,在每次剔除待训练因子数据后,利用剔除后剩余的待训练因子数据对所述模型进行训练,得到训练后用于预测该待接入系统的调用量的各个第二模型;分别获取各个第二模型预测该待接入系统的调用量对应的各个准确率,根据所述各个准确率对所剔除的待训练因子数据进行评价。
[0074] 其中,预设的剔除规则包括:将待训练因子数据排序,按照先后顺序逐一剔除某个待训练因子数据,或者,将待训练因子数据排序,按照先后顺序逐两个剔除待训练因子数据,等。
[0075] 其中,第二模型与第一模型同为RNN神经网络模型。
[0076] 在一优选的实施例中,为了对重要的待训练因子数据进行较好管理,上述处理系统被所述处理器执行时,还实现如下步骤:
[0077] 若有第二模型对应的准确率小于预设预设的数值,则将训练该第二模型中所剔除的待训练因子数据作为重要因子数据进行推荐;建立该待接入系统与对应的重要因子数据的关联关系并保存。
[0078] 其中,如果剔除某个或者某几个待训练因子数据后,对应的训练后的第二模型的准确率小于预设预设的数值,即明显下降,则认为所剔除的某个或者某几个待训练因子数据为对于该待接入系统较重要的数据;如果剔除某个或者某几个待训练因子数据后,对应的训练后的第二模型的准确率变化不大,则认为所剔除的某个或者某几个待训练因子数据为对于该待接入系统不重要的数据,可以将其排除,不作为训练模型的待训练因子数据。
[0079] 对于较重要的待训练因子数据,可以对其进行推荐,进一步地,还可以对较重要的待训练因子数据,建立其与对应的待接入系统的关联关系并保存,以对待训练因子数据进行系统的管理,有利于数据的积累和长期的分析。
[0080] 如图2所示,图2为本发明预测系统调用量的方法一实施例的流程示意图,该预测系统调用量的方法包括以下步骤:
[0081] 步骤S1,分别获取待接入系统与各已接入系统的系统参数,基于所述系统参数计算待接入系统与各已接入系统的系统相似度;
[0082] 步骤S12,分析待接入系统与已接入系统的系统相似度是否大于预设相似度阈值;
[0083] 其中,服务器给待接入系统提供接入接口,接收待接入系统的系统参数及系统调用数据,分别用于计算系统相似度及训练模型。系统参数包括业务类型、系统架构类型、部署环境类型、业务量及用户量。例如,业务类型包括保险、产险、寿险、车险等;系统架构类型包括移动端架构、PC端架构等;部署环境类型为部署的区域,包括北上广深等;业务量及用户量为数量级别。
[0084] 在一实施例中,基于系统参数计算待接入系统与各已接入系统的系统相似度包括:基于所述系统参数分别获取待接入系统与各已接入系统的业务类型的相似值a1、系统架构的相似值a2、部署环境的相似值a3、业务量的相似值a4及用户量的相似值a5,并获取业务类型预设的权重W1、系统架构类型预设的权重W2、部署环境类型预设的权重W3、业务量预设的权重W4及用户量预设的权重W5,计算系统相似度R=a1*W1+a2*W2+a3*W3+a4*W4+a5*W5,其中,权重代表该系统参数对于系统的重要程度,如果权重越大,则该系统参数越重要。
[0085] 在一具体的实例中,对于业务类型,如果待接入系统与某个已接入系统的业务类型全部相同,则该待接入系统与该已接入系统对应的相似值为1,如果业务类型有3种相同,例如,待接入系统与该已接入系统都有保险、产险、寿险3种业务,则对应的相似值为0.8,如果业务类型有2种相同,例如,待接入系统与该已接入系统都有保险、产险,则对应的相似值为0.6。对于系统架构,如果待接入系统与某个已接入系统的系统架构全部相同,则该待接入系统与该已接入系统对应的相似值为1,如果系统架构有一种相同,例如,待接入系统与该已接入系统的系统架构类型仅包括移动端架构,则对应的相似值为0.8。对于部署环境,待接入系统与某个已接入系统的部署环境全部相同,则该待接入系统与该已接入系统对应的相似值为1,如果部署环境有3个相同,例如,部署的区域都包括北上广地区,则对应的相似值为0.8,如果部署环境有2个相同,例如,部署的区域都包括北京及上海,则对应的相似值为0.6。对于业务量,如果待接入系统与某个已接入系统的业务量的数量级别相同,例如,均为千万级别,则该待接入系统与该已接入系统对应的相似值为1,如果业务量的数量级别不相同,例如,待接入系统为千万级别,已接入系统为百万级别,则对应的相似值为0.6。对于用户量,如果待接入系统与某个已接入系统的用户量的数量级别相同,则该待接入系统与该已接入系统对应的相似值为1,如果用户量的数量级别不相同,例如,待接入系统为千万级别,已接入系统为百万级别,则对应的相似值为0.6。
[0086] 步骤S2,若有待接入系统与已接入系统的系统相似度大于预设相似度阈值,则获取该已接入系统的因子数据,以该因子数据作为该待接入系统的待训练因子数据;
[0087] 其中,预设相似度阈值例如为0.85。已接入系统使用与已接入系统相同的方法来预测未来的调用量,如果有已接入系统与该待接入系统的系统相似度大于预设相似度阈值,则可以认为两系统较相似,可以直接采用已接入系统使用的因子数据作为该待接入系统的待训练因子数据。
[0088] 其中,因子数据包括时间、网络类型、主机数量、注册用户数量、系统调用量、业务类型、节假日因素等,该因子数据可以直接用于训练模型。
[0089] 步骤S3,若待接入系统与各已接入系统的系统相似度均小于或等于预设相似度阈值,则获取待接入系统在预设时间内的系统调用数据,对待接入系统的系统调用数据进行预处理,得到待用的系统调用数据;
[0090] 其中,如果在各已接入系统中,均与待接入系统的系统相似度小于或等于预设相似度阈值,则认为该待接入系统与各已接入系统均不相似,这时,需要获取待接入系统中的历史系统调用数据,通过对系统调用数据进行预处理得到待用的系统调用数据。
[0091] 在一实施例中,对待接入系统的系统调用数据进行预处理包括:获取所述待接入系统在第一预设时间内的系统调用量,计算所述系统调用量在该第一预设时间内的标准方差;若所述标准方差为0,则过滤该第一预设时间内的系统调用量,并获取该待接入系统在第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差;若所述标准方差不为0,则过滤系统调用数据中为空的数据及不符合预定格式的数据,将过滤后得到的系统调用数据作为待用的系统调用数据。
[0092] 其中,系统调用数据为未经预处理的数据,包括:系统调用量、时间、网络类型、主机数量、注册用户数量、业务类型、节假日因素等,第一预设时间为过去的一段时间,例如为过去的一个月或者两个月,第二预设时间与第一预设时间不同,例如,第一预设时间为过去的两个月,则第二预设时间为过去的一个月。通过计算待接入系统在过去一段时间内的系统调用量的标准方差,通过标准方差判定该待接入系统的稳定性,即是否出现异常情况。
[0093] 若待接入系统的标准方差为0,则判定在该段时间内所有的系统调用量相等,不能作为考虑范围内的因子数据。例如,对于12306订票系统,如果过去一个月内每天买票的数量均相等,则视为异常的情况,该一个月内的系统调用数据不能作为考虑范围内的因子数据,可过滤该一个月内的系统调用数据。另外取第二预设时间内的系统调用量,以计算该系统调用量在该第二预设时间内的标准方差,并再次分析该标准方差是否为0,若标准方差为0则过滤该第二预设时间内的系统调用数据,再取其他时间段内的系统调用量计算标准方差,依此类推,直至能够获取标准方差不为0的系统调用量。
[0094] 如果待接入系统在第一预设时间内的系统调用量的标准方差不为0,则对于该第一预设时间内的系统调用数据进行处理,包括:过滤系统调用数据中为空的数据,过滤不符合预定格式的数据,例如,日期格式不符合预定格式的数据进行过滤,数值类型不是预定数值类型的数据进行过滤,经过上述的过滤处理后,得到待用的系统调用数据。
[0095] 步骤S4,基于所述待用的系统调用数据获取该待接入系统的系统特征因子及基本因子,以该系统特征因子及基本因子作为该待接入系统的待训练因子数据;
[0096] 其中,从待用的系统调用数据中获取该待接入系统的系统特征因子及基本因子,基本因子为基本上均会影响每个待接入系统的调用量的因子,其包括时间、网络类型、主机数量、注册用户数量、系统调用量等;系统特征因子为该待接入系统特有的影响该待接入系统的调用量的因子,其包括业务类型、节假日因素等。本实施例并不限定于上述系统特征因子及基本因子,可以根据待接入系统的实际情况选择系统特征因子及基本因子。
[0097] 在一具体的实例中,若待接入系统为寿险系统,则基本因子包括时间、网络类型、主机数量、注册用户数量、系统调用量中的至少几种,在系统特征因子中,若业务类型包括寿险、养老险,则节假日因素例如为双12是否有寿险及养老险的秒杀活动、重阳节当天是否推出寿险及养老险的折扣及折扣的多少等等,这些节假日因素很大程度上影响系统调用量。
[0098] 步骤S5,基于待接入系统的待训练因子数据对预设的模型进行训练,得到训练后用于预测该待接入系统的调用量的第一模型。
[0099] 其中,预设的模型优选为RNN神经网络模型。在一实施例中,在利用上述待接入系统的待训练因子数据对RNN神经网络模型进行训练的过程中,首先确定该RNN神经网络模型的训练的次数,如果有已接入系统与该待接入系统相似(例如,系统相似度大于某一预设的阈值),则可以使用已接入系统的模型对应的训练次数,如果已接入系统与该待接入系统都不相似,则根据待接入系统提供的待用的系统调用数据的数据量确定训练的次数,如果待用的系统调用数据的数据量较多,则训练的次数可以相对少,如果待用的系统调用数据的数据量较少,则训练的次数可以相对多。
[0100] 在一实施例中,利用上述待接入系统的待训练因子数据对RNN神经网络模型进行训练包括:将待训练因子数据的75%数据作为训练集,将剩余的20%或者25%作为验证集,在用训练集训练了RNN神经网络模型之后,利用验证集对训练后的RNN神经网络模型进行验证,如果模型的准确率大于预设阈值(例如0.985),则训练后的RNN神经网络模型可以用于预测,如果准确率不大于预设阈值,则可增加待训练因子数据再进行训练,直至训练后的RNN神经网络模型的准确率大于预设阈值。在训练后得到第一模型后,可以对该待接入系统未来的调用量作出预测。例如,对于12306系统,给出1-19号的历史系统调用数据来训练模型,然后利用训练后的模型预测20号的调用量,以利用该调用量预测20号买票的用户的数量。
[0101] 与现有技术相比,本实施例在对系统的调用量进行预测之前,首先计算待接入系统与各已接入系统的系统相似度,如果待接入系统与各已接入系统均不是相似的系统,则对待接入系统的历史系统调用数据进行筛选等预处理操作,得到待用的系统调用数据,然后从待用的系统调用数据中获取该待接入系统的系统特征因子及基本因子作为该待接入系统的待训练因子数据,利用待训练因子数据训练模型以构建得到用于预测该待接入系统未来的调用量的模型,通过这种方式,利用大数据分析的方法构建预测模型,以对待接入系统未来的调用量进行准确的预测,以应对系统异常问题;对系统的调用量数据进行统一管理,有利于数据的积累和长期的分析。
[0102] 在一优选的实施例中,为了对待接入系统的待训练因子数据及时进行调整,需要对预测结果进行跟进及评价,根据预测结果及实际情况对待接入系统的待训练因子数据进行评价及调整,如图3所示,所述步骤S5之后,还包括:
[0103] 步骤S6,按照预设的剔除规则依次剔除待训练因子数据,在每次剔除待训练因子数据后,利用剔除后剩余的待训练因子数据对所述模型进行训练,得到训练后用于预测该待接入系统的调用量的各个第二模型;
[0104] 步骤S7,分别获取各个第二模型预测该待接入系统的调用量对应的各个准确率,根据所述各个准确率对所剔除的待训练因子数据进行评价。
[0105] 其中,预设的剔除规则包括:将待训练因子数据排序,按照先后顺序逐一剔除某个待训练因子数据,或者,将待训练因子数据排序,按照先后顺序逐两个剔除待训练因子数据,等。
[0106] 其中,第二模型与第一模型同为RNN神经网络模型。
[0107] 在一优选的实施例中,为了对重要的待训练因子数据进行较好管理,上述所述步骤S7之后,还包括:
[0108] 若有第二模型对应的准确率小于预设预设的数值,则将训练该第二模型中所剔除的待训练因子数据作为重要因子数据进行推荐;建立该待接入系统与对应的重要因子数据的关联关系并保存。
[0109] 其中,如果剔除某个或者某几个待训练因子数据后,对应的训练后的第二模型的准确率小于预设预设的数值,即明显下降,则认为所剔除的某个或者某几个待训练因子数据为对于该待接入系统较重要的数据;如果剔除某个或者某几个待训练因子数据后,对应的训练后的第二模型的准确率变化不大,则认为所剔除的某个或者某几个待训练因子数据为对于该待接入系统不重要的数据,可以将其排除,不作为训练模型的待训练因子数据。
[0110] 对于较重要的待训练因子数据,可以对其进行推荐,进一步地,还可以对较重要的待训练因子数据,建立其与对应的待接入系统的关联关系并保存,以对待训练因子数据进行系统的管理,有利于数据的积累和长期的分析。
[0111] 本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的预测系统调用量的方法的步骤。
[0112] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0113] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0114] 以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈