首页 / 专利库 / 企业组织 / IT治理 / 一种运维监控数据治理方法

一种运维监控数据治理方法

阅读:719发布:2020-05-13

专利汇可以提供一种运维监控数据治理方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种运维监控 数据治理 方法,包括1)采集维护对象监控指标下的不同类型的运维数据;2)对运维数据进行规整排列,存储于 数据库 ;3)依据规整排列后的运维数据构建治理模型;4)依据治理模型任意选取数据库中某一 节点 作为起始节点,根据起始节点的 阈值 ,判断进入哪个节点,直到遍历同数据类型的所有节点,并输出预测值;5)重复执行步骤4)直到遍历整个数据库,并且全部输出了预测值;6)依据预测值对维护对象的运营状况做出分析和判断。通过统计 算法 拉依达准则加权移动平均值的控制图和基于有 监督学习 算法和 无监督学习 算法相结合的运维监控数据治理,从 数据采集 、治理、存储和分析服务四个步骤实现IT运维监控数据 质量 的提高。,下面是一种运维监控数据治理方法专利的具体信息内容。

1.一种运维监控数据治理方法,其特征在于:包括如下步骤:
1)采集维护对象监控指标下的不同类型的运维数据;
2)对运维数据进行规整排列,存储于数据库
3)依据规整排列后的运维数据构建治理模型;
4)依据治理模型任意选取数据库中某一节点作为起始节点,根据起始节点的阈值,判断进入哪个节点,直到遍历同数据类型的所有节点,并输出预测值;
5)重复执行步骤4)直到遍历整个数据库,并且全部输出了预测值;
6)依据预测值对维护对象的运营状况做出分析和判断。
2.根据权利要求1所述的运维监控数据治理方法,其特征在于:所述运维数据包括指标数据和日志数据;
所述指标数据是时序数据,其包括指标采集时间和对应指标的值;
所述日志文本数据是半结构化文本格式,包括程数据库日志和中间件日志。
3.根据权利要求2所述的运维监控数据治理方法,其特征在于:根据指标数据和日志数据数据源的格式,采用相应的分析方法,建立相应的数据模型,制定出合适的数据采集策略。
4.根据权利要求2或3所述的运维监控数据治理方法,其特征在于:所述指标数据采集方法如下:
依据不同的维护对象,建立同一接收通道,
对维护对象的指标数据进行实时采集,
对采集的数据进行统计、翻译、计算以及自定义,
按照自定义的分类结果分别进行存储。
5.根据权利要求2或3所述的运维监控数据治理方法,其特征在于:所述日志数据采集方法如下:
依据不同的维护对象,建立接收者采集通道,
每一采集通道对维护对象的运维数据进行实时采集,
每一采集通道对实时采集的数据进行处理,按照采集源、汇特征进行分类,按照分类结果分别进行存储。
6.根据权利要求1所述的运维监控数据治理方法,其特征在于:使用统计算法和无监督算法过滤掉大量正样本,对样本库进行人工标注,包括先人工标注正负样本,然后通过特征工程提取特征值,通过设置有监督算法随机森林的参数进行训练,从而实现IT运维监控数据质量的提高。

说明书全文

一种运维监控数据治理方法

技术领域

[0001] 本发明涉及电IT运维监控数据分析方法,特别是指统计算法机器学习算法相结合的运维监控数据治理方法。

背景技术

[0002] IT运维监控系统相对独立,并且数据种类繁多和数据格式不统一,存在网络数据、应用性能数据、机房数据、服务器数据、平台性能数据、数据库性能数据和终端数据等,数据特点是数据分散、数据量大和数据标准和规范不统一等,造成数据共享困难,导致运维监控数据的开发利用满足不了运维监控业务的需要。
[0003] 发明的目的及亮点
[0004] 为了实现IT运维监控数据质量的提高,应用统计算法3-sigma(拉依达准则)和EWMA(加权移动平均值的控制图),并结合监督学习算法One Class SVM和有监督学习算法Random Forest(随机森林),实现了性能指标数据和日志数据质量的提高。
[0005] 具体的方案如下:
[0006] 一种运维监控数据治理方法,包括如下步骤:
[0007] 1)采集维护对象监控指标下的不同类型的运维数据;
[0008] 2)对运维数据进行规整排列,存储于数据库;
[0009] 3)依据规整排列后的运维数据构建治理模型;
[0010] 4)依据治理模型任意选取数据库中某一节点作为起始节点,根据起始节点的阈值,判断进入哪个节点,直到遍历同数据类型的所有节点,并输出预测值;
[0011] 5)重复执行步骤4)直到遍历整个数据库,并且全部输出了预测值;
[0012] 6)依据预测值对维护对象的运营状况做出分析和判断。
[0013] 优选的,所述运维数据包括指标数据和日志数据;
[0014] 所述指标数据是时序数据,其包括指标采集时间和对应指标的值;
[0015] 所述日志文本数据是半结构化文本格式,包括程数据库日志和中间件日志。
[0016] 优选的,根据指标数据和日志数据数据源的格式,采用相应的分析方法,建立相应的数据模型,制定出合适的数据采集策略。
[0017] 优选的,所述指标数据采集方法如下:
[0018] 依据不同的维护对象,建立同一接收通道,
[0019] 对维护对象的指标数据进行实时采集,
[0020] 对采集的数据进行统计、翻译、计算以及自定义,
[0021] 按照自定义的分类结果分别进行存储。
[0022] 优选的,所述日志数据采集方法如下:
[0023] 依据不同的维护对象,建立接收者采集通道,
[0024] 每一采集通道对维护对象的运维数据进行实时采集,
[0025] 每一采集通道对实时采集的数据进行处理,按照采集源、汇特征进行分类,按照分类结果分别进行存储。
[0026] 优选的,使用统计算法和无监督算法过滤掉大量正样本,对样本库进行人工标注,包括先人工标注正负样本,然后通过特征工程提取特征值,通过设置有监督算法随机森林的参数进行训练,从而实现IT运维监控数据质量的提高。
[0027] 通过统计算法3-sigma(拉依达准则)和EWMA(加权移动平均值的控制图)和基于有监督学习算法和无监督学习算法相结合的运维监控数据治理技术研究,从数据采集、治理、存储和分析服务四个步骤实现IT运维监控数据质量的提高。
[0029] 为了更清楚地说明本发明实施例现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0030] 图1为本发明数据分析方法图;
[0031] 图2为本发明指标数据采集流程图
[0032] 图3为本发明日志采集流程图;
[0033] 图4为本发明数据治理流程图。

具体实施方式

[0034] 本发明一种运维监控数据治理方法,该方法结合了统计算法和机器学习算法,对各类监控工具采集的运维监控数据进行采集、治理、存储和服务,实现IT运维监控数据的标准化和规范化。
[0035] 具体方案如下:
[0036] 参照图1至图4,一种运维监控数据治理方法,包括如下步骤:
[0037] 1)采集维护对象监控指标下的不同类型的运维数据;
[0038] 2)对运维数据进行规整排列,存储于数据库;
[0039] 3)依据规整排列后的运维数据构建治理模型;
[0040] 4)依据治理模型任意选取数据库中某一节点作为起始节点,根据起始节点的阈值,判断进入哪个节点,直到遍历同数据类型的所有节点,并输出预测值;
[0041] 5)重复执行步骤4)直到遍历整个数据库,并且全部输出了预测值;
[0042] 6)依据预测值对维护对象的运营状况做出分析和判断。
[0043] 所述运维数据包括指标数据和日志数据;
[0044] 所述指标数据是时序数据,其包括指标采集时间和对应指标的值;
[0045] 所述日志文本数据是半结构化文本格式,包括程数据库日志和中间件日志。
[0046] 优选的,根据指标数据和日志数据数据源的格式,采用相应的分析方法,建立相应的数据模型,制定出合适的数据采集策略。
[0047] 数据来源于开源监控工具zabbix和其它厂家的监控数据以及各类日志数据,鉴于数据源和数据格式的多样性,制定了数据采集的方法和步骤。根据数据采集对象不同,进而选用不同的数据采集工具。对于非结构化数据、结构化数据及半结构化数据,通过选择不同的采集模型,建立合适的数据采集策略。下面介绍了两种数据采集方法,一种是对各监控指标数据进行采集,如图2,另外一种对日志数据进行采集如图3。
[0048] 参照图2,所述指标数据采集方法如下:
[0049] 依据不同的维护对象,建立同一接收通道,
[0050] 对维护对象的指标数据进行实时采集,
[0051] 对采集的数据进行统计、翻译、计算以及自定义,
[0052] 按照自定义的分类结果分别进行存储。
[0053] 参照图3,所述日志数据采集方法如下:
[0054] 依据不同的维护对象,建立接收者采集通道,
[0055] 每一采集通道对维护对象的运维数据进行实时采集,
[0056] 每一采集通道对实时采集的数据进行处理,按照采集源、汇特征进行分类,按照分类结果分别进行存储。
[0057] 优选的,使用统计算法和无监督算法过滤掉大量正样本,对样本库进行人工标注,包括先人工标注正负样本,然后通过特征工程提取特征值,通过设置有监督算法随机森林的参数进行训练,从而实现IT运维监控数据质量的提高。
[0058] 通过统计算法3-sigma(拉依达准则)和EWMA(加权移动平均值的控制图)和基于有监督学习算法和无监督学习算法相结合的运维监控数据治理技术研究,从数据采集、治理、存储和分析服务四个步骤实现IT运维监控数据质量的提高。
[0059] 运维监控数据异常通常分为数据源异常、单指标异常、多指标异常和日志数据异常。数据源有时会出现难以预测的结果,产生异常数据,导致数据质量不高。
[0060] 通常的运维监控系统会时常出现以下两种情况:
[0061] 单指标异常:如果时间阈值设置过高,会导致遗漏告警增多,如果时间阈值设置太低,告警太多引发告警暴。
[0062] 多指标异常:在运维过程中,单独分析某个指标是正常,但是综合多个指标来分析,往往就是异常的数据。有时单独分析某个指标异常的,但是综合多个指标来分析往往是正常的。
[0063] 文本日志通常是在特定条件下触发生成的(比如中间件停止服务、重新启动服务和启动服务),并符合一定的格式(半结构化文本)。传统的日志检测有两种方式:根据日志级别(如一般、警告、重要)进行报警,往往告警级别设置不合适,导致数据准确性差;也可以通过设置规则引擎,匹配日志中预先已经规定好的字符串进行匹配并报警,但该方法的局限性依赖人工经验,只可以发现既定模式的异常,无法发现未知的异常。
[0064] 参照图4,本发明提供了一种实施例,首先针对数据源的特点进行分类,先用统计算法3-sigma和EWMA(指数加权移动平均)模型实现数据的分类。3σ准则又称为拉依达准则,如果一组检测数据仅仅含有随机误差,计算处理并得出标准偏差,按既定概率统计,并指定一个区间在正态分布(公式如下所示)中σ代表标准差,μ代表均值。x=μ是坐标图像的对称轴。如果3σ分布在(μ-σ,,μ+σ)中,概率为0.6827;如果3σ在(μ-2σ,μ+2σ)中,概率为0.9545;如果3σ分布在(μ-3σ,μ+3σ)中,概率为0.9973,结论:Y轴取值范围几乎全部集中在(μ-3σ,μ+
3σ)区间内。
[0065]
[0066] EWMA是指数加权移动平均值的控制图。每个EWMA点都结合来自3-sigma分组。定制EWMA控制图进而检测过程中大小的偏移,每个EWMA点都根据自定义的加权因子结合了来自之前所有信息数据。通过更改使用的权重以及限制的s数量,构建生成该控制图,该图可以检测过程中所有数据大小的偏移。鉴于此,使用EWMA来监控正态3-sigma过程中的数据,得出偏离目标的较小偏移。算法表示:设计权重系数λ,0<λ<1,如果λ越大,则Y(t)越大,t-1时刻相应就越小。
[0067] EWMA(t)=λY(t)+(1-λ)EWMA(t-1)for t=1,2,...,n.
[0068] 以上两种统计算法结合机器学习方法实现对数据的处理,两种机器学习算法如下:
[0069] One Class SVM属于无监督算法使用了超平面的思想适用于连续数据的异常检测和对样本进行一定比例的筛选,可以寻找高维平面区分正常点与异常点。本文利用One Class SVM异常值检测、解决极度不平衡数据,公式如下:
[0070] subject to(w*Φ(xi))≥ρ-εi i=1,2,...,lεi≥0
[0071] 随机森林由多棵CART(Classification And Regression Tree)构成的。对于CART每一棵树,存在训练集中的样本频繁多次出现在一棵树的训练集中,当然也存在从未出现在一棵树的训练集中。当训练某一棵树的节点时,选用特征值是从所有特征中根据预先设定比例,随机地无放回的抽取的,设总的特征数量为M,占比分别是sqrt(M),1/2sqrt(M),2sqrt(M)利用随机森林(Random Forest)的预测步骤如下:
[0072] (1)从当前树的根节点(第1-t棵树,i=1-t;)开始,根据当前节点的阈值th,判断进入那个节点,直到遍历某个叶子节点,并输出预测值。
[0073] (2)重复执行(1)直到所有t棵树,并且全部输出了预测值。假如是分类问题,输出当前全部树中预测概率总和最大的那一个类,即对每个c(j)的p进行累计;如果是回归问题,则输出为所有树的输出的平均值。
[0074] 采用One Class SVM算法和Random Forest算是和统计算法相结合的方法处理数据,具体流程如图4所示,使用统计算法和无监督算法过滤掉大量正样本,为了使结果更加准确,对样本库进行人工标注,先人工标注正负样本,然后通过特征工程提取特征值,通过设置有监督算法Random Forest的参数进行训练,从而实现数据质量的提高。
[0075] 数据存储分为指标数据和日志数据,对于时间序列数据(性能指标),主要以时间维度进行查询分析数据,选用主流的rrdtool时序数据库;对于日志文件,数据需要进行实时全文检索和分词搜索,选用主流的ElasticSearch引擎。通过开发丰富、灵活的API接口实现数据服务,前端web展示调用API即可。
[0076] 本文通过无监督学习算法One Class SVM和有监督学习算法Random Forest,结合统计算法3-sigma和EWMA实现了指标数据和日志数据质量的提高,为实现IT端到端的监控能力打下坚实基础
[0077] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈