首页 / 专利库 / 软件 / 中间件 / 消息中间件 / 一种云计算环境下统一运维的方法、终端设备及存储介质

一种计算环境下统一运维的方法、终端设备及存储介质

阅读:773发布:2020-05-12

专利汇可以提供一种计算环境下统一运维的方法、终端设备及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种 云 计算环境下统一运维的方法、终端设备及存储介质,该方法中包括:S1:配置云计算环境下各模 块 的日志采集策略;S2:根据配置的日志采集策略对各模块的日志进行采集;S3:根据采集的各模块的日志中的参数指标与设定的 阈值 的对比关系判断各模块的运行状态;S4:当运行状态出现异常时,对该运行状态进行预警处理。本发明通过多样化的日志 数据采集 策略可以实现对 服务器 硬件 资源、系统应用 软件 的软件资源和组件资源的统一运维和监控;系统中丰富多样的采集策略也保证了运维监控的监控粒度。,下面是一种计算环境下统一运维的方法、终端设备及存储介质专利的具体信息内容。

1.一种计算环境下统一运维的方法,其特征在于,包括以下步骤:
S1:配置云计算环境下各模的日志采集策略;
S2:根据配置的日志采集策略对各模块的日志进行采集;
S3:根据采集的各模块的日志中的参数指标与设定的阈值的对比关系判断各模块的运行状态;
S4:当运行状态出现异常时,对该运行状态进行预警处理。
2.根据权利要求1所述的云计算环境下统一运维的方法,其特征在于:云计算环境下包括三种模块,分别为:应用软件、集群服务器和组件。
3.根据权利要求2所述的云计算环境下统一运维的方法,其特征在于:应用软件的日志采集策略的配置方式至少包括:
(1)配置特定应用系统下软件的日志采集策略,该配置为精确到以数据库、表或字段值为数据源进行日志采集;
(2)配置通过通用接口程序、协议请求或消息队列的方式对软件进行主动或被动采集的日志采集策略;
(3)配置通过Agent程序对不同软件的涉及运行状态的日志进行定时汇总。
4.根据权利要求2所述的云计算环境下统一运维的方法,其特征在于:集群服务器的日志采集策略的配置方式至少包括:
(1)配置通过Agent采集方式对各集群服务器的日志数据及监控项数据进行主动或被动汇总;
(2)配置通过ICMP或SNMP采集方式对各集群服务器的硬件信息、元器件组件信息和系统运行状况信息中的一者或多者进行日志信息采集;
(3)配置通过JDBC或ODBC采集方式对关系型数据库进行日志信息采集;
(4)配置通过IPMI采集方式对各集群服务器的内核数量、磁盘容量数量、频率、带宽、系统中断状况、CPU和流量中的一者或多者进行日志信息采集;
(5)配置通过ping端口或ssh连接方式对各集群服务器的连通状况、数据传输状况、远程登录和密码中的一者或多者进行日志信息采集。
5.根据权利要求2所述的云计算环境下统一运维的方法,其特征在于:组件的日志采集策略的配置方式至少包括:分别配置容器组件、大数据组件和中间件的采集方式。
6.根据权利要求1所述的云计算环境下统一运维的方法,其特征在于:还包括步骤S5:
对采集的日志中的各参数指标进行表格或图形的可视化显示。
7.一种云计算环境下统一运维的终端设备,其特征在于:包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~6中任一所述方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~6中任一所述方法的步骤。

说明书全文

一种计算环境下统一运维的方法、终端设备及存储介质

技术领域

[0001] 本发明涉及运维领域,尤其涉及一种云计算环境下统一运维的方法、终端设备及存储介质。

背景技术

[0002] 随着信息技术的不断地发展,云计算也为更多不同的行业提供着不同的技术支持和服务。然而对于不同集群下的主机、大数据应用组件、系统应用的统一运维管理问题,传统的运维系统或者运维策略并不能实现对于从服务器硬件资源到大数据应用组件及分布式的系统应用进行统一的监控运维,云计算环境下的统一运维仍然是一个亟待解决的问题。
[0003] 而当前的系统运维主要存在以下几方面的不足:
[0004] 1、运维的成本较高,实际效果不佳。
[0005] 传统系统软件、服务器硬件以及大数据组件资源都是分开监控,监控的系统软件和系统软件之间彼此独立,导致多系统应用下的运维难度较大,投入的运维成本较高,运维的实际效率较低,系统运维达到的效果也很不理想。
[0006] 2、运维的普适性较差,监控粒度较粗。
[0007] 传统的运维方式多采用“单应用实体单集群环境”、“多集群环境”的监控运维方式对单一部署的系统应用和仅对多集群下的服务器硬件资源进行监控,对“多应用实体多集群环境”下的集群服务器资源、应用系统资源、组件(大数据组件、容器组件、中间件)资源之间的监控不做考虑,这就导致运维系统并不能够满足对任意扩充的系统应用、组件、和服务器集群环境进行统一监控。并且由于对监控策略及相关配置项设置考虑不完善导致获取到的运维信息粒度较粗,运维效果也不会很好。
[0008] 3、分析及统计方式单一,问题定位不具体。
[0009] 传统的系统运维对软件系统和服务器硬件资源采集得到的各种日志信息的统计分析方式比较单一并不能够做到对软件系统信息或者是监控的资源项进行多维度的统计分析及展示;对运维系统中的异常报警及提示信息不能及时有效的给出,往往导致运维人员在解决问题时对存在的问题及出现问题的原因把握分析不到位,导致问题不能够顺利解决。

发明内容

[0010] 为了解决上述问题,本发明提出了一种云计算环境下统一运维的方法、终端设备及存储介质。
[0011] 具体方案如下:
[0012] 一种云计算环境下统一运维的方法,包括以下步骤:
[0013] S1:配置云计算环境下各模的日志采集策略;
[0014] S2:根据配置的日志采集策略对各模块的日志进行采集;
[0015] S3:根据采集的各模块的日志中的参数指标与设定的阈值的对比关系判断各模块的运行状态;
[0016] S4:当运行状态出现异常时,对该运行状态进行预警处理。
[0017] 进一步的,云计算环境下包括三种模块,分别为:应用软件、集群服务器和组件。
[0018] 进一步的,应用软件的日志采集策略的配置方式至少包括:
[0019] (1)配置特定应用系统下软件的日志采集策略,该配置为精确到以数据库、表或字段值为数据源进行日志采集;
[0020] (2)配置通过通用接口程序、协议请求或消息队列的方式对软件进行主动或被动采集的日志采集策略;
[0021] (3)配置通过Agent程序对不同软件的涉及运行状态的日志进行定时汇总。
[0022] 进一步的,集群服务器的日志采集策略的配置方式至少包括:
[0023] (1)配置通过Agent采集方式对各集群服务器的日志数据及监控项数据进行主动或被动汇总;
[0024] (2)配置通过ICMP或SNMP采集方式对各集群服务器的硬件信息、元器件组件信息和系统运行状况信息中的一者或多者进行日志信息采集;
[0025] (3)配置通过JDBC或ODBC采集方式对关系型数据库进行日志信息采集;
[0026] (4)配置通过IPMI采集方式对各集群服务器的内核数量、磁盘容量数量、频率、带宽、系统中断状况、CPU和流量中的一者或多者进行日志信息采集;
[0027] (5)配置通过ping端口或ssh连接方式对各集群服务器的连通状况、数据传输状况、远程登录和密码中的一者或多者进行日志信息采集。
[0028] 进一步的,组件的日志采集策略的配置方式至少包括:分别配置容器组件、大数据组件和中间件的采集方式。
[0029] 进一步的,还包括步骤S5:对采集的日志中的各参数指标进行表格或图形的可视化显示。
[0030] 一种云计算环境下统一运维的终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。
[0031] 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。
[0032] 本发明采用如上技术方案,提供了一种云计算环境下统一运维的方法,通过多样化的日志数据采集策略可以实现对服务器硬件资源、系统应用软件的软件资源和组件(容器组件、大数据组件、中间件)资源的统一运维和监控;系统中丰富多样的采集策略也保证了运维监控的监控粒度;系统可以对采集到的各种数据进行多维度的统计分析,对出现异常的数据进行预警、告警,以提醒运维人员处理。附图说明
[0033] 图1所示为本发明实施例一的流程图

具体实施方式

[0034] 为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
[0035] 现结合附图和具体实施方式对本发明进一步说明。
[0036] 实施例一:
[0037] 本发明实施例提供了一种云计算环境下统一运维的方法,如图1所示,所述方法包括以下步骤:
[0038] S1:配置云计算环境下各模块的日志采集策略。
[0039] 该实施例中主要针对云计算环境下的三种模块设定日志采集策略,三种模块分别为应用软件、集群服务器和组件。
[0040] 1.应用软件的日志采集策略
[0041] 所述应用软件的日志采集策略主要是针对云计算环境下的不同应用软件之间的日志数据进行采集的策略,其具有对多系统应用软件的扩展或新增具有高可用性和灵活配置的特点。具体包括以下几点:
[0042] (1)配置特定应用系统下应用软件的日志采集策略,该配置可以为精确到以数据库、表或字段值为数据源进行日志采集,通过该配置可以方便查找出现问题的日志数据的准确来源(如来源于某个数据库、表或字段),供后续的分析对账使用。
[0043] (2)配置通过通用接口程序、协议请求或消息队列的方式对软件进行主动或被动采集的日志采集策略。
[0044] 所述通用接口程序可以为WebService、Restful、SOAP等。所述协议请求可以为HTTP、HTTPS等。
[0045] (3)配置通过Agent程序对不同软件的涉及运行状态的日志数据进行定时汇总。
[0046] 2.集群服务器的日志采集策略
[0047] 所述集群服务器的日志采集策略主要是为云计算环境下不同集群的指定的服务器设定的日志采集策略,用于对所监控的不同的监控项指标的日志数据进行采集,其对多集群服务器的扩展或新增具有高可用性和灵活配置的特点。至少包括以下几点:
[0048] (1)配置通过Agent采集方式对各集群服务器的日志数据及监控项数据进行主动或被动汇总。
[0049] (2)配置通过ICMP或SNMP采集方式对各集群服务器的硬件信息、元器件组件信息和系统运行状况信息中的一者或多者进行日志信息采集。
[0050] (3)配置通过JDBC或ODBC采集方式对关系型数据库进行日志信息采集,主要包括对数据库的连接名称、数据库连接的各属性信息和数据库异常执行情况等信息进行采集。
[0051] (4)配置通过IPMI采集方式对各集群服务器的内核数量、磁盘容量数量、频率、带宽、系统中断状况、CPU和流量中的一者或多者进行日志信息采集。
[0052] (5)配置通过ping端口或ssh连接方式对各集群服务器的连通状况、数据传输状况、远程登录和密码中的一者或多者进行日志信息采集。
[0053] 3.组件的日志采集策略
[0054] 该实施例中分别对容器组件、大数据组件和中间件配置不同的日志采集策略,具体为:
[0055] (1)通过配置cAdvisor采集方式,对云计算环境下的不同容器组件在CPU的使用量、内存占用率、网络流量使用量、磁盘IO性能及速度、并发使用时间等信息进行采集。
[0056] (2)通过配置Ambari采集方式,对云计算环境下的大数据组件,包括Spark、Flume、HDFS、MapReduce、Hive、Pig、Hbase、Zookeeper、Sqoop、Hcatalog等的运行状况及异常状况等信息进行采集。
[0057] (3)通过配置中间件采集方式,对云计算环境下中间件如:Weblogic、Apache、Tomcat、NGINX、Jboss、Redis、MQ、RMQ等运行状况信息进行采集。
[0058] S2:根据步骤S1中配置的日志采集策略对各模块的日志进行实时或定时的采集。
[0059] 该实施例中具体通过采集以下信息:
[0060] 1.通过代理Agent、接口程序、通讯协议等方式对云计算环境下的不同应用软件的运行状态、具体功能模块操作、系统异常状况等产生的日志信息进行采集汇总。
[0061] 2.通过代理Agent、接口程序、通讯协议等方式可对磁盘、内存、CPU、IO操作、网络、服务进程等产生的日志信息进行定时或者实时的采集汇总。
[0062] 3.对容器、大数据组件、中间件等运行中产生的各种日志信息进行采集汇总。
[0063] S3:根据采集的各模块的日志中的参数指标与设定的阈值的对比关系判断各模块的运行状态。
[0064] 针对不同的集群服务器、组件(容器组件、大数据组件、中间件)和应用软件分别设定不同的预警阈值,所述阈值可以为多级阈值,如该实施例中设定“正常”、“严重错误”、“异常中断”、“错误”不同级别的预警阈值,以适应不同场景的需求。当采集的日志中的某参数指标的值大于设定的对应预警阈值时,根据设置判定其为对应的运行状况。
[0065] S4:当运行状态出现异常时,对该运行状态进行预警处理。
[0066] 如果运行状态异常,自动进行预警、告警以提醒运维人员进行处理。
[0067] 所述预警可以为多种预警方式,如邮件、短信、MSN、QQ、微信、语音、系统异常提示等等,针对每种不同级别的异常情况也可以根据紧急程度采用不同的预警方式,多样化、及时快捷的向运维人员发送系统异常信息,为运维人员排查问题提供便利。
[0068] 进一步的,还可以包括步骤S5:对采集的日志中的各参数指标进行表格或图形的可视化显示。
[0069] 所述图形的可视化显示可以为饼形图、柱状图、折线图、环形图、堆积图、热图等方式,通过显示的可视化图表,可以方便运维人员快速掌握各模块的运行情况。
[0070] 本发明实施例一提出了一种解决云计算环境下多模块的统一运维的方法,主要用于解决云计算环境下的集群服务器硬件资源、系统应用软件的软件资源和组件(容器组件、大数据组件、中间件)资源如何实现统一运维的问题,具有以下有益效果:
[0071] (1)提供了一种云计算环境下对服务器硬件资源、系统应用软件的软件资源和组件(容器组件、大数据组件、中间件)资源的统一运维的方法,更加全面的解决当前云计算环境下的统一运维问题。
[0072] (2)针对不同集群服务器、应用软件和组件的各监控项配置不同的监控策略,具有较高的实用性和扩展性。
[0073] 实施例二:
[0074] 本发明还提供一种云计算环境下统一运维的终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。
[0075] 进一步地,作为一个可执行方案,所述云计算环境下统一运维的终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述云计算环境下统一运维的终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述云计算环境下统一运维的终端设备的组成结构仅仅是云计算环境下统一运维的终端设备的示例,并不构成对云计算环境下统一运维的终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述云计算环境下统一运维的终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。
[0076] 进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述云计算环境下统一运维的终端设备的控制中心,利用各种接口和线路连接整个云计算环境下统一运维的终端设备的各个部分。
[0077] 所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述云计算环境下统一运维的终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0078] 本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。
[0079] 所述云计算环境下统一运维的终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序发送指令控制相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)以及软件分发介质等。
[0080] 尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈