首页 / 专利库 / 人工智能 / 翻译管理系统 / 一种运维监控聚合管理系统

一种运维监控聚合管理系统

阅读:153发布:2020-05-08

专利汇可以提供一种运维监控聚合管理系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种运维监控聚合管理系统,包括监控聚合web服务端、监控聚合驱动服务端、数据分析服务端和数据 可视化 服务端,每个服务端将各自的实例信息提交到注册中心服务,监控聚合web服务端为web 请求 服务模 块 ,监控聚合驱动服务端为告警数据源统一处理模块,数据分析服务端为提供告警数据分析的处理模块, 数据可视化 服务端为进行数据周期性报表计算服务的模块。本发明聚合多种 监控系统 的告警通知,统一为可定制分派、可定制升级以及多渠道方式通知的告警;本系统提供的在线、离线数据分析模块,帮助使用者追溯故障数据;一键式的租户切换能够帮助用户快速处理多个空间内的业务数据,更友好的帮助用户应对多种业务场景。,下面是一种运维监控聚合管理系统专利的具体信息内容。

1.一种运维监控聚合管理系统,其特征在于:包括监控聚合web服务端、监控聚合驱动服务端、数据分析服务端和数据可视化服务端,每个服务端将各自的实例信息提交到注册中心服务,其中,所述监控聚合web服务端为web请求服务模,提供用户交互页面的大部分请求数据,所述监控聚合驱动服务端为告警数据源统一处理模块,负责侦听接收第三方监控工具推送过来的源数据进行处理并推送到用户,所述数据分析服务端为提供告警数据分析的处理模块,负责提供在线数据分析请求的处理及后台离线日志分析,所述数据可视化服务端为进行数据周期性报表计算服务的模块,负责以固定频率进行各业务报表的统计,并将统计数据更新到数据库,本地侦听端口会接收来自web服务端的数据请求,并提供最新的报表数据返回。
2.如权利要求1所述的一种运维监控聚合管理系统,其特征在于,所述监控聚合web服务端的具体工作流程如下:
Web服务端程序启动,同时注册自己的实例信息至服务注册中心;
服务尝试连接关系数据库服务,默认尝试三次连接请求,并初始化数据库schema,同时,服务程序会尝试连接分布式缓存服务,并指定使用db1;
在数据库服务正常连接的情况下,根据已存在的租户信息表(如果预先有租户数据)进行租户数据空间的初始化,在缓存服务正常连接的情况下,初始化认证授权服务的部分必要数据至缓存服务;
服务端创建在端口8420侦听并等待连接的线程,等待客户端网络连接;
服务端侦听到web请求进入,首先根据请求数据类型去本地缓存查询数据,如果有数据则直接返回请求客户端,如果没有数据,则查询关系数据库,并将数据写入本地缓存(以供下次请求的直接获取),最后将数据返回请求客户端。
3.如权利要求1所述的一种运维监控聚合管理系统,其特征在于,所述监控聚合驱动服务端程序具体工作流程如下:
驱动服务端程序启动,启动注册流程同web服务端程序;
服务尝试连接关系数据库及分布式缓存服务,连接方式同web服务端程序;
服务端尝试连接消息队列中间件服务,并分别创建名为zabbix、nagios的Exchange,服务端将启动两个线程分别实时监听zabbix和nagios的Queue;
当任意zabbix或nagios告警进入被监听的Queue,监听线程将创建处理子线程进行告警处理;
同时告警处理子线程会触发一个告警分析请求至数据分析服务程序,分析服务会异步返回受理请求,并开始计算分析告警数据,将得到的告警原因及解决方案数据持久化数据库,提供于web服务端程序的查询请求。
4.如权利要求3所述的一种运维监控聚合管理系统,其特征在于,所述告警处理包括以下步骤:
首先持久化告警源数据至持久化数据库,并将源数据翻译为统一格式的平台告警数据;
告警数据匹配用户制定的分派策略及排班表,确定推送用户的id列表,之后,根据用户id查询用户自定义的通知策略,最后,将告警数据包装为网页可识别的格式化数据发送给用户;
每个告警处理线程会开启一个定时器,监听告警的处理状态(监听策略获取于用户配置的升级策略表),定时器会根据触发器规则升级未及时处理完成的告警至职责链下一端。
5.如权利要求1所述的一种运维监控聚合管理系统,其特征在于,所述数据分析服务端的程序具体工作流程如下:
数据分析服务端程序启动,启动注册流程同web服务端程序;
服务端创建在端口8430侦听并等待连接的线程,等待客户端网络连接;
服务端创建指定初始大小的工作线程池,离线定时分析告警数据日志文件;
工作线程将收到的告警数据进行分词处理,得到的词汇列表迭代匹配告警词库,生成告警产生原因的模型数据,同时将匹配历史故障解决方案库,生成故障解决方案的模型数据,最后,包装各模型数据为网页可识别的格式化数据,应请求来源的不同分别进行返回处理。
6.如权利要求1所述的一种运维监控聚合管理系统,其特征在于,所述数据可视化服务端的程序具体工作流程如下:
数据可视化服务端程序启动,启动注册流程同web服务端程序;
服务端创建在端口8450侦听并等待连接的线程,等待客户端网络连接;
服务尝试连接关系数据库服务,默认尝试三次连接请求;
服务端创建指定初始大小的工作线程池,并提交各业务领域的报表分析任务至该线程池,之后各任务将分析处理后的报表数据持久化至数据库;
端口8450侦听到查询请求进入,开启的工作线程将获取指定业务类型的可是化数据返回至客户端。

说明书全文

一种运维监控聚合管理系统

技术领域

[0001] 本发明涉及计算机运维管理领域,具体涉及一种运维监控聚合管理系统。

背景技术

[0002] 本发明主要基于两个方面的背景,一是由于信息时代的超高速发展,加上IT环境的复杂性,要求企业必须建立完善的性能监控及故障检测机制,通过专的人员配备和专业的监控工具,对数据库、应用服务、操作系统和网络设备等软硬件设施的性能及运行情况实施监控;二是传统的IT运维监控系统(多基于Web界面的提供分布式系统监控以及网络监控功能的企业级开源或商用解决方案)的应用最为广泛,技术发展也最为成熟。
[0003] 目前,分布式监控系统越来越广泛的被应用到运维领域,在提供服务监控、告警分发、故障分析、隐患预处理方面发挥着重要的作用。随着技术的完善,计算机监控系统的功能越来越多地被开发出来。不过,IT监控系统的最基本的功能是告警通知,将IT故障以消息通知的形式推送到工程师邮箱,从而进行故障分析与及时处理。
[0004] 由于IT运维场景多样,针对特定需求的监控手段也大相径庭,因此衍生出来较多特定领域的运维监控系统,需要运维人员去学习、适应这些工具的使用,事件管理被分散在了各个特定的监控系统中,一定程度上影响到了整个异常事件的处理效率。很多传统的监控工具也开放了二次开发的接口,便于运维开发人员进行自定义能的补充,但往往有较高的技术门槛,功能扩展也相对不够开放,对于可支持接入国内常用社交软件进行告警通知的也少之又少。
[0005] 对于历史事件的处理,往往只停留在记录、回溯的层面,并没有充分挖掘数据的潜在价值。对于事件数据周期性的统计,仍然依靠人力借助于第三方工具进行分析汇总,带来的影响是数据准确性、时效性、可参考价值性的偏低;此外,没有一个数据分析的模支撑,大部分监控系统无法进行更深层次的数据挖掘,程序也便无法提供主动式的协助处理能力。因此,需对现有技术加以改进。

发明内容

[0006] 为克服现有技术所存在的缺陷,现提供一种运维监控聚合管理系统,帮助运维人员更快速、更方便、更精准的定位并处理监控异常问题。
[0007] 为实现上述目的,本发明提供了一种运维监控聚合管理系统,包括监控聚合web服务端、监控聚合驱动服务端、数据分析服务端和数据可视化服务端,每个服务端将各自的实例信息提交到注册中心服务,其中,所述监控聚合web服务端为web请求服务模块,提供用户交互页面的大部分请求数据,所述监控聚合驱动服务端为告警数据源统一处理模块,负责侦听接收第三方监控工具推送过来的源数据进行处理并推送到用户,所述数据分析服务端为提供告警数据分析的处理模块,负责提供在线数据分析请求的处理及后台离线日志分析,所述数据可视化服务端为进行数据周期性报表计算服务的模块,负责以固定频率进行各业务报表的统计,并将统计数据更新到数据库,本地侦听端口会接收来自web服务端的数据请求,并提供最新的报表数据返回。
[0008] 进一步的改进在于,所述监控聚合web服务端的具体工作流程如下:
[0009] Web服务端程序启动,同时注册自己的实例信息至服务注册中心;
[0010] 服务尝试连接关系数据库服务,默认尝试三次连接请求,并初始化数据库schema,同时,服务程序会尝试连接分布式缓存服务,并指定使用db1;
[0011] 在数据库服务正常连接的情况下,根据已存在的租户信息表(如果预先有租户数据)进行租户数据空间的初始化,在缓存服务正常连接的情况下,初始化认证授权服务的部分必要数据至缓存服务;
[0012] 服务端创建在端口8420侦听并等待连接的线程,等待客户端网络连接;
[0013] 服务端侦听到web请求进入,首先根据请求数据类型去本地缓存查询数据,如果有数据则直接返回请求客户端,如果没有数据,则查询关系数据库,并将数据写入本地缓存(以供下次请求的直接获取),最后将数据返回请求客户端。
[0014] 进一步的改进在于,所述监控聚合驱动服务端程序具体工作流程如下:
[0015] 驱动服务端程序启动,启动注册流程同web服务端程序;
[0016] 服务尝试连接关系数据库及分布式缓存服务,连接方式同web服务端程序;
[0017] 服务端尝试连接消息队列中间件服务,并分别创建名为zabbix、nagios的Exchange,服务端将启动两个线程分别实时监听zabbix和nagios的Queue;
[0018] 当任意zabbix或nagios告警进入被监听的Queue,监听线程将创建处理子线程进行告警处理;
[0019] 同时告警处理子线程会触发一个告警分析请求至数据分析服务程序,分析服务会异步返回受理请求,并开始计算分析告警数据,将得到的告警原因及解决方案数据持久化数据库,提供于web服务端程序的查询请求。
[0020] 进一步的改进在于,所述告警处理包括以下步骤:
[0021] 首先持久化告警源数据至持久化数据库,并将源数据翻译为统一格式的平台告警数据;
[0022] 告警数据匹配用户制定的分派策略及排班表,确定推送用户的id列表,之后,根据用户id查询用户自定义的通知策略,最后,将告警数据包装为网页可识别的格式化数据发送给用户;
[0023] 每个告警处理线程会开启一个定时器,监听告警的处理状态(监听策略获取于用户配置的升级策略表),定时器会根据触发器规则升级未及时处理完成的告警至职责链下一端。
[0024] 进一步的改进在于,所述数据分析服务端的程序具体工作流程如下:
[0025] 数据分析服务端程序启动,启动注册流程同web服务端程序;
[0026] 服务端创建在端口8430侦听并等待连接的线程,等待客户端网络连接;
[0027] 服务端创建指定初始大小的工作线程池,离线定时分析告警数据日志文件;
[0028] 工作线程将收到的告警数据进行分词处理,得到的词汇列表迭代匹配告警词库,生成告警产生原因的模型数据,同时将匹配历史故障解决方案库,生成故障解决方案的模型数据,最后,包装各模型数据为网页可识别的格式化数据,应请求来源的不同分别进行返回处理。
[0029] 进一步的改进在于,所述数据可视化服务端的程序具体工作流程如下:
[0030] 数据可视化服务端程序启动,启动注册流程同web服务端程序;
[0031] 服务端创建在端口8450侦听并等待连接的线程,等待客户端网络连接;
[0032] 服务尝试连接关系数据库服务,默认尝试三次连接请求;
[0033] 服务端创建指定初始大小的工作线程池,并提交各业务领域的报表分析任务至该线程池,之后各任务将分析处理后的报表数据持久化至数据库;
[0034] 端口8450侦听到查询请求进入,开启的工作线程将获取指定业务类型的可是化数据返回至客户端。
[0035] 本发明由于使用以上技术方案,使其具有的有益效果是:
[0036] 本发明聚合多种监控系统的告警通知,统一为可定制分派、可定制升级以及多渠道方式通知的告警,更便于故障处理人员快速定位问题、简单有效处理问题;本系统提供的在线、离线数据分析模块,帮助使用者追溯故障数据,更能预测并规避热点故障;强隔离的租户数据,保证了数据的安全性和可迁移性,一键式的租户切换能够帮助用户快速处理多个空间内的业务数据,更友好的帮助用户应对多种业务场景。附图说明
[0037] 图1为本发明一种运维监控聚合管理系统的连接结构图;
[0038] 图2为本发明一种运维监控聚合管理系统中监控聚合web服务端的工作流程图
[0039] 图3为本发明一种运维监控聚合管理系统中监控聚合驱动服务端的工作流程图;
[0040] 图4为本发明一种运维监控聚合管理系统中数据分析服务端的工作流程图;
[0041] 图5为本发明一种运维监控聚合管理系统中数据可视化服务端的工作流程图。

具体实施方式

[0042] 为了使发明实现的技术手段、创造特征、达成目的和功效易于明白了解,以下结合附图,进一步阐述本发明。
[0043] 本发明的实施方式公开了一种运维监控聚合管理系统,如图1所示,包括监控聚合web服务端、监控聚合驱动服务端、数据分析服务端和数据可视化服务端,每个服务端将各自的实例信息提交到注册中心服务,以维持分布式环境下的协同调用工作,同时借助关系数据库服务作为数据持久化支撑,分布式缓存作为高并发请求支撑以及消息队列服务提供异步事件驱动的支撑。
[0044] 其中,监控聚合web服务端为web请求服务模块,负责提供用户交互页面的大部分请求数据,主要包括动态数据看板(dashboard)、告警管理展示、告警接入配置、告警分派策略配置与展示、用户通知策略配置与展示、报表展示、团队管理以及租户选择。用户登录后应选择加入已存在的租户(通过站内项目组信息搜索)或进行项目组申请注册,页面提交必要信息后等待审核。
[0045] 监控聚合驱动服务端为告警数据源统一处理模块,负责侦听接收第三方监控工具(如zabbix、nagios)推送过来的源数据进行处理并推送到用户,首先,程序会有多个处理线程监听消息队列的告警入口,当有告警被转发到队列后,程序的处理线程会翻译告警数据为本系统可识别结构化数据,并将其持久化到数据库,通知分析计算服务提供计算支持。之后,处理线程将从数据库服务搜索用户预配置的告警分派策略、排班信息等规则进行过滤处理,并根据被通知处理人设定的通知策略方式推送到处理人。过程中,程序如侦听到相应告警的恢复通知,会立即更新告警的状态,并主动通知告警流转线上的所有处理人;如程序一直未侦听到相应告警的恢复通知,定时任务将根据用户预配置的升级策略将告警升级,推送到下一团队。
[0046] 数据分析服务端为提供告警数据分析的处理模块,负责提供在线数据分析请求的处理及后台离线日志分析,当有告警数据从侦听端口进入,程序会将告警数据进行分词处理,之后,匹配数据库服务的告警词库,分析得到告警原因数据列表,匹配数据库服务的故障解决方案库,分析得到故障方案数据列表,最后,包装分析得到的所有数据关联告警后持久到数据库,同时回调通知在线分析请求。程序的后台定时任务会负责处理告警日志文件,以同样的匹配规则对告警数据进行分析处理,最后存入数据库,监控聚合web服务程序及数据可视化服务程序对其作进一步的处理。
[0047] 数据可视化服务端为进行数据周期性报表计算服务的模块,负责以固定频率进行各业务报表的统计,并将统计数据更新到数据库,本地侦听端口会接收来自web服务端的数据请求,并提供最新的报表数据返回。
[0048] 具体地说,如图2所示,监控聚合web服务端的具体工作流程如下:
[0049] Web服务端程序启动,同时注册自己的实例信息至服务注册中心;
[0050] 服务尝试连接关系数据库服务,默认尝试三次连接请求,并初始化数据库schema,同时,服务程序会尝试连接分布式缓存服务,并指定使用db1;
[0051] 在数据库服务正常连接的情况下,根据已存在的租户信息表(如果预先有租户数据)进行租户数据空间的初始化,在缓存服务正常连接的情况下,初始化认证授权服务的部分必要数据至缓存服务;
[0052] 服务端创建在端口8420侦听并等待连接的线程,等待客户端网络连接;
[0053] 服务端侦听到web请求进入,首先根据请求数据类型去本地缓存查询数据,如果有数据则直接返回请求客户端,如果没有数据,则查询关系数据库,并将数据写入本地缓存(以供下次请求的直接获取),最后将数据返回请求客户端。
[0054] 如图3所示,监控聚合驱动服务端程序具体工作流程如下:
[0055] 驱动服务端程序启动,启动注册流程同web服务端程序;
[0056] 服务尝试连接关系数据库及分布式缓存服务,连接方式同web服务端程序;
[0057] 服务端尝试连接消息队列中间件服务,并分别创建名为zabbix、nagios的Exchange,服务端将启动两个线程分别实时监听zabbix和nagios的Queue;
[0058] 当任意zabbix或nagios告警进入被监听的Queue,监听线程将创建处理子线程进行告警处理;
[0059] 同时告警处理子线程会触发一个告警分析请求至数据分析服务程序,分析服务会异步返回受理请求,并开始计算分析告警数据,将得到的告警原因及解决方案数据持久化数据库,提供于web服务端程序的查询请求。
[0060] 所述告警处理包括以下步骤:
[0061] 首先持久化告警源数据至持久化数据库,并将源数据翻译为统一格式的平台告警数据;
[0062] 告警数据匹配用户制定的分派策略及排班表,确定推送用户的id列表,之后,根据用户id查询用户自定义的通知策略,最后,将告警数据包装为网页可识别的格式化数据发送给用户;
[0063] 每个告警处理线程会开启一个定时器,监听告警的处理状态(监听策略获取于用户配置的升级策略表),定时器会根据触发器规则升级未及时处理完成的告警至职责链下一端。
[0064] 另外,如图4所示,数据分析服务端的程序具体工作流程如下:
[0065] 数据分析服务端程序启动,启动注册流程同web服务端程序;
[0066] 服务端创建在端口8430侦听并等待连接的线程,等待客户端网络连接;
[0067] 服务端创建指定初始大小的工作线程池,离线定时分析告警数据日志文件;
[0068] 工作线程将收到的告警数据进行分词处理,得到的词汇列表迭代匹配告警词库,生成告警产生原因的模型数据,同时将匹配历史故障解决方案库,生成故障解决方案的模型数据,最后,包装各模型数据为网页可识别的格式化数据,应请求来源的不同分别进行返回处理。
[0069] 如图5所示,数据可视化服务端的程序具体工作流程如下:
[0070] 数据可视化服务端程序启动,启动注册流程同web服务端程序;
[0071] 服务端创建在端口8450侦听并等待连接的线程,等待客户端网络连接;
[0072] 服务尝试连接关系数据库服务,默认尝试三次连接请求;
[0073] 服务端创建指定初始大小的工作线程池,并提交各业务领域的报表分析任务至该线程池,之后各任务将分析处理后的报表数据持久化至数据库;
[0074] 端口8450侦听到查询请求进入,开启的工作线程将获取指定业务类型的可是化数据返回至客户端。
[0075] 本发明聚合多种监控系统(包括硬件设施类监控工具、软件设施类监控工具)的告警通知,统一为可定制分派、可定制升级以及多渠道方式通知的告警。更便于故障处理人员快速定位问题、简单有效处理问题;本系统提供的在线、离线数据分析模块,帮助使用者追溯故障数据,更能预测并规避热点故障。强隔离的租户数据,保证了数据的安全性和可迁移性;一键式的租户切换能够帮助用户快速处理多个空间内的业务数据,更友好的帮助用户应对多种业务场景。
[0076] 以上对发明的具体实施例进行了描述。需要理解的是,发明并不局限于上述特定实施方式,其中未尽详细描述的设备和结构应该理解为用本领域中的普通方式予以实施;本领域技术人员可以在权利要求的范围内做出各种变形修改做出若干简单推演、变形或替换,这并不影响发明的实质内容。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈