首页 / 专利库 / 人工智能 / 语音触发器 / 一种基于zabbix监控告警的方法、服务器、设备及存储介质

一种基于zabbix监控告警的方法、服务器、设备及存储介质

阅读:93发布:2020-05-17

专利汇可以提供一种基于zabbix监控告警的方法、服务器、设备及存储介质专利检索,专利查询,专利分析的服务。并且本 申请 提供一种基于zabbix监控告警的方法、 服务器 、设备及存储介质,方法包括:在所述分布式系统的各监控 节点 上分别部署zabbix代理器并启动各zabbix服务器,创建zabbix服务器与各监控节点上部署的zabbix代理器之间的通信连接;通过zabbix代理器分别从各监控节点采集各监控节点的负载信息和运行状态;将各监控节点的负载信息和运行状态生成 可视化 图形,当根据所述可视化图形和预定义的告警规则确定目标监控节点当前的负载信息和运行状态满足所述告警规则时,生成告警信息;确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,向所述目标通知渠道发送所述告警信息。采用本方案,能够提高监控的工作效率和实时性。,下面是一种基于zabbix监控告警的方法、服务器、设备及存储介质专利的具体信息内容。

1.一种基于zabbix监控告警的方法,其特征在于,所述方法由分布式系统中的zabbix服务器执行,所述分布式系统还包括多个分布式部署的监控节点;所述方法包括:
在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器,所述zabbix代理器用于采集所属的监控节点的负载信息和运行状态;
创建zabbix服务器与各监控节点上部署的zabbix代理器之间的通信连接;
通过zabbix代理器分别从各监控节点采集各监控节点的负载信息和运行状态;其中,所述负载信息至少包括处理器使用率、内存使用率和硬盘用量中的一项硬件使用信息,所述运行状态至少包括代理协议TCP连接数、矿池算及拒绝率;
将各监控节点的负载信息和运行状态生成可视化图形,当根据所述可视化图形和预定义的告警规则确定目标监控节点当前的负载信息和运行状态满足所述告警规则时,生成告警信息;
确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,所述目标通知渠道至少包括电话、邮件、短信、语音、视频和网络即时消息中的至少一种;
向所述目标通知渠道发送所述告警信息。
2.根据权利要求1所述的方法,其特征在于,所述在所述分布式系统的各监控节点上分别部署zabbix代理器,包括:
在所述分布式系统的各监控节点上分别部署zabbix代理器;
获取zabbix_agentd.conf配置文件并分别发送至各监控节点;
将所述zabbix_agentd.conf配置文件中的参数″Server=127.0.0.1″的IP地址修改为zabbix server服务器地址,并重启各监控节点上部署的zabbix代理器,以使各监控节点上的zabbix_agentd.conf配置文件生效,使得各监控节点上部署的zabbix服务器生效。
3.根据权利要求2所述的方法,其特征在于,所述在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器之后,所述方法还包括:
生成监控脚本;
在各监控节点上的zabbix_agentd.conf配置文件中添加第一参数,使得所述zabbix_agentd.conf配置文件支持自定义监控内容;所述第一参数为Unsaf eUserParameters=1;
在各监控节点上的zabbix_agentd.conf配置文件中添加第二参数;所述第二参数为UserParameter=proc.tcp_status[*],/bin/bash/etc/zabbix/share/zabbix/al ertscripts/tcp_con_stat_check.sh$1;
执行所述监控脚本,以获取各监控节点当前的TCP连接数、矿池目前算力和拒绝率;
重启各监控节点上部署的zabbix代理器,以使各监控节点上更新的zab  bix_agentd.conf配置文件生效。
4.根据权利要求3所述的方法,其特征在于,所述重启各监控节点上部署的zabbix代理器之后,所述方法还包括:
在zabbix server前端页面监控模板中增加Items监控原型,所述Items监控原型包括监控项名称、类型、键值、收集数据类型、信息类型、数据更新间隔时间、历史数据保留时长和趋势数据存储周期;
在zabbix server前端页面监控模板中增加Triggers告警规则,以及根据在所述分布式系统中部署的业务的业务特性新建一个触发器,所述触发器包括触发器名称、严重性、告警表达式和告警描述信息;
以及在zabbix server web页面监控模板中增加Graphs图形展示方式,所述Graphs图形展示方式包括图形名称、图形高度、图形宽度和待展示的Items监控原型。
5.根据权利要求2-4中任一项所述的方法,其特征在于,所述在zabbix server web页面监控模板中增加Graphs图形展示方式之后,所述方法还包括:
注册企业通讯账号,生成调用所述企业通讯账号的应用程序接口API的脚本;
在各监控节点上的zabbix_agentd.conf配置文件中添加第三参数,所述第三参数为UserParameter=proc.hashrate[*],/usr/bin/python/etc/zabbix/share/zab bix/alertscripts/send_message.py$1;
在zabbix服务器前端web页面设置特定标签,所述特定标签包括设置Configuration与动作Actions之间的映射关系;
在所述特定标签下新建一个告警操作,所述告警操作包括告警名称、计算类型、触发条件、默认操作时长、告警标题、告警正文以及告警时待发送的用户。
6.一种zabbix服务器,其特征在于,所述zabbix服务器应用于分布式系统,所述分布式系统还包括多个分布式部署的监控节点;所述zabbix服务器包括:
处理模,用于在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器,所述zabbix代理器用于采集所属的监控节点的负载信息和运行状态;创建zabbix服务器与各监控节点上部署的zabbix代理器之间的通信连接;
采集模块,用于通过zabbix代理器分别从各监控节点采集各监控节点的负载信息和运行状态;其中,所述负载信息至少包括处理器使用率、内存使用率和硬盘用量中的一项硬件使用信息,所述运行状态至少包括代理协议TCP连接数、矿池算力及拒绝率;
所述处理模块还用于将各监控节点的负载信息和运行状态生成可视化图形,当根据所述可视化图形和预定义的告警规则确定目标监控节点当前的负载信息和运行状态满足所述告警规则时,生成告警信息;确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,所述目标通知渠道至少包括电话、邮件、短信、语音、视频和网络即时消息中的至少一种;
收发模块,用于向所述所述处理模块确定的所述目标通知渠道发送所述告警信息。
7.根据权利要求6所述的zabbix服务器,其特征在于,所述处理模块具体用于:
在所述分布式系统的各监控节点上分别部署zabbix代理器;
通过所述收发模块获取zabbix_agentd.conf配置文件并分别发送至各监控节点;
将所述zabbix_agentd.conf配置文件中的参数″Server=127.0.0.1″的IP地址修改为zabbix server服务器地址,并重启各监控节点上部署的zabbix代理器,以使各监控节点上的zabbix_agentd.conf配置文件生效,使得各监控节点上部署的zabbix服务器生效。
8.根据权利要求7所述的zabbix服务器,其特征在于,所述处理模块还用于:
生成监控脚本;
在各监控节点上的zabbix_agentd.conf配置文件中添加第一参数,使得所述zabbix_agentd.conf配置文件支持自定义监控内容;所述第一参数为Unsaf eUserParameters=1;
在各监控节点上的zabbix_agentd.conf配置文件中添加第二参数;所述第二参数为UserParameter=proc.tcp_status[*],/bin/bash/etc/zabbix/share/zabbix/al ertscripts/tcp_con_stat_check.sh$1;
执行所述监控脚本,以获取各监控节点当前的TCP连接数、矿池目前算力和拒绝率;
重启各监控节点上部署的zabbix代理器,以使各监控节点上更新的zab  bix_agentd.conf配置文件生效。
9.一种计算机设备,其特征在于,所述计算机设备包括:
至少一个处理器、存储器和收发器;
其中,所述存储器用于存储程序代码,所述处理器用于调用所述存储器中存储的程序代码来执行如权利要求1-5中任一项所述的方法。
10.一种计算机存储介质,其特征在于,其包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-5中任一项所述的方法。

说明书全文

一种基于zabbix监控告警的方法、服务器、设备及存储介质

技术领域

[0001] 本申请涉及监控管理领域,尤其涉及一种基于zabbix监控告警的方法、服务器、设备及存储介质。

背景技术

[0002] zabbix是一个基于WEB界面提供分布式系统监控、网络监控及可视化展示功能的企业级的开源解决方案,通过在被监控服务器上安装代理端(agent)收集数据,主动收集数据并发送至服务端(server)进行处理,支持跨平台(windows、linux系统均有对应版本),除代理端收集数据之外,还支持SNMP协议,用来采集路由器、交换机等网络设备数据并实行监控。
[0003] 在提倡自动化运维的时代,应尽量减少重复工作的时间,提升工作效率。
[0004] 但是,目前服务器上运行着各种关键服务,随着业务量增长,重复工作的时间增加,对机器的硬件负载加重以及导致服务进程的监控的实时性较差,进而导致工作效率较低。发明内容
[0005] 本申请提供了一种基于zabbix监控告警的方法、服务器、设备及存储介质,能够解决现有技术中监控的工作效率较低的问题。
[0006] 第一方面,本申请提供一种基于zabbix监控告警的方法,所述方法由分布式系统中的zabbix服务器执行,所述分布式系统还包括多个分布式部署的监控节点;所述方法包括:
[0007] 在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器,所述zabbix代理器用于采集所属的监控节点的负载信息和运行状态;
[0008] 创建zabbix服务器与各监控节点上部署的zabbix代理器之间的通信连接;
[0009] 通过zabbix代理器分别从各监控节点采集各监控节点的负载信息和运行状态;其中,所述负载信息至少包括处理器使用率、内存使用率和硬盘用量中的一项硬件使用信息,所述运行状态至少包括代理协议TCP连接数、矿池算及拒绝率;
[0010] 将各监控节点的负载信息和运行状态生成可视化图形,当根据所述可视化图形和预定义的告警规则确定目标监控节点当前的负载信息和运行状态满足所述告警规则时,生成告警信息;
[0011] 确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,所述目标通知渠道至少包括电话、邮件、短信、语音、视频和网络即时消息中的至少一种;
[0012] 向所述目标通知渠道发送所述告警信息。
[0013] 在一些可能的设计中,所述在所述分布式系统的各监控节点上分别部署zabbix代理器,包括:
[0014] 在所述分布式系统的各监控节点上分别部署zabbix代理器;
[0015] 获取zabbix_agentd.conf配置文件并分别发送至各监控节点;
[0016] 将所述zabbix_agentd.conf配置文件中的参数″Server=127.0.0.1″的IP地址修改为zabbix server服务器地址,并重启各监控节点上部署的zabbix代理器,以使各监控节点上的zabbix_agentd.conf配置文件生效,使得各监控节点上部署的zabbix服务器生效。
[0017] 在一些可能的设计中,所述在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器之后,所述方法还包括:
[0018] 生成监控脚本;
[0019] 在各监控节点上的zabbix_agentd.conf配置文件中添加第一参数,使得所述zabbix_agentd.conf配置文件支持自定义监控内容;所述第一参数为Unsafe UserParameters=1;
[0020] 在各监控节点上的zabbix_agentd.conf配置文件中添加第二参数;所述第二参数为UserParameter=proc.tcp_status[*],/bin/bash/etc/zabbix/share/zabbix/alertscripts/tcp_con_stat_check.sh$1;
[0021] 执行所述监控脚本,以获取各监控节点当前的TCP连接数、矿池目前算力和拒绝率;
[0022] 重启各监控节点上部署的zabbix代理器,以使各监控节点上更新的zabbix_agentd.conf配置文件生效。
[0023] 在一些可能的设计中,所述重启各监控节点上部署的zabbix代理器之后,所述方法还包括:
[0024] 在zabbix server前端页面监控模板中增加Items监控原型,所述Items监控原型包括监控项名称、类型、键值、收集数据类型、信息类型、数据更新间隔时间、历史数据保留时长和趋势数据存储周期;
[0025] 在zabbix server前端页面监控模板中增加Triggers告警规则,以及根据在所述分布式系统中部署的业务的业务特性新建一个触发器,所述触发器包括触发器名称、严重性、告警表达式和告警描述信息;
[0026] 以及在zabbix server web页面监控模板中增加Graphs图形展示方式,所述Graphs图形展示方式包括图形名称、图形高度、图形宽度和待展示的Items监控原型。
[0027] 在一些可能的设计中,所述在zabbix server web页面监控模板中增加Graphs图形展示方式之后,所述方法还包括:
[0028] 注册企业通讯账号,生成调用所述企业通讯账号的应用程序接口API的脚本;
[0029] 在各监控节点上的zabbix_agentd.conf配置文件中添加第三参数,所述第三参数为UserParameter=proc.hash_rate[*],/usr/bin/python/etc/zabbix/share/zabbix/alertscripts/send_message.py$1;
[0030] 在zabbix服务器前端web页面设置特定标签,所述特定标签包括设置Configuration与动作Actions之间的映射关系;
[0031] 在所述特定标签下新建一个告警操作,所述告警操作包括告警名称、计算类型、触发条件、默认操作时长、告警标题、告警正文以及告警时待发送的用户。
[0032] 第二方面,本申请提供一种zabbix服务器,具有实现对应于上述第一方面提供的基于zabbix监控告警的方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模,所述模块可以是软件和/或硬件。
[0033] 一种可能的设计中,所述zabbix服务器应用于分布式系统,所述分布式系统还包括多个分布式部署的监控节点;所述zabbix服务器包括:
[0034] 处理模块,用于在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器,所述zabbix代理器用于采集所属的监控节点的负载信息和运行状态;创建zabbix服务器与各监控节点上部署的zabbix代理器之间的通信连接;
[0035] 采集模块,用于通过zabbix代理器分别从各监控节点采集各监控节点的负载信息和运行状态;其中,所述负载信息至少包括处理器使用率、内存使用率和硬盘用量中的一项硬件使用信息,所述运行状态至少包括代理协议TCP连接数、矿池算力及拒绝率;
[0036] 所述处理模块还用于将各监控节点的负载信息和运行状态生成可视化图形,当根据所述可视化图形和预定义的告警规则确定目标监控节点当前的负载信息和运行状态满足所述告警规则时,生成告警信息;确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,所述目标通知渠道至少包括电话、邮件、短信、语音、视频和网络即时消息中的至少一种;
[0037] 收发模块,用于向所述所述处理模块确定的所述目标通知渠道发送所述告警信息。
[0038] 在一些可能的设计中,所述处理模块具体用于:
[0039] 在所述分布式系统的各监控节点上分别部署zabbix代理器;
[0040] 通过所述收发模块获取zabbix_agentd.conf配置文件并分别发送至各监控节点;
[0041] 将所述zabbix_agentd.conf配置文件中的参数″Server=127.0.0.1″的IP地址修改为zabbix server服务器地址,并重启各监控节点上部署的zabbix代理器,以使各监控节点上的zabbix_agentd.conf配置文件生效,使得各监控节点上部署的zabbix服务器生效。
[0042] 在一些可能的设计中,所述处理模块还用于:
[0043] 生成监控脚本;
[0044] 在各监控节点上的zabbix_agentd.conf配置文件中添加第一参数,使得所述zabbix_agentd.conf配置文件支持自定义监控内容;所述第一参数为Unsafe UserParameters=1;
[0045] 在各监控节点上的zabbix_agentd.conf配置文件中添加第二参数;所述第二参数为UserParameter=proc.tcp_status[*],/bin/bash/etc/zabbix/share/zabbix/alertscripts/tcp_con_stat_check.sh$1;
[0046] 执行所述监控脚本,以获取各监控节点当前的TCP连接数、矿池目前算力和拒绝率;
[0047] 重启各监控节点上部署的zabbix代理器,以使各监控节点上更新的zabbix_agentd.conf配置文件生效。
[0048] 在一些可能的设计中,所述处理模块在所述在zabbix server web页面监控模板中增加Graphs图形展示方式之后,还用于:
[0049] 注册企业通讯账号,生成调用所述企业通讯账号的应用程序接口API的脚本;
[0050] 在各监控节点上的zabbix_agentd.conf配置文件中添加第三参数,所述第三参数为UserParameter=proc.hash_rate[*],/usr/bin/python/etc/zabbix/share/zabbix/alertscripts/send_message.py$1;
[0051] 在zabbix服务器前端web页面设置特定标签,所述特定标签包括设置Configuration与动作Actions之间的映射关系;
[0052] 在所述特定标签下新建一个告警操作,所述告警操作包括告警名称、计算类型、触发条件、默认操作时长、告警标题、告警正文以及告警时待发送的用户。
[0053] 本申请又一方面提供了一种计算机设备,其包括至少一个连接的处理器、存储器和收发器,其中,所述存储器用于存储程序代码,所述处理器用于调用所述存储器中的程序代码来执行上述第一方面所述的方法。
[0054] 本申请又一方面提供了一种计算机存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
[0055] 与现有机制相比,本申请实施例中,基于zabbix agent端收集所有监控节点的负载信息和运行状态,当确定监控节点发生故障时,确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,利用zabbix告警规则触发告警,并将告警信息通过目标通知渠道发给监控者,使得监控者及时地排查故障。结合自身产品特点,利用自行编写脚本,针对性的收集特定数据,制定符合业务逻辑的告警规则,以在服务器发生故障时在最短的时间内以最有效的方式通知到监控人员,缩短故障排查时间。附图说明
[0056] 图1为本申请实施例中一种基于zabbix监控告警的方法的一种流程示意图;
[0057] 图2a为本申请实施例中通过企业微信账号告警的一种界面示意图;
[0058] 图2b为本申请实施例中矿池算力及拒绝率监控图形的一种示意图;
[0059] 图3为本申请实施例服务器的一种功能模块示意图;
[0060] 图4为本申请实施例中计算机设备的一种结构示意图。
[0061] 本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0062] 应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。本申请的说明书权利要求书及上述附图中的术语″第一″、″第二″等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语″包括″和″具有″以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行。
[0063] 本申请提供一种基于zabbix监控告警的方法、服务器、设备及存储介质,可用于分布式系统。
[0064] 为解决上述技术问题,本申请主要提供以下技术方案:
[0065] 本申请在zabbix服务器中部署可视化功能和自定义监控功能,在各个服务器中部署zabbix agent,用于收集服务器本身硬件负载及程序运行状态,配合图形化的界面能够实时查看到所有服务器的资源使用情况,通过定义的告警规则以便快速的发现和解决问题,并进一步缩短服务器巡检的时间,提升工作效率。
[0066] 请参照图1,以下介绍本申请实施例中的一种基于zabbix监控告警的方法,基于zabbix监控告警的方法,所述方法由分布式系统中的zabbix服务器执行,所述分布式系统还包括多个分布式部署的监控节点;所述方法包括:
[0067] 101、在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器。
[0068] 其中,所述zabbix代理器用于采集所属的监控节点的负载信息和运行状态。
[0069] 在一些实施方式中,通过以下步骤在所述分布式系统的各监控节点上分别部署zabbix代理器:
[0070] 在所述分布式系统的各监控节点上分别部署zabbix代理器;
[0071] 获取zabbix_agentd.conf配置文件并分别发送至各监控节点;
[0072] 将所述zabbix_agentd.conf配置文件中的参数″Server=127.0.0.1″的IP地址修改为zabbix server服务器地址,并重启各监控节点上部署的zabbix代理器,以使各监控节点上的zabbix_agentd.conf配置文件生效,使得各监控节点上部署的zabbix服务器生效。
[0073] 102、创建zabbix服务器与各监控节点上部署的zabbix代理器之间的通信连接。
[0074] 103、通过zabbix代理器分别从各监控节点采集各监控节点的负载信息和运行状态。
[0075] 其中,所述负载信息至少包括处理器使用率、内存使用率和硬盘用量中的一项硬件使用信息。所述运行状态至少包括代理协议TCP连接数、矿池算力及拒绝率。
[0076] 104、将各监控节点的负载信息和运行状态生成可视化图形,当根据所述可视化图形和预定义的告警规则确定目标监控节点当前的负载信息和运行状态满足所述告警规则时,生成告警信息。
[0077] 105、确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道。
[0078] 其中,所述目标通知渠道至少包括电话、邮件、短信、语音、视频和网络即时消息中的至少一种。
[0079] 106、向所述目标通知渠道发送所述告警信息。
[0080] 与现有机制相比,本申请实施例中,基于zabbix agent端收集所有监控节点的负载信息和运行状态,当确定监控节点发生故障时,确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,利用zabbix告警规则触发告警,并将告警信息通过目标通知渠道发给监控者,使得监控者及时地排查故障。
[0081] 可选的,在本申请的一些实施例中,所述在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器之后,所述方法还包括:
[0082] 生成监控脚本;
[0083] 在各监控节点上的zabbix_agentd.conf配置文件中添加第一参数,使得所述zabbix_agentd.conf配置文件支持自定义监控内容;所述第一参数为Unsafe UserParameters=1;
[0084] 在各监控节点上的zabbix_agentd.conf配置文件中添加第二参数;所述第二参数为UserParameter=proc.tcp_status[*],/bin/bash/etc/zabbix/share/zabbix/alertscripts/tcp_con_stat_check.sh$1;
[0085] 执行所述监控脚本,以获取各监控节点当前的TCP连接数、矿池目前算力和拒绝率;
[0086] 重启各监控节点上部署的zabbix代理器,以使各监控节点上更新的zabbix_agentd.conf配置文件生效。
[0087] 可选的,在本申请的一些实施例中,所述重启各监控节点上部署的zabbix代理器之后,所述方法还包括:
[0088] 在zabbix server前端页面监控模板中增加Items监控原型,所述Items监控原型包括监控项名称、类型、键值、收集数据类型、信息类型、数据更新间隔时间、历史数据保留时长和趋势数据存储周期;
[0089] 在zabbix server前端页面监控模板中增加Triggers告警规则,以及根据在所述分布式系统中部署的业务的业务特性新建一个触发器,所述触发器包括触发器名称、严重性、告警表达式和告警描述信息;
[0090] 以及在zabbix server web页面监控模板中增加Graphs图形展示方式,所述Graphs图形展示方式包括图形名称、图形高度、图形宽度和待展示的Items监控原型。
[0091] 如图2a所示,图2a为矿池算力及拒绝率的一种监控图形,通过该监控图形可以直观地看出各监控节点的资源使用情况。可见,通过Graphs图形展示方式能够直观地、可视化地、实时地查看到所有监控节点的资源使用情况。
[0092] 可选的,在本申请的一些实施例中,所述在zabbix server web页面监控模板中增加Graphs图形展示方式之后,所述方法还包括:
[0093] 注册企业通讯账号,生成调用所述企业通讯账号的应用程序接口API的脚本;
[0094] 在各监控节点上的zabbix_agentd.conf配置文件中添加第三参数,所述第三参数为UserParameter=proc.hash_rate[*],/usr/bin/python/etc/zabbix/share/zabbix/alertscripts/send_message.py$1;
[0095] 在zabbix服务器前端web页面设置特定标签,所述特定标签包括设置Configuration与动作Actions之间的映射关系;
[0096] 在所述特定标签下新建一个告警操作,所述告警操作包括告警名称、计算类型、触发条件、默认操作时长、告警标题、告警正文以及告警时待发送的用户。
[0097] 可见,通过注册企业通讯账号和生成脚本,当服务器发生故障时,利用zabbix告警规则触发告警,并将告警信息通过脚本调用企业通讯账号api发送至监控者,使得监控者及时地排查故障。如图2b为一种监控告警的界面示意图,企业通讯账号为企业微信账号,监控者关注该企业微信账号后,若zabbix服务器监控到分布式系统中某监控节点发生告警,则根据告警级别通知到关联的企业微信账号,及时的通知到监控者,避免告警消息接收不及时。
[0098] 与现有技术相比,本发明结合自身产品特点,利用自行编写脚本程序,针对性的收集特定数据,制定符合业务逻辑的告警规则。能够在服务器发生故障时在最短的时间内以最有效的方式通知到监控人员,缩短故障排查时间。
[0099] 上述图1至图2中任一所对应的实施例或实施方式中所提及的技术特征也同样适用于本申请中的图3和图4所对应的实施例,后续类似之处不再赘述。
[0100] 以上对本申请中一种基于zabbix监控告警的方法进行说明,以下对执行上述一种基于zabbix监控告警的方法的zabbix服务器进行描述。
[0101] 如图3所示的一种zabbix服务器的结构示意图,其可应用于分布式系统,所述分布式系统还包括多个分布式部署的监控节点。本申请实施例中的zabbix服务器够实现对应于上述图1所对应的实施例中所执行的基于zabbix监控告警的方法的步骤。zabbix服务器实现的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。所述zabbix服务器可包括处理模块、采集模块和收发模块,所述处理模块处理模块、采集模块和收发模块的功能实现可参考图1至图2b所对应的实施例中所执行的操作,此处不作赘述。所述处理模块可用于控制所述收发模块的收发操作以及控制采集模块的采集操作。
[0102] 一些实施方式中,所述zabbix服务器应用于分布式系统,所述分布式系统还包括多个分布式部署的监控节点;所述zabbix服务器包括:
[0103] 处理模块,用于在所述分布式系统的各监控节点上分别部署zabbix代理器并启动各zabbix服务器,所述zabbix代理器用于采集所属的监控节点的负载信息和运行状态;创建zabbix服务器与各监控节点上部署的zabbix代理器之间的通信连接;
[0104] 采集模块,用于通过zabbix代理器分别从各监控节点采集各监控节点的负载信息和运行状态;其中,所述负载信息至少包括处理器使用率、内存使用率和硬盘用量中的一项硬件使用信息,所述运行状态至少包括代理协议TCP连接数、矿池算力及拒绝率;
[0105] 所述处理模块还用于将各监控节点的负载信息和运行状态生成可视化图形,当根据所述可视化图形和预定义的告警规则确定目标监控节点当前的负载信息和运行状态满足所述告警规则时,生成告警信息;确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,所述目标通知渠道至少包括电话、邮件、短信、语音、视频和网络即时消息中的至少一种;
[0106] 收发模块,用于向所述所述处理模块确定的所述目标通知渠道发送所述告警信息。
[0107] 与现有机制相比,本申请实施例中,基于zabbix agent端收集所有监控节点的负载信息和运行状态,当确定监控节点发生故障时,确定告警信息的告警级别,以及确定与告警级别对应的目标通知渠道,利用zabbix告警规则触发告警,并将告警信息通过目标通知渠道发给监控者,使得监控者及时地排查故障。
[0108] 一些实施方式中,所述处理模块具体用于:
[0109] 在所述分布式系统的各监控节点上分别部署zabbix代理器;
[0110] 通过所述收发模块获取zabbix_agentd.conf配置文件并分别发送至各监控节点;
[0111] 将所述zabbix_agentd.conf配置文件中的参数″Server=127.0.0.1″的IP地址修改为zabbix server服务器地址,并重启各监控节点上部署的zabbix代理器,以使各监控节点上的zabbix_agentd.conf配置文件生效,使得各监控节点上部署的zabbix服务器生效。
[0112] 一些实施方式中,所述处理模块还用于:
[0113] 生成监控脚本;
[0114] 在各监控节点上的zabbix_agentd.conf配置文件中添加第一参数,使得所述zabbix_agentd.conf配置文件支持自定义监控内容;所述第一参数为Unsafe UserParameters=1;
[0115] 在各监控节点上的zabbix_agentd.conf配置文件中添加第二参数;所述第二参数为UserParameter=proc.tcp_status[*],/bin/bash/etc/zabbix/share/zabbix/alertscripts/tcp_con_stat_check.sh$1;
[0116] 执行所述监控脚本,以获取各监控节点当前的TCP连接数、矿池目前算力和拒绝率;
[0117] 重启各监控节点上部署的zabbix代理器,以使各监控节点上更新的zabbix_agentd.conf配置文件生效。
[0118] 一些实施方式中,所述处理模块在所述在zabbix server web页面监控模板中增加Graphs图形展示方式之后,还用于:
[0119] 注册企业通讯账号,生成调用所述企业通讯账号的应用程序接口API的脚本;
[0120] 在各监控节点上的zabbix_agentd.conf配置文件中添加第三参数,所述第三参数为UserParameter=proc.hash_rate[*],/usr/bin/python/etc/zabbix/share/zabbix/alertscripts/send_message.py$1;
[0121] 在zabbix服务器前端web页面设置特定标签,所述特定标签包括设置Configuration与动作Actions之间的映射关系;
[0122] 在所述特定标签下新建一个告警操作,所述告警操作包括告警名称、计算类型、触发条件、默认操作时长、告警标题、告警正文以及告警时待发送的用户。
[0123] 图3中所示的收发模块对应的实体设备为图4所示的收发单元,该收发单元能够实现收发模块部分或全部的功能,或者实现与收发模块相同或相似的功能。
[0124] 图3中所示的处理模块对应的实体设备为图4所示的处理器,该处理器能够实现处理模块部分或全部的功能,或者实现与处理模块相同或相似的功能。
[0125] 上面从模块化功能实体的度分别介绍了本申请实施例中的zabbix服务器,以下从硬件角度介绍一种计算机设备,如图4所示,其包括:处理器、存储器、收发器(也可以是输入输出单元,图4中未标识出)以及存储在所述存储器中并可在所述处理器上运行的计算机程序。例如,该计算机程序可以为图1所对应的实施例中基于zabbix监控告警的方法对应的程序。例如,当计算机设备实现如图3所示的zabbix服务器的功能时,所述处理器执行所述计算机程序时实现上述图3所对应的实施例中由zabbix服务器执行的基于zabbix监控告警的方法中的各步骤;或者,所述处理器执行所述计算机程序时实现上述图3所对应的实施例的zabbix服务器中各模块的功能。又例如,该计算机程序可以为图1所对应的实施例中基于zabbix监控告警的方法对应的程序。
[0126] 所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分。
[0127] 所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0128] 所述收发器也可以用接收器和发送器代替,可以为相同或者不同的物理实体。为相同的物理实体时,可以统称为收发器。该收发器可以为输入输出单元。
[0129] 所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
[0130] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本申请各个实施例所述的方法。
[0131] 上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本申请的保护之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈