首页 / 专利库 / 软件 / 逻辑文件 / 一种EAM平台监控管理方法及系统

一种EAM平台监控管理方法及系统

阅读:1发布:2020-12-08

专利汇可以提供一种EAM平台监控管理方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种EAM平台监控管理方法及系统,通过预定义的七种分类的监控 抽取 进程 在任务调度的控制下获取监控对象的运行数据;监控分析进程进行数据转换和信息翻译;监控预警进程根据监控分析进程的结果进行提前预警或故障切换以实现问题的及时处理和系统故障修复后的及时恢复。通过这种机制,能够解决各种类型监控信息、指标的采集。此外,通过本发明的 监控系统 ,能够实现不同类型资源,包括系统和 接口 的监控整合,使系统管理员能够限时获取所有系统和接口的运行情况,并且能够通过历史记录查看系统运行的历史情况。这样,在有大量新用户接入前,就可根据系统运行情况增加更多软、 硬件 资源支持新用户的使用。,下面是一种EAM平台监控管理方法及系统专利的具体信息内容。

1.一种EAM平台监控管理方法,其特征在于,所述EAM平台监控管理方法适于在计算设备中执行,其包括:
监控抽取进程,获取各监控对象的系统运行数据,并将各监控对象的运行数据保存到本地的系统监控数据库
监控分析进程,根据业务逻辑对监控抽取进程获取的监控数据进行分析,生成对监控对象的可用性、健康情况以及业务数据处理情况的监控分析结果;及
监控预警进程,根据监控分析结果,以图形化页面、邮件或短信形式进行报警,以及调用Web反向代理服务器接口启/停监控对象负载均衡链路。
2.如权利要求1所述的一种EAM平台监控管理方法,其特征在于,所述监控对象包括:AS系统、eSOMS系统、P6系统、AWT系统、CIE系统、WCM系统、PIM系统、AS-P6接口、AS-eSOMS接口和eSOMS-P6接口。
3.如权利要求2所述的一种EAM平台监控管理方法,其特征在于,所述监控对象的监控点类型包括:数据库、Web应用服务器、Web服务、UNIX/LINUX操作系统、Windows操作系统、消息队列MQ和WAS会话数,所述Web应用服务器类型的监控点类型包括WAS类型和TOMCAT类型,所述UNIX/LINUX操作系统类型的监控点类型包括文件系统类型、内存类型、CPU类型和命令类型,所述Windows操作系统类型的监控点类型包括文件系统类型、内存类型和CPU类型。
4.如权利要求1所述的一种EAM平台监控管理方法,其特征在于,所述监控抽取进程通过以下技术手段获取各监控对象的系统运行数据:JDBC协议、JMX协议、HttpClient协议、Telnet协议、SNMP协议、JMS协议或com.ibm.ws.admin.client协议。
5.如权利要求3所述的一种EAM平台监控管理方法,其特征在于,通过UNIX连接池基于SSH2协议为所述UNIX操作系统分配连接与所述监控抽取进程连接,所述UNIX连接池设计有连接池管理器,所述UNIX连接池通过连接池管理器进行:初始化连接、创建连接、分发连接、回收连接、销毁连接和连接状态检查。
6.如权利要求5所述的一种EAM平台监控管理方法,其特征在于,所述UNIX连接池中UNIX操作系统的初始化连接数和最大连接数由配置文件决定,启动服务时,执行各个UNIX操作系统的UNIX连接池中初始化的SSH2连接;UNIX操作系统的初始化连接统一放在各个UNIX连接池的空闲池中,当调度时从空闲池取出放到活动池;各个UNIX连接池中UNIX操作系统的连接存放在EAM平台监控管理系统的程序内存中,以UNIX操作系统的服务器IP和服务器用户名取得连接;当有UNIX连接申请者申请获取连接时,连接池管理器先执行一个简单的命令以保持会话可用性;当有UNIX连接申请者申请释放连接时,进行连接回收、连接销毁并将连接放回以备后续使用;利用定时器进行定期的轮询检验UNIX连接池中未分配的连接可用性,当检查到不可用的连接后,销毁失效的连接,并根据最小连接数的情况申请新的连接。
7.如权利要求1所述的一种EAM平台监控管理方法,其特征在于,监控对象的监控点类型为命令类型时,所述监控抽取进程执行:
通过定时器启动命令类监控抽取进程;
根据UNIX操作系统类监控的配置策略,得到监控对象的服务器ID和所需要执行的操作命令;
从UNIX连接池申请并获取一个监控对象的服务器连接;
执行操作命令并得到执行命令后的结果;
申请释放监控对象的服务器连接;及
对命令结果进行格式化并保存在本地数据库中。
8.如权利要求1所述的一种EAM平台监控管理方法,其特征在于,所述监控分析进程分析AS系统的AS服务可用性的过程包括:
AS系统展现层子服务可用性分析,包括:
监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的进程监控数据分析是否存在展现层子服务进程,如果不存在,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的日志文件监控数据分析展现层子服务日志中是否出现异常,如果出现异常,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的数据库可用性监控数据分析展现层子服务数据库是否可用,如果不可用,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的展现层子服务所在WAS的WAS运行参数监控数据分析WAS运行参数是否出现异常,如果出现异常,则AS服务不可用,其中,WAS运行参数包括会话数、垃圾回收数、堆内存使用率、活动线程、守护线程、线程峰会和线程总数;
AS系统业务逻辑层子服务可用性分析,包括:
监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的进程监控数据分析是否存在业务逻辑子服务进程,如果不存在,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的监听进程个数监控数据分析监听进程个数是否低于阈值7个,如果低于阈值7个,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的日志文件监控数据分析业务逻辑子服务日志中是否出现异常,如果出现异常,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的队列个数监控数据分析队列个数是否超过阈值,如果超过阈值,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的队列增长监控数据分析队列增长在过去预定时间段内是否超过阈值,如果超过阈值,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的内存段使用率监控数据分析内存段使用率是否超过阈值,如果超过阈值,则AS服务不可用;
监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的数据库可用性监控数据分析业务逻辑子服务数据库是否可用,如果不可用,则AS服务不可用;
其中,所述监控分析进程由监控预警进程调用。
9.如权利要求1所述的一种EAM平台监控管理方法,其特征在于,所述监控预警进程预警AS系统的AS服务可用性的过程包括:
监控预警进程以5秒的频度调用监控分析进程,以获取AS服务可用性的监控分析结果;
当AS服务不可用时,首先,调用停止Web反向代理服务器的成员接口,实现Web反向代理服务器不再向该AS服务转发用户请求,并根据监控预警进程的配置发送提醒短信和/或提醒邮件;然后,判断该Web反向代理服务器下是否还有可用的AS服务,如果同一个Web反向代理服务器下所有的展现层子服务都不可用时,调用停止Web反向代理服务器的接口,停止Web反向代理服务,并根据监控预警进程的配置发送提醒短信和/或提醒邮件;
当AS服务恢复可用时,首先,检查该AS服务是否已经被系统管理员设置为手工停止状态,如果是,则结束,否则,判断该AS服务所属的Web反向代理服务器下是否有可用的AS服务;如果没有可用AS服务,调用启动Web反向代理服务器的接口,启动Web反向代理服务器,然后调用启动Web反向代理服务器的成员接口;如果有可用AS服务,则仅调用启动Web反向代理服务器的成员接口,启动Web反向代理服务器到该AS服务的访问,并根据监控预警进程的配置发送提醒短信和/或提醒邮件。
10.一种EAM平台监控管理系统,其特征在于,所述EAM平台监控管理系统有多条指令,所述指令适于由处理器加载并执行:
监控抽取进程,获取各监控对象的系统运行数据,并将各监控对象的运行数据保存到本地系统监控数据库;
监控分析进程,根据业务逻辑对监控抽取进程获取的监控数据进行数据转换和信息翻译,生成对监控对象的可用性、健康情况以及业务数据处理情况的监控分析结果;及监控预警进程,根据监控分析结果,以图形化页面、邮件或短信形式进行报警,以及调用Web反向代理服务器接口启/停监控对象负载均衡链路;
其中,所述EAM平台监控管理系统具有数据存储层、业务管理层和展现层,所述数据存储层设置有用于储存监控分析结果的规范化数据库,所述业务管理层设置有监控对象信息配置模、抽取策略配置模块、发送策略配置模块、邮件、短信接口配置模块、停机计划配置模块、预警阈值配置模块、日志文件自动归档模块和统一认证及权限管理模块,所述展现层设置有AS用户域监控主页、AS接口域监控主页、CIE监控主页、AS-P6-eSOMS监控主页和WCM-AWT-PIM监控主页,监控分析进程从系统监控数据库获得数据并进行分析后储存至规范化数据库,所述规范化数据库与展现层的AS用户域监控主页、AS接口域监控主页、CIE监控主页、AS-P6-eSOMS监控主页和WCM-AWT-PIM监控主页相连接,监控预警进程连接有Web反向代理服务器接口、全流程监控应用系统接口、短信网关接口和邮件服务器接口。

说明书全文

一种EAM平台监控管理方法及系统

技术领域

[0001] 本发明涉及软件平台的监控技术领域,具体涉及一种EAM平台监控管理方法及系统。

背景技术

[0002] 任何信息系统或平台都或多或少需要监控管理功能,特别是涉及工厂生产管理的信息平台系统。监控系统或者信息系统中的监控功能主要目的是对关注的目标资源的运行状态进行监测,采集监控目标的状态信息和指标信息,然后分析监控对象的健康状态,对任何异常状态进行告警。
[0003] 监控管理系统在保障信息平台运行过程中起到了非常重要的作用,其通过自动化以软件程序的方式,大大减轻了运维人员的工作量、降低了对运维人员的要求,使得运维人员能够使用较小的人就能够保障涉及电厂核心的复杂的企业资产管理平台(EAM)高效、稳定地运行。在减少平台故障时间,提升工厂生产管理平、提高安全生产能力,提高企业效益都有十分重要的意义。
[0004] 现在市场上的监控软件非常多,不同监控软件能够的监控对象类型不同,监控的深度和力度不同,应用领域也不尽相同。但还没特别是针对瑞士ABB公司EAM平台的监控管理系统,同时ABB公司也未提供针对该平台的监控系统。ABB公司的EAM平台是全球核电领域中使用最广泛、完全符合国际核电标准绩效模型(SNPM)的企业资产管理平台。该平台由以工单为核心的资产套件(Asset Suite,缩写:AS)及以隔离为核心的电子值班运行管理系统(Electronic Shift Operations Management System,eSOMS)组成。中国核能电力股份有限公司(以下简称中国核电)在2010年引入该平台后,在经历引进、消化、吸收后经过多次改造、升级、完善、创新后,开发了以AS、eSOMS为基础的CIE、AWT、WCM等系统以及相关接口
[0005] EAM作为中国核电核心的资产管理系统平台,其涉及到的资源类型繁多,数量繁多,需要监控的资源指标也非常多,现有市场以及原厂都没有任何监控软件能够满足该平台的所有监控需求。而且随着新电厂的不断加入、用户对平台可靠性的不断提高以及监控需求的不断发展,用户希望能够监控的资源越来越多,这使得监控的技术、数据分析能力也不断提高。为此,针对相关监控的难题,目前尚未提出有效的解决方案。

发明内容

[0006] 本发明的目的在于提供一种EAM平台监控管理方法及系统,用以解决目前瑞士ABB公司EAM平台没有监控管理系统的问题。
[0007] 为实现上述目的,本发明公开了一种EAM平台监控管理方法,所述EAM平台监控管理方法适于在计算设备中执行,其包括:监控抽取进程,获取各监控对象的系统运行数据,并将各监控对象的运行数据保存到本地的系统监控数据库;监控分析进程,根据业务逻辑对监控抽取进程获取的监控数据进行分析,生成对监控对象的可用性、健康情况以及业务数据处理情况的监控分析结果;及监控预警进程,根据监控分析结果,以图形化页面、邮件或短信形式进行报警,以及调用Web反向代理服务器接口启/停监控对象负载均衡链路。
[0008] 本发明公开的上述一种EAM平台监控管理方法,所述监控对象包括:AS系统、eSOMS系统、P6系统、AWT系统、CIE系统、WCM系统、PIM系统、AS-P6接口、AS-eSOMS接口和eSOMS-P6接口。
[0009] 本发明公开的上述一种EAM平台监控管理方法,所述监控对象的监控点类型包括:数据库、Web应用服务器、Web服务、UNIX/LINUX操作系统、Windows操作系统、消息队列MQ和WAS会话数,所述Web应用服务器类型的监控点类型包括WAS类型和TOMCAT类型,所述UNIX/LINUX操作系统类型的监控点类型包括文件系统类型、内存类型、CPU类型和命令类型,所述Windows操作系统类型的监控点类型包括文件系统类型、内存类型和CPU类型。
[0010] 本发明公开的上述一种EAM平台监控管理方法,所述监控抽取进程通过以下技术手段获取各监控对象的系统运行数据:JDBC协议、JMX协议、HttpClient协议、Telnet协议、SNMP协议、JMS协议或com.ibm.ws.admin.client协议。
[0011] 本发明公开的上述一种EAM平台监控管理方法,通过UNIX连接池基于SSH2协议为所述UNIX操作系统分配连接与所述监控抽取进程连接,所述UNIX连接池设计有连接池管理器,所述UNIX连接池通过连接池管理器进行:初始化连接、创建连接、分发连接、回收连接、销毁连接和连接状态检查。
[0012] 本发明公开的上述一种EAM平台监控管理方法,所述UNIX连接池中UNIX操作系统的初始化连接数和最大连接数由配置文件决定,启动服务时,执行各个UNIX操作系统的UNIX连接池中初始化的SSH2连接;UNIX操作系统的初始化连接统一放在各个UNIX连接池的空闲池中,当调度时从空闲池取出放到活动池;各个UNIX连接池中UNIX操作系统的连接存放在EAM平台监控管理系统的程序内存中,以UNIX操作系统的服务器IP和服务器用户名取得连接;当有UNIX连接申请者申请获取连接时,连接池管理器先执行一个简单的命令以保持会话可用性;当有UNIX连接申请者申请释放连接时,进行连接回收、连接销毁并将连接放回以备后续使用;利用定时器进行定期的轮询检验UNIX连接池中未分配的连接可用性,当检查到不可用的连接后,销毁失效的连接,并根据最小连接数的情况申请新的连接。
[0013] 本发明公开的上述一种EAM平台监控管理方法,监控对象的监控点类型为命令类型时,所述监控抽取进程执行:通过定时器启动命令类监控抽取进程;根据UNIX操作系统类监控的配置策略,得到监控对象的服务器ID和所需要执行的操作命令;从UNIX连接池申请并获取一个监控对象的服务器连接;执行操作命令并得到执行命令后的结果;申请释放监控对象的服务器连接;及对命令结果进行格式化并保存在本地数据库中。
[0014] 本发明公开的上述一种EAM平台监控管理方法,所述监控分析进程分析AS系统的AS服务可用性的过程包括:AS系统展现层子服务可用性分析,包括:监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的进程监控数据分析是否存在展现层子服务进程,如果不存在,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的日志文件监控数据分析展现层子服务日志中是否出现异常,如果出现异常,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的数据库可用性监控数据分析展现层子服务数据库是否可用,如果不可用,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的展现层子服务所在WAS的WAS运行参数监控数据分析WAS运行参数是否出现异常,如果出现异常,则AS服务不可用,其中,WAS运行参数包括会话数、垃圾回收数、堆内存使用率、活动线程、守护线程、线程峰会和线程总数;AS系统业务逻辑层子服务可用性分析,包括:监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的进程监控数据分析是否存在业务逻辑子服务进程,如果不存在,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的监听进程个数监控数据分析监听进程个数是否低于阈值7个,如果低于阈值7个,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的日志文件监控数据分析业务逻辑子服务日志中是否出现异常,如果出现异常,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的队列个数监控数据分析队列个数是否超过阈值,如果超过阈值,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的队列增长监控数据分析队列增长在过去预定时间段内是否超过阈值,如果超过阈值,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的内存段使用率监控数据分析内存段使用率是否超过阈值,如果超过阈值,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的数据库可用性监控数据分析业务逻辑子服务数据库是否可用,如果不可用,则AS服务不可用;其中,所述监控分析进程由监控预警进程调用。
[0015] 本发明公开的上述一种EAM平台监控管理方法,所述监控预警进程预警AS系统的AS服务可用性的过程包括:监控预警进程以5秒的频度调用监控分析进程,以获取AS服务可用性的监控分析结果;当AS服务不可用时,首先,调用停止Web反向代理服务器的成员接口,实现Web反向代理服务器不再向该AS服务转发用户请求,并根据监控预警进程的配置发送提醒短信和/或提醒邮件;然后,判断该Web反向代理服务器下是否还有可用的AS服务,如果同一个Web反向代理服务器下所有的展现层子服务都不可用时,调用停止Web反向代理服务器的接口,停止Web反向代理服务,并根据监控预警进程的配置发送提醒短信和/或提醒邮件;当AS服务恢复可用时,首先,检查该AS服务是否已经被系统管理员设置为手工停止状态,如果是,则结束,否则,判断该AS服务所属的Web反向代理服务器下是否有可用的AS服务;如果没有可用AS服务,调用启动Web反向代理服务器的接口,启动Web反向代理服务器,然后调用启动Web反向代理服务器的成员接口;如果有可用AS服务,则仅调用启动Web反向代理服务器的成员接口,启动Web反向代理服务器到该AS服务的访问,并根据监控预警进程的配置发送提醒短信和/或提醒邮件。
[0016] 本发明还公开了一种EAM平台监控管理系统,所述EAM平台监控管理系统有多条指令,所述指令适于由处理器加载并执行:监控抽取进程,获取各监控对象的系统运行数据,并将各监控对象的运行数据保存到本地系统监控数据库;监控分析进程,根据业务逻辑对监控抽取进程获取的监控数据进行数据转换和信息翻译,生成对监控对象的可用性、健康情况以及业务数据处理情况的监控分析结果;及监控预警进程,根据监控分析结果,以图形化页面、邮件或短信形式进行报警,以及调用Web反向代理服务器接口启/停监控对象负载均衡链路;其中,所述EAM平台监控管理系统具有数据存储层、业务管理层和展现层,所述数据存储层设置有用于储存监控分析结果的规范化数据库,所述业务管理层设置有监控对象信息配置模、抽取策略配置模块、发送策略配置模块、邮件、短信接口配置模块、停机计划配置模块、预警阈值配置模块、日志文件自动归档模块和统一认证及权限管理模块,所述展现层设置有AS用户域监控主页、AS接口域监控主页、CIE监控主页、AS-P6-eSOMS监控主页和WCM-AWT-PIM监控主页,监控分析进程从系统监控数据库获得数据并进行分析后储存至规范化数据库,所述规范化数据库与展现层的AS用户域监控主页、AS接口域监控主页、CIE监控主页、AS-P6-eSOMS监控主页和WCM-AWT-PIM监控主页相连接,监控预警进程连接有Web反向代理服务器接口、全流程监控应用系统接口、短信网关接口和邮件服务器接口。
[0017] 本发明具有如下优点:
[0018] 本发明全面、深入、近实时地对ABB公司EAM平台的软、硬件进行监控;监控分析进程通过自定义的算法进行系统可用性、健康性以及业务数据处理情况进行综合分析;监控预警进程则根据监控分析结果,实时控制断开、启动应用系统,为用户提供高可用性的应用系统,并通过邮件、短信及图形方式进行报警。附图说明
[0019] 图1为本发明公开的一种EAM平台监控管理系统的总体架构图。
[0020] 图2为本发明需要监控的具有代表性的AS服务的对象逻辑图。

具体实施方式

[0021] 以下实施例用于说明本发明,但不用来限制本发明的范围。
[0022] 实施例1
[0023] 参考图1,本实施例公开的一种EAM平台监控管理系统能够实现对不同类型资源监控的整合:ABB公司的EAM平台,其包括AS系统和eSOMS系统,Oracle公司的P6系统以及中国核电在此基础上开发的AWT、CIE、WCM、PIM等系统以及AS-P6接口,AS-eSOMS接口、eSOMS-P6接口,使用户能够即时获取到不同资源的运行信息,并且能够在需要时对监控管理系统进行扩展时,快速添加监控对象,从而有效地提高系统的横向扩展能力。
[0024] 本实施例公开的一种EAM平台监控管理系统有多条指令,所述指令适于由处理器加载并执行:监控抽取进程,获取各监控对象的系统运行数据,并将各监控对象的运行数据保存到本地系统监控数据库;监控分析进程,根据业务逻辑对监控抽取进程获取的监控数据进行数据转换和信息翻译,生成对监控对象的可用性、健康情况以及业务数据处理情况的监控分析结果;及监控预警进程,根据监控分析结果,以图形化页面、邮件或短信形式进行报警,以及调用Web反向代理服务器接口启/停监控对象负载均衡链路;其中,所述EAM平台监控管理系统具有数据存储层、业务管理层和展现层,所述数据存储层设置有用于储存监控分析结果的规范化数据库,所述业务管理层设置有监控对象信息配置模块、抽取策略配置模块、发送策略配置模块、邮件、短信接口配置模块、停机计划配置模块、预警阈值配置模块、日志文件自动归档模块和统一认证及权限管理模块,通过上述模块实现以下管理功能:监控对象的配置管理、监控抽取和监控预警的频度管理、监控对象停机计划管理、预警值的配置管理、监控日志自动压缩存储、统一认证及权限管理。所述展现层设置有AS用户域监控主页、AS接口域监控主页、CIE监控主页、AS-P6-eSOMS监控主页和WCM-AWT-PIM监控主页,监控分析进程从系统监控数据库获得数据并进行分析后储存至规范化数据库,所述规范化数据库与展现层的AS用户域监控主页、AS接口域监控主页、CIE监控主页、AS-P6-eSOMS监控主页和WCM-AWT-PIM监控主页相连接,监控预警进程连接有Web反向代理服务器接口、全流程监控应用系统接口、短信网关接口和邮件服务器接口。
[0025] 上述一种EAM平台监控管理系统的EAM平台监控管理方法适于在计算设备中执行,其包括:监控抽取进程,获取各监控对象的系统运行数据,并将各监控对象的运行数据保存到本地的系统监控数据库;监控分析进程,根据业务逻辑对监控抽取进程获取的监控数据进行分析,生成对监控对象的可用性、健康情况以及业务数据处理情况的监控分析结果;及监控预警进程,根据监控分析结果,以图形化页面、邮件或短信形式进行报警,以及调用Web反向代理服务器接口启/停监控对象负载均衡链路。
[0026] 进一步,上述监控对象包括:AS系统、eSOMS系统、P6系统、AWT系统、CIE系统、WCM系统、PIM系统、AS-P6接口、AS-eSOMS接口和eSOMS-P6接口。
[0027] 进一步,上述监控对象的监控点类型包括:数据库、Web应用服务器、Web服务、UNIX/LINUX操作系统、Windows操作系统、消息队列MQ和WAS会话数,所述Web应用服务器类型的监控点类型包括WAS类型和TOMCAT类型,所述UNIX/LINUX操作系统类型的监控点类型包括文件系统类型、内存类型、CPU类型和命令类型,所述Windows操作系统类型的监控点类型包括文件系统类型、内存类型和CPU类型。
[0028] 进一步,上述监控抽取进程通过以下技术手段获取各监控对象的系统运行数据:JDBC协议、JMX协议、HttpClient协议、Telnet协议、SNMP协议、JMS协议或com.ibm.ws.admin.client协议。
[0029] 为了减少被监控的UNIX操作系统的服务器的连接没有统一管理和连接数的上限没有限制的问题,从而导致无法再分配连接的问题,实现了与数据库连接池类似的UNIX连接池管理方案,通过UNIX连接池基于SSH2协议为上述UNIX操作系统分配连接与所述监控抽取进程连接,上述UNIX连接池设计有连接池管理器,上述UNIX连接池通过连接池管理器进行:初始化连接、创建连接、分发连接、回收连接、销毁连接和连接状态检查。
[0030] 进一步,上述UNIX连接池中UNIX操作系统的初始化连接数和最大连接数由配置文件决定,例如,UNIX连接池默认初始化连接数为10个,最大连接数为50个,启动服务时,执行各个UNIX操作系统的UNIX连接池中初始化的SSH2连接;UNIX操作系统的初始化连接统一放在各个UNIX连接池的空闲池中,当调度时从空闲池取出放到活动池;各个UNIX连接池中UNIX操作系统的连接存放在EAM平台监控管理系统的程序内存中,以UNIX操作系统的服务器IP和服务器用户名取得连接;当有UNIX连接申请者申请获取连接时,连接池管理器先执行一个简单的命令以保持会话可用性;当有UNIX连接申请者申请释放连接时,进行连接回收、连接销毁并将连接放回以备后续使用;利用定时器进行定期的轮询检验UNIX连接池中未分配的连接可用性,当检查到不可用的连接后,销毁失效的连接,并根据最小连接数的情况申请新的连接。
[0031] 在本实施例中,监控抽取进程提供监控信息采集的功能,能够对具体监控采用预定义的监控方式进行监控信息收集,并将采集到的监控信息保存在系统监控数据库中。监控对象的监控点类型为命令类型时,所述监控抽取进程具体的流程为:通过定时器启动命令类监控抽取进程;根据UNIX操作系统类监控的配置策略,得到监控对象的服务器ID和所需要执行的操作命令;从UNIX连接池申请并获取一个监控对象的服务器连接;执行操作命令并得到执行命令后的结果;申请释放监控对象的服务器连接;及对命令结果进行格式化并保存在本地数据库中。
[0032] 在本实施例中,监控分析进程根据监控抽取进程采集的数据和预定义的分析算法判断所监控对象的可用性、系统运行健康情况、业务数据处理情况。结合图1和2说明监控分析进程分析AS系统的AS服务可用性的具体工作流程:AS系统展现层子服务可用性分析,包括:监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的进程监控数据分析是否存在展现层子服务进程,如果不存在,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的日志文件监控数据分析展现层子服务日志中是否出现异常,如果出现异常,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的展现层子服务的数据库可用性监控数据分析展现层子服务数据库是否可用,如果不可用,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的展现层子服务所在WAS的WAS运行参数监控数据分析WAS运行参数是否出现异常,如果出现异常,则AS服务不可用,其中,WAS运行参数包括会话数、垃圾回收数、堆内存使用率、活动线程、守护线程、线程峰会和线程总数;AS系统业务逻辑层子服务可用性分析,包括:监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的进程监控数据分析是否存在业务逻辑子服务进程,如果不存在,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的监听进程个数监控数据分析监听进程个数是否低于阈值7个,如果低于阈值7个,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的日志文件监控数据分析业务逻辑子服务日志中是否出现异常,如果出现异常,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的队列个数监控数据分析队列个数是否超过阈值,如果超过阈值,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的队列增长监控数据分析队列增长在过去预定时间段内是否超过阈值,如果超过阈值,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的内存段使用率监控数据分析内存段使用率是否超过阈值,如果超过阈值,则AS服务不可用;监控分析进程根据数据库中由监控抽取进程获取的业务逻辑子服务的数据库可用性监控数据分析业务逻辑子服务数据库是否可用,如果不可用,则AS服务不可用;其中,所述监控分析进程由监控预警进程调用。
[0033] 在本实施例中,监控预警进程根据监控分析进程分析得到的结果,以图形化页面、邮件、短信等形式进行即时展现、报警,同时,调用IBMWebSeal系统接口启动、停止AS系统负载均衡的链路接口,实现故障自动切换和转移。以下为监控预警进程在分析得到AS服务可用的结果后的预警工作流程:监控预警进程以5秒的频度调用监控分析进程,以获取AS服务可用性的监控分析结果;当AS服务不可用时,首先,调用停止Web反向代理服务器的成员接口,实现Web反向代理服务器不再向该AS服务转发用户请求,并根据监控预警进程的配置发送提醒短信和/或提醒邮件;然后,判断该Web反向代理服务器下是否还有可用的AS服务,如果同一个Web反向代理服务器下所有的展现层子服务都不可用时,调用停止Web反向代理服务器的接口,停止Web反向代理服务,并根据监控预警进程的配置发送提醒短信和/或提醒邮件;当AS服务恢复可用时,首先,检查该AS服务是否已经被系统管理员设置为手工停止状态,如果是,则结束,否则,判断该AS服务所属的Web反向代理服务器下是否有可用的AS服务;如果没有可用AS服务,调用启动Web反向代理服务器的接口,启动Web反向代理服务器,然后调用启动Web反向代理服务器的成员接口;如果有可用AS服务,则仅调用启动Web反向代理服务器的成员接口,启动Web反向代理服务器到该AS服务的访问,并根据监控预警进程的配置发送提醒短信和/或提醒邮件。
[0034] 本实施例中其它管理功能中增加自动监控对象的方式:系统管理员在监控对象管理页面增加一个监控对象,并针对监控对象的各个监控点配置以下七种监控抽取策略的某一类:JDBC协议、JMX协议、HttpClient协议、Telnet协议、SNMP协议、JMS协议和com.ibm.ws.admin.client协议。具体地,Windows操作系统类抽取通过SNMP协议实现,数据库类抽取通过JDBC协议实现,Web应用服务器类抽取通过JMX协议实现,UNIX操作系统类抽取通过Telnet协议实现,Web服务类抽取通过HttpClient协议实现,消息队列类抽取通过JMS协议实现、WAS会话数类抽取通过com.ibm.ws.admin.client协议实现;系统管理员在监控分析管理页面上传、发布新的监控数据分析类;系统管理员在监控分析管理页面为抽取结果选择监控数据分析类,并验证数据分析类的正常性;系统管理员在监控预警管理页面上传、发布新的接口调用类;系统管理员在监控预警管理页面定义预警的接口方式:邮件、短信、Web Service。
[0035] 综上所述,借助于本发明的实施方案,通过预定义的七种分类的监控抽取进程在任务调度的控制下获取监控对象的运行数据;监控分析进程进行数据转换和信息翻译;监控预警进程根据监控分析进程的结果进行提前预警或故障切换以实现问题的及时处理和系统故障修复后的及时恢复。通过这种机制,能够解决各种类型监控信息、指标的采集。此外,通过本发明的监控系统,能够实现不同类型资源,包括系统和接口的监控整合,使系统管理员能够限时获取所有系统和接口的运行情况,并且能够通过历史记录查看系统运行的历史情况。这样,在有大量新用户接入前,就可根据系统运行情况增加更多软、硬件资源支持新用户的使用。
[0036] 本发明使用了或隐含使用了计算机领域的一些基本概念,它们分别是:
[0037] EAM:Enterprise Asset Management企业资源管理系统;
[0038] AS系统:Asset Suite资产套件,ABB公司的EAM软件;
[0039] eSOMS:Electronic Shift Operations Management System,电子值班运行管理系统,ABB公司的核电运行管理软件;
[0040] CIE:Common Interface Engine,中国核电开发的针对Web应用的通用接口开发平台;
[0041] AWT:Auto Work-order Terminal,中国核电开发的工单自动开完工终端设备;
[0042] WCM:Work-order Control Management System,中国核电开发的工单签入签出控制管理系统;
[0043] PIM:Plant Information Management中国核电开发的电厂信息管理;
[0044] P6:美国oracle公司的计划排程软件;
[0045] WAS:Websphere Application Server,IBM公司的Web应用服务器;
[0046] TOMCAT:Apache组织提供开源的Web应用服务器;
[0047] MQ:Message Queue,即,消息队列,一种大量使用的计算机所应用程序间通信的接口技术;
[0048] JDBC:Java DataBase Connectivity,即Java数据库连接。这是一种用于执行SQL语句的Java API;
[0049] JMX:Java Management Extensions,即Java管理扩展。实现该功能的程序,可被管理和监控。常见的Web应用服务器,如WAS、TOMCAT、JBOSS,均实现此功能,因为可以很容易被监控、管理;
[0050] HttpClient:Apache组织提供的用于支持HTTP协议的客户端编程工具包;
[0051] Telnet:该协议是TCP/IP协议族中的一员,是Internet远程登陆服务器的标准协议和主要方式。它为用户提供了在本地计算机上完成远程主机工作的能力;
[0052] SNMP:Simple Network Management Protocol,即简单网络管理协议,由一组网络管理的标准组成,该协议能够支持网络管理系统,用以监测连接到网络上的服务器是否有任何引起管理上关注的情况;
[0053] JMS:Java Message Service,即Java消息服务应用程序接口,是一个Java平台中关于面向消息中间件(MOM)的API,用于在两个应用程序之间,或分布式系统中发送消息,进行异步通信。Java消息服务是一个与具体平台无关的API;
[0054] com.ibm.ws.admin.client:WAS系统提供的专连接WAS的JAR包;
[0055] SSH:Secure Shell,即安全外壳协议,由IETF的网络小组(NetworkWorking Group)所制定;SSH为建立在应用层基础上的安全协议。SSH是目前较可靠,专为远程登录会话和其他网络服务提供安全性的协议;
[0056] WebSeal:IBM公司的高性能、多线程的Web服务器,通常作为反向Web代理服务器使用。本文中,即把WebSeal作为一种反向代理服务器实现;
[0057] FA:AS系统的展现层;
[0058] 水晶报表:Crystal Reports,是一款商务智能(BI)软件,主要用于设计及产生报表。水晶报表是业内最专业、功能最强的报表系统,它除了强大的报表功能外。最大的优势是实现了与绝大多数流行开发工具的集成和接口;
[0059] Web Service:是一个平台独立的,低耦合的,自包含的、基于可编程的web的应用程序,可使用开放的XML(标准通用标记语言下的一个子集)标准来描述、发布、发现、协调和配置这些应用程序,用于开发分布式的互操作的应用程序;
[0060] SOI:Service Oriented Integration,AS的一种接口类型;
[0061] IF:Integration Framework,AS的一种接口类型;
[0062] FI:Financial Integration,AS的一种接口类型;
[0063] ADS:Adapter for Document Services,AS的一种接口类型。
[0064] 虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈