首页 / 专利库 / 专利权 / 第I章 / 国际申请 / 修改 / 一种服务器CMC双机热活方法、系统、终端及存储介质

一种服务器CMC双机热活方法、系统、终端及存储介质

阅读:965发布:2021-06-08

专利汇可以提供一种服务器CMC双机热活方法、系统、终端及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 提供一种 服务器 CMC双机热活方法、系统、终端及存储介质,服务器包括第一CMC和第二CMC,所述第一CMC与所述第二CMC通信连接,方法包括:获取第二CMC 修改 数据及修改过程数据,根据所述修改过程数据确认需要对本地相应数据同步处理后,将本地相应数据更新为所述修改数据;所述修改过程数据包括原数据和修改时间;获取第二CMC的工作模式,在确认第二CMC同时负责对内管理和对外管理后,将本地空闲工作模式切换为对内管理;在确认第二CMC故障后向第二CMC发送复位 信号 ,并在确认故障解除后将本地所有数据同步至第二CMC。本发明中两个CMC设备互为备份同时协作运行,即可确保安全冗余备份,又可提高设备利用效率,还能便于后续功能的扩展。,下面是一种服务器CMC双机热活方法、系统、终端及存储介质专利的具体信息内容。

1.一种服务器CMC双机热活方法,其特征在于,服务器包括第一CMC和第二CMC,所述第一CMC与所述第二CMC通信连接,方法包括:
获取第二CMC修改数据及修改过程数据,根据所述修改过程数据确认需要对本地相应数据同步处理后,将本地相应数据更新为所述修改数据;所述修改过程数据包括原数据和修改时间;
获取第二CMC的工作模式,在确认第二CMC同时负责对内管理和对外管理后,将本地空闲工作模式切换为对内管理;
在确认第二CMC故障后向第二CMC发送复位信号,并在确认故障解除后将本地所有数据同步至第二CMC。
2.根据权利要求1所述的方法,其特征在于,所述根据修改过程数据确认需要对本地相应数据同步处理,包括:
确认第二CMC的原数据与本地相应数据相同后,对本地相应数据做同步处理;
在第二CMC的原数据与本地相应数据不同时,确认第二CMC的修改时间比本地数据修改时间晚,对本地相应数据做同步处理。
3.根据权利要求1所述的方法,其特征在于,所述确认第二CMC故障,包括:
获取第二CMC的脉冲信号;
确认无法获取第二CMC脉冲信号的时间超过预设时间后,向第二CMC发起询问;
判断是否接收到第二CMC对询问的应答:
是,则判定第二CMC脉冲信号生成装置故障;
否,则判定第二CMC故障。
4.根据权利要求1所述的方法,其特征在于,所述在确认第二CMC故障后向第二CMC发送复位信号,包括:
将本地工作模式切换为对外管理和对内管理兼备模式,接管第二CMC业务;
向第二CMC发送复位信号;
生成第二CMC故障记录日志。
5.一种服务器CMC双机热活系统,其特征在于,服务器包括第一CMC和第二CMC,所述第一CMC与所述第二CMC通信连接,系统包括:
数据同步单元,配置用于获取第二CMC修改数据及修改过程数据,根据所述修改过程数据确认需要对本地相应数据同步处理后,将本地相应数据更新为所述修改数据;所述修改过程数据包括原数据和修改时间;
模式切换单元,配置用于获取第二CMC的工作模式,在确认第二CMC同时负责对内管理和对外管理后,将本地空闲工作模式切换为对内管理;
故障监测单元,配置用于在确认第二CMC故障后向第二CMC发送复位信号,并在确认故障解除后将本地所有数据同步至第二CMC。
6.根据权利要求5所述的系统,其特征在于,所述数据同步单元包括:
数据比对模,配置用于确认第二CMC的原数据与本地相应数据相同后,对本地相应数据做同步处理;
时间比对模块,配置用于在第二CMC的原数据与本地相应数据不同时,确认第二CMC的修改时间比本地数据修改时间晚,对本地相应数据做同步处理。
7.根据权利要求5所述的系统,其特征在于,所述故障监测单元包括:
脉冲获取模块,配置用于获取第二CMC的脉冲信号;
询问发起模块,配置用于确认无法获取第二CMC脉冲信号的时间超过预设时间后,向第二CMC发起询问;
应答接收模块,配置用于判断是否接收到第二CMC对询问的应答;
第一判定模块,配置用于判定第二CMC脉冲信号生成装置故障;
第二判定模块,配置用于判定第二CMC故障。
8.根据权利要求5所述的系统,其特征在于,所述故障监测单元包括:
业务接管模块,配置用于将本地工作模式切换为对外管理和对内管理兼备模式,接管第二CMC业务;
信号发送模块,配置用于向第二CMC发送复位信号;
故障记录模块,配置用于生成第二CMC故障记录日志。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器
其中,所述处理器被配置为执行权利要求1-4任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。

说明书全文

一种服务器CMC双机热活方法、系统、终端及存储介质

技术领域

[0001] 本发明属于服务器技术领域,具体涉及一种服务器CMC双机热活方法、系统、终端及存储介质。

背景技术

[0002] 随着AI技术和互联网技术的快速发展,以往单一的服务器单元已经无法满足海量数据的处理需要,大规模并行化的计算机系统架构,尤其具有扩展性强,计算能高、支持统一管理等特点,越来越迎合大数据时代对服务器产品的需求,这使得目前的服务器系统物理体积逐渐庞大、模组成逐渐复杂、集成度逐渐增加。随着服务器的功能和节点数量逐渐增加,而对于监控管理的挑战逐渐增加,同时对系统的冗余度要求也越来越高。
[0003] 目前关于双机冗余备份主要有两种形式,一种是主备模式(既Active-Standby的模式),一种是双机热活(既Active-Active的模式)。具体说,主备模式指的是系统中主机负责全部业务的管理和运行(即Active状态),而备机则处于备用状态(即Standby状态);双机热活模式指的是为了提高双机设备利用效率,让双机协作各负责一部分业务分开运行,且业务互相备份(即Active-Standby和Standby-Active状态),该模式充分利用了主备模式中长期闲置的备机来给主机进行分担压力。相对于主备模式,双机热活模式在充分利用设备资源方面具有很大优越性。
[0004] 但是,现有双机热活模式存在两个独立运行的CMC之间没有数据同步机制,当有一个CMC出现故障后,另一个CMC根本无法知道,进而两个CMC就会出现数据、参数不一致的情况发生。当看狗将故障设备重启,故障恢复后,两个独立运行且参数不同步的CMC,此时就是出现管理打架的问题,进而造成系统混乱的问题。由于两个CMC数据不同步,如果客户登录两个CMC查看数据,存在会看到两套不同的数据、参数的情况,导致用户体验极差。

发明内容

[0005] 针对现有技术的上述不足,本发明提供一种服务器CMC双机热活方法、系统、终端及存储介质,以解决上述技术问题。
[0006] 第一方面,本发明提供一种服务器CMC双机热活方法,服务器包括第一CMC和第二CMC,所述第一CMC与所述第二CMC通信连接,方法包括:
[0007] 获取第二CMC修改数据及修改过程数据,根据所述修改过程数据确认需要对本地相应数据同步处理后,将本地相应数据更新为所述修改数据;所述修改过程数据包括原数据和修改时间;
[0008] 获取第二CMC的工作模式,在确认第二CMC同时负责对内管理和对外管理后,将本地空闲工作模式切换为对内管理;
[0009] 在确认第二CMC故障后向第二CMC发送复位信号,并在确认故障解除后将本地所有数据同步至第二CMC。
[0010] 进一步的,所述根据修改过程数据确认需要对本地相应数据同步处理,包括:
[0011] 确认第二CMC的原数据与本地相应数据相同后,对本地相应数据做同步处理;
[0012] 在第二CMC的原数据与本地相应数据不同时,确认第二CMC的修改时间比本地数据修改时间晚,对本地相应数据做同步处理。
[0013] 进一步的,所述确认第二CMC故障,包括:
[0014] 获取第二CMC的脉冲信号;
[0015] 确认无法获取第二CMC脉冲信号的时间超过预设时间后,向第二CMC发起询问;
[0016] 判断是否接收到第二CMC对询问的应答:
[0017] 是,则判定第二CMC脉冲信号生成装置故障;
[0018] 否,则判定第二CMC故障。
[0019] 进一步的,所述在确认第二CMC故障后向第二CMC发送复位信号,包括:
[0020] 将本地工作模式切换为对外管理和对内管理兼备模式,接管第二CMC业务;
[0021] 向第二CMC发送复位信号;
[0022] 生成第二CMC故障记录日志。
[0023] 第二方面,本发明提供一种服务器CMC双机热活系统,服务器包括第一CMC和第二CMC,所述第一CMC与所述第二CMC通信连接,系统包括:
[0024] 数据同步单元,配置用于获取第二CMC修改数据及修改过程数据,根据所述修改过程数据确认需要对本地相应数据同步处理后,将本地相应数据更新为所述修改数据;所述修改过程数据包括原数据和修改时间;
[0025] 模式切换单元,配置用于获取第二CMC的工作模式,在确认第二CMC同时负责对内管理和对外管理后,将本地空闲工作模式切换为对内管理;
[0026] 故障监测单元,配置用于在确认第二CMC故障后向第二CMC发送复位信号,并在确认故障解除后将本地所有数据同步至第二CMC。
[0027] 进一步的,所述数据同步单元包括:
[0028] 数据比对模块,配置用于确认第二CMC的原数据与本地相应数据相同后,对本地相应数据做同步处理;
[0029] 时间比对模块,配置用于在第二CMC的原数据与本地相应数据不同时,确认第二CMC的修改时间比本地数据修改时间晚,对本地相应数据做同步处理。
[0030] 进一步的,所述故障监测单元包括:
[0031] 脉冲获取模块,配置用于获取第二CMC的脉冲信号;
[0032] 询问发起模块,配置用于确认无法获取第二CMC脉冲信号的时间超过预设时间后,向第二CMC发起询问;
[0033] 应答接收模块,配置用于判断是否接收到第二CMC对询问的应答;
[0034] 第一判定模块,配置用于判定第二CMC脉冲信号生成装置故障;
[0035] 第二判定模块,配置用于判定第二CMC故障。
[0036] 进一步的,所述故障监测单元包括:
[0037] 业务接管模块,配置用于将本地工作模式切换为对外管理和对内管理兼备模式,接管第二CMC业务;
[0038] 信号发送模块,配置用于向第二CMC发送复位信号;
[0039] 故障记录模块,配置用于生成第二CMC故障记录日志。
[0040] 第三方面,提供一种终端,包括:
[0041] 处理器、存储器,其中,
[0042] 该存储器用于存储计算机程序
[0043] 该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
[0044] 第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
[0045] 本发明的有益效果在于,
[0046] 本发明提供的服务器CMC双机热活方法、系统、终端及存储介质,通过在服务器的两个CMC之间建立通信连接,并根据原数据+时间比对原则实现两个CMC的数据修改同步;在确认另一个CMC同时负责对内管理和对外管理后,将自身空闲工作模式切换为对内管理,实现两个CMC的业务均衡,避免存在CMC空跑的现象;在确认另一个CMC故障后向故障CMC发送复位信号,并在确认故障解除后将本地所有数据同步至故障CMC,通过发送复位信号重启故障CMC相对于原有利用看门狗重启,延迟更低。本发明中两个CMC设备互为备份同时协作运行,即可确保安全冗余备份,又可提高设备利用效率,还能便于后续功能的扩展。实现了真正的双机热活。解决了系统资源闲置无法充分利用的问题,有效地提高服务器的稳定性和可靠性。降低运维成本,提高产品口碑。
[0047] 此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。附图说明
[0048] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049] 图1是本发明一个实施例的方法的示意性流程图
[0050] 图2是本发明一个实施例的方法的服务器拓扑示意图。
[0051] 图3为本发明实施例提供的一种终端的结构示意图。

具体实施方式

[0052] 为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0053] 下面对本发明中出现的关键术语进行解释。
[0054] 图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种服务器CMC双机热活系统。
[0055] 如图1所示,该方法100包括:
[0056] 步骤110,获取第二CMC修改数据及修改过程数据,根据所述修改过程数据确认需要对本地相应数据同步处理后,将本地相应数据更新为所述修改数据;所述修改过程数据包括原数据和修改时间;
[0057] 步骤120,获取第二CMC的工作模式,在确认第二CMC同时负责对内管理和对外管理后,将本地空闲工作模式切换为对内管理;
[0058] 步骤130,在确认第二CMC故障后向第二CMC发送复位信号,并在确认故障解除后将本地所有数据同步至第二CMC
[0059] 可选地,作为本发明一个实施例,所述根据修改过程数据确认需要对本地相应数据同步处理,包括:
[0060] 确认第二CMC的原数据与本地相应数据相同后,对本地相应数据做同步处理;
[0061] 在第二CMC的原数据与本地相应数据不同时,确认第二CMC的修改时间比本地数据修改时间晚,对本地相应数据做同步处理。
[0062] 可选地,作为本发明一个实施例,所述确认第二CMC故障,包括:
[0063] 获取第二CMC的脉冲信号;
[0064] 确认无法获取第二CMC脉冲信号的时间超过预设时间后,向第二CMC发起询问;
[0065] 判断是否接收到第二CMC对询问的应答:
[0066] 是,则判定第二CMC脉冲信号生成装置故障;
[0067] 否,则判定第二CMC故障。
[0068] 可选地,作为本发明一个实施例,所述在确认第二CMC故障后向第二CMC发送复位信号,包括:
[0069] 将本地工作模式切换为对外管理和对内管理兼备模式,接管第二CMC业务;
[0070] 向第二CMC发送复位信号;
[0071] 生成第二CMC故障记录日志。
[0072] 为了便于对本发明的理解,如图2所示,下面对本发明所用到的服务器拓扑结构进行描述:
[0073] (1)CMC管理模块通过LAN与交换机连接,提供人机交互和远程管理服务。客户可以通过LAN访问任意一个CMC设备,对整机管理系统进行控制和访问。(该总线形成了本设计中对外服务业务的实体部分)
[0074] (2)CMC管理模块通过I3C总结或者I2C总线与各个节点设备相连接,CMC通过该总线采集每个节点上的数据或者控制每个节点上设备。(本原理图中扇模组也被抽象成一个节点)。(该链路形成了本设计中的对内管理业务的实体部分。)
[0075] (3)两个CMC设备之间采用I3C总线连接,形成了两个CMC设备之间的数据通信和数据同步链路。主从模式采用多主模式或者默认从模式,谁发起通讯谁切换到主模式,可根基实际情况配置,本设计不做强制要求。
[0076] (4)两个CMC设备之间连接有双向两根心跳信号线,分别向对方CMC提供自己的心跳信号。用于检测对方设备的故障状态。心跳信号为脉冲信号。
[0077] (5)两个CMC设备之间连接有两个复位信号线,分别用于复位故障设备。
[0078] 对内管理业务:CMC设备负责整机柜/箱的各个节点上的信息采集和散热风扇调控,前面板按键和指示灯的显示控制管理工作。
[0079] 对外管理业务:CMC设备对外提供web服务、命令行等人机交互的接口等服务,用于远程设备管理、固件更新或者故障上报远程控制中心等服务。
[0080] 基于上述拓扑结构,具体的,所述服务器CMC双机热活方法包括:
[0081] S1、数据修改同步。
[0082] 首先对两个CMC时钟进行同步,开机后系统按照默认工作模式进行工作,由于设备RTC时间由负责对内管理的CMC设备获取,所以将负责对内管理业务的CMC将时钟信息同步更新至负责对外服务业务的CMC。
[0083] 两个CMC系统采用相同数据存放格式,当一个CMC的存储数据发生变化时,数据同步模块就将“原有数据+修改后数据+修改时间”打包发送给另外一个CMC。另外一个CMC收到该同步数据后,首先判断原有数据与本地数据是否相同,如果相同说明本地数据未发生变化,直接更新修改后数据。如果原有数据与本地数据不同,说明本地也发生了修改,则对比数据修改时间,哪个时间新采用哪个数据,并同时反同步回去。保持数据一致性。
[0084] S2、工作模式切换。
[0085] 本设计中CMC主要有以下4种工作模式:系统只负责对内管理业务(模式1),系统只负责对外服务业务(模式2),系统负责全部业务(模式3),系统空闲模式(模式4)。
[0086] 由于对内管理业务不存在空闲模式,所以对内管理只有模式1。但是对外服务业务存在客户不访问的情况,也就是存在网络访问空闲模式,因此模式2的空闲状态定义为模式4。当有客户访问模式4的CMC设备时,自动变为模式2。持续一段时间无网络访问则变为模式
4。
[0087] 系统上电后默认两个CMC设备都是处于系统空闲状态(模式4),谁先起来谁先询问对方工作模式,如果对方是空闲状态,则自己切换到对内管理业务模式(模式1)。例如:CMC0设备先起来,则CMC0负责对内管理业务,CMC1负责对外管理业务。
[0088] 当客户通过网络访问CMC0时,CMC0主要负责对外服务,CMC1主要负责对内管理工作。
[0089] 当客户通过网络访问CMC1时,CMC1承担起对外服务的工作,CMC0则负责对内管理的工作。
[0090] 当客户同时访问两个CMC时,对内管理的责任人则维持现状不变,两个CMC同时提供对外服务业务。(一个模式3,一个模式2)
[0091] 当客户都不访问时,对内管理和对外管理的责任人则保持现有状态维持不变。(一个模式1,一个模式4)。
[0092] 由于两个CMC设备之间数据实时同步且互为备份,因此工作模式可以实现无缝切换。双机采用内外业务协作模式工作,对内管理业务只能由一个设备负责,对外服务业务可以由两个设备同时提供。客户访问哪个CMC,哪个CMC提供对外业务,相应的另外一个负责对内管理业务。均衡资源,提高效率。
[0093] CMC设备工作模式主要有四种工作模式,系统只负责对内管理业务(模式1),系统只负责对外服务业务(模式2),系统负责全部业务(模式3)和模式2的空闲状态(模式4)。
[0094] 本设计支持手动设置工作模式和自动动态调整。
[0095] 手动设置工作模式时,系统按照客户设定的工作模式进行工作,模式切换模块不在进行模式调整工作。例如,客户设置两个CMC分别工作在“模式3和模式4”就是典型的主备模式。客户也可以设置两个CMC分别工作在“模式1和模式2”,只要是正常工作模式都可以设置,不允许客户进行异常工作模式搭配的配置,只给出正常工作模式搭配选项。
[0096] 自动动态调整时,模式切换模块会定期检查两个CMC设备的工作模式,进行工作模式的纠错和优化处理。以下是系统自动切换模式:
[0097] 异常工作模式搭配:(不可以同时存在的模式,会系统异常):
[0098] ①模式1和模式1;②模式2和模式2;③模式3和模式3;④模式4和模式4;⑤模式1和模式3;⑥模式2和模式4;
[0099] 根据系统中必须有对内管理,且不能同时对内管理的原则,上述情况均为异常工作情况,只要系统模式切换模块检测到该情况发生,会立刻按照默认模式重新分配。
[0100] 2、正常工作模式搭配:(可以同时存在的模式,无需切换):
[0101] ①模式1和模式2;②模式1和模式4;③模式3和模式2;
[0102] 这3中情况均为正常工作模式,亦无需进行模式切换。
[0103] 3、边界工作模式搭配:(可以正常工作,需要模式切换)
[0104] 模式3和模式4;
[0105] 当系统中存在该情况时,就是典型的主备模式,一个负责全部业务,一个完全空闲,因此系统会进行模式切换,保证持续对外服务的同时,将对内管理业务交给空闲的设备进行处理。也就是修改为“模式2和模式1”的组合,将对内管理业务交给模式4所在的CMC(模式变更为模式1)。而自己只负责对外服务业务(由模式3,切换到模式2)。
[0106] CMC设备内部状态切换:
[0107] ①模式2与模式4的切换:处于模式2的CMC设备,持续一段时间(例如5秒)无网络访问则变为模式4。当有客户访问模式4的CMC设备时,立刻自动变为模式2。
[0108] ②模式1与模式3的切换:处于模式1的CMC设备,如果客户突然通过网络进行访问,则立刻将模式变更为模式3。如果持续一段时间(例如5秒)无网络访问则自动变更为模式1。
[0109] 上述两种内部状态切换时,会触发检测一次对方设备的工作模式,如果形成“模式3和模式4”的边界工作模式组合,就会立刻启动模式切换工作。以保证系统高效运行。
[0110] 设备故障时CMC设备之间状态切换:
[0111] 当CMC设备检测到另外一个CMC设备出现故障的时候,无论自己处于什么模式,都将自己切换到全业务模式既模式3。(如果一段间隔后无网络访问,内部状态切换机制会使其会自动在回落到模式1。)
[0112] 当CMC设备检测到另外一个CMC设备故障恢复后(该CMC一定处于模式3(有网络访问)或者模式1(无网络访问)中的一种),等同步数据完成后,根据自身情况进行模式切换,如果当前处于模式3,则将对内管理业务交给对方,告知对方切换到模式1,自己切换到模式2工作。如果当前自身处于模式1,则告知对方工作在模式2即可。自己不变。
[0113] S3、互相监测故障。
[0114] 每个CMC系统中都有故障检测模块,负责本设备的心跳信号的生成和对方设备心跳信号的监测功能。
[0115] ①故障检测模块,负责收集本机工作状态和线程的异常挂起情况,当本机工作正常时,故障检测模块会在心跳信号IO上产生持续的脉冲信号。当检测到本机线程挂起等工作异常时,心跳信号就会停止输出。当出现死机、程序跑飞等情况时,故障检测模块也会死的自然无法输出信号
[0116] ②检测对方心跳信号,故障检测模块会实时监控对方CMC设备的心跳信号IO上是否有心跳信号,当超过1秒检测不到对方脉冲信号,即可初步判断对方设备异常。
[0117] ③确认对方心跳信号,故障检测模块会立刻通过数据总线向对方发起询问,如果对方无应答,则判定对方设备出现故障。如果对方有应答,则再次检测心跳信号,如果恢复则为假死,继续工作。如果检测不到,说明对方故障检测模块异常,也判定为对方设备故障,同步好数据后,将对方重启。
[0118] 故障处理机制,当故障检测模块判定对方设备出现故障时,本机CMC设备立刻接管全部工作,将自己的工作模式调整为模式3,另外通过复位信号线,将故障设备重启。具体的模式切换,故障恢复后的数据同步方式和工作模式再切换,前面均有介绍到,不再赘述。
[0119] 本机故障恢复模块,主要有看门狗和外部复位信号线组成,当系统运行过程中出现异常会导致不喂狗的情况,一段时间后看门狗饿死,会重启系统。当对方设备先检查到本机设备故障时,对方会通过复位信号线将本机拉复位。看门狗一般延时较长(本系统设计为4秒,可根据实际情况调整),一般情况下,对方CMC会优先看门狗发现系统故障。看门狗在收到外界干扰出现两个CMC同时故障时,提供复位。当然,如果看门狗的实际时间足够短,或者心跳检测机制比较慢,也会出现看门狗先复位的情况。
[0120] CMC设备除了进行常规的运行过程中各种功能和服务的异常情况进行日志记录和告警外,也会对另外一个CMC设备的故障情况进行记录和告警,以便维护人员能够及时了解到两个CMC设备的运行状态。
[0121] 当故障模块判定对方CMC设备出现故障时,本机会立刻将该情况记录在LOG日志中,并通过LED和上报远程服务器的方式进行一般告警。
[0122] 如果故障设备一天内出现两次故障及以上则上报严重级别的告警。
[0123] 如果故障设备无法通过复位的方式恢复工作,则CMC设备继续上报致命级别的故障告警。
[0124] 该告警会持续存在,即使另外一个CMC设备通过复位恢复了业务,也不会取消,除非维护人员手动消除。
[0125] 本实施例提供的服务器CMC双机热活系统3包括:
[0126] 数据同步单元,配置用于获取第二CMC修改数据及修改过程数据,根据所述修改过程数据确认需要对本地相应数据同步处理后,将本地相应数据更新为所述修改数据;所述修改过程数据包括原数据和修改时间;包括:数据比对模块,配置用于确认第二CMC的原数据与本地相应数据相同后,对本地相应数据做同步处理;时间比对模块,配置用于在第二CMC的原数据与本地相应数据不同时,确认第二CMC的修改时间比本地数据修改时间晚,对本地相应数据做同步处理。
[0127] 模式切换单元,配置用于获取第二CMC的工作模式,在确认第二CMC同时负责对内管理和对外管理后,将本地空闲工作模式切换为对内管理;
[0128] 故障监测单元,配置用于在确认第二CMC故障后向第二CMC发送复位信号,并在确认故障解除后将本地所有数据同步至第二CMC;包括:脉冲获取模块,配置用于获取第二CMC的脉冲信号;询问发起模块,配置用于确认无法获取第二CMC脉冲信号的时间超过预设时间后,向第二CMC发起询问;应答接收模块,配置用于判断是否接收到第二CMC对询问的应答;第一判定模块,配置用于判定第二CMC脉冲信号生成装置故障;第二判定模块,配置用于判定第二CMC故障;业务接管模块,配置用于将本地工作模式切换为对外管理和对内管理兼备模式,接管第二CMC业务;信号发送模块,配置用于向第二CMC发送复位信号;故障记录模块,配置用于生成第二CMC故障记录日志。
[0129] 图3为本发明实施例提供的一种终端系统300的结构示意图,该终端系统300可以用于执行本发明实施例提供的服务器CMC双机热活方法。
[0130] 其中,该终端系统300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0131] 其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
[0132] 处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器310可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
[0133] 通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
[0134] 本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
[0135] 因此,本发明通过在服务器的两个CMC之间建立通信连接,并根据原数据+时间比对原则实现两个CMC的数据修改同步;在确认另一个CMC同时负责对内管理和对外管理后,将自身空闲工作模式切换为对内管理,实现两个CMC的业务均衡,避免存在CMC空跑的现象;在确认另一个CMC故障后向故障CMC发送复位信号,并在确认故障解除后将本地所有数据同步至故障CMC,通过发送复位信号重启故障CMC相对于原有利用看门狗重启,延迟更低。本发明中两个CMC设备互为备份同时协作运行,即可确保安全冗余备份,又可提高设备利用效率,还能便于后续功能的扩展。实现了真正的双机热活。解决了系统资源闲置无法充分利用的问题,有效地提高服务器的稳定性和可靠性。降低运维成本,提高产品口碑,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
[0136] 本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
[0137] 本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
[0138] 在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0139] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0140] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0141] 尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
相关专利内容
标题 发布/更新时间 阅读量
一种修改中性笔 2020-05-12 880
一种修改纸 2020-05-11 922
声学信号修改 2020-05-12 965
修改分析流 2020-05-11 489
修改图表 2020-05-11 305
路线修改 2020-05-11 126
定向声音修改 2020-05-13 713
修改命令 2020-05-11 389
错字修改笔 2020-05-12 675
错字修改笔 2020-05-12 309
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈