首页 / 专利库 / 软件 / 后台任务 / 一种基于故障漂移的云服务器容灾实现方法

一种基于故障漂移的服务器容灾实现方法

阅读:254发布:2020-05-17

专利汇可以提供一种基于故障漂移的服务器容灾实现方法专利检索,专利查询,专利分析的服务。并且一种基于故障漂移的 云 服务器 容灾实现方法,包括宿主异常状态检测,宿主动态选择, 虚拟机 自动迁移三个部分,所述的宿主异常状态检测为基于etcd,存储网络,管理网络三者综合判断,确认宿主是否是异常宕机,所述的宿主动态选择为宿主动态选择:基于宿主的状态,内存以及CPU利用率,选举出最佳的目标宿主,所述的虚拟机自动迁移为基于ceph和libvirt的迁移 接口 ,通过添加 后台任务 ,实现宕机宿主上的虚机自动迁移,对多部服务器进行统一的 算法 管理,使得当某一台服务器发生故障时,该故障服务器能够自动将服务转移到另一台正常的服务器上继续提供服务,不会中断服务,出现故障时进行实时(分钟级响应)自动迁移保障业务的 稳定性 。,下面是一种基于故障漂移的服务器容灾实现方法专利的具体信息内容。

1.一种基于故障漂移的服务器容灾实现方法,其特征在于:包括宿主异常状态检测,宿主动态选择,虚拟机自动迁移三个部分,所述的宿主异常状态检测为基于etcd,存储网络,管理网络三者综合判断,确认宿主是否是异常宕机,所述的宿主动态选择为宿主动态选择:基于宿主的状态,内存以及CPU利用率,选举出最佳的目标宿主,所述的虚拟机自动迁移为基于ceph和libvirt的迁移接口,通过添加后台任务,实现宕机宿主上的虚机自动迁移。
2.根据权利要求1所述的一种基于故障漂移的云服务器容灾实现方法,其特征在于:所述的宿主异常检测步骤为:a、通过宿主上的watch进程,设置该宿主的带ttl属性的key(名称alive),如果该key超时消失,则触发检测流程;
b、第一轮检测,通过libvirt接口测试服务是否存活,检测失败则继续通过ceph的rest api接口检测宿主上虚机挂载的rbd是否存在活跃链接;
c、步骤检测失败,则在etcd中设置带ttl属性的key,如果此时宿主恢复正常,则终止流程;
d、death key超时消失,触发第二轮检测,检测开始前先设置带ttl属性的key,然后重复步骤b,如果在lock超时时间内宿主恢复正常,则终止流程,否则设置lock为永久key,该宿主后续状态变化被忽略,宿主故障被确认。
3.根据权利要求1所述的一种基于故障漂移的云服务器容灾实现方法,其特征在于:所述的宿主动态选择步骤为:a、从数据库中选出所有在线状态的宿主,依次计算CPU内核利用以及内存利用情况,生成排行榜数据;
b、从排行榜中选出当前资源利用率最低的宿主。
4.根据权利要求1所述的一种基于故障漂移的云服务器容灾实现方法,其特征在于:所述的虚拟机自动迁移步骤为:a、服务端选择异常宿主上处于开机状态的所有虚机,通过rq任务队列发送批量迁移指令;
b、后台worker获得任务,通过libvirt接口迁移虚机到第3步中选出的宿主中,成功后开启虚机。

说明书全文

一种基于故障漂移的服务器容灾实现方法

技术领域

[0001] 本发明涉及数据处理技术领域,具体地说就是一种基于故障漂移的云服务器容灾实现方法。

背景技术

[0002] 随着信息技术的迅猛发展,数据中心的建设已经经历了几十年的历程。实际上目前使用的服务器架构已经沿用了几十年了,存在的问题已经浮出面。刀片服务器的出现使服务器的架构设计向前迈进了一步;但也带来了分散的存储资源利用问题。数据中心众多的网络设备、存储设备等,虽然通过网络连接起来,但实际上仍是一个个独立的群体。数据中心设备的整合、优化,进行集约化、集成设计已经提到了日程。提高服务器的效率和整个数据中心的效能,进行节能、降耗降低整体的拥有成本(TCO),同时要提高数据中心对外提高服务的响应速度和运行效率,要求数据中心和服务器的体系架构设计必须变革,云计算技术的发展很好满足了这一变革的需要。
[0003] 当前,云计算技术的飞速发展,让硬件资源充分利用、动态调整业务规模以及保障业务可靠性具有重要意义。云计算带来的这些好处依赖于底层虚拟化技术将服务器资源虚拟出多份可供用户使用的计算资源,从而方便为企业用户提供高效、弹性、高可靠和可维护的底层IT基础架构,但在机器发生故障或进行负载均衡时虚拟机需要进行快速迁移,如何能够快速找到相应虚拟机进行迁移,并保障服务的稳定性,不会因迁移产生服务的蝴蝶效应,从而带来稳定的云服务。

发明内容

[0004] 为了解决上述技术问题,本发明的目的在于提供一种基于故障漂移的云服务器容灾实现方法。
[0005] 本发明解决其技术问题所采取的技术方案是:一种基于故障漂移的云服务器容灾实现方法,包括宿主异常状态检测,宿主动态选择,虚拟机自动迁移三个部分,所述的宿主异常状态检测为基于etcd,存储网络,管理网络三者综合判断,确认宿主是否是异常宕机,所述的宿主动态选择为宿主动态选择:基于宿主的状态,内存以及CPU利用率,选举出最佳的目标宿主,所述的虚拟机自动迁移为基于ceph和libvirt的迁移接口,通过添加后台任务,实现宕机宿主上的虚机自动迁移。
[0006] 作为优化,所述的宿主异常检测步骤为:a、通过宿主上的watch进程,设置该宿主的带ttl属性的key(名称alive),如果该key超时消失,则触发检测流程;
[0007] b、第一轮检测,通过libvirt接口测试服务是否存活,检测失败则继续通过ceph的rest api接口检测宿主上虚机挂载的rbd是否存在活跃链接;
[0008] c、步骤检测失败,则在etcd中设置带ttl属性的key(名称death,ttl=300秒),如果此时宿主恢复正常,则终止流程;
[0009] d、death key超时消失,触发第二轮检测,检测开始前先设置带ttl属性的key(名称lock,ttl=30秒),然后重复步骤b,如果在lock超时时间内宿主恢复正常,则终止流程,否则设置lock为永久key,该宿主后续状态变化被忽略,宿主故障被确认。
[0010] 作为优化,所述的宿主动态选择步骤为:a、从数据库中选出所有在线状态的宿主,依次计算CPU内核利用以及内存利用情况,生成排行榜数据;
[0011] b、从排行榜中选出当前资源利用率最低的宿主。
[0012] 作为优化,所述的虚拟机自动迁移步骤为:a、服务端选择异常宿主上处于开机状态的所有虚机,通过rq任务队列发送批量迁移指令;
[0013] b、后台worker获得任务,通过libvirt接口迁移虚机到第3步中选出的宿主中,成功后开启虚机。
[0014] 本发明的有益效果是:与现有技术相比,本发明的一种云服务器容灾方法,对多部服务器进行统一的算法管理,使得当某一台服务器发生故障时,该故障服务器能够自动将服务转移到另一台正常的服务器上继续提供服务,不会中断服务,出现故障时进行实时(分钟级响应)自动迁移保障业务的稳定性。

具体实施方式

[0015] 实施例1
[0016] 一种基于故障漂移的云服务器容灾实现方法,包括宿主异常状态检测,宿主动态选择,虚拟机自动迁移三个部分,所述的宿主异常状态检测为基于etcd,存储网络,管理网络三者综合判断,确认宿主是否是异常宕机,所述的宿主动态选择为宿主动态选择:基于宿主的状态,内存以及CPU利用率,选举出最佳的目标宿主,所述的虚拟机自动迁移为基于ceph和libvirt的迁移接口,通过添加后台任务,实现宕机宿主上的虚机自动迁移。
[0017] 实施例2
[0018] 作为优化,所述的宿主异常检测步骤为:a、通过宿主上的watch进程,设置该宿主的带ttl属性的key(名称alive),如果该key超时消失,则触发检测流程;
[0019] b、第一轮检测,通过libvirt接口测试服务是否存活,检测失败则继续通过ceph的rest api接口检测宿主上虚机挂载的rbd块是否存在活跃链接;
[0020] c、步骤检测失败,则在etcd中设置带ttl属性的key(名称death,ttl=300秒),如果此时宿主恢复正常,则终止流程;
[0021] d、death key超时消失,触发第二轮检测,检测开始前先设置带ttl属性的key(名称lock,ttl=30秒),然后重复步骤b,如果在lock超时时间内宿主恢复正常,则终止流程,否则设置lock为永久key,该宿主后续状态变化被忽略,宿主故障被确认。
[0022] 实施例3
[0023] 作为优化,所述的宿主动态选择步骤为:a、从数据库中选出所有在线状态的宿主,依次计算CPU内核利用以及内存利用情况,生成排行榜数据;
[0024] b、从排行榜中选出当前资源利用率最低的宿主。
[0025] 实施例4
[0026] 作为优化,所述的虚拟机自动迁移步骤为:a、服务端选择异常宿主上处于开机状态的所有虚机,通过rq任务队列发送批量迁移指令;
[0027] b、后台worker获得任务,通过libvirt接口迁移虚机到第3步中选出的宿主中,成功后开启虚机。
[0028] 本发明的有益效果是:与现有技术相比,本发明的一种云服务器容灾方法,对多部服务器进行统一的算法管理,使得当某一台服务器发生故障时,该故障服务器能够自动将服务转移到另一台正常的服务器上继续提供服务,不会中断服务,出现故障时进行实时(分钟级响应)自动迁移保障业务的稳定性。
[0029] 上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式的产品形态和式样,任何符合本发明且任何所属技术领域的普通技术人员对其所做的适当变化或修饰,皆应落入本发明的专利保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈