首页 / 专利库 / 电子零件及设备 / 实时时钟 / 一种基于心跳的双机热备方法

一种基于心跳的双机热备方法

阅读:742发布:2020-05-08

专利汇可以提供一种基于心跳的双机热备方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于心跳的双机热备方法。它包括两台导播机和一台直播 服务器 ,导播机与直播服务器连接,每台导播机上最核心的包括两个部分,心跳监测部分和资源接管部分,具体包括如下步骤:(1)心跳监测部分通过无线网卡链路进行,主导播机定时发送报文来告诉备导播机自己当前的状态;(2)如果在 指定 的时间内未收到主导播机发送的心跳报文,那么就认为对方出现故障,这时启动备导播机上的资源接管部分来接管运行在主导播机上的直播业务推流到直播服务器。本发明的有益效果是:能够很快恢复正常的直播业务,主备切换时间较短,速度快,无须人工干预自动切换,保证直播业务不间断的实时运行,为直播的安全性和实时性增加了保障。,下面是一种基于心跳的双机热备方法专利的具体信息内容。

1.一种基于心跳的双机热备方法,其特征是,包括两台导播机和一台直播服务器,导播机与直播服务器连接,每台导播机上最核心的包括两个部分,心跳监测部分和资源接管部分,具体包括如下步骤:
(1)心跳监测部分通过无线网卡链路进行,主导播机定时发送报文来告诉备导播机自己当前的状态;
(2)如果在指定的时间内未收到主导播机发送的心跳报文,那么就认为对方出现故障,这时启动备导播机上的资源接管部分来接管运行在主导播机上的直播业务推流到直播服务器。
2.根据权利要求1所述的一种基于心跳的双机热备方法,其特征是,在步骤(1)中,通过IP做心跳检测时,主导播机和备导播机会通过心跳路径周期性的发出检测的测试包,在系统正常情况下,主导播机为系统提供直播服务,备导播机监视工作机的运行情况,主导播机同时也在检测备导播机是否正常。
3.根据权利要求2所述的一种基于心跳的双机热备方法,其特征是,在步骤(1)中,具体操作方法如下:主导播机和备导播机同步完成后,主导播机启动发送心跳报文进程,报文大小和内容固定由主导播机和备导播机提前定义,心跳报文发送间隔为2s,当备导播机收到主导播机发送过来心跳报文时检查心跳报文大小和内容是否与之前定义一致,如果一致备导播机获取当前系统时钟T1,每次收到主导播机发送过来的心跳报文时再次获取当前系统时钟并更新T1。
4.根据权利要求3所述的一种基于心跳的双机热备方法,其特征是,在步骤(1)中,当主导播机和备导播机正常连接时,由主导播机直播开启运行后通过Tcp消息告知备导播机直播状态,主导播机的直播状态、直播地址和信源发生改变时通过tcp发送不同类型的消息告知备导播机,备导播机根据消息类型做相应同步处理,主机直播状态、直播地址和直播输出编码参数发生变化时都会实时告知备导播机。
5.根据权利要求4所述的一种基于心跳的双机热备方法,其特征是,在步骤(2)中,故障判断方法如下:主导播机和备导播机同步完成后,备导播机启动心跳报文的检测进程,检测进程每隔1s获取一次系统时钟T2,计算T2与T1的差值是否大于4s,如果小于4s等待下一次检测,如果大于4s即备导播机连续2次未收到主导播机发送过来的心跳报文由此判定主导播机出现系统故障、导播机故障或网络故障。
6.根据权利要求5所述的一种基于心跳的双机热备方法,其特征是,在步骤(2)中,主导播机系统故障和导播机故障异常退出的情况下,会触发Tcp底层异常处理机制发送SOCKET_ERROR消息,备用导播机通过Tcp底层的异常处理机制会立刻收到SOCKET_ERROR消息判定;
网络故障情况下,备导播机是通过心跳超时检测机制判定,即:主导播机与备导播机建立Tcp连接时通过设置数据发送超时时间参数,设定发送超时时间为2s,发送超时即判定。
7.根据权利要求5或6所述的一种基于心跳的双机热备方法,其特征是,在步骤(2)中,当备导播机判定主导播机出现故障时,备导播机检查主导播机发生故障时的直播状态,如果是直播开启状态,备导播机则启动直播业务模,直播业务模块按照主导播机设定的直播地址推送直播数据流到直播服务器,主动接管主导播机的工作,继续支持主导播机上的直播服务,保证系统不间断的运行;如果直播状态未开启则不启动备机直播模块。
8.根据权利要求7所述的一种基于心跳的双机热备方法,其特征是,在步骤(2)中,如果在备导播机出现故障时,主导播机会显示备导播机故障告警提示检测;如果还有其他备导播机,则切换其它备导播机。
9.根据权利要求7所述的一种基于心跳的双机热备方法,其特征是,在步骤(2)中,备导播机在运行过程中,同时检测主导播机是否正常,如果备导播机接收心跳检测包数量正常,则主动接管备导播机的工作,继续支持备导播机上的直播服务,保证系统不间断的运行。

说明书全文

一种基于心跳的双机热备方法

技术领域

[0001] 本发明涉及数据处理相关技术领域,尤其是指一种基于心跳的双机热备方法。

背景技术

[0002] 双机热备系统是高可用领域的一项重要技术,数据的高可用性和系统的连续运转能极其重要,服务器是企事业单位存放数据的重要设备,如果一旦因为服务器的故障而无法正常运转,就会造成业务停顿,服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要几分钟、几小时甚至几天,从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上,而如果技术人员不在现场,则恢复服务的时间就更长,而对于一些重要系统而言,在直播过程中发生故障时用户是很难忍受这样长时间的服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,为系统的安全性增加了保障,提供可靠的服务。
[0003] 双机热备的工作方案发展:
[0004] 基于共享存储(磁盘阵列)的方式,共享存储双机热备方案中需要两台服务器以及一台共享存储设备(一般情况下就是共享磁盘阵列柜),共享存储设备同时连接至两台服务器,用户业务数据存储在共享存储设备中,由主服务器对外服务并访问共享存储设备进行数据读写,一旦主服务器发生故障(例如:操作系统宕机、服务器意外掉电、网络故障等),由ServHA双机热备软件自动将业务应用切换至备用服务器并接管共享存储设备的访问权继续对外服,该模式需要引入昂贵的存储设备,成本有所增加,数据只有一份,在磁盘阵列中。
[0005] 全冗余方式就是双机双存储,为实现存储冗余,存储高可用也已经越来越多的被用户接受。该方案需要两台服务器和两台共享磁盘阵列柜,每台服务器同时连接两台磁盘阵列柜,每台磁盘阵列柜同时连接两台服务器,ServHA双机双柜软件(ServHA DS Mirror)负责实时将数据写入两台磁盘阵列柜,保证两台磁盘阵列柜数据完全一致,在服务器读取数据时,会从两台磁盘阵列柜同时读取,提高读取效率,一旦主服务器发生故障(例如:操作系统宕机、服务器意外掉电、网络故障等),由ServHA双机热备软件自动将业务应用切换至备用服务器继续对外服务,保护业务应用不间断运行,当一台磁盘阵列柜发生故障时,ServHA双机热备软件会将故障磁盘阵列柜隔离,整个过程业务不间断,无缝使用单盘柜继续服务,该模式数据双份存储,两台磁盘阵列柜各一份,数据安全性高,数据通过存储链路实时写入两台磁盘阵列柜,能承载较高的数据吞吐量,但硬件成本较高。
[0006] 复制方式双机热备中仅需要两台服务器即可实现双机热备,两台服务器利用本地磁盘存储业务数据,ServHA镜像双机热备软件(ServHA Mirror)负责实时同步两台服务器数据,保证两台服务器数据完全一致,由主服务器对外服务并将业务数据实时同步至备用服务器,一旦主服务器发生故障(例如:操作系统宕机、服务器意外掉电、网络故障等),由ServHA双机热备软件自动将业务应用切换至备用服务器继续对外服务,保护业务应用不间断运行。
[0007] 在现有的双机热备方案中,一般意义上的双机热备都会有一个切换过程,这个切换过程可能是一分钟左右。在切换过程中,服务是有可能短时间中断的。但是,当切换完成后,服务将正常恢复。因此,双机热备不是无缝、不中断的,但它能够保证在出现系统故障时,能够很快恢复正常的服务,业务不致受到影响,但在系统直播过程中发生故障时用户的容忍程度会大大降低,尤其在一些重要会议的直播过程中,一旦主服务器发生故障,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。

发明内容

[0008] 本发明是为了克服现有技术中存在上述的不足,提供了一种速度快且无须人工干预的基于心跳的双机热备方法。
[0009] 为了实现上述目的,本发明采用以下技术方案:
[0010] 一种基于心跳的双机热备方法,包括两台导播机和一台直播服务器,导播机与直播服务器连接,每台导播机上最核心的包括两个部分,心跳监测部分和资源接管部分,具体包括如下步骤:
[0011] (1)心跳监测部分通过无线网卡链路进行,主导播机定时发送报文来告诉备导播机自己当前的状态;
[0012] (2)如果在指定的时间内未收到主导播机发送的心跳报文,那么就认为对方出现故障,这时启动备导播机上的资源接管部分来接管运行在主导播机上的直播业务推流到直播服务器。
[0013] 本发明具有导播机热备的功能,保证在主机直播过程中发生故障时,备机自动切换为主机同时启动直播业务推流到直播服务器,能够很快恢复正常的直播业务,主备切换时间较短,速度快,无须人工干预自动切换,保证直播业务不间断的实时运行,为直播的安全性和实时性增加了保障。
[0014] 作为优选,在步骤(1)中,通过IP做心跳检测时,主备双导播机会通过心跳路径周期性的发出检测的测试包,在系统正常情况下,主导播机为系统提供直播服务,备导播机监视工作机的运行情况,主导播机同时也在检测备导播机是否正常。
[0015] 作为优选,在步骤(1)中,具体操作方法如下:主导播机和备导播机同步完成后,主导播机启动发送心跳报文进程,报文大小和内容固定由主导播机和备导播机提前定义,心跳报文发送间隔为2s,当备导播机收到主导播机发送过来心跳报文时检查心跳报文大小和内容是否与之前定义一致,如果一致备导播机获取当前系统时钟T1,每次收到主导播机发送过来的心跳报文时再次获取当前系统时钟并更新T1。
[0016] 作为优选,在步骤(1)中,当主导播机和备导播机正常连接时,由主导播机直播开启运行后通过Tcp消息告知备导播机直播状态,主导播机的直播状态、直播地址和信源发生改变时通过tcp发送不同类型的消息告知备导播机,备导播机根据消息类型做相应同步处理,主机直播状态、直播地址和直播输出编码参数发生变化时都会实时告知备导播机。
[0017] 作为优选,在步骤(2)中,故障判断方法如下:主导播机和备导播机同步完成后,备导播机启动心跳报文的检测进程,检测进程每隔1s获取一次系统时钟T2,计算T2与T1的差值是否大于4s,如果小于4s等待下一次检测,如果大于4s即备导播机连续2次未收到主导播机发送过来的心跳报文由此判定主导播机出现系统故障、导播机故障或网络故障。
[0018] 作为优选,在步骤(2)中,主导播机系统故障和导播机故障异常退出的情况下,会触发Tcp底层异常处理机制发送SOCKET_ERROR消息,备用导播机通过Tcp底层的异常处理机制会立刻收到SOCKET_ERROR消息判定;网络故障情况下,备导播机是通过心跳超时检测机制判定,即:主导播机与备导播机建立Tcp连接时通过设置数据发送超时时间参数,设定发送超时时间为2s,发送超时即判定。
[0019] 作为优选,在步骤(2)中,当备导播机判定主导播机出现故障时,备导播机检查主导播机发生故障时的直播状态,如果是直播开启状态,备导播机则启动直播业务模,直播业务模块按照主导播机设定的直播地址推送直播数据流到直播服务器,主动接管主导播机的工作,继续支持主导播机上的直播服务,保证系统不间断的运行;如果直播状态未开启则不启动备机直播模块。
[0020] 作为优选,在步骤(2)中,如果在备导播机出现故障时,主导播机会显示备导播机故障告警提示检测;如果还有其他备导播机,则切换其它备导播机。
[0021] 作为优选,在步骤(2)中,备导播机在运行过程中,同时检测主导播机是否正常,如果备导播机接收心跳检测包数量正常,则主动接管备导播机的工作,继续支持备导播机上的直播服务,保证系统不间断的运行。
[0022] 本发明的有益效果是:能够很快恢复正常的直播业务,主备切换时间较短,速度快,无须人工干预自动切换,保证直播业务不间断的实时运行,为直播的安全性和实时性增加了保障。附图说明
[0023] 图1是本发明的方法流程图
[0024] 图2、图3、图4是本发明主导播机三种故障的示意图。

具体实施方式

[0025] 下面结合附图和具体实施方式对本发明做进一步的描述。
[0026] 如图1所述的实施例中,一种基于心跳的双机热备方法,包括两台导播机和一台直播服务器,导播机与直播服务器连接,每台导播机上最核心的包括两个部分,心跳监测部分和资源接管部分,具体包括如下步骤:
[0027] (1)心跳监测部分通过无线网卡链路进行,主导播机定时发送报文来告诉备导播机自己当前的状态;具体为:通过IP做心跳检测时,主备双导播机会通过心跳路径(TCP/IP协议)周期性的发出检测的测试包,在系统正常情况下,主导播机为系统提供直播服务,备导播机监视工作机的运行情况,主导播机同时也在检测备导播机是否正常;
[0028] 具体操作方法如下:主导播机和备导播机同步完成后,主导播机启动发送心跳报文进程,报文大小和内容固定由主导播机和备导播机提前定义,心跳报文发送间隔为2s,当备导播机收到主导播机发送过来心跳报文时检查心跳报文大小和内容是否与之前定义一致,如果一致备导播机获取当前系统时钟T1,每次收到主导播机发送过来的心跳报文时再次获取当前系统时钟并更新T1;当主导播机和备导播机正常连接时,由主导播机直播开启运行后通过Tcp消息告知备导播机直播状态,主导播机的直播状态、直播地址和信源发生改变时通过tcp发送不同类型的消息告知备导播机,备导播机根据消息类型做相应同步处理,主机直播状态、直播地址和直播输出编码参数发生变化时都会实时告知备导播机;
[0029] (2)如果在指定的时间内未收到主导播机发送的心跳报文,那么就认为对方出现故障,这时启动备导播机上的资源接管部分来接管运行在主导播机上的直播业务推流到直播服务器;故障判断方法如下:主导播机和备导播机同步完成后,备导播机启动心跳报文的检测进程,检测进程每隔1s获取一次系统时钟T2,计算T2与T1的差值是否大于4s,如果小于4s等待下一次检测,如果大于4s即备导播机连续2次未收到主导播机发送过来的心跳报文由此判定主导播机出现系统故障、导播机故障或网络故障;
[0030] 主导播机系统故障(如图2所示)和导播机故障(如图3所示)异常退出的情况下,会触发Tcp底层异常处理机制发送SOCKET_ERROR消息,备用导播机通过Tcp底层的异常处理机制会立刻收到SOCKET_ERROR消息判定;网络故障情况下,备导播机是通过心跳超时检测机制判定,即:主导播机与备导播机建立Tcp连接时通过设置数据发送超时时间参数,设定发送超时时间为2s,发送超时即判定;当备导播机判定主导播机出现故障时,备导播机检查主导播机发生故障时的直播状态,如果是直播开启状态,备导播机则启动直播业务模块,直播业务模块按照主导播机设定的直播地址推送直播数据流到直播服务器,主动接管主导播机的工作,继续支持主导播机上的直播服务,保证系统不间断的运行;如果直播状态未开启则不启动备机直播模块。如果在备导播机出现故障时,主导播机会显示备导播机故障告警提示检测;如果还有其他备导播机,则切换其它备导播机;备导播机在运行过程中,同时检测主导播机是否正常,如果备导播机接收心跳检测包数量正常,则主动接管备导播机的工作,继续支持备导播机上的直播服务,保证系统不间断的运行。
[0031] 本发明具有导播机热备的功能,保证在主机直播过程中发生故障时,备机自动切换为主机同时启动直播业务推流到直播服务器,能够很快恢复正常的直播业务,主备切换时间较短,速度快,无须人工干预自动切换,保证直播业务不间断的实时运行,为直播的安全性和实时性增加了保障。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈