WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 机房 > 正文

双机热备容错软件主服务器发生故障解决方案

watchstor.com  佚名丨2009-12-19 15:30 标签:机房 HA双机热备 

双机热备容错软件在市场上应用的时候还是需要广阔的空间。但是在使用的时候还是有很多的障碍。下面就是一些具体问题的详细解决方式。希望对大家有所帮助。

I、通讯路径

“Heartbeat”是服务器间发出的周期性检测信息,它允许双机热备容错软件决定服务器的状态。当一个服务器向另一处服务器发送一个“Heartbeat”消息,并且在规定时间段里没有得到任何回应时, 发送消息的服务器开始评测接收消息的服务器是否正在发生故障。多种“Heartbeat”检测信号保证故障检测的可靠性,以防止不必要的资源服务切换。双机热备容错软件为双机热备镜像提供下列途径上的“Heartbeat”通信:

Socket (TCP/IP )

RS-232 TTY通信端口(Communications port )

双机热备容错软件镜像软件消除了共享SCSI 的需要。

II、主服务器发生故障

客户向Server1上运行的一个程序发送一个请求,而Server1出现写错误时,使用带有双机热备镜像功能的双机热备容错软件能够检测出系统失败。然后,双机热备容错软件 执行恢复规则,试图关闭Server1上的应用,并且在Server2上重新启动它们。Server2现在承担主服务器的角色,镜像文件夹地址从Server1转移到Server2上去,这个转换过程对用户来说是透明的,客户一般不会发现系统曾经发生这样的故障。

一旦系统发生的故障被被纠正过来,管理员必须重新同步镜像文件夹。重新同步这些文件夹并被锁定,目的是不接受任何客户的存取。在这个过程中,非镜像应用不会受到影响,因此这些应用可以毫无干扰的继续运行。系统管理员可以选择何时对镜像文件夹进行同步,通过提供选择时间的灵活性达到对整个系统的影响减为最小。

重新同步主服务器和从服务器上镜像的时间依赖于文件夹的大小。 一般情况下,在100MB 以太网上, 恢复1Gigabyte(GB)的数据只需要10分钟。

III、从服务器发生故障

双机热备容错软件当从系统发生故障时,受影响的镜像文件夹标志为Broken。有必要纠正这些故障,并重新同步有关的文件夹。当从系统发生故障时,任何写请求不会送给从系统。当从服务器发生故障后再次恢复时,镜像管理器用来重新同步主镜像文件夹和从镜像文件夹

【编辑推荐】

  1. 双机热备与数据备份的关系
  2. 双机备份方案的介绍及案例分析
  3. 思科 HSRP的配置方案双机热备经典案例
  4. 双机热备解决方案在实现中需要考虑的因素
  5. 双机热备技术在实施中的方案选择


相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统