WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 机房 > 正文

数据容灾备份方案菜鸟必杀技

Watchstor.com  佚名丨2009-10-16 09:56 标签:机房 灾难恢复 

企业向提高自身的业务水平改善服务质量增强自身的义务支持能力就需要大量的采用先进的技术手段。任何企业都要对大量的而且十分机密的数据信息进行保存。数据容灾备份方案不仅可以安全的存储企业的各种信息,而且还能大大的提高企业的各项实力。数据容灾备份方案是企业提高自身综合实力的好帮手。

所有这些都要求企业重新设计和建立自己的高可用性和数据容灾备份方案。对于业务严重依赖于数据的企业来说,此系统必须包括保证应用系统的连续性,并提供有效的数据恢复机制。应用系统的连续性则应该从最终用户的角度来衡量,以整个系统的停机时间和可接受程度作为评价标准。数据恢复规划则需要以企业IT人员的视角来进行,肩负着在真正灾难发生时维系企业命脉的责任。

一、高可用数据容灾方案设计

1 高可用数据容灾备份方案的影响因素

影响应用系统可用性主要有三方面的因素,计划外的系统停机、计划内的维护操作和灾难恢复。

1.1 计划外的系统停机计划外的系统停机指由于应用系统故障导致的系统不可用。

减少计划外的停机时间是应用系统设计人员和管理人员面临的主要任务,虽然每个数据容灾备份方案都在硬件、软件和人员方面投入很多,但每年计划外的停机时间还是不可避免的发生,造成了很多不可避免的经济损失。一般来说,计划外的系统停机主要是由于以下原因引起的。

1.人为错误。如用户具有过多的权限,从而可以访问没有被授权的一些数据。或者数据库管理人员过度劳累导致的错误。

2.硬件/软件出错。硬件和软件失败是不可避免的现象,而且随着数据库系统使用年限的增加而变得更加脆弱。通常由于硬件/软件出错所引起的故障包括应用程序出错、数据库出错、操作系统故障,如操作系统死机等以及硬件故障,如硬盘或网卡损坏等。

3.环境失败。环境失败指由于外部环境改变导致系统不可用或无法有效地进行数据库管理。如断电,工人罢工等等。

1.2 数据容灾备份方案计划内的维护操作

系统操作人员经常提到的一个术语就是“维护”。大多数维护操作会影响到系统的可用性和性能。由于进行主动系统维护所引起的停机时间被称为计划内停机时间。对于每个数据库应用来说,每年或每月都需要一定的计划内停机时间,因为停机时间可以控制,停机操作对系统的影响也可以预先通知到用户,因而计划内停机时间虽然发生频繁,对系统的影响可以控制在一定范围。

1.3数据容灾备份方案恢复

对于高可用需求的应用系统来说,自然灾害与人为灾害始终存在。自然原因引起的灾难包括地震、洪水、火灾、飓风、恐怖活动、战争、暴乱活动等,人为因素导致的数据库不可用包括故意破坏。这些灾难发生的概率非常低,但是如果一旦发生,对严重依赖于数据的企业是致命的打击,甚至导致企业无法继续运营。

在灾难发生的情况下,数据恢复成为高可用性管理的首要任务,数据备份、特别是异地数据备份是成功实现灾难恢复的核心。企业需要在保证业务数据恢复的情况下保持业务系统的连续性。

2.2 高可用数据容灾备份方案的建设目标

系统的数据容灾备份方案和高可用方案必须能够应付所有可能引起计算机系统失效的问题。应用系统高可用性和数据容灾备份方案方案需要满足两方面的要求:

1.业务系统的连续性

保持业务系统的连续性,意味着无论是由于硬件,软件或电源的失效都不应中断信息中心的处理工作;实现业务的连续性需要减少或消除计划外停机时间,控制计划外停机时间对系统的影响,在灾难发生时间进行业务系统的快速接管,这些主要通过各个层次的冗余技术实现的。

2.业务数据的可恢复性业务数据的可恢复性从本质上来说是业务系统连续性的一个子集。

如果数据出现问题而不能恢复,业务系统的连续性无从谈起。因为数据对严重依赖于信息系统的企业非常重要,数据的可恢复性一直是高可用性系统的一个重点考虑因素。业务数据的可恢复性是通过数据备份和冗余的数据拷贝完成的。数据库复制和硬件复制都是用于这个环境的一些成熟技术。业务数据的可恢复性主要考虑因素为备份数据的安全性,需要确保在任何情况下,包括容灾发生时备份数据都可以有效地进行恢复。同时,数据丢失也是一个非常重要的评价指标。

2.3 建设数据容灾备份方案系统的考虑因素

因为要建立整个应用系统的冗余备份,数据容灾备份方案系统是一个非常昂贵的系统,在容灾系统建设时需要考虑以下因素:

(1)数据容灾备份方案距离:

根据灾备中心建设的目的不同,灾备中心的建设需要考虑灾备中心的距离。一般来说,数据容灾备份方案距离有本地和同城、异地三种方式。异地容数据容灾备份方案方案中,灾备中心和主中心的距离较远,如北京到上海。异地数据容灾备份方案可以有效地防止由于本地灾难发生引起数据损失,但是实施成本很高、为了保障业务系统的性能一般采用同步数据拷贝方式,这样会存在一定的数据损失,同时将应用系统切换到灾备中心的工作也非常繁琐。一般来说,异地灾备中心建设的主要目的提供业务数据的恢复能力。

同城容灾方案中,灾备中心和主中心距离在几十公里以内。同城容灾可以有效地提供业务数据的恢复能力以及应用快速接管能力。根据业务系统对数据访问以及数据丢失的需求,数据复制可以采用同步或异步两种方式。

同地容灾指灾备系统和主中心在一个地理位置。一般来说,它可以和现有的其他可用性技术,如Cluster结合,提供更高级别的高可用性。同时,很多同地容灾解决方案提供灾备中心的数据访问能力。

为了有效地进行容灾,很多关键的业务系统建立两个系统,同城灾备中心和异地灾备中心,同城灾备中心由生产系统采用同步方式进行数据复制,异地灾备中心由同城灾备中心采用异步方式进行数据复制。

(2)数据丢失

企业能忍受的数据丢失和具体处理的业务有关。例如:财务系统的数据很难承受任何损失,而电信营帐系统在灾难发生时可以允许少量的数据丢失。目前,虽然有很多方案可以做到“零数据丢失“,但企业往往为此支付高昂的费用,生产系统的性能也会受到很大影响。从业务的角度企业能够承受德考虑数据丢失问题可以帮助企业在容灾方案上做出适合企业自身特点的选择。

(3)应用切换时间

容灾系统建设的一个重要目的是保障业务系统的连续性。在灾难发生或业务系统出现问题时间,将应用快速地切换到灾备系统可以最大程度地减少系统的停计时间。当灾难发生,启用灾备中心需要采取一系列的措施。如将网络、电话线路切换到新的地点,启动操作系统、数据库,进行应用程序的切换等等。一般来说,容灾系统的切换时间应该控制到30分钟以内。

(4)主系统的可恢复性

主系统的可恢复性主要指数据的恢复,将应用切换灾备系统后,业务的连续性得以保持,主系统的恢复时间应该控制在一天到几天之内。数据恢复的关键问题在于数据的可恢复性,以及恢复过程中如何和灾备中心的数据保持一致。

(5)目标系统的可访问性

目标数据可访问能够提高容灾系统的投资回报,增加容灾系统的利用价值。企业可以将目标系统作为报表查询、统计分析等系统的数据源,减轻源系统的压力,使投资变为可用,而不是单存的冷备闲置。同时,目标数据的在线使用可以保障数据的准确性,从而避免容灾系统长期冷备,数据错误而无人发现的情况,能够确保容灾系统在灾难发生时被有效接管,进行数据恢复。

(6)对源系统的影响。灾备中心的建设是对现有系统的扩展和补充,不能因为灾备中心影响当前业务系统的性能,导致系统的可用性降低。

(7)网络资源的使用。网络资源的使用对于容灾系统特别是异地容灾系统非常重要。在网络上传输的数据量大小直接决定数据传输的实时性,同时,网络资源占用会影响灾备中心后期的网络使用费用。

(8)数据容灾备份方案环境的开放性。组成数据库应用系统的环境非常复杂,主机、存储、数据库是容灾环境的三个主要组件,支持开放环境,例如容灾系统支持不同的操作系统和数据库、不同的磁盘阵列、不同的主机系统会有效地适应未来的扩展需求,充分保护投资。

实施成本是在充分评估了上述内容后需要考虑的又一个重要因素。事实上,在建立数据容灾备份方案系统时,一个对业务系统没有任何影响、没有任何数据损失、容灾距离足够远的方案是很难实现的。企业需要了解自己的需求,建立适合自身特点的数据容灾备份方案系统。双数据中心环境下的有效冗余和网络结构

2.4 数据容灾备份方案系统的实现技术

2.4.1 基于磁带拷贝的传统灾难备份方式

利用磁带拷贝进行数据备份和恢复是最常见的传统灾难备份方式。这些磁带拷贝通常都是按天,按周或按月进行组合保存的。

使用这种方式的数据拷贝通常是存储在盘式磁带或盒式磁带上,并存放在远离基本处理系统的某个安全地点。存储到安全地点的磁带拷贝,其上的数据已有数小时的延迟,而在灾难或各种故障出现系统需要立即恢复,必须将磁带提取出来,并运送到恢复地点,通常还要滞延几个小时。

基于磁带拷贝方式的传统灾难备份方式有着明显的缺陷,越来越不适合用户不断发展的业务系统的需要。其备份和恢复过程非常复杂,数据延迟较大,磁带管理困难,数据恢复必须按照正确的顺序,出错的可能性也较大。

2.4.2 数据库方式

数据库复制是目前最流行的高可用解决方案。每种数据库系统来实现的机制和方式略有不同,但都包括逻辑复制和物理复制两种方式:

逻辑复制指针对数据库的逻辑层数据进行复制,复制的基本单位为数据库表以及表中所有的数据,复制时采用标准的TCP/IP协议。这种复制方法的好处是复制的数据量少,网络资源占用低,在复制的过程中目标数据库可以被访问,企业可以将目标系统用于报表和查询系统。同时因为目标数据库处于启动状态,接管时不需要重新启动数据库,接管可以接近实时。

物理复制方法主要通过日志文件的传送和应用实现的。数据库交易的复制机制利用日志的这种特性,在生产中心将日志传输到灾备中心;如果灾备中心的数据库结构和

生产中心的数据库结构保持一致,则灾备中心的数据库对日志中记载的交易执行前滚操作,即实现了对灾备中心数据库数据的更新。

数据库级别的复制可以支持计划内停机时间、计划外的停机时间和应用可以允许一些损失的情况下进行灾难恢复。

2.4.3 服务器卷方式

服务器卷方式复制嵌入到操作系统的卷管理系统中,卷发生的变化分为结构的变化和卷内容的变化。这种复制方式可以复制卷内容的变化。

服务器卷方式有两种复制方式,同步方式和异步方式。同步方式采用数据库两阶段提交的方法,对源系统的影响非常大。异步方式从数据的一致性保障方面存在问题。

由于卷复制部件使用服务器CPU、Memory资源,使用标准的TCP/IP网络,对业务的正常运行产生的较大的性能影响。

使用服务器卷方式进行复制,必须使用专用的卷管理软件,整个应用系统的结构需要根据卷管理的要求经过严格的设计和重新划分,同时,在后期的维护过程中也需要对卷结构的变化进行同步的维护,从而增加实施和维护方面的一些困难。

服务器卷方式复制对服务器的硬件平台、数据库版本有严格限制,局限于主机同构环境。

2.4.4 数据容灾备份方案存储系统方式

智能存储方式利用磁盘系统自身的处理能力,通过磁盘系统之间的通道连接复制磁盘系统内的数据更新,从而在异地中心保存生产数据的记录。利用磁盘复制可以独立于服务器、操作系统、卷管理系统、数据库、文件系统、中间件、应用程序。

和服务器卷方式一样,智能存储两种复制方式,同步方式和异步方式。同步方式采用数据库两阶段提交的方法,对源系统的影响非常大。异步方式从数据的一致性保障方面存在问题。

智能存储系统方式复制使用存储上的CPU资源,但对IO资源的消耗比较大。这种方式复制速度很快,但这种复制方式对存储依赖非常强,主备服务器必须使用同样的存储设备,依赖于专有网络。因为在存储级进行复制,目标数据库处于不可用状态。当需要应用切换时,必须停止复制过程,Mount复制卷组,将操作系统启动,启动数据库,进行数据库恢复。所有这些工作一般手工进行,需要花费一定的时间。

采用数据容灾备份方案系统方式进行复制,源系统和目标系统的硬件平台、操作系统、数据库版本必须一致。复制的内容包括所有底层数据,占用的网络带宽较高。而且目标系统无法访问。

【编辑推荐】

  1. 数据中心容灾手把手逐一解密
  2. DSG容灾备份技术成为证券业的守护神
  3. 远程容灾备份简要方式概括
  4. 数据容灾公司企新生杀手的克星
  5. 容灾备份见招拆招经典详解

相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统