WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 数据保护 > 正文

业务持续计划的保障措施

Watchstor.com  佚名丨2009-11-07 11:02 标签:数据保护 存储资源管理 

在灾难降临时,企业是多么需要一种技术产品来帮助他们恢复数据系统的运营,保证业务连续性。无论是何种规模的企业,都必须将业务持续计划作为重要任务进行设计实施。在过去的20年中,统计数据持续显示:有相当比例的公司在过去的一年中由于持续的多日停电而歇业。当前瞬息万变的IT环境中,业务持续计划作为一个综合流程,给IT经理带来了巨大挑战。本文我们将聚焦企业成功开展业务持续计划所需关注的三方面问题。

第一:了解你企业的RPO/RTO需求

恢复点目标(RPO)是指一个企业在一次灾难(停电、病毒、自然或人为灾难)中所能接受的总数据损失量。恢复时间目标(RTO)是指企业从灾难状态中恢复联网和正常功能所需的时间。基于终端用户本地灾难恢复的需求,对于任何指定的应用软件环境,这两个基准标定了企业必须遵从的服务水准协议(SLAs)。

由于对RPO/RTO的需求越来越迫切,数据保护系统的基础设施在增加,成本在增长。为了准确确定企业业务的持续需求,并确保资金被用于适宜的领域,你必须对企业应用软件环境的服务水准协议有深入的了解。

基于应用软件的RPO/RTO需求,其可被划分为几个不同的等级,通常是三个等级。一级包括任务导向型应用软件,要求是RTO少于一个小时;二级包括RTO要求少于四个小时的应用软件;而三级应用软件可接受的RTO是24小时之内。你需要和部门主管共同商讨决定哪一种应用软件应采用哪一等级。退款系统可用于激励应用软件的正确分级,可通过给每一部门制订精确的服务水准未从规的罚款来达到这一目的。基于企业的客户类型,在服务水准没达到协议要求时,就会收取费用或罚款。

在决定服务水准协议时,了解在数据无法获得的情况下企业业务会受到何种影响。实时推动收益水平提高的在线软件、影响核心服务(如医疗和应急反应)的应用软件应该被评为一级。E-mail系统可被评为一级或二级(这取决于每天email沟通的业务量)。主目录可被评为三级(具体取决于企业的业务环境)。

一般来说,只有很少一部分的应用软件被确定为一级或二级,一般情况下80%的企业应用软件被确定为三级。

第二:配置适当的数据保护设施

在你了解清楚了企业不同应用软件的“灾难恢复等级”,就可以配置与灾难恢复需求相匹配的基础设施。

首先,你面对的是来自不同供应商的不同的应用软件、操作系统以及服务器、存储器的异质IT环境。当购买硬件或重新规划现有硬件时,确保数据保护解决方案(比如,你的备份软件和硬件支持设备)支持异质环境,以实现系统的复杂性最小化、灵活性最大化。

已有80%各种规模的企业在不同程度上开展了服务器虚拟化技术,在生产环境中虚拟化技术的应用将更加普遍。确保企业的数据保护基础设施与物理和虚拟服务器环境相适应,并可最优化利用服务器虚拟化平台。

然后,你需要识别支持企业业务所需的存储系统规模,除了要与其相匹配,还要确保基础设施构建的可靠性。数据量的增长为平均每年50%—60%或更多,在未来的几年里,即使是小企业也要管理100TB或者更多的数据量。与直接附加的存储器相比,存储区域网络(SANs)提供了更大的灵活性,SAN更适用于虚拟服务器环境,并可通过集中管理实现易行性和成本优势。

并且,SAN促进了存储管理技术的开展,主要解决了存储区域网络光纤网络的数据安全问题,提供了有成本效益的方式来提高复杂存储系统的功能性(来自中心存储池的自动精简配置,代理服务器的脱机备份,WAN最优化技术如压缩,安全性能如加密等)。其次,SAN使得产品服务器上的企业管理费用最小化。通过SAN实现了存储器加固,也实现了远程灾难恢复站点中重要数据集创建和维护过程中复制的高效化。

最后,根据所确定的灾难恢复等级来评估技术的可用性是否符合RPO和RTO的需求。基于磁盘的备份实现了多种性能且可靠性较高,同时提供了采用其他技术的路径。快照备份可使备份产品的影响最小化,并提高传统备份频率(基于磁带的每日一次备份),每天创建多个灾难恢复点。

CDP可以切实保证即时的数据复制,基本实现即时数据恢复。在这种情况下,CDP作为一种数据保护技术被推荐用于RPO/RTO需求等级最高和一级应用软件环境中。

连续ATA (SATA)磁盘技术满足了成本较高的二级存储软件(如备份和灾难恢复软件)性能和可靠性需求,减小了基于磁盘和磁带的数据保护基础设施之间的差别。

第三:存档并测试灾难恢复计划

在设计完灾难恢复流程后,写出并存档。如果企业只有一名管理员了解这一灾难恢复流程的整体情况,而这一流程并未存档,系统运营则面临很大风险。如果这名管理员离职了或者在需要进行灾难恢复的那天恰巧不在,怎么办?如果已经创建了一份业务持续计划,确保你能利用这一计划实施灾难备份,并达到所期望的结果。将企业灾难恢复流程存在操作说明书里,并将附件放置在两个不同地方。

本地和远程灾难恢复有很大差别。大多数企业备份软件产品可很好地追踪本地数据保护系统的运行情况,并向你通报相关问题。大多数企业几乎每天都要恢复部分本地数据,这是应用户需求(错误删除文件或文件毁坏)而实施的,企业需要有规律、有效地测试这些流程。如果问题在本地灾难恢复过程中发生,问题通常能被很快恢复并解决。

当你处理多站点的灾难恢复解决方案,问题变得复杂了。与本地数据恢复相比,远程灾难恢复是一个更复杂的流程,因此风险更大。在一般的运行环境中,灾难恢复结构趋于退化,这一过程被称为“组态飘移”。给系统增加补丁,增加新数据流,且结构参数被更改。为了确保灾难恢复过程依照预期开展,必须同时更改复制资源和目标位置,否则灾难恢复过程很可能无法按预期进行。

测试是管理灾难恢复方案按预期实施的理想方式,但之前的灾难恢复测试已经被中断,用于产品运行,因此不经常开展。大多数有灾难备份计划的企业很少进行测试,很多企业在配置完灾难备份系统后从不对其进行测试。这就存在灾难发生的隐患。

测试企业的灾难备份计划、进行灾难备份(按预期开展灾难备份流程)、另一种灾难恢复情况(陷入无法达到RPO和RTO需求的非预期问题)三者是有区别的。相关问题在本文中不具体展开讨论,将在以后谈到。

减少灾难恢复过程风险的一个好办法是提高流程自动化,使得灾难恢复测试快速易行,并提供提高灾难恢复程序的结构框架。通过脚本工具或其他软件工具,可将操作说明书中的很多灾难恢复步骤自动化。如果能实现全面自动化,那最好不过。

如果采用服务器虚拟化技术,则可以增强数据保护方案中的快照和复制功能,以产生成本效益,且不影响灾难测试过程的开展。还需评估企业服务器虚拟化供应商提供的支持工具。

如果灾难恢复测试是自动开展的,并在实施过程中不受影响,你可以频繁实施测试,这样,系统恢复的可靠性会提高,出现意外情况的可能性也会减少。测试频率多少比较合适呢?我们推荐至少每六个月进行一次灾难恢复测试。

总结

设计并维持业务持续计划是一项长期工作,但是现在已有成熟的技术来满足不同等级RPO和RTO的需求。上述三方面的技巧可使保证你快速而成功地开展企业业务持续计划。

【编辑推荐】

  1. Retrospect Express软件简化小型企业网络管理
  2. 重复数据删除解决方案的标准评定
  3. 磁带加密技术为你保障数据安全
  4. RAID数据恢复的具体讲解
  5. 浪潮海量存储系统软件保护业务连续性

相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统