WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 数据保护 > 正文

数据备份管理企业数据安全的升华

Watchstor.com  佚名丨2009-10-22 18:07 标签:数据保护 存储资源管理 备份恢复 

随着数据备份在众多企业中的地位日趋重要,对于数据备份管理的力度也要大大的加强。在数据备份管理的时候我们还要注意很多的问题,这些问题关系到数据备份的安全性和可利用率。

网络数据备份管理软件的工作原理是在网络上选择一台服务器作为整个网络的数据备份管理服务器,安装网络数据备份管理服务器端软件。此备份服务器连接或管理一个或数个大容量存储设备(磁盘阵列、磁带库或光盘库等)。在网络中其他需要进行数据备份管理的服务器上安装备份客户端软件,有特别备份要求的还要加装特殊的备份客户端代理软件(如数据库应用的在线备份、SAN环境中的LAN FREE传输等等),然后通过各种网络将数据集中存储在目标存储设备上。

引 言

数字信息比以往任何时候都更有力地推动着社会的发展。据估计,现在世界上四分之三的信息都是数字化保存的,信息的爆炸性增长、互联网发展的日新月异,越来越多的行业、企业已经意识到了数据安全存储的重要。

现代社会很多企、事业单位的运营都是基于庞大的数据流来进行的。急剧增长的信息系统数据存储安全性需求,使数据备份/恢复技术面临着革命性的演进。因此对于关键信息系统来说应拥有一套稳定、安全、可靠的数据备份管理基础架构,以承受电子商务时代信息数据的爆炸性增长,适应互联网变幻莫测的要求,以及主动对不可预测的灾难事先进行有效的预防。

网络数据备份管理软件技术简介

网络数据备份软件技术,就是以软件的方式来实现,将跨平台存储的分散数据提取出来(包括静态和动态的数据),通过网络(IP Network或FC SAN)集中备份到一个或数个大容量存储设备中(如磁盘阵列、磁带库或光盘库等)。一旦源数据受到损失,就可以从原先备份的介质中恢复。

技术要点包括数据的提取和重导入、数据网络传输、数据转存、集中控制与自动化处理等。

 网络数据备份管理软件技术发展现状

网络备份软件脱胎于数据存储软件,最初只是简单地将源数据从一个介质转存到另一个介质中。但随着IT科技的不断发展以及在电子商务、公务、业务的深入使用,许多问题也应运而生:数据从原先的单机存储演变为目前的网络多机、多平台分散存储,这就需要建立集中化的网络备份架构;备份的数据从以前的以M计到以G计直至现在拥有上T数据的环境也不罕见,这就对数据的传输和存储提出了高要求;大多数需要备份的信息以动态应用数据的形式组织存储,而非简单的静态数据,这些数据之间还存在关联,于是数据的提取工作就变得相当复杂。

网络数据备份管理技术就是针对这些现实IT环境中的需求,实现分散数据的网络集中备份,各类应用产生的动态数据的在线提取,多种网络环境下的数据传输,以及跨平台主机、各类存储设备和备份数据自动化管理等等。

目前国际上,这个课题还属于工业先行的状况,即相关的商业化软件产品不少,有些技术已经在各类的IT环境中运行使用了相当长的时间。但该领域内的理论学术研究几乎空白,可以查阅到的仅有的一些技术文献,大多局限于几个流行软件产品的使用,在某些特定环境或个案中的解决方案(比如只谈论如何备份/恢复Oracle数据库;备份软件在SAN环境中的使用等等),却很少有上升到理论层面,对网络数据备份管理的流程、架构以及要点等进行全面阐述的著作。

这样一方面使得厂商们为了本身的利益而各自为政,难以形成统一的技术框架以及行业标准,使得IT用户在数据备份管理系统的建设中无论从设计到选型到实施直至日常的运作都或多或少带有一定的盲目性,投资要么重复要么不到位,严重影响了IT用户的数据安全性和投资回报;另一方面,工业先行的现实状况也影响到了数据备份这个课题本身作为计算机科学中的一个新兴分支学科的长远发展以及相关交叉领域的理论沉淀。

在国内,目前这方面还处于初步研究阶段,真正实用化的同类软件产品还未见报道。在国际及国内的学术刊物上该领域公开发表的研究论文极少。

网络数据备份管理软件模型

虽然目前,商业化的网络数据备份管理软件也有不少,各自的产品构架可谓千差万别,但是我们依然可以从中提炼出其骨干元素,结合实际IT环境,设计出一个完善的网络数据备份管理的基本模型来。

完整的网络数据备份模型分为两个层面,面向使用者的管理控制层以及面向低层处理的数据处理层。数据处理层模型包括:数据提取、数据传输、数据转存以及数据恢复等单向的或双向的流程;管理控制层模型则包含索引控制、自动化操作、日志管理、存储管理、策略管理、统一监控操作管理以及备份软件本身的系统管理等要素。

网络数据备份软件的基础功能部分为C/S结构,数据的提取/恢复以及传输为客户端的功能,其余为服务器端的功能。备份服务器连接或管理一个或数个大容量存储设备。在网络中其他需要进行数据备份管理的服务器上安装备份客户端软件,有特别备份要求的还要加装特殊的备份客户端代理软件(如数据库应用的在线备份、SAN环境中的LAN FREE传输等等),然后通过各种网络将数据集中存储在目标存储设备上。

我们在对备份软件系统的研究过程中体会到,备份软件系统模型的设计至关重要,它不仅关系到整个备份软件系统运行的效率,而且会对备份软件的功能乃至整个数据备份存储有很大影响。

数据处理模型

数据处理模型是网络备份软件系统的实现部分。作为备份软件的基础,其设计工作在整个系统中占重要地位。数据处理模型分为数据提取/恢复、数据传输和数据转存三个主要环节。透过数据处理层的主要环节,我们可以清晰地观察到备份过程中的备份数据的生命周期。

数据提取/恢复

数据提取的难度在于提取颗粒度以及动态数据提取一致性等问题。

数据提取的颗粒度可分为空间颗粒度和时间颗粒度。空间颗粒度即传统意义上的全量备份、增量备份以及差量备份等数据提取方式,一般是针对静态孤立数据而言,如文件系统中的普通文件、裸设备文件等。而时间颗粒度则一般针对应用的动态数据而言,数据备份管理的频繁程度是以天计还是以小时或是分钟计,或者是动态的LOG方式等。

数据提取为将来的数据恢复打下了坚实的基础,数据提取的颗粒度越细,数据恢复时就越能够逼近数据故障前的最新数据,数据的损失就可以达到越小。但在现实环境中,这并不意味着恢复效果就越好。这是因为数据提取的颗粒度越细,备份/恢复的开销也就越大,无论是性能的下降、存储的增加、还是备份/恢复时间窗口的延长等等。而过大的开销在现实情况中,往往会制约数据恢复的正常工作。

应用动态数据提取的一致性保障也是数据提取过程中的一大难题,这直接关系到将来恢复的数据是否有意义。应用动态数据的提取主要考虑是热备份还是冷备份。应用热备份是在应用数据打开的情况下做的,所以在数据提取前一定要保证应用数据的完整性。失去完整性的应用数据是无法恢复的。冷备份是在应用数据正常关闭后或数据文件离线后做的备份,所以不需要考虑完整性(数据库已经是完整的)。如果只要做冷备份,非常简单,使用普通的Client端备份相关文件即可;如果需要热备份,则需要有相应的应用数据备份接口和相应的特殊备份Client端软件来实现。比如包括主流数据库(如Oracle、DB2、Informix等)、电子邮件系统(如Lotus Domino、MS Exchange)等。

此外,对于应用数据恢复的数据备份管理,一般要透过应用本身的备份接口,将备份数据导入,这样才能保证数据恢复时的一致性。

【编辑推荐】

  1. Windows Server 2003 R2的强化存储管理功能>
  2. 全面容量管理的含义分析
  3. 网络管理员日常必做的12项工作
  4. 移动硬盘加密的实用技巧分享
  5. 存储资源管理工具的发展趋势

相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统