WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 数据保护 > 正文

重复数据删除技术在磁带机上的具体应用

watchstor.com  佚名丨2009-11-28 18:09 标签:数据保护 存储资源管理 重复数据删除 

重复数据删除技术已经开始迈向成熟,经过很长时间的考验。虚拟磁带库解决方案的提供商,如FalconStor(也是EMC和Sun的供应商)、NetApp和Sepaton通常会认证一系列的备份应用程序,但是对数据源或数据目标系统来说,它们并不是中立的。

特别需要指出的是,虚拟磁带库解决方案是仿真磁带库。因此,只有那些对磁带库具有特定支持的应用程序才能使用虚拟磁带库,这使得应用程序本身受到限制,难以取得更大的发展。

在数据中心中流行使用的很多工具通常是将数据装入磁盘,而并不支持磁带协议。很多数据保护工具并不支持将数据复制到虚拟磁带库中。

带重复数据删除技术功能的虚拟磁带库解决方案的局限大部分来自系统管理复杂性的增加以及在线处理与后处理的优劣之争上。通常来说,新增的虚拟磁带管理需要在磁盘上仿真磁带,因此对已经很复杂的环境来说不异于又增加了更多的复杂性。

对持续的日常管理来说,后处理方式进一步增加了其复杂性,而且这种方式对重复数据删除技术和复制(或是创建灾难恢复副本)的时间会有负面影响。后处理方式同时还需要增加额外的磁盘容量来充当重复数据删除技术的“着陆区”。

最终,更多的容量意味着需要管理更多的磁盘,消耗更多的电源和制冷成本,占据更多的空间,当然,还需要购买更多的设备。如果使用低效率的后处理重复数据删除方式,在现有的虚拟磁带库产品中还不如不增加重复数据删除技术功能。

基于软件的重复数据删除和单实例存储

正如人们所期望的,备份软件厂商目前正在其功能集中增加重复数据删除技术功能。此外,备份软件厂商,如CommVault正在使用一种数据缩减技术,也即众所周知的单实例技术,在备份主机接收数据并开始文件层次的比较时发挥作用。

尽管这种方法很明显会降低备份过程引发的某些存储要求,但是它不能解决网络带宽的需求问题,也不能解决类似数据的多个副本的问题(只有那些通过特定应用程序运行的数据才需要检验是否存在冗余)。

单实例存储并不能解决备份存储中存在的另一个大问题:那些定期发生轻微变动的文件。

在单实例存储中,那些不需要每天变化的离散文件通常被排除在备份的实例之外。然而,在所有的备份传送策略中,那些无变化的文件并不是问题所在,那些每天变化一点的大型文件才是真正的问题所在。

数据库,VMware镜像和Exchange存储通常每天都会发生轻微变化。一个文件层次的单实例对照能够看到不同文件之间的变化,但不能显示同一文件之间的轻微变化。这意味着,整个文件必须要重新存储,与真正的重复数据删除技术相比,这会导致贫乏的数据缩减效果。很明显,如果没有数据块级别的缩减,就不可能节省空间,特别是对那种超大型的数据库文件来说,更不可能节省空间了。

单实例存储另一大无法解决的挑战在于,相似的数据集中通常存在多个备份源。例如,备份管理员可能会使用备份软件的Exchange模块来备份Exchange;而Exchange管理员可能同时还使用另一单独的工具来备份Exchange存储。在这个备份过程中不存在数据缩减,因为一个备份软件不能看到由另一个独立的备份工具创建的备份。

在这两种情况中(频繁且小规模变化的应用程序及多个备份源的情况),基于块级的重复数据删除技术系统会识别冗余的数据块,从而即便是备份源不同(可能来自备份应用程序或是Exchange),也能够减少存储负担。

那些使用单实例存储技术的软件供应商声称这种方式是最适合存储恢复的方式。言外之意是,重复数据删除技术系统存在一些恢复性能方面的问题。然而,虽然一些厂商的重复数据删除系统中有可能已经存在一些恢复性能问题,但是只要系统的架构设计得当,那么重复数据删除技术过程应该就不会给性能造成很大的影响。

在真实世界的数据中心中,在通过通用型重复数据删除技术系统进行恢复的过程,备份后数据和源服务器之间存在太多的其它瓶颈,这些是问题所在。如果恢复的性能需求超过了从磁盘恢复的能力,那么就需要考虑其它的高可靠性解决方案,例如集群技术或活动目标等。(活动目标是一种备份目标应用程序,可以像正常的文件系统一样被浏览和阅读访问。)

【编辑推荐】

  1. 移动硬盘误区的认识与防护
  2. McAfee Total Protection for Data扩展性极强
  3. 虚拟化环境备份的要点点评
  4. 浪潮BCP软件具有完善的数据监控体系
  5. 涉密存储介质的安全防护措施


相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统