WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 数据保护 > 正文
重复数据删除方案中不能忽视的小问题
作者: 佚名 2010-01-03 14:28 【Watchstor.com】

重复数据删除方案在使用的时有不少的问题是我们忽略的,但是这些小问题也许就导致了整个方案的失败。为了避免千里之堤毁于蚁穴的惨剧发生。我们下面就来仔细学习下。

具备可扩展能力

由于重复数据删除方案是用于长期的数据储存的,在容量和性能方面的可扩展能力也是非常重要的考虑因素,而且至少要考虑未来五年甚至更长时间的增长计划。那么,在保证快速访问的前提下,你希望有多少数据保存在磁带上?你需要怎样的数据索引系统呢?

优秀的重复数据删除方案提供的架构,无论是在初始部署时,还是面对未来系统的长期增长,都应该能保证最优化(Right-sizing)、最经济的架构规模。集群可以帮助用户满足不断增长的容量需求——即使是N多Petabyte数据增长的环境——而且不会降低重复数据删除方案的效率或系统的性能。

这个架构还为存储库保护的部分提供了故障切换(Failover)功能。

支持分布式应用

重复数据删除技术,不只是能为单个数据中心带来利益,对于具有多个分支机构或多个站点的大型企业来说,它可以让整个企业的分布式应用受益无穷。一个包含复制和多级重复数据删除方案可以将这一技术的优势发挥到极致。

举例来说,一个企业由1个总部和3个区域代表机构构成,可以在区域代表机构部署一台具备重复数据删除方案功能的容灾设备,使本地存储及向远程中央站点的复制更为高效。这种解决方案使数据复制到中央站点的带宽需求降到最低,它只不过是用来确定远程的数据是否已经包括在中央的存储库中。所有站点中,只有唯一的数据会被复制到中央站点或是容灾站点,否则所需的带宽就会增大。

能够对存储库提供实时保护

保证对删除重复数据的存储库的访问是非常关键的,因此它不能允许有单点故障发生。一个优秀的重复数据删除方案应该包括可以在本地存储故障发生时提供保护的镜像功能,同时也应该具备复制功能以在灾难发生时提供保护。这种解决方案还应该在出现节点故障时具备故障切换能力,即使是一个集群中的多个节点出现故障,企业也必须能够及时恢复数据,同时还要保证业务持续运营。

效率及有效性

与基于文件的重复数据删除方案相比,在SUBFILE或数据块级分析数据的方式删除的冗余数据会更多。比如,一个4MB大小的文件被修改了一行内容,如果是文件级解决方案,整个4MB的文件都必须再被保存,而存储上就需要保存两遍。如果这个文件被发送给多个人(这种情况非常普遍),这种负面的效应也会随之倍增。

大多数SUBFILE重复数据删除方案处理是通过将大量的数据分割成“块”,就像虚拟磁带匣一样,在相对小尺寸的数据块中搜索重复数据。分割成大块的数据处理速度更快,但发现的重复数据也比较少;而分割成小块的数据可以更轻松地发现更多重复数据,但它在扫描数据时所需的开销也会更高。

【编辑推荐】

  1. 重复数据删除技术在市场中的潜力无限
  2. 重复数据删除解决方案已经有了技术上的突破
  3. 重复数据删除技术被EMC推向市场中心
  4. 重复数据删除技术被很多虚拟磁带库厂商看好
  5. 重复数据删除技术引领存储节能降耗

标签:数据保护 存储资源管理 重复数据删除 

了不起的IT经理
LecVideo
论坛与活动