WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 数据保护 > 正文

重复数据删除技术成为备份系统的支撑点

Watchstor.com  佚名丨2010-01-03 15:24 标签:数据保护 存储资源管理 重复数据删除 

重复数据删除技术一个市场上十分火爆的词,其实在很多的地方还是有不少的问题存在。下面我们就详细的来解读下这些技术的相关信息。希望对大家有所帮助。

相较于去年大谈磁盘备份的优点——可为企业节省搜寻回复近期档案的时间,进而达成信息生命周期管理(ILM, Information Lifecycle Management)愿景;今年存储厂商对于磁盘备份技术的看法显然更为实际,在今年企业数据量首度超越存储空间之际,包括了EMC和NetApp两大存储业者,都提出重复数据删除(Data De-duplication)技术的重要性,表示前者的最大优点,即在于缩减备份窗口时间以及节省后端的磁带备份空间。

所谓的重复数据删除技术,意指扫描作业服务器(production)磁盘数据,判断数据是否为“重复”或“冗余”。原理是以算法切割磁盘里的数据成为区块(Block)或是区段(Segment),并为每一个分割单位求出一个特征值(unique ID),即可以代表此区块的数据。

藉由这个特征值,系统就可以比对硬盘中已有数据新写入数据之间,是否具有相同之处。若是一致,即代表这笔数据为重复写入,系统便只会为这份数据留下一个索引(index),而不会重复存储占有磁盘空间。换言之只有特征值不同的数据才会被实际写入硬盘。

有趣的是,由于重复数据删除技术为新兴技术,因此专注者反而都非领导的存储厂商,而是诸如Asigra、Avamar、Data Domain与Rocksoft等这类新创业者。

藉由收购Avamar,EMC亦取得了这项技术,并表示为该公司今年重点,EMC资深产品营销经理李百飞说。该公司指出,前者能将每日备份资料量减至300分之一,备份时间则可减少至10分之一。对于拥有5TB以上的备份数据量、集中在档案等非结构性数据的企业尤其适用。

Avamar强调的是全局性的重复数据删除,也就是在数据产出时,即比对前者是否已经存在备份磁盘中,仅备份差异部分。即使企业的远程办公室欲存取或产出数据,亦可进行比对。

“这对目前企业已经有将近七成的资料并非存在数据中心的现况,特别适用,”李百飞说。

不过建置Avamar的价格不斐,要价在千万台币等级以上。因此EMC目前锁定的系本地金字塔顶端的大型企业用户,诸如医疗、IC设计业者。

NetApp也在日前宣布推出重复数据删除技术 —NetApp A-SIS (Advanced-Single Instance Storage;不重复单元存储系统),适用于自家的NetApp NearStore和FAS存储系统。表示前者让用户能比传统模式节省高达20倍的空间,而且随着时间的推移可能达到更大的压缩比。

“重复数据删除技术能让企业用户正视到磁盘备份的价值所在,”NetApp资深技术顾问姜群说。他表示虽然磁盘价格已经大幅下滑,但是由于成本仍和磁带有一段差距,导致迄今部分企业用户仍未大举采用磁盘。数据重复删除技术则能凸显磁盘备份较磁带备份的强项。

【编辑推荐】

  1. 重复数据删除技术被EMC推向市场中心
  2. 重复数据删除技术在虚拟化中的应用
  3. 重复数据删除技术被很多虚拟磁带库厂商看好
  4. 重复数据删除技术的厂商观点
  5. 重复数据删除技术引领存储节能降耗

相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统