WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评测导购 > 机房 > 正文

数据归档 你准备好了吗

Watchstor.com  佚名丨2009-11-04 09:51 标签:机房 归档 

随着数据的迅猛增长,越来越多的公司需要根据业务需求归档客户档案和信息,但是市场上出现的数据归档产品种类繁多,如果你对数据归档产品没有一个标准,很难找到一个适合自己公司的归档产品。

1数据归档有多完整?

并非所有的电子邮件存档解决方案都能捕获每一封邮件,但是人们可能希望捕获每封邮件。在一些环境中,只需要保留发送的邮件或从外部接收的邮件,所以采用网关方法的邮件存档工具比较受欢迎。但是许多公司需要更加完整的邮件存档,因而存档必须与邮件服务器相互作用,保证内外部邮件都得到保留。

即使邮件存档应用程序能捕获内外部邮件,一些邮件仍可能成为“漏网之鱼”。存档工具如果定时“扫描”邮件系统,就可能会丢失一些在扫描间隙发送、接收或删除的邮件。邮件必定具备发送者和接收者,双方都会删除邮件(还可能清空回收站),以此隐藏邮件,这种情况通常称为“二次删除”。公司如果关注法规遵从,就必须确保邮件存档工具能捕获每封邮件。

2数据归档工具能记录人们的行为吗?

除了完整的邮件,存档工具还需要维护用户的行为记录。一些系统能记录用户是否打开、转发邮件,是否对邮件进行标记、归档,产品演示证明这项特性大受欢迎。

但是,芝加哥Empire Today 公司IT网络经营主管Matthew Ushijima认为:“邮件标记为‘已读’并不能表明用户真的读过了,Outlook的预览面板既有好处,也有坏处,产品的这种特性无法使其成为最可靠的数据源。”

捕获用户对邮件采取的行为在技术上非常困难。传统的数据归档产品通常采用Exchange日志,必须利用MAPI扫描邮件系统,才能定期检查每封邮件,捕获这种所谓的用户行为元数据。MAPI扫描行为会消耗CPU和IO资源,要处理这种负载,必须添加额外的邮件服务器。另外还有一种存档方法,称为日志传送(log shipping),就无需这么密集的扫描行为,但是使用并不广泛。你应该考虑这种用户行为对你的存档需求是否重要。

3数据归档会摄取现有的邮件存储或PST文件吗?

许多公司都希望,邮件归档能包括在安装存档程序之前就存在的邮件。这些邮件通常来自邮件系统本身,可能包含十多年前的邮件;也可能来自离线存档或用户创建的存档,如Microsoft Outlook邮件客户端创建的PST文件。许多邮件程序能摄取这些旧邮件,有一些则不能(见下文的“PST摄取”)。

利用MAPI 协议从邮件服务器引进旧邮件,这个过程通常需要大量的迁移行为,需要花费几天的时间,因而通常在周末进行;大型环境以及那些在多站点配备邮件服务器的环境可能会花费更长的时间。

大多数邮件客户在本地磁盘中存储个人存档,因此数据归档可能存在用户涉及的任何地方,如笔记本、台式机、网络共享和便携式驱动器。这就使存档导入工作变得非常复杂,必须首先定位和整合。不是所有的系统都能处理各种格式的邮件,包括Outlook PST、Notes NSF、Unix mbox 和目录文件等。

无论从何处导入历史邮件,在实行电子搜索时,包含这些邮件的数据归档都应该标记为不完整、不可靠的邮件。但是,邮件服务器和个人存档会因此丢失大量邮件。要改变个人存档的内容,这种方法显得非常麻烦;现代邮件存档系统的防干扰性更强。

4数据归档能处理多个邮件系统吗?

不是所有的邮件归档程序都能处理多个邮件服务器。如果你的环境具有多个邮件服务器,又有大量的邮件系统正在使用中,处理多个邮件服务器这种功能就至关重要。一般来说,利用实时信息网关的存档在异构环境中非常灵活,而如果环境直接与邮件系统集成,存档就会变得迟缓。

如果公司由几家企业合并而成,这种现象更加普遍;一些公司由于历史原因,可能会拥有异构邮件系统。无论原因如何,大多数邮件存档解决方案都不可能支持所有的邮件服务器,如Microsoft Exchange、IBM Lotus Notes/Domino、Unix 以及 Apple的邮件服务器。

5非邮件内容怎么样呢?

一些邮件存档程序通常只关注邮件本身,而另一些也能存档日历项目、任务和通讯录。还有一些支持其它程序,包括文件系统、即时消息和数据库应用程序。不是每种环境都需要这类存档,但是应确保能满足管理部门和法律部门目标,明确哪些需要保存哪些不需要保存。一些数据归档系统支持邮件系统之外的内容。EMC公司邮件存档产品销售部经理Kelly Ferguson认为:“邮件是最重要的,包含文件和链接当然更好,但是邮件必须加以控制,因为邮件是消息繁衍的最大危险源。客户首先看重邮件,但是随着需求增长,就会期待系统功能扩展到其它内容。”

6重复数据删除技术呢?

重复数据删除技术是个热门话题,很多电子邮件供应商早就开始采用这种能够节省容量的技术。邮件存档工具如果支持重复数据删除技术,就只需存储一份邮件复本,以节约空间,然后在存档中关联邮件。一些应用程序只是针对邮件采用重复数据删除技术,而另一些程序则将邮件分成成几部分,对附件进行重复删除,这样就能节约更多的空间。

7法律部门会高兴吗?

并非所有的邮件存档工作都是为了遵从法规,尽管如此,你还是得时刻准备应付可能出现的诉讼案件,包括法律保留区(对特定邮件加密)和电子搜索等。一些存档工具会生成日志和报告,支持后台安全存储,确保日志和报告的内容能满足诉讼要求。

EMC公司的Ferguson指出,存档系统的记录比用户元数据更加重要。“哪些人访问了存档,他们查看了哪些内容,这点很重要。” Ferguson说,“删除策略也是如此,系统必须追踪每一次删除行为,或许碰巧能证明数据归档工作是否遵从收集策略和保留策略。”一些存档程序能生成监管链报告,记录导出的内容;另一些程序则具备加密、SAS 70安全法规遵从(见下文的“电子邮件监管”)等安全特性。

如果法律部门对邮件存档感兴趣,可能就是希望存档具有诉讼保留(litigation-hold)功能。在起诉之前,法律人员必须指导IT人员保留一组不可变的内容,以备电子搜索之用。

一些存档程序具备本地诉讼保留功能,但是保留力度不尽相同。保留能应用到个体、邮件、文件夹、用户、邮箱或者整个邮件存储中,但并非所有的系统都能处理这些变化。Mimosa Systems公司法律法规解决方案市场部的Tolson认为:“一些程序不能对单独的项目实施法律保留,需要保留整个邮箱或邮件的存储,才能确保满足保留策略。”

你应该决定系统能否处理多个彼此重叠的保留项目,所保留的范围应该无需释放就能随时改变。最后,法律部门对保留的具体实施过程可能各不相同,这需要与法律人员协商,看看他们有没有特别的要求。

即使你选择的数据归档系统具备本地诉讼保留和查找功能,你可能还需要将其与第三方工具集成。不是所有的存档程序都具备灵活的诉讼保留和查找功能,供实际使用,尤其是当你的公司频繁面临法律事件时,你可能需要更加专业的法律保留工具。

申报和发布诉讼保留的过程非常复杂。保留项目包括大量的日期、系统,保留范围由多方协商确定。通常,专业的第三方诉讼保留程序提供多项功能,与存档程序集成。

集成的保留和查找功能遭到反对通常还有一个原因,即法律人员的偏好。过去十年,电子搜索变得非常普遍,大多数律师都曾经受此类案件。他们熟悉专业的法律支持软件,因此很有可能寻求电子搜索这种解决方案,而不会依靠与邮件存档系统绑定的陌生方案。

8查找如何实现?

数据归档应用程序的查找功能——对于电子搜索而言,这项功能至关重要——因产品而异。看看你的法律团队每天如何实现查找;他们可能对不同的查找内容采用不同的方法,希望有一种适用范围更广的方法,如在隔离邮件之前实行嵌套查找。与法律人员一起测试查找功能,看看能否按照他们的要求实现查找。

“我们的法律团队着迷于电子搜索。”一位匿名的某公司管理员说,“他们慢慢熟悉了邮件存档的功能,随之提出很多查询问题,而且问题更加精练。”这就有助于保护公司利益,减少电子搜索的成本。

考虑查找功能的技术性能。能在邮箱和软件库中实现查找吗?多次查找可能会降低存档的利用率,丢失一些内容。不是所有的存档系统都能快速有效地查找大型数组。试着查询大量数组,判断数据归档工具的查找功能反应是否迅速。

9数据归档工具容易与第三方工具集成吗?

大多数情况下,邮件存档系统是基础架构中必不可少的一部分,所以要考虑能否很好地与其它软件集成。存档能与用户账户管理器集成吗?能访问控制系统吗?能与报告、日志和审计工具集成吗?大公司发布产品时,缺乏这些功能可能会成为绊脚石。

请注意:存档工具和其它合法工具的集成能力各不相同。大多数存档能够利用电子搜索工具,在PST文件中导出一组消息;其它存档则能利用数据库访问或API函数,直接与其它工具绑定。后者更加灵活和有效,如果公司经常需要查找存档,并采用合适的工具,就会从中获益。

10用户会怎么考虑?

邮件客户端具有多种集成方式:一些数据归档不具备集成功能,依靠Web浏览器接口访问存档;一些存档利用工具栏、可执行的扩展文件访问邮件服务器中的特定客户端或存档文件夹。无论采用哪种技术,都要考虑用户的反应(见下文的“用户想要什么”)。当具有合适存档的时候,用户与邮件客户端的交互行为如何发生变化?如果客户机需要安装可执行的扩展文件,记得考虑交互行为的影响。

考虑可以使用的邮件客户端。大多数公司提供Web邮件客户端,但是一些存档系统不能与Web客户端集成。许多用户也能利用BlackBerry、 Windows Mobile、 Palm、iPhone、Symbian等移动设备访问邮件。但是,大多数存档系统不能与Web之外的移动设备集成,有时候这些站点的格式杂乱、图像复杂,不利于移动浏览。离线访问也是一种选择。如果用户能够在飞机上访问存档邮件,就会很容易接受这种系统。

实际上,技术因素也重要。例如,数据归档程序能够处理大规模的邮件系统吗?能处理每天发送和接收的邮件吗?同样,还需要考虑数据归档产品是否支持操作系统,是否支持邮件系统的地理布局。不是所有的邮件存档解决方案都可以扩展。

【编辑推荐】

  1. 海量存储的技术发展分析
  2. 备份软件的详细技术分析
  3. 固态存储的发展历程
  4. 智能存储管理系统为企业优化管理
  5. 在线存储市场发展迅猛

相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统