WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

技术文档 > 存储网络 > 正文
连接私有云和公共云的4个顶级云存储用例
作者: George Crump 2019-04-29 10:37 【企业网D1Net】

对于大多数组织来说,公共云和私有云如今不再是二者选一的选择。相反,混合云被认为是当今的最佳云实践。组织还希望在选择使用哪个公共云以及在云平台之间迁移的能力方面具有灵活性。然而,连接私有云和公共云仍然具有挑战性。

延迟、带宽和云平台的性能都会影响将哪些数据放入云中以及如何访问这些数据。因此,IT专业人员应该为特定的云存储用例寻找解决方案,而不是试图寻找能够满足组织所有需求的云计算应用程序。

在可以了解在最常见的云存储使用案例下,需要现场基础设施和私有云与一个或多个公共云连接的最有效策略。这些情况包括云爆发、云作为主存储或主计算、云作为备份和灾难恢复目标,以及云作为数据存档。

1.云爆发

大多数组织都在存储和计算方面构建他们的数据中心,以应对对资源具有高峰需求的最坏情况。在这些高需求峰值之间,大部分资源未被使用。当添加足够的工作负载或当前的工作负载接近数据中心能力的限制时,组织通常会对这些资源进行额外投资。云爆发的目标是打破持续保持领先于需求曲线而成本高昂的周期。

凭借可靠的云爆发策略,组织可以将其数据中心运营设计为常态而非峰值。当需求超出当前数据中心资源时,他们可以在云中启动某些应用程序或工作负载。

云爆发用例的连接质量在很大程度上取决于预先规划的数量以及组织在需要将工作负载推送到云平台之前的通知。通过适当的预先规划,相对标准的商务级互联网连接就足够了。预先规划需要在峰值之前将数据复制到云平台中。复制需要是连续的,以便云副本与本地副本不同步不能超过几分钟。由于关键应用程序预先定位在云中,因此预植入的方法也具有灾难恢复的价值。使用潜在爆发候选者预先植入云中的缺点是云存储资源不断消耗,这增加了成本。

如果组织希望更加动态地将工作负载迁移到云平台,则他们将不得不对更快的网络连接进行投资。更加动态的方法不会消耗额外的云计算资源,并且可以更好地在高峰需求发生时选择工作负载以迁移到云平台。此外,还有一些应用程序可以比典型的文件传输应用程序更优化地迁移数据。

2.云作为主存储

最有趣的也是最具挑战性的云存储用例,就是将云平台用作主存储或主计算。将云平台作为主存储需要解决任何延迟问题。与云计算备份和恢复不同,其连接问题主要是带宽问题,主存储通常更具事务性,使延迟成为主要问题。

云作为主存储的主要用途是网络附加存储。该领域的供应商专注于创建云托管文件系统,该系统可以自动确保最常用数据的副本位于本地设备或边缘设备上。如果本地用户修改或更改该数据,则会更新云副本。如果用户访问不在本地边缘设备上的文件,则从云中检索该文件。在大多数情况下,除非文件很大,否则检索它的时间几乎不明显。

数据备份和恢复是连接本地基础设施和公共云最常用的(通常是最初的)用途。组织可以轻松地将这些边缘设备放在所有数据中心和远程办公室中,因为所有存储都有效地放在一个位置:云平台。这个领域中的一些供应商还添加了全局文件锁定功能;如果文件在一个位置使用,则所有位置的用户在访问同一文件时都会看到只读通知。

其中一些系统也支持多云使用。创建卷时,管理员可以将其连接到特定的云计算帐户。在提供程序之间移动数据需要将副本从一个卷移动到另一个卷,这意味着所有数据路由都会通过内部部署设备返回。

主要块存储云实例比文件存储更具挑战性。首先,应用程序不像等待文件的用户那样耐心。如果数据访问速度不够快,应用程序将超时甚至崩溃。在过去,确保应用程序稳定性的唯一方法是使本地设备足够大,使数据不在其上的机会非常小。问题是这种方法并不能节省成本。

有两种方法可以解决此问题。首先,许多云计算提供商现在具有直接连接选项,其中标准企业存储系统直接连接到云计算资源。供应商将与位于公共云提供商附近的托管服务提供商合作,以便实现高速连接。这种情况意味着组织将主要使用云计算资源,使用更传统的存储系统来存储数据。它还可以使用备份应用程序备份此传统存储系统,并将这些备份存储在云存储中。同样,由于连接速度非常快且非常接近,因此这些备份可以相对快速地完成。

有几个托管主机设施可以直接访问多个公共云提供商。这些设施在物理上和地理上与公共云提供商的数据中心非常接近,云计算提供商的计算资源可以访问存储,其延迟类似于提供商数据中心内的存储。由于数据是“静止的”,因此不需要迁移工作。如果组织想要使用其他提供商的服务来应用更强大或更便宜的计算功能,那么可以轻松地在云计算提供商的平台之间移动。

另一种选择是在将数据存储在云中之前将数据分层到第二层。通过这些多层产品,组织可以在内部部署为活动数据实现相对较小的基于闪存的缓存,这些缓存分层到地理位置相近的辅助提供程序以存储热数据。一旦数据需要冷存储,可能只存储在云中。其结果是内部缓存大小与日常活动数据的容量相等,热数据在几毫秒之外复制,以免干扰应用程序执行。所有数据在创建或修改时都会复制到云中,但该复制是异步的,因此不会影响生产性能。这个云副本用作灾难恢复副本。它还意味着数据在第一层和第二层之间逐渐过时,实际上并不需要复制。它只是从这些层中删除,因为它已经在云层上。

多层主云存储策略通常支持多个云平台,但由于数据最终存储在单个云平台中作为中央存储库,因此提供商之间的迁移与任何其他迁移工作相同。内部部署设备策略可以指向多个云平台,但在发送给新的提供商的云平台之前,所有数据都很可能需要迁移回内部部署。

3.云备份和恢复

数据备份和恢复是连接本地基础设施和公共云最常用的(通常是最初的)用途。由于采用了压缩、重复数据消除和块级增量备份等技术,本地备份存储系统与公共云存储之间的连接不需要特别高的速度,采用基本的业务级连接通常就足够了。

就本地备份存储而言,每个供应商对其进行不同的处理。传统备份供应商通常将本地存储视为主要备份副本,将云副本视为仅用于灾难。云计算被视为磁带的替代品。其他更现代化的备份软件产品将公共云存储视为更有形的资产。内部部署设备用作缓存或层,较旧的备份根据访问时间自动移动到公共云层。缓存层方法的优点是内部部署投资相对较小,很少需要升级。

虽然压缩、重复数据删除和块级增量备份降低了备份过程所需的带宽,但备份供应商最近才通过利用灾难恢复即服务来解决恢复问题。灾难恢复即服务(DRaaS)支持将应用程序恢复为云计算虚拟机,暂时消除了连接速度回到本地数据中心的担忧。在发生灾难时,所有数据移动都在云计算数据中心内,不需要互联网连接。根据软件如何使用云计算资源,应用程序可以在宣布发生灾难后的四小时内恢复运行。

当IT部门决定将应用程序移回本地时,互联网带宽将成为一个问题,除非云计算提供商能够批量发送数据。虽然许多灾难恢复即服务(DRaaS)工具可以在后台将数据复制回本地,但使用低带宽连接这样做将需要数天甚至数周的时间。遗憾的是,重复数据删除和块级增量备份技术无法帮助提高恢复速度。

在许多情况下,组织可能希望将已备份到云中的数据放在那里,仅在恢复请求进入时使用。在其他情况下,它可能希望使用云计算对数据执行更多操作计算资源。例如,由于灾难恢复即服务(DRaaS)使用云计算资源而不仅仅是云存储,因此组织可能希望使用其数据的云计算副本来测试、开发或运行报告和分析。挑战在于大多数备份应用程序以专有格式存储数据,而云计算资源无法直接读取这些数据。这意味着IT需要首先恢复数据,使其处于本机格式。如果执行恢复的时间过长,请查找以本机格式存储数据的备份应用程序。

4.存档原有数据

云存档实际上可能是最佳用例,因为它通常不需要对网络带宽进行任何更改,并提供显著的投资回报率(ROI)。存档产品分析本地生产存储,以查找在用户定义的时间段内(通常超过一年)未访问的数据。然后将这些文件移动到以每TB为基础的成本更低的辅助存储设备。

传统存档产品的问题在于,它们需要在二级存储系统中进行大量的前期投资,通常为50TB或更多的数据。大多数组织通常没有50TB的容量存档。云存档通过逐步归档数据来解决此问题,必要时以每GB为基础。

逐步的方法使得能够使用更适度的带宽连接。根据定义,存档很少被访问,因此这种情况与其他云存储用例没有相同的带宽检索问题。

一个值得关注的领域是元数据。大多数存储I/O都与元数据相关。例如,如果用户想要执行云存档目录的列表,则需要通过宽带连接发送所有元数据,这需要时间。为了解决元数据问题,一些供应商在内部部署和云平台中存储元数据,因此查询访问本地元数据副本,用户体验将会得到即时响应。

大多数云存档产品可以将数据发送到多个云平台,有些甚至可以同时支持多个云平移。交换提供商面临的挑战是将数据从一个云平台移动到另一个云平台所需的成本和时间,特别是在存档的情况下,这可能意味着移动大量信息。如果组织想要将存档移出云平台,并将其原有数据存储在本地,则会出现同样的问题,因为云平台的租赁成本比本地对象存储的购买价格更昂贵。由于网络和出口费用,将以前存档的云计算数据移回内部部署非常耗时且成本高昂。

将组织的私有云连接到公共云比以往更容易。存在多种云存储用例,其中内部部署和公共云存储可以很好地协同工作。还有一些公共云可能是合适的替代品。组织需要制定计划并逐步执行计划。关注特定的用例并转移到其他用例上是有意义的,因为组织采用云计算技术将会获得成功。


标签:存储网络 

LecVideo