人们需要知道存储快照的一切

  虽然数据中心备份是基本数据保护策略的一个核心要素,但主要关注数据保护,保护和可用性的企业战略集团(ESG)的资深分析师杰森 布福因森解释了为什么存储快照和复制也是必须一样策略的原因。

人们可能听说过存储快照并不是备份的口头禅。这当然是真的,但存储快照在现代数据保护中越来越重要。根据企业战略集团的数据,10个组织中有9个组织使用以存储为中心的保护技术(快照或复制)来补充高度虚拟化环境中的数据备份措施。

存档与备份,以及为什么人们需要了解二者之间的差异

从数据备份中区分数据备份是IT专业人员在数据恢复方面所遇见的最常见的问题之一。而人们需要知道为什么需要了解两者之间的区别,以及为组织构建或优化最佳数据归档策略获得重要提示和最佳实践。

虽然备份继续支持每个组织的数据保护策略,但存储快照通常是确保IT基础架构的可靠保护和快速恢复的一种补充方法。此外,快照与复制是现代数据保护的基础。

快照的工作原理

虽然粒度细节可能略有不同,但快照本质上是表示文件系统或卷看起来像在一个特定时间点的磁盘块的集合。无论应用程序,虚拟化层或其他抽象层,几乎所有的存储产品都可以归结为文件系统,其中各个文件和文件夹实际上由存储系统本身上的盘块内保存的相关数据块组成。要明确的是,这些可以是存储阵列内的物理块或软件定义的存储或虚拟设备平台内的虚拟化块。访问文件,文件夹和数据的关键是磁盘映射,指向块的本身,并驻留所选文件系统中。

简单地说,假设一个75kB文件的数据分布在三个32kB磁盘块上。所有高层访问方法(包括文件信息,属性和元数据以及应用程序相关性)都包含在由操作系统驱动的文件系统中,该操作系统将文件提供为结构化或非结构化数据。文件系统本身仅包含 文件 的条目和到三个磁盘块的顺序指针,这三个磁盘块随机分布在实际存储介质上。可以将快照视为这三个块的 冻结 内容,以及元数据和指针。

文件的中间块更改后,也许在文件系统下,第一个和第三个块保留,但第二个块现在包含新数据。快照过程保留块的副本,因此可以通过简单地重新连接三个原始数据块将文件 恢复 到以前的时间点。在充分披露后,快照几乎总是发生在卷级别,而不是一个文件级以上例子描述。这个解释适用于两者,并且可以通过以下的 快照如何工作 更好地理解。

为什么快照很重要

根据调查机构ESG公司的研究,67%的服务器具有不到两个小时的停机容错,如调查的停机时间容错。

虽然备份系统通常可以处理两个小时以上的恢复率,但是在七个服务器中只有一个容忍由传统备份机制强制停机6小时以上的时间窗口。并且因为备份数据将在替代硬件或服务上比原始数据驻留更容易压缩和可存储的状态,所以即使是从备份数据进行最快的恢复也有一些实际的限制。另外,恢复到以前的快照的时间为几分钟或更少的时间,因未块位于与主数据相同的阵列内。虽然逆转从快照看起来肯定比从备份的恢复更好,但有一些常见的权衡:

本地漏洞。根据定义,备份是在其他位置保存的副本,快照驻留在与生产数据相同的存储中介质中,如果生产阵列被阻碍,快照将不可用。

存储消耗。有些与此相关,虽然备份经常对其存储库使用不同类别的存储介质,但是快照总是在生产环境的高性能存储系统内消耗容量。

保护频率。由于高级的存储消耗,大多数组织将保留快照中的数据以天计算,与备份的月份或年份相比,存储时间较短。也就是说,用户可以在白天(每隔几个小时或每15分钟一次)存储一次快照,而不太频繁和典型的夜间备份操作。

在使用快照时,大多数组织应该使用快照作为他们最好的存储方式,这个近乎即时的相对最近的数据可恢复性,然后将备份(甚至从磁盘)作为恢复的第二个选项。他们还应该将快照与备份结合起来,以确保数据在阵列外部可生存时间更长。

区分快照机制

快照方法中的一个可区别的特征是写入时复制(CoW)与写时重写(RoW),基本上涉及当写入新数据时磁盘块的行为。

参考一下前面的例子:

将需要三个磁盘块的文件写入块A,B和C.

调用快照,可能是由于存储用户界面中的策略或与存储阵列集成的备份应用程序。

文件已更新,需要替换逻辑文件中间的信息。

如果存储系统使用写入时复制,将发生以下情况:

磁盘块B的内容将复制到卷上的其他位置-新块 D 。

更新的文件数据写入现有块B-覆盖现在已在其他位置保存的初始数据。

通过将新数据写入块B,可以顺序访问这三个块(ABC)。

或者,如果存储系统使用写入重定向,则需要满足以下条件:

新数据立即写入新块D.

文件系统中的指针现在指示文件由块 ADC 组成,原始块B保留为快照。

通过将更改重定向到新块,在生产使用期间不必在存储系统中进行额外的I/O操作。

从历史上看,额外的I/O导致明显的碎片化,导致一些存储系统执行回收或重组任务,特别是当文件系统保持在单个阵列(例如,个人计算机与多轴阵列)上时。在CoW和RoW示例中,当快照保留窗口已经过期(例如,在72小时的时间内至少已发生一个备份)时,磁盘系统回收作为自由空间的块(CoW中的D,RoW中的B)快照指针将消失。

如何从快照获得更多

从快照启用的两个常见功能包括克隆和可移动的快照。

克隆,提供了各种品牌的术语,通常指使用快照功能用于除数据恢复之外的目的。许多组织希望将其数据副本用于应用程序开发,补丁测试,报告和分析等。但是他们不能承受所有的增量存储容纳不同的副本,也不想承受I/O从生产系统传输所有的数据。相反,因为快照字面上是指向块的指针,所以这些指针通常可以被暴露为第二个文件系统(即,克隆),而不占用任何额外的存储容量。虽然生产用户继续访问实时数据,但开发人员,分析人员和其他受益人可以访问克隆用于其目的,假定存储阵列可以确保足够的IOPS,以免阻碍生产环境的运行。虽然新数据可能会消耗少量的增量存储,但它通常是临时性的,并且远远少于创建数据集的完整新副本。

尽管技术上不是快照的一部分,复制的块本身通常被供应商所吹捧,往往被吹捧的供应商提供更有效的比基于文件的复制技术所执行的更高级别的功能。在存储产品中通常是相同的基础技术,用于管理作为快照编织在一起或传输以进行复制的块功能。

移动快照利用基于块的一些阵列复制,但也复制从第二个数组重建相同快照所需的元数据和指针。或者,可以每小时在主阵列上配置快照,但仅在非现场二次阵列上每四个小时调用快照,在需要备份进行还原之前需要更长的保留时间。

上面描述的所有内容(CoW与RoW,克隆,复制等)特定于各个阵列的机制,但是,如前所述,快照通常与传统的备份机制相结合,用于更灵活和全面的恢复场景。历史上,存储管理员使用独立于备份管理员界面,采用供应商阵列的特定工具专门管理许多组织的快照。如今,许多领先的备份软件产品集成了主流存储产品的可管理性及其快照功能。虽然支持集成管理的阵列有很大差异,快照管理功能的集成和可扩展性也是如此,更常见的配置允许以下内容:

单个管理UI(备份控制台),用于通过类似于计划备份方式的策略配置快照计划,从而获得所有每日,每周和每月恢复点(来自备份)和每小时恢复点(从快照)。

单个目录,其中主存储上的快照迭代被视为恢复的另一个来源,以及备份软件本机使用的任何磁盘,磁带或云存储。也就是说,关于目录的可用性,供应商之间存在很大差异,其中一些备份界面与正确的存储阵列相结合,可以呈现所有文件及其在每个快照中的版本的索引。其他组合在备份管理员手动安装之前,无法查看快照。

恢复(来自备份)不能够满足业务部门的当前服务级别,特别是对于数据库或虚拟化主机等核心平台。然而,必须为那些事务应用程序提供额外的技术调整,由此存储快照供应商向数据库或管理程序层提供集成扩展,因此快照具有其处于最佳可行状态的数据。这样做,许多备份应用程序可以从快照中恢复单个项目,因为它们可以从自己的备份存储介质中恢复,这是将数据保护策略现代化的整个过程。

编辑:Harris