AnyBackup如何应对海量虚拟化数据保护
在虚拟化技术日益成熟的今天,在企业中的应用已变得十分广泛。IDC研究表明,2014 年有 69.7% 的 x86 系统实现了虚拟化,到 2018 年该比率上升到了 71.1%。但是,如何确保海量虚拟化数据,都能得到有效地保护和管理,这对于企业来说无疑是一项巨大的挑战。
要想实现海量虚拟化数据的高效保护,必须考虑到三点:备得少、备得快、存得少。爱数AnyBackup在虚拟化备份领域深耕多年,有着深厚的技术积累,能够很好地通过上述三点来实现虚拟化数据的高效保护。
CBT技术让虚拟化数据备得少AnyBackup支持VMware的CBT(Changed Block Tracking)技术,即块修改跟踪技术,用来帮助实现增量备份。在许多文件系统上,CBT在两个变更集ID之间,可以识别修改了的磁盘扇区。在VMFS分区上,CBT还可以识别所有正在使用的磁盘扇区。当AnyBackup执行备份时,请求VMware仅传输自上次备份以来更改的数据块或正在使用的数据块(有效数据块),从而达到完全备份时只备份有效数据,增量备份时只备份变化的数据块。
除了VMware外,AnyBackup同样支持FusionSphere、H3C CAS以及Hyper-V等有效数据和增量数据的读取。其中,FusionSphere同样包含CBT技术,而H3C CAS和Hyper-V则采用备份精简虚拟磁盘文件来实现。
以H3C CAS为例,其平台上使用的虚拟磁盘文件为qcow2格式。qcow2格式的磁盘文件为精简格式,其文件大小略大于磁盘内有效数据的大小。qcow2具备指定后端文件(backing file)的特性,当disk1指定后端文件为disk0时,相当于disk1成为了disk0的子盘。在CAS中,其外部快照功能会针对当前虚拟机使用的磁盘生成子盘,备份时只需备份母盘即可。
重删技术让虚拟化数据存得少对于海量虚拟化数据来说,通过CBT技术获取有效数据或者变化数据块,其需要存储的备份数据量仍然庞大,尤其是完全备份时。这种情况下就需要进一步来删减数据量,从而降低对存储资源的占用。AnyBackup第三代重复数据删除技术就是一种源端去除重复数据的技术,旨在数据源头过滤冗余数据,筛选出新增数据进行备份,从而可以最大限度地降低备份数据对存储资源的压力。
当第三代重复数据删除技术搭配CBT技术结合使用时,能够进一步减少备份数据量。AnyBackup在备份虚拟化平台数据时,其累积重删率高达99%。第三代重复数据删除技术,能够大幅减少需要备份的数据量,因此,在减少了存储资源占用的同时,还极大地提高了海量虚拟化数据的备份效率。
SAN、LAN-Free技术让虚拟化数据备得快尽管上述方式能可以减少需要备份的数据量,但却不能真正的提高数据的备份速度,并彻底解决这种对带宽的影响。假设虚拟化平台有3PB的置备空间,其中有1PB的有效数据,按首次备份70%的重删率计算,仍然有307.2TB的数据需要备份。此时,如果备份走业务网,按200M/s的速度计算,需要19天左右才能完成一次完全备份。这种长时间的业务影响对企业来说是难以接受的,在海量数据面前,仍然需要更好的方式来解决带宽占用的问题。因此,AnyBackup 的SAN备份和LAN-Free技术通过改变备份数据流,从而能够有效解决这种问题。
VMware模块的SAN备份技术当用户的VMware平台使用的存储是SAN时,可以将AnyBackup接入SAN环境中,确保AnyBackup可直接访问SAN存储。备份前,根据VMware的配置要求,设置数据传输模式为SAN模式。备份时,AnyBackup调用VADP接口获取到目标虚拟机的详细信息,定位到目标虚拟机所在存储。之后,在AnyBackup 客户端与存储之间建立SAN数据通道。AnyBackup 客户端直接从该数据通道读取数据,并备份至介质服务器中。而此时读取的数据,仍然是通过CBT获取到的有效数据或增量数据。
CAS模块的LAN-Free技术VMware模块的SAN备份技术其本质上也是一种LAN-Free技术,但与AnyBackup的LAN-Free技术相比,其实现原理与应用场景并不一致。VMware SAN备份是由AnyBackup Client直接访问存储数据,而AnyBackup LAN-Free是在AnyBackup Client和AnyBackup Server之间建立一个光纤数据通道。AnyBackup LAN-Free更适用于Client与Server分离的场景。
CAS模块与HyperV等诸多虚拟化模块都符合该场景。以CAS模块为例,CVK作为服务器节点,为整个CAS平台提供计算资源。部署时,AnyBackup Client会部署到每个CVK节点上,同时需要确保CVK节点和AnyBackup备份服务器接入同一台光纤交换机。备份时,首先AnyBackup与CVK节点上的Client之间建立光纤通道。之后,Client读取虚拟的配置信息和磁盘数据,从该光纤通道传输给AnyBackup介质服务器。
实际环境下,备份任务的性能瓶颈常常出现在网络带宽上,AnyBackup的SAN备份和LAN-Free技术一方面避免了对网络带宽的影响,同时也解决了之前网络性能瓶颈的问题,可谓一举两得。
AnyBackup通过一系列技术,不仅删减了需要备份的数据量,减少了对存储资源的占用,还能降低备份任务对业务网络的影响,提高了数据的保护效率,帮助企业用户实现海量虚拟化数据的高效保护。