论文部分内容阅读
说起容灾,无论是IT管理员,还是行业专家,各有各的说法。纷繁复杂的技术和理念,争奇斗妍的方案和产品,让人犹如雾里看花般,难辨优劣。但是,需要容灾的用户,首先要搞清楚的,就是容灾到底是什么,容灾解决什么问题,具有什么价值,如何去选择解决方案。这些也是我们《谁说容灾难普及》系列文章的出发点,看清容灾,了解方案,透视成本和价值,让选择更加从容,方案更加专业。
亚里士多德有言:如果你想明白一件事情的话,就要观察它的开始和以及它的发展过程。古语亦云:欲用其妙,必先知其道。
所以,对于纠结于各种容灾定义的人来说,他首先需要做的应该是追本溯源地了解一下到底什么是容灾,它有怎样的一个发展过程,在这个发展过程中又有哪些经久不变的追求。下面就让我们一起来梳理一下容灾的前世今生。
再辨容灾
面对应接不暇的容灾介绍和定义,用户真正关心的其实只有两点:首先,容灾是否可以保证数据不丢失;其次,容灾是否可以保证应用不間断。在我们的IT应用中,也接触到一些可能是解决这些问题的应用,比如双机高可用方案就是解决应用不间断的问题。但真正意义上的容灾,必须同时具备保证数据不丢失和应用不间断的能力,这也是容灾的基本目标。
在这里很容易出现另一个困惑,一提到容灾,就会提到备份、快照、镜像、CDP和双机等等名词,它们跟容灾有怎样的关系呢?或者它们是不是就是容灾呢?
备份的主要实现方式是将数据从原位置移到目标端,形成可任意恢复的时间点。所以,备份仅仅是用来保证数据不丢失的一种技术手段,让用户在关键时刻能够拥有可以恢复的数据,并不是一种应用。另外,快照也是在原介质上根据某一时间创建一个照片,镜像则是建立实时的对等的版本,以保证意外情况下的数据可恢复性。对于应用来说,大家可能认为双机是可以保证应用不间断的,但是双机有一个非常明显的缺陷,就是不能保证数据不丢失,因此它仅仅是一个高可用的方案,并不能作为普及容灾的一种通用型方案。
所以,无论是备份、快照、CDP,还是双机,它们都是容灾的一部分,是实现容灾的技术手段,但它们只能解决一部分问题,真正能做到普及容灾的方案应该是一套完整的方案。
那么,到底什么是容灾呢?
容灾严格来说主要包含三个部分,分别为数据容灾、应用容灾和业务容灾。绝大多数用户,只需要关注两个部分,第一部分是数据容灾,第二部分是应用容灾,并且分别包括本地和异地的部署方式。其中数据容灾解决的是数据不丢失的问题,应用容灾解决的是数据不丢失以及应用不间断的问题。
半个世纪的容灾发展史
只要有计算机技术,只要有数据,只要考虑数据安全问题,容灾就是不可避免的话题。上世纪五六十年代出现的容灾,这几十年来,又是如何发展起来的呢?
纵观容灾的整个发展过程,就会发现,从它开始出现到上世纪90年代,当备份方案使用不起价格高昂的磁盘备份介质时,均是以磁带备份为主,那要做异地容灾该怎么办?惟有采取异地磁带托管的方式。这直接导致磁带托管业务出现繁荣。在中高端的存储磁盘阵列出来后,逐步出现了通过磁盘镜像技术实现实时复制效果的方案,但因为成本过高,应用范围非常有限。因而在上世纪90年代,备份技术基本不变,一直波澜不惊地以磁带备份为主。
到了21世纪前十年,备份还是以磁带为主,但在这时磁带在性能和管理方面的瓶颈越来越明显,因此磁带库技术应运而生,并且逐渐成为主流。但是因为磁带介质本身无法避免的一些硬伤,比如它在备份过程中管理的复杂性,而更主要的是磁带介质数据长期保存的可靠性不高。
备份须以恢复为目的,如果备份的数据无法恢复,那备份的意义就不复存在。基于磁带备份的缺陷,21世纪前十年,一种非常重要的技术 —— SATA磁盘技术产生了。SATA 磁盘技术的诞生不仅仅意味着备份性能的提高,更意味着容量的提高,意即单位GB的成本越来越低了。有了这样一种新的应用,就有人开始思考,如何用磁盘替代磁带,但是因为主流的备份软件都是以磁带为核心的,并不支持磁盘,所以这是一个各路英雄都感到棘手的问题。
乱世出英雄,IBM在2003年时基于这样的应用需求,研发了一种新的技术 —— VTL虚拟磁带库,旨在把磁盘当做磁带用的同时,还可充分利用用户环境现有的备份软件。VTL 的横空出世虽然没有对备份方案做出实质性的改变,但却做了一个非常好的铺垫,就是开始把磁盘应用于备份方案,这是容灾历史上非常重要的一个转折点。
磁盘一旦用于备份,即刻显著拉动磁盘的需求,磁盘成本逐渐下降,而随着其广泛的应用,磁盘技术也得到进一步优化。随着磁盘的异军突起,人们发现,磁盘介质有一个很重要的特性在虚拟带库里面是没有应用起来的 —— 磁盘的随机访问特性。因为磁带不是随机访问的,所以虚拟带库将磁盘虚拟成带库后,就牺牲了磁盘这个极重要的特性,所以,VTL的技术特性绝大部分仍然跟磁带一致,惟独改变的就是用了一个更可靠的介质。需求催生应用,这个时候,业界就开始思考如何更好地使用磁盘。
在应用磁盘备份的过程中,第一个阶段就有一个非常重大的技术突破出现,那就是CDP技术。前面提到,容灾率先要解决的问题是数据不丢失,而无论是磁带备份,还是虚拟磁带库,都有一个很大的硬伤,即数据丢失量大。因为它们不能实现随机写,所以它在做数据布局的时候,不能实时地写和更改,这也就意味着它一定存在一个备份窗口,也就是说数据不可能不丢失。所以当应用磁盘备份后,率先要解决的问题便是备份窗口带来的数据丢失,解决这个问题的技术就是CDP持续数据保护技术。然后又相应地出现了解决应用不间断的高可用技术。
但是,我们会发现,CDP和高可用技术是分开的,即备份是备份,双机是双机。因而,业界会普遍面临一个问题 —— 一套系统里,要么解决了数据不丢失的问题,要么解决了应用不间断的问题,没有合二为一的方案。但用户的需求实实在在地摆在那里,容灾一定要上,因为不只是数据不丢失的需求,还要保证应用不间断。
所以,到了现在,慢慢出现了一种新的主流技术 —— 一体化容灾,将CDP、Realtime、Deduplication等技术合在一起,如赛门铁克的NBU、EMC的BSR部门、爱数的爱数备份容灾家族产品系列,目的都是一个,就是突出一体化容灾,这也是目前以至未来容灾方案发展的趋势。
性能与管理是不变的追求
从上面的分析我们可以看出,容灾的整个发展过程,基本上是非常坚定地围绕两个目标在追求 —— 第一个就是更好的性能,第二个就是更好的管理。而且这两个目标也是用户在选择容灾的时候,需要考虑的两个指标。
在性能方面,从磁带到磁带库,到CDP,再到应用容灾,都是为了实现更小的RPO和RTO。
在管理方面,从上世纪80、90年代,用户只需针对单个系统做备份即可,所以备份软件的鼻祖都是从UNIX发家的。但随着服务器和应用的增多,就会逐渐变成以Master Server和Media Server为架构的备份系统,于是,大家需要通过购买服务器(Sever)、操作系统(OS)、备份软件(Backup Software),甚至加上存储硬件(Storage)来完成一套完整方案的部署,这也就是4S方案。一定要这样做吗?其实,现在已经有很多很好的技术可以突破这个传统的4S方案了。2008年,市场上以爱数为代表出现了新技术 —— 一体化备份系统。一体化备份即将传统4S方案的步骤一步到位,集成化地实现,将管理的复杂度降至更低。而现在,几乎所有的备份厂家都已经开始推一体化的备份系统,包括赛门铁克、EMC等。
前面提到,备份只是容灾的一部分,因为它只是一种技术实现手段,并不能覆盖所有的技术方案。但容灾要解决的是两个问题, 一个是数据不丢失,一个是应用不间断。一体化备份解决了数据不丢失的问题后,另一个问题的出路又在哪里?很明显,就是既能保证数据不丢失又能保证应用不间断的真正的容灾 —— 一体化容灾。
一体化容灾的出现就是极限吗?在管理上就解决了所有问题吗?
这里我们就会发现,它还有一个漏洞,一套容灾系统它只是解决容灾需要解决的性能问题,但并没有将容灾整体管理起来,这也就脱离了它真正的核心 —— 为了实现企业经营目标而容灾。所以,随着一体化容灾的出现,接下来会有一个更主流的容灾管理模型出来,那就是基于法规遵从的一体化容灾。它能够将企业管理的价值目标和容灾管理的技术目标有效结合起来,有效推动容灾更广泛的普及。
容灾,可望不可及?
万变不离其宗,通过以上的分析,容灾前世今生的脉络已经非常清晰。我们可以看到,容灾的发展由各种技术和需求驱动,最终,形成同时具有数据不丢失和应用不间断能力的一体化容灾。对于我们而言,容灾的需求清晰而明确,核心需求就是数据不丢失和应用不间断。但是,大量市场调查显示,用得起容灾的用户少,用得好容灾的用户少之更少,容灾在用户的印象中简直是可望而不可及,难以普及,它到底有哪些痛处,该如何对症下药,请继续关注《谁说容灾难普及系列之二:为什么容灾难普及》。
亚里士多德有言:如果你想明白一件事情的话,就要观察它的开始和以及它的发展过程。古语亦云:欲用其妙,必先知其道。
所以,对于纠结于各种容灾定义的人来说,他首先需要做的应该是追本溯源地了解一下到底什么是容灾,它有怎样的一个发展过程,在这个发展过程中又有哪些经久不变的追求。下面就让我们一起来梳理一下容灾的前世今生。
再辨容灾
面对应接不暇的容灾介绍和定义,用户真正关心的其实只有两点:首先,容灾是否可以保证数据不丢失;其次,容灾是否可以保证应用不間断。在我们的IT应用中,也接触到一些可能是解决这些问题的应用,比如双机高可用方案就是解决应用不间断的问题。但真正意义上的容灾,必须同时具备保证数据不丢失和应用不间断的能力,这也是容灾的基本目标。
在这里很容易出现另一个困惑,一提到容灾,就会提到备份、快照、镜像、CDP和双机等等名词,它们跟容灾有怎样的关系呢?或者它们是不是就是容灾呢?
备份的主要实现方式是将数据从原位置移到目标端,形成可任意恢复的时间点。所以,备份仅仅是用来保证数据不丢失的一种技术手段,让用户在关键时刻能够拥有可以恢复的数据,并不是一种应用。另外,快照也是在原介质上根据某一时间创建一个照片,镜像则是建立实时的对等的版本,以保证意外情况下的数据可恢复性。对于应用来说,大家可能认为双机是可以保证应用不间断的,但是双机有一个非常明显的缺陷,就是不能保证数据不丢失,因此它仅仅是一个高可用的方案,并不能作为普及容灾的一种通用型方案。
所以,无论是备份、快照、CDP,还是双机,它们都是容灾的一部分,是实现容灾的技术手段,但它们只能解决一部分问题,真正能做到普及容灾的方案应该是一套完整的方案。
那么,到底什么是容灾呢?
容灾严格来说主要包含三个部分,分别为数据容灾、应用容灾和业务容灾。绝大多数用户,只需要关注两个部分,第一部分是数据容灾,第二部分是应用容灾,并且分别包括本地和异地的部署方式。其中数据容灾解决的是数据不丢失的问题,应用容灾解决的是数据不丢失以及应用不间断的问题。
半个世纪的容灾发展史
只要有计算机技术,只要有数据,只要考虑数据安全问题,容灾就是不可避免的话题。上世纪五六十年代出现的容灾,这几十年来,又是如何发展起来的呢?
纵观容灾的整个发展过程,就会发现,从它开始出现到上世纪90年代,当备份方案使用不起价格高昂的磁盘备份介质时,均是以磁带备份为主,那要做异地容灾该怎么办?惟有采取异地磁带托管的方式。这直接导致磁带托管业务出现繁荣。在中高端的存储磁盘阵列出来后,逐步出现了通过磁盘镜像技术实现实时复制效果的方案,但因为成本过高,应用范围非常有限。因而在上世纪90年代,备份技术基本不变,一直波澜不惊地以磁带备份为主。
到了21世纪前十年,备份还是以磁带为主,但在这时磁带在性能和管理方面的瓶颈越来越明显,因此磁带库技术应运而生,并且逐渐成为主流。但是因为磁带介质本身无法避免的一些硬伤,比如它在备份过程中管理的复杂性,而更主要的是磁带介质数据长期保存的可靠性不高。
备份须以恢复为目的,如果备份的数据无法恢复,那备份的意义就不复存在。基于磁带备份的缺陷,21世纪前十年,一种非常重要的技术 —— SATA磁盘技术产生了。SATA 磁盘技术的诞生不仅仅意味着备份性能的提高,更意味着容量的提高,意即单位GB的成本越来越低了。有了这样一种新的应用,就有人开始思考,如何用磁盘替代磁带,但是因为主流的备份软件都是以磁带为核心的,并不支持磁盘,所以这是一个各路英雄都感到棘手的问题。
乱世出英雄,IBM在2003年时基于这样的应用需求,研发了一种新的技术 —— VTL虚拟磁带库,旨在把磁盘当做磁带用的同时,还可充分利用用户环境现有的备份软件。VTL 的横空出世虽然没有对备份方案做出实质性的改变,但却做了一个非常好的铺垫,就是开始把磁盘应用于备份方案,这是容灾历史上非常重要的一个转折点。
磁盘一旦用于备份,即刻显著拉动磁盘的需求,磁盘成本逐渐下降,而随着其广泛的应用,磁盘技术也得到进一步优化。随着磁盘的异军突起,人们发现,磁盘介质有一个很重要的特性在虚拟带库里面是没有应用起来的 —— 磁盘的随机访问特性。因为磁带不是随机访问的,所以虚拟带库将磁盘虚拟成带库后,就牺牲了磁盘这个极重要的特性,所以,VTL的技术特性绝大部分仍然跟磁带一致,惟独改变的就是用了一个更可靠的介质。需求催生应用,这个时候,业界就开始思考如何更好地使用磁盘。
在应用磁盘备份的过程中,第一个阶段就有一个非常重大的技术突破出现,那就是CDP技术。前面提到,容灾率先要解决的问题是数据不丢失,而无论是磁带备份,还是虚拟磁带库,都有一个很大的硬伤,即数据丢失量大。因为它们不能实现随机写,所以它在做数据布局的时候,不能实时地写和更改,这也就意味着它一定存在一个备份窗口,也就是说数据不可能不丢失。所以当应用磁盘备份后,率先要解决的问题便是备份窗口带来的数据丢失,解决这个问题的技术就是CDP持续数据保护技术。然后又相应地出现了解决应用不间断的高可用技术。
但是,我们会发现,CDP和高可用技术是分开的,即备份是备份,双机是双机。因而,业界会普遍面临一个问题 —— 一套系统里,要么解决了数据不丢失的问题,要么解决了应用不间断的问题,没有合二为一的方案。但用户的需求实实在在地摆在那里,容灾一定要上,因为不只是数据不丢失的需求,还要保证应用不间断。
所以,到了现在,慢慢出现了一种新的主流技术 —— 一体化容灾,将CDP、Realtime、Deduplication等技术合在一起,如赛门铁克的NBU、EMC的BSR部门、爱数的爱数备份容灾家族产品系列,目的都是一个,就是突出一体化容灾,这也是目前以至未来容灾方案发展的趋势。
性能与管理是不变的追求
从上面的分析我们可以看出,容灾的整个发展过程,基本上是非常坚定地围绕两个目标在追求 —— 第一个就是更好的性能,第二个就是更好的管理。而且这两个目标也是用户在选择容灾的时候,需要考虑的两个指标。
在性能方面,从磁带到磁带库,到CDP,再到应用容灾,都是为了实现更小的RPO和RTO。
在管理方面,从上世纪80、90年代,用户只需针对单个系统做备份即可,所以备份软件的鼻祖都是从UNIX发家的。但随着服务器和应用的增多,就会逐渐变成以Master Server和Media Server为架构的备份系统,于是,大家需要通过购买服务器(Sever)、操作系统(OS)、备份软件(Backup Software),甚至加上存储硬件(Storage)来完成一套完整方案的部署,这也就是4S方案。一定要这样做吗?其实,现在已经有很多很好的技术可以突破这个传统的4S方案了。2008年,市场上以爱数为代表出现了新技术 —— 一体化备份系统。一体化备份即将传统4S方案的步骤一步到位,集成化地实现,将管理的复杂度降至更低。而现在,几乎所有的备份厂家都已经开始推一体化的备份系统,包括赛门铁克、EMC等。
前面提到,备份只是容灾的一部分,因为它只是一种技术实现手段,并不能覆盖所有的技术方案。但容灾要解决的是两个问题, 一个是数据不丢失,一个是应用不间断。一体化备份解决了数据不丢失的问题后,另一个问题的出路又在哪里?很明显,就是既能保证数据不丢失又能保证应用不间断的真正的容灾 —— 一体化容灾。
一体化容灾的出现就是极限吗?在管理上就解决了所有问题吗?
这里我们就会发现,它还有一个漏洞,一套容灾系统它只是解决容灾需要解决的性能问题,但并没有将容灾整体管理起来,这也就脱离了它真正的核心 —— 为了实现企业经营目标而容灾。所以,随着一体化容灾的出现,接下来会有一个更主流的容灾管理模型出来,那就是基于法规遵从的一体化容灾。它能够将企业管理的价值目标和容灾管理的技术目标有效结合起来,有效推动容灾更广泛的普及。
容灾,可望不可及?
万变不离其宗,通过以上的分析,容灾前世今生的脉络已经非常清晰。我们可以看到,容灾的发展由各种技术和需求驱动,最终,形成同时具有数据不丢失和应用不间断能力的一体化容灾。对于我们而言,容灾的需求清晰而明确,核心需求就是数据不丢失和应用不间断。但是,大量市场调查显示,用得起容灾的用户少,用得好容灾的用户少之更少,容灾在用户的印象中简直是可望而不可及,难以普及,它到底有哪些痛处,该如何对症下药,请继续关注《谁说容灾难普及系列之二:为什么容灾难普及》。