论文部分内容阅读
Internet时代,随着信息成为生产力的核心,企业对信息的存储与管理需求正在飞速地增长,存储设备正在从服务器体系中独立出来,成为企业信息基础设施的中心。有调查表明,在未来的2~3年之间,75%的公司会重组以支持存储的这种改变。
现在,越来越多的企业发现,在数据的存储和管理方面面临着两大难题:一方面,随着数据的爆炸性增长,企业在存储设施方面的投资正在急剧膨胀。据IDC调查,到2003年,未来存储将占据企业75%的IT预算,而且客户的大容量存储的要求每年都会翻一番,存储市场正在成长为比服务器更大的市场。另一方面,数据每年成倍增加,管理费用也成倍增加,同样根据IDC的调查,用户每投1美元在存储上,就再得投入8美元用于管理。有一件事是肯定的,企业都有存储并保护数据的需求,IT部门被要求既要节省费用又要满足它的需求。而按照传统的存储管理方式需要投入大量的人力和时间并需要不断增加昂贵的物理存储容量。这就象是一个无底洞,更多的数据意味着用户需要购买更多的存储容量,而更多的存储容量又意味着更大的管理难度和成本。
因此,如何有效地利用现有的存储容量以削减物理硬件投资,简化管理以降低运营维护成本成为当务之急。虚拟存储技术的出现和应用将有助于企业实现这一目标,作为存储技术未来的发展趋势之一。业界分析人士认为,到2003年,90%的公司会将存储虚拟化。那么,什么是虚拟存储?它又能给用户带来什么好处?
虚拟存储技术的实质
简单地说,虚拟存储的实质和核心就是使用较少的真正存储硬件,但是表现为多个虚拟存储硬件。虚拟存储技术(StorageVirtualization)将物理上的存储设备和操作系统中的文件独立开来,在它们之间建立起一个虚拟层。虚拟层将文件系统映射到相应的存储设备上,并对存储设备进行管理。用户不再需要知道存储设备是如何配置的、它们在什么地方和容量有多大。
比如,用户看上去是一个能够存储数据的容量为太字节的磁盘接在他的计算机上。而实际上,磁盘可能在网络上的任何地方,也可能由多个分布式磁盘组成,或者甚至是一个复杂系统的一部分,此系统包括了缓存、磁盘、光盘和磁带。数据存储在哪里是无关紧要的。即使容量非常大,用户所看到的也只是一个简单的磁盘。
为什么需要虚拟存储
对于用户来说,随着要存储的数据量的急剧膨胀,问题也显著增多:数据存储设备总是不够;访问它会很复杂;要充分利用它几乎是不可能的;并且作备份会很棘手……这些只是与数据存储有关的问题的一部分。
利用基于网络的存储技术可以解决一部分的问题,因为它模糊了网络和本地资源之间的界限,配以合适的一层硬件和软件支持,就有可能使网络资源看上去是本地资源,因而散布在网络各处的存储设备就如同是常驻在本地计算机上那样,能够被访问。这就有可能更充分地利用分布在局域网和广域网上的数据存储设备。但这同时也带来了新的问题:虽然网络资源看上去像本地资源,但并不一定会使利用网络数据存储变得容易,访问不同的存储设备仍有不同的协议,保持对各处不固定的以兆字节计的数据进行跟踪,是有困难的。随着向存储虚拟化方向转移,这些问题可能会迎刃而解。这是因为虚拟存储技术具有如下两个主要优势:
1.更充分地发挥存储硬件的能力和提高存储效率,降低用户存储硬件开销
目前存储业界面临的最大问题之一就是物理存储的效率非常低。现在用户为了保护数据,经常需要不断地建许多镜像和进行大量的备份工作,这需要占用大量的物理存储空间,针对这一问题的传统技术解决方案是增加更多的磁盘。现在大多数客户的情况是,在他们的磁盘中,只有30%得到了真正有效的利用,其他的都浪费到镜像方面。
而虚拟存储技术允许客户以透明有效的方式在磁盘和磁带上存储数据,让用户对他们的存储空间进行更加有效的使用。可以说,虚拟化并不是一个新平台,而是一种新的方式,它为存储资源管理提供了更好的灵活性,可以将不同类型的存储设备集中管理使用,保障了用户以前购买存储设备的投资。
2.削减总体存储的管理和运行成本,包括硬件费用、维护费用以及操作人员费用等
虚拟存储提供了一个大容量存储系统的集中管理手段,由网络中的一个环节(如服务器)进行统一管理,避免了由于存储设备扩充所带来的管理方面的麻烦。例如,使用一般的存储系统,当增加新的存储设备时,整个系统(包括网络中的诸多用户设备)都需要重新进行繁琐的配置工作,才可以使这个“新成员”加入到存储系统之中。而使用虚拟存储技术,增加新的存储设备时,只需要网络管理员对存储系统进行较为简单的系统配置更改,客户端无需任何操作,感觉上只是存储系统的容量增大了。
此外,虚拟存储技术可以通过管理软件,为网络系统提供一些其他有用的功能,如无需服务器的远程数据镜像、数据快照(Snapshot)等。
虚拟存储的主要应用领域
虚拟磁盘和磁盘阵列
已经安装的一些虚拟存储系统是面向磁盘的,向用户提交一个像磁盘的接口,并可从多个网络磁盘中配置实际的存储。在讨论面向磁盘的系统中经常提到一个术语是存储池。
从用户的眼光看,存储池就是一个存储设备库,用户可以从中申请不超过限定最大值的任何容量的磁盘空间。介入软件和硬件层的目的是管理不连在一起的磁盘空间,使它看上去和工作起来像单一磁盘一样。
面向磁盘的范例除使用简单外还具有很多优势。当一系列异构网络磁盘的接口被统一时,系统管理员就有可能实施单一的政策,覆盖所有的数据存储。这也使实现单一的全面备份方案更加容易。这种虚拟接口有助于确保充分使用散布在网络各处的数据存储设备的全部容量。而且系统是可扩的:增加磁盘对用户来说是透明的。
比如象康柏公司用于WindowsNT和Windows2000的StorageWorksVirtualReplicator,它能让用户将物理存储阵列分成与真正的磁盘类似的逻辑虚拟存储池。这样,系统管理人员能根据用户和应用的需求分配磁盘空间,使公司能根据自己的实际需求扩缩存储空间。StorageWorks的另一主要特点是“瞬态”能力,即了解虚拟磁盘的瞬时状态。管理人员可以利用瞬态特性来进行存储器备份或恢复工作,不必费时去拷贝存储器或使之脱机。
另一个例子是美国存储(StorageTek)公司的VSA系列虚拟磁盘阵列,它的优势主要表现在两个方面:第一,用大量的硬盘组成单一连续存储空间的虚拟存储器,支持多个主机的并发访问;第二,把主机和物理存储器完全隔离,使主机看到的只是分配到的存储空间,并带有数据保护和数据镜像功能,而不必关心具体的存取操作。由于存储容量和主机的分配完全是在逻辑上进行的,这就带来了以下好处:
*存储区可由多个主机共享(可支持48个不同平台的主机并发共享);
*各主机所使用的存储容量可任意设置;
*可跨越多个磁盘甚至整个磁盘阵列进行奇偶校验计算,从而将奇偶校验计算开销降至3%;
*可根据需要随时增减物理磁盘;
*可在数据集(而不是磁盘)一级设置数据保护和镜像级别;
*可随时改变数据保护和镜像级别,不必进行任何硬件配置更改。
*虚拟磁带
面向磁带的虚拟存储方案主要是解决用户数据的备份问题。比如象IBM和StorageTek公司的虚拟磁带库系统。StorageTek公司大中国区市场总监老丞尉先生介绍说:“虚拟技术的引入为传统的备份工作带来了巨大的变革,它可以有效缩短备份时间,提高备份工作的效率,节省用户的投资,特别适合于象数据中心、金融、电信等业务种类繁多,需要频繁进行大批量备份作业的行业用户使用。”
StorageTek公司的张红艳先生进一步介绍说:对商业用户来说,数据备份不是目的,备份的目的是为了恢复——快速恢复。而要实现这一目标,备份时必须采取特殊的方式,即所谓精细备份。比如象银行这样的用户,有很多种业务,一个业务对应一些文件,可能有几千上万个文件。传统备份方式是一个磁盘或一个卷备份,这样即使只有一个文件损坏也要把整个磁盘或整个卷的数据都进行恢复,难以做到快速恢复。因此精细备份把备份作业分得很细,每个应用更改的是哪个文件,只备份这个文件,这样恢复时只需要恢复损坏的文件,大大提高了恢复的速度。但这同时也带来另外一些问题,由于每个备份作业的数据量可能不是很大,许多的磁带空间被浪费掉了,并且由于作业数量很多,大量备份作业需要逐个排队等待磁带机空闲下来,备份的时间托得很长,传统的解决方法是买更多的磁带机,这意味着一大笔投资,同时配套的机房空间、耗电量也随之加大。
采用虚拟磁带技术则可以有效解决这些问题。比如StorageTek公司的虚拟磁带库系统,它通过在主机和磁带库系统之间增加一组高速的磁盘缓存,并把他们仿真成多个虚拟磁带机驱动器。对主机来说,它看上去好像是把数据写到了物理磁带设备上,实际是中间的磁盘缓存,该缓存在数据写到备份的盒式磁带上之前处理数据,并最终把一个一个虚拟带迁移到物理的磁带上。
这样做的好处主要有三个:(1)通过利用虚拟磁盘技术,可以根据备份文件的大小灵活地分配虚拟磁带的存储空间,大大节省磁带用量;(2)由于虚拟磁带机不需要象真实磁带机那样找带、装带,大大缩短了备份时间;(3)一个虚拟磁带库系统可以虚拟多个(比如StorageTek公司的产品可以虚拟64或更多个)磁带机,而其费用却比购买同样数量的真实磁带机便宜得多,可大大降低用户的硬件投资。
*虚拟SAN
虚拟技术目前也广泛地应用于SAN当中,据VERITAS公司的技术人员介绍:随着SAN备受关注,如何管理这种新的SAN网络成为存储管理软件的一大热点。对SAN而言,虚拟存储技术能够使最终用户很方便地使用、改变存储而不必去了解存储的生产厂商、位置和型号等。特别是对于现在越来越复杂的存储环境,企业为了管理好SAN的网络环境,需要雇用了解各种存储设备特性的专业管理人士。而采用虚拟存储技术,可以使在主机端对物理资源的管理变得很简单。
由于当前用于配置和管理存储设备的费用比起购买存储设备的花费越来越昂贵,当一个公司采取高度集中的内部网结构,对存储容量和持续可用的需求越来越迫切。同时,由于每个管理员都需要了解许多产品的特性,有经验的管理员价格昂贵而且很少,导致公司管理SAN网络的成本上升。
在这个时候,SAN结构已经和服务器结合得特别紧密,虚拟存储技术可以用于减少管理存储的费用。虚拟存储技术实际上是一个可以用来建立存储服务的平台工具。随着越来越多的厂商都在发展各自的虚拟存储技术,虚拟存储技术已经融合到SAN结构中的各个环节:如在主机端、存储子系统,甚至融合到了Hostbusadapter或光纤设备,主要分为如下几种:
1.在主机端的虚拟存储
一般是通过逻辑卷管理(VolumeManager)来实现虚拟存储技术。逻辑卷管理为从物理存储映射到逻辑上的卷提供了一个虚拟层。主机只需要处理逻辑卷,而不用去管理存储设备的物理参数,VERITAS公司的卷管理工具更是提供了软件RAID和在线变更配置功能。这种技术的优点在于它是基于可靠的技术如广泛应用的卷管理工具;主机文件系统与数据库结合紧密,允许在线调整磁盘容量,而不需要将数据库关闭;虚拟存储技术可以通过共享磁盘等集群的技术扩展到多台服务器。
2.在存储子系统端的虚拟存储
在存储子系统端的虚拟存储设备主要通过大规模的RAID子系统通过多个I/O通道连接到主机,智能控制器提供LUN访问控制,缓存和其它如数据复制的管理功能。这种方式的优点在于存储设备管理员对设备有完全的控制权,而且通过与主机系统独立开来,可以将存储的管理与多种服务器操作系统隔离开来,并且可以很容易地调整硬件参数。
还有另外两种比较特殊的虚拟存储是“In-BandAppliance”和“Out-BandAppliance”也可以实现简化SAN的管理。
由于通过各种虚拟存储技术可以降低SAN管理的复杂性,提高易用性并能实现高可用性。因此,当前的虚拟存储技术正在成为SAN上的一种标准。
当前存在的主要问题
作为一种新兴的技术,虚拟存储技术也不是尽善尽美,还存在许多问题,主要的问题就是:存储虚拟化可以用不同的方案或标准实现。目前,市场上还没有一种广为接受的标准,这就意味着,设备中使用什么——即软件层中或者有可能在硬件中有什么,取决于您所选择的供应商。虽然有朝标准化前进的动力,但无章可循。迄今为止,很多供应商把精力都放在分散的问题上,按他们的想法设计和制造虚拟存储系统。多数供应商考虑的一个问题是在不牺牲性能的情况下,存储虚拟化的目标是提供最充分的存储资源的利用。供应商还关心的其他重要问题是易用性和维护性。
与SAN技术的情况极其相似,标准化的问题将直接影响虚拟存储技术的应用前景,希望业界各方加强合作尽快妥善解决这一问题,使这一能为广大用户带来极大利益的技术得到广泛应用。