数据备份应着眼于恢复

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:Iknowyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  美国慷孚系统公司
  
  数据备份设施之于IT系统,就相当于消防系统之于楼房,它是保护IT系统的最后一道防线。即使配备了数据备份设施,也不表明在IT系统遇到问题时一定能将丢失的数据成功恢复。
  在越来越多的用户开始重视数据保护的今天,许多人只考虑将数据进行备份,却多多少少忽略了数据备份的终极目标——数据恢复。
  对备份/恢复的一个误区是:只要定时做了备份,在需要的时候,自然而然地能将所需数据进行恢复,因为跑得了和尚跑不了庙,所需数据一定在备份磁带里,花点时间和精力找一找,总能找到并成功恢复。果真如此吗?日常生活中的一个例子也许能给我们一些启示。
  众所周知,建造大楼时一定会配备消防系统,但是,并非有了消防系统就能高枕无忧。人们经常获悉,有的楼房突遭火灾时,消防系统却无故瘫痪了,或者消防栓里没有水,或者消防通道被堵塞,以致火势蔓延,造成巨大的生命财产损失。因此,并非所有的消防系统在遭遇火灾时都能起作用。一样的道理,数据备份设施之于IT系统,就相当于消防系统之于楼房,它是保护IT系统的最后一道防线。即使配备了数据备份设施,也不表明在IT系统遇到问题时一定能将丢失的数据成功恢复。
  为了进一步阐明恢复的重要性,让我们再来对比一下备份和恢复操作的区别。
  
  备份与恢复区别
  
  一是备份是计划内的工作,而恢复则是计划外的工作。
  对于IT技术人员来说,备份是按照既定的备份策略,每隔一定时间,按部就班地操作即可。而恢复,则是只有当发生数据丢失时,或者要查找历史数据时才会进行的操作。通常情况下,实施恢复操作时,往往都是十万火急,越快越好,同时还希望恢复后的数据可用。
  由于备份对系统的影响比较大,所以备份的工作往往是在特定的时间内完成的,也即所谓的“备份窗口”,这时生产系统通常不工作。而恢复,因为是计划外的工作,对生产系统肯定会产生影响。下面以电子邮件数据的备份和恢复为例,来说明恢复对系统的影响。
  假定您对电子邮件系统的备份策略是每晚8点定时备份到磁带,备份完成后磁带里就会保存有昨天晚上八点之前收到的所有电子邮件。当然,收发电子邮件是一个连续的动作,晚上8点后,邮箱仍然在不停地收邮件。假设到了今天中午12点,您发现某一个重要的邮件不小心被删掉了,如果这个邮件是昨天晚上8点前收到的,那么您还是有可能从磁带里恢复该邮件。这时就要启动恢复操作了。
  如果备份软件能够实现邮件一级的恢复(恢复颗粒是单个邮件),您只要能找到那封丢失的邮件,直接将它恢复到邮箱就可以了,恢复的过程对整个邮件系统没有任何影响。但是,如果您的备份软件只能做到邮箱级的恢复(恢复颗粒是一个邮箱),那么如果您想恢复该邮件的话,就不得不把整个邮箱恢复到昨晚8时的状态,造成的后果就是昨天晚上8点到今天上午12点收进的邮件会全部被覆盖。可见,如果从备份的角度来说,两者没什么区别,但是从恢复的角度来讲,两者差别很大。
  二是备份是大批量的数据移动过程,往往需要将所有数据或所有增量数据全部拷贝到备份设备,而恢复往往是少量的数据移动过程,只需将需要恢复的数据从备份设备拷贝回主服务器。
  现在市场上流行的很多备份软件,基本上都是在上世纪80年代设计的,那时的数据量相对较小(几十兆到几百兆)。当进行备份操作的时候,备份软件会把所需要备份的数据文件打包成一个备份集(backup set),然后将它拷贝至备份设备中,并且针对该备份集形成相对应的索引,但一般不会对备份集里的内容建立详细的索引。那么当需要恢复该备份集中的某一个文件时,备份软件就必须从备份集中搜索到该文件,然后进行恢复。这在只有几百兆数据量的IT环境下完全可行。然而来到我们目前所处的海量数据的时代,由于数据量已经高达几十甚至几百TB,如果继续沿用这种方式,势必产生许多问题。当您想要从浩如烟海的备份数据里,找到并恢复您需要的数据,难度无异于大海捞针!例如,有的用户需要去电信公司要求查询自己的历史话单(如两年前的某一个月的通话记录),而在今天,很多电信公司无法满足用户的这一需求,因为很多情况下明知该历史话单一定存在于原先的备份介质中,但由于数据量实在太大,对指定数据进行读取几乎没有可操作性。这种情况下,备份虽然是成功的,但是恢复的成功率却很低。
  说了这么多,想必读者朋友已认同了数据恢复的重要性。所以,当考虑数据保护时,应着眼于“恢复”,需着重考虑以下几点。
  1. 确保数据能够恢复;
  2. 恢复速度要尽量快;
  3. 恢复操作对系统的影响要尽可能小;
  4. 能够恢复到用户指定的时间点;
  5. 恢复的数据是可以使用的。
  当然,恢复是在备份的基础上进行的,如果备份失败,恢复肯定不会成功。为了确保能达到恢复的目的,对备份操作有以下几点基本要求:
  对备份的新要求
  一是提高备份成功率。
  备份过程中,当备份介质、备份设备和网络出现问题时,备份作业就会中断,要提高备份的成功率,备份系统就应具有容错机制。如果是备份介质或备份设备出现问题,可以将备份自动切换到其他的备份介质、设备或路径上,并能确保从中断处继续备份操作。另外,备份的断点续传也很重要,当网络发生阻塞时,备份也会中断,一旦网络恢复正常,备份能从中断处自动重启并继续进行。
  二是精细的备份数据索引。
  当用户希望恢复数据时,绝大多数情况下并不需要恢复整个系统,而只要恢复部分数据,甚至只是一个文件或邮件。索引做得足够精细,有利于在恢复时能快速查找并定位所需要恢复的数据,实现小颗粒恢复,同时将对系统的影响降到最小,恢复速度大幅提高。
  三是能产生多个数据副本。
  为了防止备份数据意外损坏,产生多个备份副本是必要的,也很有效。产生数据副本的方法有两种:同步和异步。同步的方法是,在备份时,同时把备份数据写入到两个不同的介质中;异步的做法是,先把备份数据写入一个介质,然后再利用空闲时段,将备份数据复制到其他介质上。当然也可以通过网络将其复制到异地,达到数据容灾的目的。
  四是离场保护。
  本刊上一期曾刊载过《数据备份的离场保护》。如果数据备份是为了恢复而进行的,就应该考虑到万一数据中心遭遇灾难时,怎样进行恢复。这时离场保护中保存的数据副本就会起到很大的作用。
  五是操作界面应足够简单。
  用户界面应该面向恢复,而非面向备份。在面向数据恢复的用户界面,所有的备份数据是按照数据原先的结构来组织的,需要恢复哪个数据,很快就能找到,轻松点击一下就能恢复该数据了。
  综上所述,一个真正有效的数据备份系统应该是这样的:以恢复为目的来设计数据保护系统,管理简便,能快速便捷地实现恢复。除此以外,正如前文提到的消防系统的事例,为了确保消防系统在遭遇火灾时能够正常工作,应该定期进行防灾演习,数据备份系统也应该经常做些数据恢复演习,确保在真正需要时,能够实现对数据的有效恢复。
  META Group一份关于数据保护的调查
  
  ● 恢复作业的平均成功率只有70%左右;
  ● 主要的恢复需求是恢复单个文件或单个表空间,而不是整个卷;
  ● 而恢复单个文件至少要花1个小时, 有时甚至要接近1天。
其他文献
中兴C500    此套组合中的硬件是物流公司员工需要配备的CDMA GPSone手机,具体产品推荐是外观为直板设计的中兴C500手机。它拥有8MB内存,基于CDMA 1X 800MHz网络,其特色功能是能够实现UTK、BREW、WAP2.0、GPSone等数据业务。  另外,车载终端还可推荐AG-GC002车载定位台,它是工作于800MHZ/450MHz频段的无线接入系统,可以安装在出租车、公交
由共青团中央、国务院新闻办、教育部等国家14个部委支持举办的IEF2007国际数字娱乐嘉年华于3月27日在北京大学百周年纪念讲堂正式启动。  在启动仪式上记者得知,由IEF中方组委会和第五届软交会组委会联合主办的数字娱乐高峰论坛将于今年6月大连软交会期间隆重开幕。  其中包括产业论坛、技术论坛、青少年绿色网络教育论坛、学习专场和普及教育专场等,将邀请国内外官员、专家、学者及企业高管参会并发表演讲,
企业信息化项目一般包括相应的初始系统、二次开发、管理咨询、系统实施以及软件、硬件的系统集成、项目监理等工作。其中,一部分情况下,企业是将其中的某些系统完全交给某一个项目总承包商去负责。而根据项目需要,参考需求企业的建议,总承包商会考虑选择分承包商来参与项目实施。尤其是对于一些大型的企业信息化项目而言,由于项目系统的复杂性以及所涉及的多领域、多专业的特点,完全由一个承包商来承担全部的工作往往具有一定
校园网是一个承载各种网络应用的平台。随着数字校园、网络教学等应用的深入发展,以及基于网络视频等大流量网络应用的快速发展,一些服务器也已经开始广泛使用千兆网卡,这使得校园网骨干网升级为万兆成为一个迫切的需求。  下面我们按照结构、性能、接入、IP和应用五个方面来看如何部署万兆校园网络。    校园网结构分析    在核心层采用万兆交换机可以大大提高核心数据交换能力,而整个校园网络不仅需要保证各个接入
SK不认为自己是一个所谓的电信运营商,而是拥有技术的数字内容的传播者。  作为全球范围极成功的3G运营商,SK电讯在韩国本土、中国和全球的策略和布局已经成为一个样板。这对同处亚太圈的中国来说,亦或有着积极的参考意义。  在电信运营商领域,韩国的SK电讯身上有着世界电信巨头无法比拟的明星风采:它成功地开通了世界上第一个商用CDMA业务,成为全球极成功的3G运营商,并即将成为第四代和第五代移动通信服务
关于持临时工作签证的印度人抢走美国人饭碗的讨论,将印度外包巨头推向了风口浪尖。这对于急切借鉴印度经验的我国外包企业,可谓一个绝佳的学习海外斗争经验的机会。  当华盛顿的决策者讨论是否需要更严厉的H-1B签证制度时,受益于该政策的IT产业被美国国会划分为两个阵营,一边是微软、Oracle和Intel等巨头,另一边是软件外包巨头,如印度的Infosys信息技术公司和Wipro公司。  H-1B签证是一
根据技术路线图,AMD第一款4核处理器“巴塞罗那”的首发日期早已公布,而且据AMD公司全球高级副总裁兼首席技术官Phil Hester透露,其位于德国的处理器生产厂Fab36也已实现量产。这意味着由于时差的关系,9月10日AMD在中国先于其它地区举行的全球首发式并非预发布,各个企业基于该处理器的服务器同期面市,全球用户将即时获得以“巴塞罗那”为内核的服务器。尽管似乎都在意料之中,但在发布活动当天,
第一次听说以太网光纤通道(FCoE)标准是在笔者去美国参加春季存储网络世界(SNW)大会的前一天,当时的第一个反应是兴奋,因为又有一项新的存储技术标准即将诞生了。在SNW大会上,当笔者与几位存储厂商的专家谈起FCoE时,对方的回答几乎是一致的:FCoE标准的出台表明FC厂商承认未来是属于以太网的,FC厂商在做垂死挣扎……  2007年4月17日,由博科、思科、EMC、Emulex、IBM、Inte
商业软件的开源进展非常缓慢。与之相对应的是,Linux和它的跟随者,如Apache、MySQL、Firefox等,在过去10年中正逐步在软件领域建立它们的地盘。不得不指出的是,开源运动主要还浮于表面,说得多,做得少。在软件市场上,我们能找到的开源软件还不是很多。  最近的IDC报告显示,Linux在服务器市场的份额是12.7%,Windows的份额是38.8%,剩下的份额基本被Unix和IBM大型
关键字:微软/.NET    微软已经在金融、电信、石化等高端领域和IBM等厂商正面交火,而对于他们从桌面到服务器,从平台到应用的做法,IBM等厂商会有何种感受,抑或如何应对?  “微软的VSTS中文版去年3月份才发布,但VSTS今年的销售额跟已经有十多年历史的同类产品IBM的 Rational差不多。”说到微软的新版软件开发生命周期管理工具Visual Studio Team System(VS