基于网格计算的容灾系统设计

来源 :科学时代·下半月 | 被引量 : 0次 | 上传用户:cliff800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】网格计算技术的出现,实现了对海量数据的高效率处理;基于网格计算技术的容灾系统成为信息安全领域倍受关注的研究方向,较之传统的容灾系统,它的应用使系统性能得到了跨越式的提升。本文介绍了容灾系统的概念和基于网格计算容灾系统的关键技术,并对其进行了总体的构架。
  【关键词】容灾系统;网格计算;备份;恢复
  1.引言
  当今社会已步入信息社会,数据在人类社会活动中扮演着重要的角色。然而,没有任何保护措施的数据易受到各种自然灾害或人为因素的破坏,后果不堪设想。保护数据,最重要的手段是备份。虽然传统的备份技术在一些情况下可以有效地保护数据,但在发生诸如地震、恐怖袭击等大规模灾难时,传统的备份往往无能为力,主要原因是受制备份系统对海量数据处理的底效率、备份数据不能快速实现异地存储,这样使得传统备份技术在今天已很难胜任。网格计算技术的发展,使我们获得了超级计算能力,能高效率处理海量数据。建立基于网格计算技术的容灾系统能很好解决传统备份技术的瓶颈问题,实现对数据最为科学、合理的备份。
  2.容灾系统的概述
  对于计算机系统来说,灾难是指一切引起系统非正常停机的事件。造成计算机系统灾难事故的原因有自然灾害、计算机系统故障和各种人为因素,等等。这些事故直接造成计算机系统数据丢失。
  容灾系统就是在计算机系统非正常停机时,对计算机系统数据进行有效备份,之后通过管理员及时恢复备份的数据并重新组织系统运行,使计算机系统使用者能够正常工作的系统。因此,容灾系统是由容灾备份和数据恢复两部分组成。
  容灾备份的主要目标是:保护系统和数据的完整性,使系统数据损失最少甚至无损失。数据恢复主要是使管理人员在最短时间内恢复备份的数据,使系统正常运行。
  2.1容灾备份的衡量指标
  衡量容灾备份的主要技术指标为恢复点目标RPO(Recovery Point Object)与恢复时间目标RTO(Revovery Time Object)。其中,RPO指灾难发生时与最近一次数据备份时的时间间隔,代表丢失的数据量;RTO指系统从灾难发生到重新启动的时间,表示系统恢复的能力。
  RPO主要针对的是数据丢失,代表容灾系统性能优越的指标。RTO针对的是服务丢失,是衡量应用容灾的指标,在数据容灾的基础上,在灾难备份中心建立一套完整的与生产系统匹配的备份应用系统。灾难发生时,灾难备份中心可以迅速接管业务,最大限度地降低丢失的数据量,并且能最大相对地减少系统恢复时间,保证系统不间断地运行。
  RPO与RTO之间没有关联性。RTO与RPO必须在进行风险分析和业务影响分析后根据不同的业务需求确定。
  2.2 灾难备份的级别
  根据数据中心对RPO与RTO要求的不同,按照国际标准,灾难恢复水平可以划分为下表所示的七个等级:
  表 1
  从上表中,我们能看出高性能的容灾系统都是基于网络实现的。
  2.3 数据复制技术与方式
  在建立容灾备份和恢复系统时会涉及多种技术,如数据复制、SAN/NAS、快照、集群,等。其中,数据复制技术是灾难备份系统的核心。数据复制技术主要是将生产中心的数据复制成容灾备份数据,容灾备份数据与生产数据应保持一致。目前,数据复制的主要方式分为:同步复制与异步复制。
  2.3.1 同步复制
  同步复制的主要原理是在主机向本地磁盘写数据的同时,将数据传到备份中心的系统,在确认远程备份系统的数据同步更新后,完成写数据的操作。
  同步复制的数据实时性强,灾难发生时备份能够与生产数据保持一致,几乎没有数据丢失。其缺点是由于数据更新操作时间长,影响应用性能。
  2.3.2 异步复制
  异步复制的原理是在主机系统向本地写磁盘数据后,将本地生产数据在后台复制到异地。
  异步复制对数据的更新不必等本地卷和备份卷的数据都更新完毕后才算是更新完成,因此减少了更新操作的时间,同时对主机性能的影响较小。但是,由于不同步,可能出现数据的丢失。
  选择复制模式应该结合自身的容灾目标和实际情况来考虑。如果优先考虑系统性能,同时能够接受备份中心数据更新的较小延迟,就应该采用异步复制方式。反之,就可以考虑采用同步复制方式。
  2.4 容灾系统的效率及风险防范
  容灾系统的建立必然会带来一些效率问题。例如,为达到数据的实时备份,将采用数据的同步备份方式,这样会对应用系统的效率带来一定影响。因此,在灾备系统的设计时既实现灾备的功能,又能保持系统运行的效率,是一个重要问题。
  容灾备份和恢复技术十分复杂,其中涉及业务风险分析、方案选择、实施等多方面内容。在灾难备份系统的实施中将涉及数据的完整性和安全性等问题,在灾难恢复计划中涉及业务风险,因此,如何采取安全、可靠的方式进行灾难备份,如何防范恢复过程中的风险,也是需要认真研究的问题。
  结合上叙介绍,我们能看出容灾系统对系统自身的效率、适时性、安全性要求极高,如何来优化容灾系统性能?将网格计算技术应用到容灾系统中:运用网格计算技术动态调度管理容灾系统内各种设备、提供对海量数据的实时存储、在设备和远程存储系统之间提供传输服务,这样便实现了对容灾系统性能的优化。
  3.基于网格计算容灾系统的设计
  今天,计算机硬件性能及网络性能不断提升,随着网格计算技术的成熟,为我们建立基于网格计算的容灾系统提供了有力支持。
  3.1 网格、网格计算的介绍
  网格(Grid),是一个集成的计算与资源环境。网格能够充分吸纳各种计算资源,并将它们转化成一种随处可靠、经济的超级计算能力。除了各种类型的计算机,这里的计算资源还包括网络通信能力、数据资料、仪器设备等相关资源。   网格计算(Grid Computing),是对基于网格问题的求解。
  网格中的网格资源主要是指分布的计算机资源,而网格计算就是指将分布的计算机组织起来协同解决复杂的计算问题。
  3.2 建立基于网格计算容灾系统的关键技术
  容灾系统作为一个整体,它通常由分布于异地的若干子模块组成。在网格出现之前,人们就构建了容灾系统,但系统性能取决于构建它的成本,并且系统性能并不稳定,随着网格技术的推广应用,系统构建成本得到降低的同时,也实现了容灾系统整体性能大幅度的提升。
  在容灾系统内,需要在第一时间内响应用户的请求,并且要确保数据的安全性。
  3.2.1 基于网络的海量存贮系统 HPSS
  由表1可看出,高级别的容灾系统都是基于网络实现的,因此需要使用基于网络的海量存贮系统,之所以如此,是因为系统运行时会产生大量的数据,而且这些数据都需要存贮、管理并支持来自异地的访问,所以使用海量存贮系统(HPSS)是很必然的选择。
  随着科技的进步,海量存贮系统的性能不断被刷新着:1994年数据存贮系统的容量达到10TB,吞吐量达到10MB/S;1997年,容量达到100TB,吞吐量达到100MB/S;2000年,容量达到100PB,吞吐量达到1GB/S。
  HPSS是一个层次化的存贮系统,主要为高性能计算产生的海量数据提供快速存贮服务,以弥补计算能力与I/O吞吐能力之间的差距。
  HPSS主要设计目标是让海量数据能够在网络化存贮、高性能计算机、集群计算机、海量数据库之间快速传递。它有如下特征:
  HPSS中的所有计算机和存贮结点都直接连接在网络上,数据在提供者与需求者之间直接传递,无需经过中间结点。
  HPSS把数据分散在多个节点上,这些节点并行传送数据,因而吞吐量接近这些节点吞吐量之和。
  HPSS支持事务的原子操作-----对于一次操作,要么彻底完成,要么回滚到操作开始之前的状态,从而保证了数据的完整性;
  HPSS是一些软件模块的集合,每个模块担负一个任务,模块之间通过API提供的调用接口,实现组合使用。
  HPSS不需要特定操作系统的支持,它用ANSIC书写,调用POSIX功能,因而可以运行在许多平台上。
  HPSS的性能可以动态扩展,允许随时将新的服务器、存贮设备等,加入到HPSS的网络存贮池中,从而满足系统不断增长的应用需求。
  对于容灾系统而言,HPSS的应用提供了高性能的数据缓冲和存贮服务,优化了系统恢复点目标(RPO)与恢复时间目标(RTO)的值,使系统能够在最短时间内完成数据的备份和恢复。
  3.2.2分布式监控
  在容灾系统中,网络存贮器、大型计算机等各种设备分散于各地,需要进行全局协调和管理,这些工作可以由分布于各地的代理程序来完成。除了完成特定的功能外,代理程序还必须支持全局性的监控。
  当系统出现故障时,就需要代理程序担负起分布式监控的任务,它们实时记录下每个有潜在意义的事件,为全局的实时监控提供支持。处于系统关键点的代理程序,还需要对某些关键性能参数作记录,支持对系统性能的分析和调整。
  3.2.3基于策略的访问控制
  容灾系统的安全管理非常复杂,基于高级别安性性的要求,不可能人工完成每一次授权,也不可能让用户只要有一个口令就通行无阻。
  解决这个问题最为有效的途径就是让所有设施的使用者拥有唯一标识自己身份的授权,系统资源访问控制部件负责收集所有这些授权,并在用户发起授权申请时,用一个策略控制引擎代替所有的授权人完成授权操作。这样,在及时完成授权的同时,不影响合法用户对资源的正常访问,从而从整体上提升了系统的性能。
  3.3 基于网格计算容灾系统的设计
  通过上述分析,我们可以知道:容灾系统最为关心的是数据备份和数据恢复的及时性、完整性、安全性,将网格计算技术融合到容灾系统中(如下图所示),可以很容易解决上述问题,而且能大幅提升容灾系统的性能:
  4.结束语
  信息化社会的到来,决定了人们对数据安全要求不断的提升,传统的数据备份系统已无法满足人们在这方面的需求。网络技术的发展,为人们构建高级别容灾系统提供有力的技术保障。
  [ 参考文献 ]
  [1] 都志辉,陈渝,刘鹏 . 网格计算 .北京:清华大学出版社,2002-11.
  [2] 罗作民,张景,李军怀,谢长生 . 网格计算及其关键技术综述 .北京:计算机工程与应用 , 2003-10.
  [3] 王德军,王丽娜 . 容灾系统研究 .上海:计算机工程,2005-3.
  作者简介:
  徐云喜,1981年12月生,男,汉族,湖北武汉人,工程师,从事网络管理工作。
其他文献
【摘 要】介绍了基于Google Earth、Sketch Up、ProE等软件的三维虚拟施工技术在输电线路工程建设中的应用实践。采用卫星地图虚拟现实和三维结构仿真等技术,在GPS定位仪、计算机等设备的支持下,对施工过程进行全面的仿真模拟,以发现施工中可能出现的问题,以便在实际投资、设计或施工活动之前就采取预控措施,从而实现项目的可控性,并降低成本、缩短工期、减少风险,增强施工过程中的决策、优化与
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
随着人文价值的逐步推广,人们对人文价值的理解不断深入,同时,维果茨基提出了关于人的心理发展的两个基本规律:1.人所特有被中介的心理机能只能产生于人们的协同活动和人际交往之中;2.人所特有的新的心理过程结构最初必须在人的外部活动中形成,随后才可能被转移至内部,成为人的内部心理过程的结构。这观点,深刻揭示了长期困扰教育界的理论知识与文化实践的关系问题,并在近二三十年中得到了西方心理学界和教育学界的认同
期刊
【摘 要】近些年来,随着水利工程量以及任务的不断加大,为了能够保证水利工程满足安全度汛的要求,很多水利工程必须在冬季进行施工。本文从水利工程混凝土冬季施工存在的问题入手,详细的介绍对应的施工技术和管理措施。  【关键词】水利工程;冬季施工;施工技术  引言  混凝土是当前水利工程使用非常普遍的建筑材料,其质量在很大程度上关乎着工程的整体安全性能。在冬季水利工程施工过程中,最不确定的因素是混凝土。温
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
班主任如何在素质教育的背景下,有效开展班级管理工作,成为现代中小学班主任老师亟待解决的问题。尤其是高中生正处在“人生观、价值观、世界观”正要形成但还没有形成的关键
本文通过对荣华二采区10
在新课程下的语文教学中,教师再也不能把课堂占为已有,全盘灌输,把课堂还给学生,放飞自己的智慧,去捕捉那些扣动学生心灵的信息,创造性的开发和利用教材,把学习语文和体验生
【摘 要】本文通过对换热站几种常见供暖方式的讨论与分析,探讨目前城市热网换热站的施工质量控制与供热效率的相关因素,分析换热站供热系统中质量问题与常发生的故障方面,以做到对最大程度地提高施工质量控制的探讨。  【关键词】换热站;施工质量;控制措施  每逢冬季,每当北方的用户抱怨暖气供热温度过低时,往往不一定是热网供水温度不够高,而是换热站换热工作中出了一些问题,不能将热能更好的输送给每个家户,要想解
学校文化是学校的灵魂,它凝聚了全校师生共同的价值观、共同的信念、共同的愿景、共同的努力方向。创建特色学校,是优化学校管理,丰富学校内涵,提升学校品位的重要举措。珠海市香洲区吉莲小学以“莲文化”为主线,致力于校园特色文化建设。  一、“莲文化”的形成背景  莲,“出淤泥而不染,濯清涟而不妖”,体现了它不随世俗、洁身自爱而天真自然、不显媚态的可贵精神;莲,“中通外直,不蔓不枝”,体现了它表里如一、不牵
期刊