基于异步复制的容灾系统研究

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:ixunsoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]介绍了数据备份策略与容灾技术,阐述容灾系统的指标以及容灾等级。并通过基于异步复制机制实施了本地信息化系统的远程容灾中心,实现了信息系统的高可用性。测试结果验证该方案具有可靠地的备份性能和数据有效性。
  [关键词]备份;异地备份;容灾能力
  中图分类号:G307 文献标识码:A 文章编号:1009-914X(2014)36-0014-02
  引言
  随着运营商企业信息化进程的不断深化,管理信息系统已经成为支撑企业业务运行的重要平台,同时业务的发展也对管理信息系统的业务支撑能力和可靠运行的要求越来越高。陕西移动基础设施的集中建设在实现业务快速响应和控制运营成本的同时,也带来故障点集中的风险问题,如自然灾害、电网停电等不可控风险。因此,适时、合理的规划和开展异地容灾建设,成为确保信息化系统高可用的重要手段。
  1.备份及容灾
  1.1 备份
  常用的备份策略有3种:全量备份、增量备份和差量备份[1]。差分备份在备份的代价和效率对于前两种备份策略进行折衷,在上一次全量备份的基础上,对所指定的数据集在上次全量备份后发生了改变的数据进行备份,备份的数据量通常大于增量备份量,但小于数据总量。
  1.2 容灾
  容灾主要是指在计算机系统因软件或硬件故障时,仍然能够保证系统工作的能力。容灾涉及到的内容比较广泛,对容灾的分类也可从不同层面上进行。通常情况下,可从容灾抵御灾难的程度和容灾功能的有效范围两个角度对容灾进行分类[2]。容灾系统根据具体的抵御灾难的能力,可分为数据容灾和应用容灾两类。
  第一、数据容灾。它主要侧重于对数据的保护,通常需要在异地建立数据系统实现,该系统一般是本地生产系统关键数据的实时复制,即指将本地系统的关键数据进行备份保存,不涉及具体应用业务。
  第二、应用服务容灾。它是更高级别的容灾,建立能够完全实现本地应用功能的远程应用系统。灾难发生前,该远程系统与本地进行数据同步,一旦发生灾难,远程系统会接管本地系统业务,继续提供服务,保证业务的连续性。
  从本质上来讲,二者是密不可分的。数据容灾是应用容灾的基础,没有数据的一致性,就不可能有应用的连续性。应用容灾又是数据容灾的延伸,不但保证灾难发生时数据不丢失,还保证了业务的连续性。
  2.容灾能力指标
  2.1 RPO与RTO
  容灾系统优劣的判断通常用灾难后的数据丢失量和灾难后系统的恢复时间来衡量。公认的有两个技术指标:RPO和RTO[4]。
  RPO是指当灾难发生的时刻到本地业务系统与容灾备份中心最近一次同步数据时刻的时间间隔,是以时间为单位以数据为出发点,说明了容灾系统所能容忍的数据丢失量。RTO是指灾难发生时刻与业务或容灾系统彻底恢复业务正常运行的时刻之间的时间间隔,用来衡量業务服务的影响程度。
  RPO针对的是数据丢失,RTO针对的是服务丢失,RPO与RTO越小,系统的可用性就越高, 但二者没有必然的关联。RPO和RTO的合理制定,需要以风险分析和业务影响分析为前提,同时结合实际业务需求来完成。
  2.2 容灾能力级别
  根据数据中心对灾难恢复RPO与RTO要求的不同,按照国际标准, 数据中心的灾难恢复水平可以划分为如下所示的七个等级[5](表1)。
  显然, 各等级标准在技术方案、灾备响应时间、投资管理的复杂性等方面有较大差别。在实际工程中需要根据备份恢复数据量、生产和灾备中心的距离、灾难时的恢复时效等进行方案规划。
  3.同城与异地灾备
  3.1 同城与异地灾备方式
  从容灾功能的有效范围来分可以分为同城灾备和异地灾备。同城灾备方案是在同城或相近区域内建立两个数据中心,一个为生产中心,负责日常生产运行; 另一个为灾难备份中心,负责在灾难发生后的计算机系统运行。该方案生产与灾备中心的距离较近,容易实现数据的同步镜像,保证高效的数据完整性。同城灾难备份方案一般用于供电故障、计算机系统以及人为操作等引起的灾难。
  异地灾备一般是在两个较远的(100公里以上)的城市分别建立生产中心和灾备中心,实现远距离的灾难备份。异地灾备能够防范地震、水灾等不可抗风险。
  同城灾备和异地灾备各有所长。为达到最理想的防灾效果,在保证计算机系统性能的前提下,可考虑采用同城和异地各建立一个灾备中心的解决方案。
  3.2 数据复制技术
  在灾难备份系统的建立中,数据复制是其技术的核心。数据复制技术主要是将生产中心的生产数据复制成灾难备份数据,灾难备份数据与生产数据应保持一致。目前,数据复制的主要方式有同步数据复制和异步数据复制两种[3][6]:
  3.2.1 同步数据复制
  同步数据复制方式是在主机向本地磁盘写数据的同时,将数据传到备份中心的磁盘,在确认远程备份系统的数据同步更新后,完成写数据的操作。同步数据方式的数据实时性强,灾难发生时备份数据能够与生产数据保持一致,几乎没有数据丢失。其缺点是由于数据更新操作时间长,影响应用的性能[7]。同时,由于数据在两个站点之间传输,使得I/O时间受到两个站点之间距离的影响,距离很难突破60公里。由于传输技术的限制,该方式对生产中心和备份中心之间的距离和通信质量有严格要求,一般适用于近距离的同城备份。
  3.2.2 异步数据复制
  异步数据复制方式的主要原理是在主机系统向本地写磁盘数据后,将本地生产数据以后台的方式复制到异地。异步数据方式对数据的更新操作不必等本地卷和备份卷的数据都更新完毕后才算是更新完成,因此减少了更新操作的时间,同时对主机性能的影响较小。但是,由于不同步,会出现数据的丢失。企业选择复制模式应该结合自身的容灾目标和实际情况来考虑。   4.异地容灾系统方案实现
  4.1 方案概述
  为了保证数据复制架构的通用性和标准化,在综合兼顾成本和效率的基础上,陕西移动管理信息系统实施建立了异地灾备中心,规划并建成了陕西公司与集团公司统一的数据复制平台,同时进行了灾备系统卷管理的标准化工作。
  4.2 逻辑卷改造
  灾备中心项目的建设采用了基于主机卷复制的解决方案。VxVM首先对AIX操作系统进行改造,在物理磁盘的基础上产生一个由可变块大小组成的条带化的抽象层VM,把多个物理磁盘组成一个卷组(DG),再从DG中划分逻辑卷。逻辑卷提供与传统物理磁盘提供的类似功能,在卷之上创建文件系统,改造后的结构图如图1所示。由于VxVM是通过底层卷组操作,具有比操作系统以及文件系统层面更高的读写性能,同时由于逻辑卷可以在不停机的情况下进行动态调整,提高系统的可用性。
  4.3 基于异步复制的容灾实现
  容災备份的机制是同时打开省公司的生产卷和灾备中心对应的备份卷,当陕西本地应用系统有I/O操作或是数据块变化时,将此I/O或数据块的变化以实时异步的方式在灾备中心对应的备份卷上发起请求,从而实现在不影响本地系统性能的基础上两边数据的异步复制。
  在灾难恢复方面,接管平台实现广域网的集群管理,实现控制台管理集群系统,并实时监测每个网元的运行状况。当本地发生无法恢复的严重故障或灾难而导致的业务中断,接管平台监测到本地应用退服,可根据策略自动或手工快速地从远端接管平台进行业务的接管,恢复正常应用。异地容灾结构图如图2所示。
  4.2 应用效果
  根据管理信息系统核心应用OA以及ERP的数据级容灾备份以及应用系统接管的要求,对高可用性指标进行持续的监控与运维,改进包括规划执行等环节的管理体系。从建成后的应用验证结果,灾备系统实现了管理信息系统四到五级的系统容灾能力,提高管理信息系统整体安全性,满足内控和外部监管的需要,保证业务的连续运行能力。
  5.结束语
  随着业务的发展和技术的变革,信息系统的逻辑架构和功能、数据和配置信息处于不断地变化中,必须建立持续的监控、改进流程和规范的管理方法,才能保持并持续改进系统的高可用水平。
  信息系统的容灾系统建设是一个长期、全面、持续完善的工作,企业应结合组织的整体规划目标,依靠可靠的技术手段和完善的管理体系。通过制定、实施和不断改进信息系统高可用性建设计划,提升信息系统服务质量,确保业务的持续运行。
其他文献
[摘 要]经济社会发展对油气资源的需求不断增加使得油气田勘探开发的规模逐渐扩大,在这样的形势下,油气田建设也成为油气田发展中的重要内容,油气田地面建设对油气田的产能有着巨大的影响。油气田地面建设工程浩大,所以其工程造价管理与控制也成为建设中的重点内容,笔者在本文中简单介绍分析了工程造价的控制模式,旨在对今后油气田地面建设提供科学的理论参考。  [关键词]油气田地面建设 工程造价管理 技术经济  中
期刊
[摘 要]近两年来,受台风影响,盖州市发生多次泥石流地质灾害,对当地居民的生命、财产安全造成了重大损失。本文对盖州市小石棚乡某泥石流沟的发育特征及成因进行了分析,并提出了防治对策建议。  [关键词]泥石流 成因 防治对策  中图分类号:S471 文献标识码:A 文章编号:1009-914X(2014)36-0022-02  1.项目概况  2011年受第9号台风“梅花”影响,盖州市普降暴雨,8月9
期刊
[摘 要]本文着重对齿轮热处理的生产过程进行系统分析和探讨,找到了减小齿轮热处理变形的措施,结果显示在生产中取得了良好的效果。  [关键词]齿轮加工;热处理;变形;控制  中图分类号:TG61 文献标识码:A 文章编号:1009-914X(2014)36-0036-01  1.原材料对变形的影响和控制  1.1 化学成分  齿轮用钢中的含碳量及合金元素的化学成分应符合国家对齿轮用钢的规定。钢材的含
期刊
[摘 要]随着科学技术的不断发展,自动化技术在各种应用中不断地渗透。电厂热工自动化的应用促进了我国电厂的发展。电厂热工自动化在电厂中的应用减少了劳动力同时提高了生产的效率,在一定的程度上减少了电厂投入的成本。虽然,电厂热工的自动化为我国的电力事业做出了巨大的贡献,但是仍然存在一定的弊端需要改进。  [关键词]电厂热工自动化;发展现状;趋势  中图分类号:TM62 文献标识码:A 文章编号:1009
期刊
[摘 要]随着城轨交通建设步伐的加快,为了确保地铁线路及站点治安稳定和反恐工作的落实,安检系统逐渐出现在地铁车站中。本文首先就安检对象和内容、安检工作流程以及安检系统的构成三部分简单介绍了目前应用于城轨交通的安检系统的工作形式。再从地铁自身环境特点、近年来地铁恐怖袭击案件分析和国内地铁常态化安检取得的成效三部分分析了地铁设置安检系统的必要性。接着,重点就广州地铁实行常态化安检的可行性进行分析,逐条
期刊
[摘 要]液压传动系统是保证设备高效运转的前提和基础,然而机器设备在运行中受负载、作业环境等多方面因素的影响,液压传动系统常常出现不同原因导致的故障,此时如果不能准确的对故障进行判断和维修,必将影响机器设备的工作效率。本文从液压传动系统的常见故障入手,并结合故障实例对液压传动系统的故障排除进行较为详细的分析。  [关键词]液压传动系统;系统故障;排除及诊断  中图分类号:U66414 文献标识码:
期刊
[摘 要]最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科,解决最优控制问题的主要方法有古典变分法、极小值原理和动态规划。最优控制理论已被应用于综合和设计最速控制系统、最省燃料控制系统、最小能耗控制系统、线性调节器等。同时,这篇综述也阐释了几种常见方法之间的关系。  中图分类号:C935 文献标识码:A 文章编号:1009-914X(2014)36-0043-01  1、最优控制
期刊
[摘 要]本文以工程实例并结合自身多年的工作经验,阐述了火电机组保温项目的施工技术及工艺,由于其保温施工质量的好坏直接关系到电厂的节能降耗及运行的经济效益,工艺的美观影响着电厂的文明运行环境,因此,对火电机组的保温项目施工现在是越来越重视,通过对保温施工技术工艺的分析,在施工中从根本上做到符合设计的质量要求和满足系统的安全运行需要。  [关键词]火电机组;保温项目;施工技术;施工工艺  中图分类号
期刊
[摘 要]近年来,以知识工程为核心的计算机辅助工程越来越流行,自然地钣金工件折弯加工辅助工艺设计也得到了发展。但是折弯工序作为钣金加工的一个重要的工艺之一却存在着一些技术上的问题。因此,本文主要针对钣金特征识别与折弯工序优化的问题进行研究和分析。  [关键词]钣金 特征识别 折弯工序 优化  中图分类号:N945.15 文献标识码:A 文章编号:1009-914X(2014)36-0008-02 
期刊
[摘 要]建筑电气安装工程施工是建筑工程中非常重要的部分,其安装质量的好坏对建筑工程的质量有着决定性的影响。首先简单介绍了建筑电气工程施工的质量控制要点,随后结合自身工作实践对建筑电气安装工程施工中常见的质量问题及防治措施做了粗浅的探讨。  [关键词]建筑电气、施工技术、常见问题、防治措施  中图分类号:TU74 文献标识码:A 文章编号:1009-914X(2014)36-0046-01  1、
期刊