基于OMS高可用架构的切换方案

来源 :中国新通信 | 被引量 : 0次 | 上传用户:kilmic1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一、概述
  国内某银行的核心业务系统部署在2台IBM AS400服务器上,2007年上线,采用Vision OMS构建基于数据库日志复制技术的业务连续性方案。2011年启动灾备项目建设,把核心拓扑结构扩展为3个节点。在本地生产机房部署两个节点,在生产机发生异常的情况下切换到本地备机;在远程灾备机房部署灾备机,在生产机房发生停电、火灾等异常的情况下,外围服务器连接到灾备机房保持银行核心基本业务的顺畅、持续运行。
  本文以该银行的灾备项目为背景,对基于IBM AS400+ Vision OMS的业务连续性方案的设计、实施、验证等环节进行展开。
  二、基于OMS的核心业务拓扑结构
  该银行核心业务系统部署在3个节点上,生产机房2个节点,灾备机房1个节点。该方案的典型特征为:(1)生产机房部署所有需要的外围设备,承担所有银行业务;而灾备机房受到空间的限制通常仅部署最核心的外围支持系统,仅能承担少数核心银行业务。(2)生产机房和灾备机房之间通常使用150MB的带宽即可满足OMS复制的需要。
  三、OMS切换操作
  高可用方案设计的目的就是要通过switch-over或者fail-over来实现业务连续运行。根据切换场景的不,有两种可能出现的场景:(1)计划切换;(2)非计划切换。计划性切换,通常发生在以下场景中:(1)生产机硬件维护,例如更换RAID卡电池,更换已经损坏的冗余电源;(2)更换RAID5阵列发生损坏的硬盘等;(3)主机操作系统,或重要软件的升级;(4)安装PTF。
  计划性切换也需要安排业务中断,通常会安排在周末夜晚进行,以便最大限度的减小对生产的影响。
  非计划切换则往往发生在主机发生异常故障,已经无法负担生产任务的情况下,切换到备份机继续运行业务的场景。非计划切换发生的情况包括:(1)主机发生关键硬件故障;(2)生产机出现宕机等异常情况,业务性能降低严重影响业务;(3)出现系统或数据库异常,修复时间超过允许范围。
  切换是一个复杂的过程,除了完成数据库对象的反向复制以外,还需要考虑到业务连续性的要求,外围设备的连接等综合的要求。通常的业务切换需要考虑以下环节:(1)IP interface的切换;(2)Job Schedule Entry的设置;(3)User Profile的设置。
  正常情况下,业务在生产机运行,备份机和灾备机作为复制的目标节点。
  当切换到备份机以后,GRPA复制链路执行change role动作,翻转复制的方向;同时激活GRPC,实现从备份机到灾备机的数据复制;同时需要停止由生产到灾备的复制链路GRPB。
  当切换到灾备以后,GRPB复制链路反向,GRPC复制链路反向,停止GRPA复制链路。
  非计划切换:(1)进入OMS400主菜单,在连接前选2并执行切换,备份机状态将从Normal Target改为SOURCE REVERSE。根据生产机宕机时备份机上的状态,该过程可能会比正常的切换慢。(2)在备份机上输入:ADDLIBLE ODS400,回车。输入INZODS,回车。(3)在备份机上输入ODS400命令,进入ODS主菜单。(4)选择选项6(Change System Role),并输入回车。(5)在备份机上激活生产用IP地址。方法为:CFGTCP;选1 Work with TCP/IP interface,回车;找到相关IP地址,在其前面选9,回车,在按安F5刷新,直到该地址变成ACTIVE。(6)这时备份机已经接替生产机的工作,用户可以用原有的IP地址访问系统,作业实际发生在备份机上。(7)修复生产机。在确保其生产用网线仍未连接交换机的前提下开机。在生产机终端上用QSECOFR登录。(8)在生产机上,关闭生产用IP地址,方法是:CFGTCP;选1 Work with TCP/IP interface,回车;找到相关IP地址,在其前面选10 ( END ),回车,再按F5刷新,直到该地址变成INACTIVE。(9)在生产机上用QSECOFR登录。(10)在生产机上确认没有其他终端连接时,输入命令OMS400并回车执行,以进入OMS400的主菜单。可以看到连接PRDBCK。其状态是:SOURCE NORMAL。(11)在这个连接前选2并执行。生产机将进行切换,其状态变成TARGET REVERSE。(12)在生产机上,输入ODS400命令,进入ODS主菜单。(13)选择选项6(Change System Role),并输入回车。(14)在备份机上输入STROMS,并确认OMS在备份机上已经启动。(15)在生产机上输入STROMS,并确认OMS在生产机上已经启动。(16)在备份机上输入STRODS。(17)系统将用一段时间追同步。(18)重新连接生产机对外的网线。(19)激活生产机上的备份用IP地址。(20)这时两台机器的状态类似于计划切换后的状态。用户可以用生产用IP地址访问系统,但作业运行在备份机上,生产机在追同步后将继续备份原备份机上的数据。(21)等追同步后反向切换将两系统的角色重置。
  四、结束语
  银行投资搭建的基于OMS的高可用架构就是为了在生产机无法继续正常运行的情况下把生产切换到运行能力相当的备份机或灾备机,保证银行业务的连续运行。每年进行2到3次的计划切换,一方面验证切换流程的正确性,一方面也加强运维人员对切换流程的熟练程度。随着我国经济的高速发展,即使是核心业务也要经常发生变更,而这些变更是否会对切换造成影响,除了在理论上进行验证,也必须通过切换实战来进行验证。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
“夜静空斋茉莉香”,是我书房条幅的下联,语出清初著名诗人孙枝蔚,在其《溉堂前集》卷九《入空城过无言》中,见到“秋睛隔院葡萄熟,夜静空斋茉莉香”的佳句,认为不错,就让一位擅书法
【摘要】 SGSN是WCDMA分组数据网中核心网元之一,SGSN Pool技术在容灾、负荷分担、提高网络资源利用率等方面有着显著的优势,本文结合实际案例对SGSN Pool在容灾和提高资源利用率方面的优势进行了分析。  【关键词】 SGSN Pool 容灾 潮汐效应  一、概述  2013上半年,我国3G用户达到3.25亿户,渗透率接近30%,用户对移动互联网业务的需求日益增强,对业务感知要求也越
喜欢甜味又不想吃糖的人,肯定吃过三氯蔗糖。跟其他的甜味剂一样,它的发现是研究人员犯错的结果——科学研究中犯错可能产生致命的后果,也可能导致伟大的发现。三氯蔗糖的发现,就是源于一个很别致的错误。  1970年代,泰莱公司和英国伊丽莎白王后学院的一位学者合作,研究蔗糖经过分子修饰之后作为杀虫剂的使用。有一个实验品是用三个氯原子取代了蔗糖的三个氢氧基团。这位学者叫他的学生去测试一下这个样品。英文里的“测
移动互联网就是将移动通信和互联网二者结合起来,成为一体。移动通信和互联网成为当今世界发展最快、市场潜力最大、前景最诱人的两大业务,它们的增长速度都是任何预测家都未
“茅檐低小,溪上青青草。醉里吴音相媚好,白发谁家翁媪?……陶醉于辛弃疾的《清平乐·村居》的美好乡村生活里,更勾起厂我对屋檐的美好记忆。
本文重点阐述了铁路公安处现场勘查实时指挥调度系统的总体设计目标,具体设计思路、主要技术指标及技术特点,并详细分析了该系统实现的技术原理及应用效果。
我的母亲啊,在我们相伴的十六年的岁月里,你总是那么的辛劳。你饱经沧桑的脸上,镌刻着岁月无情的痕迹。时光的留白染花你的头发,我却无能为力。  犹记得那天,濛濛的细雨,熹微的晨光,在那样寒意料峭的清晨,你却早已起床收拾。  我忙跟着你,我要去体验你的工作。  母亲,我已记不清有多少个这样风雨无阻的日子,因为你的早出晚归,我们之间很少见面。  每一次,我都问你:“妈,你在忙什么?”可你给我的回答却是:“
电缆隧道中运行环境复杂,人工巡检不仅工作量大、工作效果不理想,容易造成人员伤亡事故。鉴于此,在电缆隧道巡检工作过程中开始使用机器人,工作人员借助于机器人开展巡检工作,有效
随着计算机网络的不断进步,通信工程从中获益良多。人们对于通信的需求正在迅猛发展,相关的设施建设也被提上了建设的日程。由于通信工程建设需要投入的资金量较多,而且建设过程