山东移动:容灾中心也是生产中心

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:liuyc077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在很多CIO眼里,容灾中心的建设是一个吃力不讨好的系统工程,投入大,建设难。如果灾难不来,容灾中心似乎就一无是处。但在中国移动山东公司(以下简称山东移动)账务中心副主任崔可升眼里,容灾系统每天都在发挥作用。在这个系统中,既没有绝对的生产中心,也没有绝对的容灾中心,每个中心都兼具生产与容灾的功能。
  
  善用容灾中心 降低成本
  
  “山东移动每增加一个新用户,业务支撑系统就需要投资约11元。这一数据在其他省份一般是20~30元,比我们高出了两三倍。移动的客户量很大,这个数目是非常可观的。”崔可升给记者这样算了一笔账。
  目前,山东移动的用户数已经高达5500万,平均每天发送近亿条短信,有千万个用户通过手机看报和收发邮件,有20多万家企业应用山东移动提供的话音、数据业务、互联网接入等解决方案。
  山东移动BOSS(Business Operation Support System,业务运营支撑系统)作为一个综合业务运营和管理平台,包括了网络管理、系统管理、计费、营业、账务和客户服务等基本功能。承载如此巨大的业务量,山东移动BOSS系统的压力可想而知。
  2009年,山东移动BOSS同城三中心容灾信息系统建成。这是一个基于三个物理中心的容灾信息系统,可以把风险分解到三个中心。但是,这三个中心不是简单的备份关系。“在三个中心,生产和容灾的资源相互共享。”崔可升说,“从生产角度来看,这三个中心在资源的分配上基本上是1对2的关系,就是一个中心承担了山东全省1/2的业务量,另外两个中心各承担1/4的业务量。同时,三个中心还承担了互相备份的任务,三个中心中的任何一个出了问题,其他两个都能把业务接过来。这样就大大提升了整体服务质量以及客户的满意度。”
  让容灾中心与生产中心协同工作,在没有灾难发生的日子里也能发挥效用,是一个美好的愿景,但要实现它却不容易,这需要一系列复杂的规划和系统架构。山东移动采用了IBM高端Power595服务器和DS8300存储系统搭建的BOSS系统,并采用虚拟化技术。虚拟化技术将资源动态地分成几个小块,山东移动可以根据业务发展的情况进行动态调整,实现了企业级云计算,从而保证了企业的业务连续性,降低了风险,并实现了高投资回报。
  
  业务先行 安全随后
  
  也许很多人会问,山东移动为什么没有像很多企业那样规划两地三中心的异地容灾。对于这个问题,崔可升认为,异地中心要进行远程传输,耗时较长,不利于不同中心间的同步,建还是不建异地容灾中心,取决于企业对安全的重视程度以及投资回报之间的平衡,要具体情况具体分析。事实上,山东移动正在规划第四个容灾中心。这将是一个异地容灾中心,主要用于数据备份,以应对重大地质自然灾害,如地震等。
  “容灾规划主要考虑业务的发展——如果连业务发展需求都满足不了,这才是最大的安全问题。我觉得在资金充足的情况下,业务规划和安全规划要放在一起考虑,同步发展。但是如果资金紧张,就首先要考虑业务需求。随着业务对IT的要求变得越来越高,客户服务的期望值也变得越来越高,公司对安全重视程度也就越来越高。”崔可升这样总结了他的容灾策略。
  可见,山东移动的容灾策略从一开始就牢牢跟随着业务发展的需要。事实上,那种单纯地把容灾看作是应对自然灾害的需要,以为只要投一大笔钱建成一个系统就万事大吉的想法是一个误区。
  崔可升认为,在做容灾规划的时候,首先要对业务进行深入分析,清楚哪些业务是重要的,哪些业务是次重要的,哪些业务是不重要的。业务重要性不一样,基点不一样,投入也不一样。比如说,在计费业务中,如果用户打电话后计费晚几分钟,甚至晚半个小时,感受可能不是特别明显,但是如果用户交了费后不能及时通话,满意度就会大幅降低。
  目前同城三中心容灾信息系统的建成是山东移动容灾建设的第四个台阶。此前,山东移动在2004年建设了BOSS应急系统,在2005年建设了主备级容灾系统,在2007年建设了双中心容灾。崔可升指出,不同阶段的容灾策略满足不同阶段的业务需求,这样既考虑到了IT投入产出比,又能在发展中积累宝贵经验。
  
  善用经验 形成后发优势
  
  山東移动的容灾建设是一个循序渐进的过程,但在关键技术和流程得到验证之后,适当利用后发优势,适当超前。
  从2005年建设主备级容灾系统开始,山东移动就选择了IBM作为他们容灾建设的长期合作伙伴,接受了IBM为其提供的容灾系统建设咨询与规划等方面的支持。“IBM做过很多容灾项目,拥有很多客户的经验和教训。我们在进行容灾中心建设时,这些经验和教训的帮助非常大。”崔可升并不讳言IBM对他们的帮助。
  值得一提的是,有些经验并不一定要求有多先进的技术。很多时候,一个小小的改动就能产生很大的改进。
  山东移动与IBM合作,自然会使用IBM的高端服务器和存储产品。原来为了保证美观,山东移动的机房没有做固定的支架。结果机房来了什么设备,就要根据这个设备定做一个支架。这样每来一个设备定做一个支架,每一个支架的批次、标准都不一样,整个机房就变得很不平整。
  IBM在设计机房时,用的是一个动态的方式,把支架上支撑的东西做成动态的,设备来了再随时进行调整,并且在这个支架上固定。山东移动所要做的就是把所有的架构规划好,比如说这个机房要放几台设备。把机架全部布局好后,设备来了以后就可以直接放在机架上固定。
  与此同时,山东移动的容灾建设也给IBM积累了不少的经验。IBM信息技术架构首席顾问王纪奎告诉记者:“山东移动的成功经验,不仅移动行业可以分享,其他行业,也可以借鉴。山东移动用户规模达到了5000万人,打电话、发短信的频率都很高,而且其电话计费档次又特别多。整个美国的移动电话业务量都不一定赶上一个山东移动。现在有很多IBM资深的专家,都来山东移动参观。他们非常关心IBM的DS8300存储系统在这里用得好不好,会不会出现业务瓶颈。”
  
  关注细节 重视演练
  
  容灾系统建设是一个系统工程,不只是建一个机房,买一堆设备。很多单位在建设容灾系统时,只是重视硬件系统的投资,而轻视在容灾恢复计划(DRP)中的软件投入。这是一个非常严重的错误。
  崔可升给我们举了两个非常生动的例子来说明这一点。山东移动在刚开始建设容灾中心时,传输中心用的是双路由:一个主路由和一个备用路由——主路由坏了,可以切到备用路由上。有一次他们发现两个路由都用不了了,一查才发现这是因为工人施工时把整个光纤管道都挖断了。可见,虽然传输用的是双路由,但是物理路由只有一个,也就是说光纤管道只有一个,不管有多少光纤,一挖全都断了。那个事件发生以后,山东移动就明确规定哪个路由走哪条线路。还有一个例子是计算机系统非常好,结果电源却出了问题。这给山东移动的启示是,在建设容灾系统时不能不考虑电源是否符合要求。
  “要尽量避免设计上的缺陷。”崔可升明确指出,“在设计之初,就应该尽可能地考虑周到,尽可能采用冗余备份的方式,减少单点故障,以降低故障发生的概率。凡是可能出错的地方,准会出错!”
  但不论计划如何周详,灾难都可能比预计的更恶劣,而且持续的时间可能要比预计的更长。容灾系统建设不可能一劳永逸,需要不断完善,唯有演练才能把那些需要完善的地方找出来。
  “在演练时首先要保证流程畅通。这样,演练过程也就是发现风险的过程,既能降低风险,又能在演练中发现问题。我们每年都会做演练。”崔可升告诉记者。
其他文献
华硕近日推出的两款迷你姊妹机箱TM-B11、TM-B12,以268元的价位在全国各大卖场亮相。这两款产品的箱体尺寸只有(L)435mm×(W)180mm×(H)352mm,小巧的身材能够随意摆放在桌上或者桌下。    TM-B11、TM-B12的前置USB和音频接口采用了下翻式挡板设计,既不破坏机箱面板的整体统一性,又能够有效防止灰尘进入,并在USB接口之间保留了3cm间距,不会因为USB接口间隔
中国中东欧印度        印度最大业务流程外包公司简柏特(Genpact)首席执行官帕拉蒙·哈辛今年年初在接受《金融时报》采访时表示:“中国是印度IT外包业面临的唯一真正的威胁。”不过,对印度IT外包业发起挑战的除了中国企业外,还有一批位于中东欧的外包企业,它们早已跃跃欲试。    在知名IT系统项目论证与决策权威机构Gartner的一份名为《全球前30位离岸外包目的地》的研究报告中,捷克、匈
作为一位中国电子政务领域资深的技术专家,杨文胜带领团队勇于创新,把科技创新作为企业生存之本,不断取得新成就。  杨文胜毕业于南开大学计算机应用专业,现任北京信城通数码科技有限公司董事、总经理。他从事信息技术领域企业管理19年,带领北京信城通数码科技有限公司打造了国内第一家“电子政务公共服务平台”,成为中国电子政务发展的典范,并成功实施了出口电子监管项目、大通关项目、进口敏感货物电子监管项目、原产地
第二代模块化之间的区别    即使都是第二代模块化UPS,它们之间也有质量和功能的差别,用户切不可只从价格上看问题。    如今,不同模块化UPS厂商采用的电路相差甚微,采用的元器件也是市场上常見的几个厂商的产品,而且,同等元器件的体积和重量差别也不会很大,因此,UPS产品的单位体积重量也相差无几。所以,用户在选用模块化UPS时,如果产品的体积重量与常见产品相差甚远,就需要慎重考虑;如果价格相差甚
认为IT服务外包低端、没有太高价值、没有创新成分,这种观点失之偏颇。IT服务外包和自主创新并不矛盾。  长期以来,IT外包服务业存在着一种错误的观点。这种观点认为技术能力对于IT外包服务业并不重要,强调IT外包服务业的发展不利于中国自主创新的发展。这种观点将IT服务外包和自主创新对立起来,认为IT服务外包低端、没有太高价值、没有创新成分,这种观点失之偏颇。事实上,IT服务外包和自主创新并不矛盾。 
“团团(《我的团长我的团》的昵称)现在可火了!”优酷市场部洪露露兴奋地向记者表示。优酷首次押宝热门影视剧后的忐忑之心终于放下来了,因为它的宝押对了。  确实,自3月5日《我的团长我的团》在四个卫视频道播出之后,迅速掀起一股收视热潮。自开播以来,该剧一直保持着1.6%以上的收视率。  “正版剧集版权已经成为视频网站最大的最大成本。”一个视频网站内部人员告诉记者。这种逃避的心态可以理解——带宽成本、人
福建蔡先生网银中全部21万元存款不翼而飞,这是今年3.15晚会上最让人印象深刻的一幕,而“肉鸡”也成为3.15后最流行的词之一,地下木马产业正通过各种“肉鸡”控制工具,疯狂侵蚀着网民的个人财富和隐私。网络安全也因此成为越来越多的用户关注的重点。    赛门铁克最新的生活调查报告也显示,尽管99%的成年人都认为他们采取了安全的网络保护措施,但很多个人用户在网上谈恋爱、公开隐私和结交朋友时并未受到完全
年仅32岁的北京中煤软通总经理崔茂军,曾经是“农友”软件的创始人、四通集团的核心骨干、微软的高级数据库工程师,在IT领域实战了12年。他曾参与和领导建设了中石油19个大型信息系统,多次参加国家重点项目的设计和评审。如今,他正耕耘在煤炭信息化领域,领导着中煤软通——中国煤炭行业信息化建设的优秀解决方案厂商。  金融危机袭来时,煤炭行业也遭受了一定程度的影响。崔茂军却认为,这也同时意味着机遇的到来。当
2009年,国际金融危机还在蔓延,成都却逆市而上,成为服务外包的新高地。国内外知名企业纷纷加快步伐,积极抢滩成都高新区。    1月23日,位列亚洲十大网络游戏公司的完美时空网络技术公司与成都高新区签订了投资合作协议,在成都高新区设立网络游戏开发和运营中心,总投资5亿元;2月18日,埃森哲与成都高新区签署投资协议,计划在成都成立埃森哲成都全球交付中心;4月2日,DHL与成都高新区正式签订投资合作协
几年前,当步长集团投入几十万元的物料生产管理系统打了水漂后,集团上下对信息化的信心大大下降。虽然步长集团的企业文化是“鼓励创新,容忍失败”,但是信息化的首次尝试遭遇重创,无疑加重了信息化推进的难度。  集团信息中心经理的位置,成了一个烫手山芋。回想起当时的情景,步长集团信息中心经理励江说:“那个时候,没有人能坐得稳经理这个位子。走马灯似地接连换了几个人,始终没人能够从那次失败中寻找到信息化的长久之