论文部分内容阅读
当今IT系统已成为大多数业务流程的重要组成部分和关键环节,IT系统的可用性和灾难恢复能力直接影响到业务流程的连续性。为保障组织的业务连续运作和灾难生存能力,企业或政府必需建立具有高可用性和灾难恢复能力的IT系统。同样,电信网一些核心设备承担了非常关键的服务,这些设备的业务连续运作和灾难生存能力直接影响到国计民生,用于集中提供增值业务的智能网IN(Intelligent Network)就是其中的关键设备之一,智能网的可靠性是运营商必须考虑的问题。智能网发展初期,容错计算机系统是智能网的首选平台。随着呼叫量的激增,容错计算机系统的处理能力已成为智能网系统能力的瓶颈。为此,具有较高处理能力的高可用HA(High Availability)计算机系统已逐渐成为智能网系统的首选平台。HA系统确保本地应用系统在多机环境下具有抗御任何单点故障的能力,一旦系统发生局部的意外(如掉电、网络故障等),HA系统可以迅速确保系统的应用继续运行。但是HA系统无法完全承担应用系统发生重大灾难时业务系统的安全运行,例如,当应用系统的一个完整环境因灾难性事件(如火灾、地震等)遭到破坏时,仍然需要提供系统的可用性,并要迅速恢复应用系统的数据、环境,立即恢复应用系统的运行,这需要容灾(Disaster Tolerance)系统提供远程的实时备份系统。本论文针对电信领域智能网系统的容灾方案展开研究工作,分析智能网及其增值业务的容灾需求,研究高可靠、高性能、低成本的大规模智能网系统的体系结构和具体实现方法,并对其可用性、系统性能、配置容量等进行数学建模和理论分析论证。论文中对研究过程中取得的主要成果进行了详细阐述,相关成果可归纳如下:1)智能网系统的风险分析模型和业务评估指标从智能网的功能、组网、运作模式入手,总结智能网自身特点,建立了智能网的风险分析模型,提出了分别从业务平面和物理平面两个层面进行智能网业务影响分析,并给出了业务重要性的评估指标和评估算法,总结出智能网多层次容灾设计指标以满足不同增值业务的容灾需求。2)业务中断损失与中断时长函数关系的建模针对智能网业务中断造成的损失进行分析,对智能网业务中断损失与中断时长的函数关系进行建模,在确定可容忍损失条件下可以计算出可以容灾的最大中断时长。3)具有二级安全防护体系的智能网容灾体系提出了智能网容灾的四层技术体系架构和通用的三层容灾系统结构,对多种智能网容灾系统的拓扑结构进行了对比分析;设计了实现数据容灾和应用容灾的具有二级安全防护体系的智能网容灾系统方案,提出了基于7号信令的、无结构瓶颈、无前端调度节点方式的广域负载均衡和切换机制;对所提出的智能网容灾方案进行可用性的数学建模和分析,理论上证明了该方案可以满足容灾需求。4)智能网容灾系统的性能分析和最小代价配置计算方法针对容灾系统结构,建立了多任务、FCFS的闭合排队网络模型,使用MVA算法对SCP容灾系统进行了性能分析,找出SCP系统的性能瓶颈。分别从应用层面、逻辑层面和物理层面的视角,提炼出智能网SCP系统的性能指标要求,提出了同时满足高可用性和多业务性能指标多个约束条件的最小代价配置计算方法。通过对比演算证明,该方法可以有效地计算出满足容灾需求的、成本代价最低的智能网SCP容灾系统的配置容量。