论文部分内容阅读
下一代网络是业务驱动的网络,Parlay应用服务器作为下一代网络业务层的核心设备,需要为种类繁多的个性化、智能化业务逻辑提供了稳定高效的运行环境,同时也需具备电信级的可靠性。本文的目的即是为了提高Parlay应用服务器的可靠性和可用性,为其设计和实现了一套容错解决方案。本文首先从Parlay应用服务器分布式的体系架构及其功能结构入手,分析了现有系统对容错的实时性需求,结合国内外在软件容错方面的研究成果,总结了使现有系统达到不间断服务目标的技术可行性。接着,作者在假设系统中的故障均是单点柔性故障的前提下,对节点故障,关键进程故障设计了详细的解决方法和处理流程,并达到了业务逻辑的容错部署目标,即系统中的任一单点故障,均不影响系统中业务逻辑的正常运行,系统依然可以正常地接收和处理网络层上报的触发消息。另外,作者还针对呼叫实例的状态恢复,线程级容错处理等问题提出了简要的解决思路。在论文的后半部分,详细描述了容错子系统总体结构设计及其各主要子模块的具体实现,结合各子模块的特点,在对各功能模块的恢复方式及策略做了细致地分析后,描述了对原有系统持久化层及部分逻辑处理层的改造。最后,作者简要阐述了对已设计实现的容错子系统的测试工作。测试主要分为功能测试和性能测试,功能测试的用例及其结果初步验证了该容错子系统在功能上基本达到了既定的设计目标,即在对原有系统改动不大的情况下满足了系统的容错需求;性能测试的用例及其结果表明,在引入容错子系统后,应用服务器的呼叫处理能力在性能上受到的影响是可以接受的。