论文部分内容阅读
随着经济的全球化发展,特别是电子商务的出现,工业经济不断向知识经济转变,企业对信息具有重大的依赖性。目前的服务器系统在可靠性方面不能完全满足这种需求,研制具有强容错能力的服务器系统具有重要的意义。该课题将容错技术、分布式技术、并行处理技术、网络技术等相互融合,提出了分布式并行服务器系统的体系结构,并基于该体系结构研究多模型预测复本控制机制和基于寄生式故障检测的容错机制,能实现服务器系统的“永不停顿”。 文章在研究集群Web服务器系统和分布式并行数据库系统基础上,结合分布式系统、并行处理系统等相关概念,给出了分布式并行服务器系统的定义,并根据容错处理的需要研究了系统结构及相关模块。分布式并行服务器系统由四个部分组成:接口系统、执行系统、通信系统和管理系统。接口系统负责服务器系统与客户端的交互,执行系统负责完成用户的任务请求,通信系统负责节点间的信息交换,而管理系统负责整个系统的管理和维护。 在分布式并行服务器系统中,复本控制机制在保证用户数据可用性的前提下尽可能提高系统的资源利用率。在研究前人成果基础上,文章提出了预测复本控制算法。该算法通过选择合适的数学模型来预测各个节点未来可能达到的任务量,以此作为依据并在保证可用性的前提下,采用多目标优化策略确定数据的冗余度和驻留节点。该算法比纯基于过去或现在任务情况部署复本的一些复本控制算法,具有较高的准确性,并对系统资源利用率有较大的提高。 为了实现分布式并行服务器系统的容错,文章在研究现行故障检测技术基础上,提出了寄生式故障检测算法。该算法通过监测系统内节点间的信息交换,并以动态的时间阈值确定故障节点,与其它检测算法相比能明显地减少系统的通信开销。在节点出现故障时,通过动态重构任务执行过程中的主代理或辅代理等,系统保证当前正在执行的任务不会被终止,以提高系统的可靠性及可用性,实现故障透明。同时,系统通过数据动态重构和系统动态重构将故障节点隔离,使整个系统运行在正常状态。系统利用该机制可实现服务器节点的动态在线加入和退出,从而实现在线维护,使系统具有“永不停顿”的能力。 最后,文章对分布式并行服务器系统的可靠性及可用性、平均响应时间进