论文部分内容阅读
云计算作为一种新型的计算服务模式,已成为信息基础设施的重要形态。依托于计算资源虚拟化的云数据中心,云计算实现了大规模计算资源的分享与整合。随着云技术的迅猛发展,云计算受到工业界、学术界的广泛接受与采纳,许多商业公司、研究机构都将它们的应用部署到云数据中心中。云计算在商业上获得的巨大成功引起了军事领域的关注,许多军事研究者乃至决策者注意到,在下一代指挥信息系统的建设过程中采用云计算技术具有极其重要的意义。然而,云计算技术的军事应用仍面临着一个严重问题的掣肘——资源故障问题。容错成为了云系统的一个重要需求,特别是对于指挥信息系统中大量存在的实时性任务。容错调度是一种可以有效实现容错的方法,其中基于主/副版本(Primary-Backup,PB)模型的容错调度方法受到了广泛的关注。迄今已有学者研究了如何在传统的分布式计算系统中采用该方法实现高效的容错。然而,这些研究成果都没有考虑虚拟化云环境的特征,无法在云计算中得到应用。为了解决该问题,本文以PB模型为基础,立足于虚拟化云环境的特征,研究面向容错的任务调度与资源优化方法,主要工作与创新点总结如下:(1)提出了一种新的基于PB模型的综合重叠技术现有的PB模型主要针对传统的分布式计算系统而设计,无法适应虚拟化云环境的特征。本文拓展了现有的PB模型,使其满足在虚拟化云环境下提供容错能力的要求。此外,本文综合了PB模型的各种改进技术,提出了一种新的综合重叠技术,该技术可以进一步降低采用PB模型带来的额外的资源开销,有效地提高系统的可调度性与资源利用率。(2)分析了虚拟机迁移应满足的容错约束虚拟机迁移技术是云数据中心进行资源管理的常用手段,它是云计算优势的重要来源之一。然而,云系统在采用PB模型实现容错后,虚拟机迁移必须受到容错约束的限制,否则会破坏系统的容错性。本文首次详细分析了虚拟机迁移应满足的容错约束,云系统实现了不以牺牲系统容错性为代价,高效地管理计算资源。(3)设计了一种面向容错的资源弹性供给策略云系统可以根据任务的资源需求动态地调整系统中计算资源的规模,现有的资源弹性供给策略没有考虑容错性的要求。本文提出了一种适应PB模型的虚拟机关闭时间更新方式,并以此为基础设计了一种面向容错的资源弹性供给策略,分别以任务需求、资源使用状态为触发条件,进行资源按需扩展与资源整合收缩,实现云系统的高度弹性。(4)提出了一种改进的实时任务容错调度算法在虚拟化云环境下,基本的计算实体是虚拟机而非主机,但主机的运行状态往往也会影响任务调度的性能,针对该问题,本文改进了容错调度算法中经典的As Early As Possible(AEAP)策略与As Late As Possible(ALAP)策略,提出了一套改进策略:I-AEAP策略与I-ALAP策略,并在此策略的基础上,综合采用上文研究的综合重叠技术、虚拟机迁移技术以及资源弹性供给策略,提出了一种适应虚拟化云环境的实时任务容错调度算法FESTAL,实验证明该算法可以显著提升云系统的可调度性、资源利用率。