论文部分内容阅读
云计算平台是一种新型的资源管理以及调度平台,通过采用虚拟化的方法,最大限度地帮助用户获得所需的资源。混合云结合了公有云在资源分配能力及私有云在用户需求定制化方面的优势,已成为广泛使用的云平台架构。然而由于云平台中的资源调度非常频繁,不仅与底层物理设备状态相关,还和平台内部资源分配方法相关,所以混合云平台内部虚拟化实例以及资源调度策略,往往容易发生故障。同时在混合云平台内部,一个管理节点需要同时管理多个不同虚拟化实例,容易造成单点故障。 本文对混合云资源调度的容错过程及策略进行研究。定义混合云的形式化模型语言,用于描述其资源调度过程,并构建混合云的资源调度模型。基于构建好的模型,研究相应的容错策略。最后,通过实验仿真说明方法的实用性。本文主要的工作有以下三点: 1)提出了一种基于排队Petri网的混合云平台资源调度模型。该模型可以有效地刻画资源调度过程中的不同组件运行时消耗的时间和资源。同时,可以分析调度过程中的故障行为,建立故障恢复模型。 2)提出了一种资源调度的容错策略。该策略对混合云平台资源调度过程中的故障进行分类,并分析单点故障以及不存在单点故障的情况。通过使用改进的PAXOS一致性算法来保证单点故障的恢复。 3)采用QPME工具对资源调度容错模型进行仿真,定量地分析不同负载情况下容错策略对整个混合云平台性能的影响。