论文部分内容阅读
当前,数据中心普遍利用虚拟化技术来提高部署灵活性、降低操作成本、提高资源利用率。虚拟机具有封装性,可以避免重复安装操作系统、中间件、应用软件等软件栈,虽然方便了数据中心的管理,但会使虚拟机镜像备份中出现大量冗余,导致严重的存储危机。为提高存储资源的利用率,虚拟化数据中心往往利用去冗余技术进行虚拟机镜像备份。由于虚拟化技术具有资源共享的特点,去冗余过程会对虚拟机上托管的应用产生性能干扰,数据中心通常只能选择负载较低的时间段进行去冗余备份操作,使得虚拟机镜像备份面临时间短、任务重的严峻挑战。另外,虚拟机镜像备份采用去冗余存储方案,严重的碎片化会导致还原性能的降低,影响系统的故障恢复能力。因而,提高虚拟机镜像备份和还原的性能,对于保障服务质量具有重要意义。 本文分析了虚拟机镜像去冗余、多节点备份、镜像还原等主要操作过程中产生的性能问题,并研究了相应的性能优化技术,有效提高了虚拟机镜像备份及还原过程的性能。本文的主要贡献如下: 1)基于聚类分组的虚拟机镜像去冗余优化方法:虚拟机镜像具有小范围相似的特点,对不相似的镜像进行去冗余会导致无效查找。本文提出了一种利用聚类分组进行去冗余的方法,利用虚拟机镜像相似性作为启发式规则对虚拟机镜像进行分组,通过统计抽样的方法为镜像选取最为相似的分组进行去冗余,旨在将全局去冗余变成局部去冗余,以优化镜像去冗余操作的开销,降低去冗余操作的时间和空间复杂度。通过对比实验,证明方法具有较好的稳定性和有效性,在极端情况下可以减少50%以上的去冗余时间。 2)基于遗传算法的虚拟机镜像自适应备份策略:常用的备份策略可以分为三种:先去冗余再备份、先备份再去冗余、边去冗余边备份。每种策略有不同的资源需求,适当的组合策略可以优化资源配置,达到缩短备份时间的目的。本文提出一种基于遗传算法的虚拟机镜像自适应备份策略。针对不同的虚拟机镜像备份策略分别建立资源需求模型,然后根据系统当前资源占用情况自适应地进行策略规划,以最小化备份时间。实验结果表明,该模型可以在2%~10%误差范围内预测去冗余备份时间,通过优化组合策略可以减少20%左右的备份时间。 3)基于引用计数的虚拟机镜像还原优化:虚拟机镜像还原时间取决于容器读次数,而去冗余存储导致的碎片化现象大大增加了还原过程中的容器读次数,具体体现在对同一容器的读次数增加和对不同容器的读次数增加两个方面。论文提出了一种基于引用计数的数据块重写方法用于降低对同一容器的读次数,并根据重写后的数据块分布提出了一种基于平均引用计数的分级缓存替换算法用于降低对不同容器的读次数。实验表明,论文提出方法可以显著降低碎片化对还原的影响,提升51%左右的还原性能。 最后,本文提出的性能优化方案已经在OnceCloud系统中进行实施,并取得良好的效果。