论文部分内容阅读
云计算技术的不断进步带动了数据中心的蓬勃发展,不仅在数量上不断增加,更从规模上迅速扩张。与此同时,高能耗、高成本和高碳排放问题开始凸显出来,成为了制约云计算发展的瓶颈。以Google为首的产业界纷纷开始构建绿色云数据中心,涉及的主要技术包括:能耗监测、节能部署和绿色调度等。因此,本文将针对这几方面存在的问题展开研究,主要包括以下四个部分:第一,云服务器能耗测量模型与方法。作为数据中心调度的基本单位,对服务器能耗实时监测具有重要意义。从用户角度,云服务器可以分为物理机和虚拟机两种。本文首先从模型和方法的角度对物理机能耗进行测量,为后续数据中心绿色调度算法研究做铺垫。由于运行在相同物理机上的虚拟机对总能耗贡献不同,为了实现像水、电、煤气一样的按需计费和管理,对虚拟机能耗进行测量也同样具有重要意义。针对物理机能耗测量,采用了回归树的方法将收集的物理机资源—能耗向量构成的数据集划分成若干子集并分别进行线性回归,较已有方法准确度更高。基于该模型,提出了一种公平划分的方法估测出物理机上运行的各个虚拟机的能耗。为了更加客观地对测量方法进行评价,提出了一种新的准确度和稳定性计算方法,其中准确度计算方法解决了传统评价方法中基础能耗占比过大导致的准确度偏高问题。第二,基于多睡眠模式的单数据中心服务器节能调度。通过对处于活跃状态或不同睡眠状态下的服务器进行调度,在满足服务质量的条件下最小化单数据中心总能耗。当前大部分服务器都具备ACPI电源管理功能,因而服务器可以选择不同深度的睡眠模式来节能。睡眠越深,其睡眠能耗越低,但唤醒过程却需要花费更多时间。针对多睡眠服务器节能调度问题,本文首先将其建模成大规模整数线性规划问题。由于问题规模过大,将其在时间上划分成若干同类型子问题并使用Cplex优化工具分别求解。由于相邻子问题之间存在关联关系,提出Backtrack-and-Update方法对服务器状态进行调整,保证在不破坏断点处正在进行转换的服务器状态的同时,后面的子问题有可行解。为了减少活跃服务器能耗,本文再一次利用整数线性规划建模,对每个时间片内的服务器频率进行调度。实验结果表明,本文提出的多睡眠模式调度算法较已有工作更节能。第三,基于DVFS的单数据中心节能调度。通过对任务分发、服务器调频和开关机调度,最小化单数据中心总能耗。假定每个任务都有到达时间、峰值功率下的执行时间,以及截止时间。在满足任务截止时间的条件下,服务器可以通过DVFS降低频率节能,也可以通过调整开始时间拉大任务间的时间空隙关机节能。然而,任务分发、频率调整以及开关机调度三者之间存在着互相制约、互相影响的关系。针对该问题,本文提出了三层次频率调整算法。首先,基于最优频率档,将任务按照执行时间长度优先的策略紧密排布到不同服务器里。其次,如果相邻任务间的时间空隙足以通过关机后再开机节能,则将其左右两边任务的执行频率调整到最合适的档位上。此时,每个服务器上的任务调度被转化成整数线性规划问题,可以利用Cplex确定每个服务器上的任务的开始时间和执行频率。实验结果表明,本文提出的方法较已有工作更节能。第四,分布式多数据中心绿色调度。通过将具有多维资源需求的任务分发到不同数据中心的服务器里,同时对不同类型的能源进行调度,分别最小化数据中心的总能耗成本和碳排放。本文假设每个数据中心的电能有五种来源:从外部购买的电网电能、风能和太阳能,以及数据中心自己生产的风能和太阳能。为了充分利用不同地区不同时间段波动的电价和产生的新能源,引入ESDs(Energy Storage Devices)存储不同类型能源,并同时考虑电网电能回购机制。针对分布式绿色数据中心调度中的最小成本和最小碳排放问题,本文首先提出了按照平均计算价格最低(LCPP)和数据中心最绿色(MGP)的原则将任务分发到优先级较高的数据中心。然后利用资源向量匹配方法(RVM)将请求装箱到尽可能少的服务器里。此时,能源调度问题被转化成大规模混合整数线性规划问题,可以通过分支定界法进行求解。实验结果表明,本文提出的绿色调度框架和算法较已有工作进一步降低了数据中心的能耗成本和碳排放。