论文部分内容阅读
不断增长的云服务、大数据分析、电子商务和互联网流量使数据中心的能源消耗增长得越来越快,因此高能效性(Energy Efficiency)成为设计数据中心的首要目标之一。目前主要使用每瓦特性能(Performance per Watt)来表征服务器的能效性。但是,由于服务器在不同资源利用率级别时其能效性不同,能量等比性计算(Energy Proportional Computing)逐渐成为工业界和学术界关注的焦点。对一台理想的能量等比性服务器(能量等比性值为1.0),服务器的功耗应与其硬件资源利用率等比例变化。例如,如果服务器在100%利用率时的功耗为100瓦,则其在30%利用率时的功耗应为30瓦,而在服务器空闲时其功耗应近似为0瓦。目前的功耗感知调度方法,主要是通过调度或迁移方式将单台服务器尽可能多的运行任务负载,将其它服务器处于空闲状态以进行休眠或关闭。在大规模异构数据中心中,这类方法不仅忽视了单个不同服务器的能量等比性特征,也造成了数据中心整体能效性的降低。对大型数据中心运维来说,充分理解服务器的能量等比性特征,在不干扰上层任务的情况下,根据不同服务器的能量等比性特点,尤其是其功耗-利用率曲线,将服务器运行在高能效比区间,则可以最大化的提高整个数据中心的能效性,同时满足上层应用的服务质量。本文将能效性与能量等比性结合起来分析数据中心的能效性。由于数据中心的资源利用率随负载所变化,本文基于能效性和能量等比性设计数据中心任务调度策略。此外,由于数据中心的迭代式采购与更新进一步加剧了数据中心的异构性,本文设计了一个数据中心能效模拟器,以评估硬件选型对数据中心整体能效性的影响。本文的研究工作包括以下几个方面:(1)从能量等比性和能效性的角度深入分析了SPEC官方发布的所有SPECpower基准测试结果(2007-2017),并提出了PEEP度量方法。根据服务器的硬件可用性日期,深入分析了近几年服务器能量等比性停滞与处理器微体系结构的关系,发现服务器空闲时功率和节点规模是影响服务器能量等比性的关键因素。此外,分析还发现服务器峰值能效性从100%利用率点转移到60%-70%附近,并且服务器硬件配置对其能效性有较大影响。(2)提出面向能效性的软件定义体系结构(Software-Defined Architecture for Energy Efficiency),通过大量实验得到服务器能效性与硬件配置的关系,并针对大内存系统做了深入研究。对SPECpower的分析结果表明,硬件配置对服务器的能效性有一定的影响。为了研究服务器硬件配置与能效性的关系,本文在4台2U服务器上搭建SPECpower环境,并进行实验,得到CPU频率和服务器配置的内存大小对服务器能效性的影响。此外,随着DRAM在现代服务器系统和处理器中扮演着重要角色,本文在3台2U服务器上搭建STREAM基准测试工具,并进行实验,分析了大内存系统上运行内存密集型应用的能效性特征。(3)设计了能效性可感知的数据中心在线-离线混合任务调度策略及基于真实服务器的大规模数据中心能效模拟器——e Scope。由于硬件配置的多变及负载的复杂性,本文设计了能效性可感知的数据中心在线-离线混合任务调度策略,合理调度在线、离线任务,以充分利用数据中心资源,提升数据中心整体能效性,降低数据中心能耗。最后利用调度策略以及所有研究结果设计了基于真实服务器的大规模数据中心能效模拟器e Scope,利用e Scope可以动态调整数据中心中不同类型服务器的占比参数及其利用率水平,以评估在一定功率限制下,如何最大化数据中心的负载量、吞吐量及其整体能效性。本文对真实SPECpower基准测试数据的分析结果,及通过实验进一步验证的服务器配置与能效性的相互关系,和能效性可感知的数据中心在线-离线混合任务调度策略以及基于真实服务器的大规模数据中心能效模拟器,对于数据中心的能效性优化设计、负载放置、任务调度等具有重要参考价值。