论文部分内容阅读
近年来,随着大规模互联网应用、企业级基础服务和数字经济建设对云计算需求的日益增长,数据中心的规模与数量都得到了前所未有的发展。迅速增长的数据中心规模与数量也给数据中心运营商带来了高能耗和高污染等多方面的问题,因此高能效性成为建设和运营数据中心的主要目标之一。作为数据中心最重要的基础设施,服务器的能效性(Energy Efficiency)和能量等比性(Energy Proportionality)成为学术界和工业界的热点研究问题,如果能提高数据中心服务器的能效,数据中心的整体能效也将得到有效提升。在真实的大规模数据中心中,由于负载复杂多样、动态变化、业务耦合等原因,IT基础设施部门对于处理器硬件功耗挖潜及服务器聚合能效更加关注。因此,发现和识别数据中心服务器在不同处理器架构技术下的能效特性并进行实证研究和分析,对于提高生产系统及整个数据中心的能效具有重要的现实意义。本文的研究内容主要围绕降低服务器的功耗和提升服务器的能效进行,并在某大型互联网企业的数据中心进行实证研究,主要的工作内容包括以下几个部分:(1)以数据中心服务器能效性和能量等比性的视角对2007年至2019年SPECpower官方公布的测试结果进行深入分析,展示了服务器能效和能量等比性的演进趋势并且通过多元线性回归拟合分析了影响服务器能效的关键硬件参数。然后对SST技术和NUMA架构进行了研究和实验,并分析了这两种技术对服务器能效的影响。实验表明SST与NUMA技术对服务器能效有着较大的影响,数据中心运营商需要了解上层应用的特征并且正确地进行任务调度才能有效地使用这两种技术,提升服务器的能效。(2)设计并开发了能效可感知的虚拟机调度系统EASE以及数据中心能效仿真器Escope。EASE的核心思想是通过识别虚拟机上的负载类型以及资源利用率,从而调度集群中位于不同服务器的虚拟机,使得服务器处于最高能效利用率的附近工作。Escope可以模拟数据中心不同型号服务器的在线数量以及服务器的最佳工作范围,从而分析数据中心所有服务器的能效特性,为数据中心运营商提供数据支持。(3)设计并开发了服务器功耗字典测试工具—Power Dictionary Tool,该工具整合了针对多种不同组件的测试负载,数据中心运营商可以根据上层应用类型配置压力模型,并且在数据中心的真实散热条件下获得定制化的服务器功耗数据,从而建立服务器的功耗字典。通过使用功耗字典,数据中心运营商可以较为精确地计算出服务器的上架功耗,从而最大化电力资源的利用率。(4)设计并开发了用于通用服务器和SMART-NIC异构服务器的功耗管控工具,其可以在尽可能不影响性能的情况下降低服务器功耗并将服务器功耗保持在所设定的功耗阈值之下。本文从服务器能效和能量等比性的角度对SPECpower官方公布的测试结果进行了深入分析,并且通过实验分析了应用NUMA和SST技术的服务器能效特性。通过虚拟机能效可感知调度系统EASE,进一步证明了理解服务器能效特性对降低数据中心能耗具有重要意义。数据中心运营商可以使用数据中心能效仿真器Escope理解数据中心服务器的能效特性,从而合理地进行负载放置以及任务调度。在服务器上架时,数据中心运营商可以使用Power Dictionary Tool估算服务器的上架功耗,计算合理的上架密度,从而最大化电力以及空间使用率。在服务器运行时,数据中心运营商可以通过使用基于功耗代理的通用服务器功耗管控工具以及基于启发式算法的SMART-NIC异构服务器功耗管控工具,降低服务器运行时功耗以及保障数据中心电力安全。数据中心运营商可以通过服务器上架功耗估算、服务器运行时功耗管控、虚拟机能效感知调度、数据中心能效仿真等一系列方法和工具,有效地降低数据中心能耗并且提升数据中心能效。