论文部分内容阅读
分布式存储系统能够适应当前爆炸性增长的海量数据存储需要,它具有高存储带宽和可扩展性好等诸多特点,是当今海量存储系统的主流技术方向;但分布式存储系统的电力能量消耗已经成为其运行过程中的最大开支,另外大量的电力能量消耗间接地加大了CO2排放,也加剧了全球温室效应。因此分布式存储系统中的节能管理问题是目前计算机存储技术领域中的热点研究问题,也是一个理论性和实际性非常强的重要研究课题;它对于减少分布式存储系统中的能量消耗、降低存储成本和符合国家的节能减排政策具有非常重要的实际意义。分布式存储系统在运行过程中的节能问题可以通过能耗管理策略来进行实现,然而现有的能耗管理策略中,存在着经典随机能耗管理策略不适用于分布式存储系统的动态环境、能耗管理策略容易影响存储系统的I/O性能以及存储系统的冷却能耗策略没有进行优化等不足等问题。因此,本文重点针对分布式存储系统能耗管理策略中的动态负载自适应性能耗管理策略、内存能耗管理策略和存储系统冷却子系统节能优化策略三个主要科学问题进行了系统而深入的研究,本文作者所做的主要工作和取得的创新性研究成果如下:1)提出了一种基于迭代估计的动态自适应能耗管理策略。针对经典的随机策略对动态负载适应性差的不足,通过使用一种随机迭代参数估计方法对负载参数进行估计,获得负载状态参数后结合组件状态建立全局静态马尔科夫控制链,然后建立基于性能、能耗的限制性满足方程,使用线性规划原理解出最优化能耗策略。使用的迭代参数估计方法能快速、准确、以较小的计算量得到动态负载的状态参数值,迭代参数估计方法为静态马尔科夫模型应用于动态环境垫定了基础,能把模型计算的准确性应用于动态负载中,克服了经典滑动窗口随机能耗策略对动态环境适应性差的不足。2)提出了一种基于副本机制的高性能内存能耗管理策略。针对能耗管理策略时通常造成性能延迟,内存能耗管理对I/O性能影响最显著与直接,在已有的内存能耗策略基础上进行扩展,即通过使用可编程NIC,在其内存中建立副本空间,把I/O过程中的高频“只读”热点数据的副本存储在副本空间,并在内存中建立副本元数据表用于指引主机对副本空间进行操作;同时也设计了一种基于时空局部性原理的副本候选算法(DCA),以确保NIC副本数据的时效性,高性能能耗管理算法中增加令元数据表始终保持活跃状态指令,其它内容不需要进行更改。在I/O过程中,高频只读数据不再通过总线反复传输,减少了总线的流量,进而提高系统的吞吐率。理论分析与实验结果表明,新策略的NIC副本过滤了I/O过程中的高频只读数据,增加了内存空闲时间,减少了总线带宽以及数据I/O时间,能够在有效降低能耗的条件下克服原策略对存储I/O的不利影响。3)提出了一种基于温度均衡的冷却子系统能耗管理策略。针对分布式存储冷却子系统已经存在的冷却策略中被动适应存在的温度场的方案节能效果有限、主动温度均衡方案中反馈机制造成内核冷却冗余、基于预测的热点消除影响性能的不足,在深入分析了散热机理后,设计了基于温度均衡的多级任务调度冷却优化策略,在热源间通过反馈机制指派给各个CPU相应的负载以平衡CPU之间热负载,当热负荷相当的CPU间存在过热内核时通过CPU间的线程迁移调度消除热点。在CPU内部使用平滑回归模型预测内核间的温度,预测温差达到设置的触发值后对热核与冷核之间进行线程交换调度进一步均衡温度分布。均衡的温度分布能获得最小的冷却风扇平均转速,从而最小化能量消耗,线程调度相对于操作系统任务级调度时间开销可以忽略。理论分析与实验表明,新策略克服了传统冷却节能策略的冷却效率不高的不足,在不影响性能的前提下更好地节省了冷却能量。4)提出了一种基于中间件的自适应能耗管理应用框架,所有能耗控制策略均可集成在此框架内,平台位于操作系统与用户应用层之间。本文提出的能耗管理应用框架由组件级能耗策略部分与设备级能耗部分组成,通过限制满足原理为不同任务在要求的性能条件下提供最少的服务节点,关闭不活跃状态节点节省能量;对于活跃节点所属的设备,组件级模块调用适当的组件能耗策略进一步降低运行中的设备能量;通过此能耗集成应用框架能够满足用户服务要求,并最大限度的利用能耗管理策略降低系统能量。