论文部分内容阅读
对当前的存储系统及设备,能耗和实际应用程序的性能逐渐超越简单的硬件特性成为重要性能评估指标之一。这主要表现在两个方面。其一,随着硬件和电力开销的上升,系统及设备的功耗和可靠性越来越成为一个重要的衡量指标。因此,节能型存储系统近年来受到广泛关注。其二,由于系统和应用的复杂性增加,对系统及设备的性能评价逐渐由单纯的器件级性能评价体系变为基于应用的性能评价方法。例如,固态盘设备理想情况下可以达到低于20us的延迟,但是因为各层存储软件的开销相对增加,导致应用程序通常仅能获得其不足50%的性能,器件性能并不能被应用程序充分利用。本文对存储系统从以上两个方面进行了多维属性的研究。 近年来,存储系统及设备的功耗模型和节能方案已有大量的研究成果。然而相关存储系统及设备的温度模型,以及功耗和温度之间的关系却少有研究。有统计数据表明,存储设备的温度对其寿命及错误率有重要影响,从而也影响着系统的可靠性。由于主要的节能存储系统,如MAID及PARAID,均采用把I/O负载集中在少数硬盘上的策略,使得数据中心的温度不能均匀分布。这样既增加了制冷的难度也影响了系统可靠性。为了研究存储系统中温度和功耗的关系,本文搭建了大规模硬盘温度测量平台对单个硬盘设备进行在线的实时监测,并建立和验证了在线温度预测模型,完成了对硬盘温度的突变、过度和动态平衡等过程的准确预测。 针对节能型存储系统中,局部高负载硬盘设备的温度过热问题,提出通过增加温度负反馈对存储系统进行温度限制的方法。通过改进节能存储系统,增加温度限制条件,提出的温度受限的节能存储系统改变了系统的温度特性,在节能的同时提高系统的可靠性,对实际系统有巨大的经济效应。并从控制理论角度对不同的温度控制方法进行了理论分析和对比。由于设备温度变化有较高的迟滞性和随机性,本文引入了模糊决策的控制理论和方法对存储系统的I/O调度策略进行多维度优化,实现了温度阀值的动态调节。 在新型存储器件的性能优化研究中,本文提出并研究了基于语义维度的映射表和缓存管理算法。固态盘在当前的存储系统中得到了越来越多的应用。但是,当前固态盘固件的优化策略仍然主要基于数据访问的时间和空间局部性原理。这两个维度的数据访问特点,已经被CPU、主存等多级缓存重复利用。有研究指出,多个主流应用——如数据库服务和网页服务——在存取数据时,仅能利用固态硬盘约一半到三分之二的性能。这是因为应用程序访问硬盘数据时,主要基于数据的语义关系,即数据间的关联性。利用数据关联关系可进一步优化存储系统的I/O性能,尤其是在数据访问的局部性较低的器件层。由于上层软件无法感知固态盘内部的结构特点,在器件层对固态盘进行语义维度的优化就变得很有必要。 使用有限的内存空间对闪存映射表进行查找和更新,是导致固态硬盘的性能下降的主要原因之一。这个问题随着固态硬盘容量的提升变得越来越严重。然而,在内存空间有限的情况下,固态盘却对读和写所产生的映射缓存进行了无差别的管理。通过对实际的负载分析得知,写操作产生的缓存的命中率远低于读操作产生的缓存的命中率。另外,大部分的映射关系的更新集中在很少的映射页中。基于这些观察,本文为固态硬盘设计了写倾斜感知的缓存管理算法,进一步提高了缓存命中率,并降低了固态盘内部的写放大现象。 通过对节能存储系统进行硬盘温度建模并增加温度限制,存储系统中硬盘的工作温度降低最大约30%,并基本保持原有的系统负载与功耗成比例的特性。在负载压力测试下,该温度受限的节能存储系统仍能有效保证系统可靠性,并提高总体满意度约2倍。基于语义的固态盘闪存映射算法可提高最大约58%的缓存命中率,降低实际应用负载的I/O响应时间最大约63.4%。