论文部分内容阅读
大数据时代催生的新型存储架构内存云(RAMCloud)基于其访问快速、易于扩展、存储量大等优点在近年来得到长足发展。内存云任何时候都将数据存储在动态随机访问存储器(Dynamic Random Access Memory,DRAM)中,由此摒弃了磁盘访问的高延迟、低吞吐量的缺点,实现了数据快速访问,使用内存替代磁盘能够更快速地进行数据存取和处理。DRAM由于自身断电易失原因不能长久地保存数据,内存云架构通过将主服务器中的数据进行若干备份到备份服务器中来保证数据持久性,由此使得存储代价增加,同时使用内存存储数据使得系统总能耗增加。相变存储器(Phase-Change Memory,PCM)是近年来出现的一种新型存储介质,由于其非易失、存储密度大、能耗低等优点逐渐进入学术界和工业界的视野成为DRAM的替代者。但PCM也具有两个较大的弱点:相比于寿命1015的DRAM其寿命是非常有限的;PCM的读写速度是不对等的,写数据速度相比读数据速度慢很多。由于上述缺点,不能完全使用PCM代替DRAM作为内存进行数据存储。必须考虑结合两种内存的优点,优化已知缺点构成混合内存云存储架构。本文通过研究内存云架构,对其不足之处进行了优化研究,使用PCM替代部分DRAM构成同级混合内存云架构,考虑到PCM的寿命远远低于DRAM,如若不进行写入次数和磨损均衡控制,系统将在PCM主机寿命到时自动崩溃,本文通过讨论规定时段内数据是否存在于PCM内的概率,如果数据存在的概率高于0.7就不再对将此数据写入。同时构建双向链表,通过统计PCM中的页面的访问计数进行动态排序,始终保持链表从尾部到头部写入次数单调递增,保证数据写入始终在链表尾部。数据对象管理方面首先通过两种器件的读能耗、写能耗、待机能耗和活动能耗的比较计算出混合内存云架构的内存分配比,发现当DRAM与PCM的比例为4.847:1时系统存储性能最优。随后对数据进行读写倾向性预判断,计算出所有存入系统的数据倾向性,将读倾向性高的数据存储于PCM中,其余所有数据存储于DRAM中,此步骤是为了减少PCM的写入数据量。为了保证架构的稳定性,构建数据迁移模型,在每个PCM主机中管理一个LRU链表,动态地将PCM中某时段读倾向性不高的数据对象迁移到DRAM中,同时通过成本效益分析法将DRAM内存重要性较低的数据删除。构建的混合内存云架构在数据读取、断电恢复和保证访问命中率、数据存储量等方面都有较好的性能。