论文部分内容阅读
随着科技的高速发展和大数据时代的到来,数据的存储需求和对响应时间的要求都在不断提高,仅仅从软件层面上解决存储问题比较困难,需要有新技术来摆脱磁盘的机械特性限制。近年来,材料技术的进步促进了新型存储器的飞速发展,为高效能大数据存储和管理研究带来了新机遇。继Flash之后,国内外许多研究者开始关注以相变存储器PCM为代表的非易失存储器。 可字节寻址、非易失、低能耗和大容量等特点,让PCM成为当下可替代传统内存介质DRAM的热门新型存储器。但由于PCM与DRAM特性的不同,已有的数据管理方法不适用于PCM。首先,DRAM是易失型介质,因此一般用来存储计算过程中的动态数据;而PCM是非易失介质,既可以存储动态计算数据,也可以存储文件等持久的静态数据。其次,主存级PCM的引入并不能完全取代DRAM,虽然PCM读性能较好,但写代价相对较高,而且写次数有限,因此在存储架构中依然需要借助DRAM来保证其高效性。因此传统的内存数据管理机制,包括空间分配、存储组织、索引等不能直接适用于PCM。本文针对内存数据管理机制中的索引算法,探讨如何优化传统的索引机制,以让其适用于基于PCM的内存数据管理。 具体而言,本文的主要贡献有: (1)提出了溢出类型B+-tree(OB+-tree)索引的读访问优化算法CB+-tree。本文首先对结点的读写倾向性进行了定义,分析了读写倾向性判断方法,然后详尽阐述了利用结点的读写倾向进行溢出链调整的策略,以及优化后索引的查询、插入和删除操作方法。最后通过对比实验,证明溢出链优化方法可以有效的减少索引对PCM的读次数,与OB+-tree相比减少约25%读次数,平均整体时间性能提高约15%。 (2)提出了利用DRAM作为辅助存储的溢出类型B+-tree(OB+-tree)索引的优化算法XB+-tree。在DRAM和PCM混合主存架构中,以DRAM的高写性能来弥补PCM的缺点,结合索引结点具有读写倾向性的特点,将少量具有写倾向的结点迁移至DRAM上;同时,为小容量的DRAM提出了索引结点管理算法。实验证明,提出的优化算法可以有效减少PCM的读写次数,与OB+-tree相比,对PCM的读写次数分别降低约31%和64%,混合主存架构的整体性能也有较大提升,平均约为38%。