论文部分内容阅读
随着云存储技术的日益成熟,用户存储访问数据变得更加便捷,同时,用户对数据的访问模式也在发生变化,由原来的呈现类zipf分布逐渐转变为SE分布,甚至更加扁平化,这使得传统的缓存系统在缓存效率上也在降低。 设计并实现了一种云存储环境下的缓存系统,旨在充分利用云存储系统中热访问数据与冷访问数据中包含的相同数据块,在缓存系统中引入了重复数据删除技术,在该缓存架构中包含文件级缓存(重删)模块和块级缓存(重删)模块,实现对热访问数据与冷访问数据中存在的相同数据块做数据重删,从而提高缓存空间的利用率;另外,在缓存替换算法方面,本文提出了LRFDU缓存替换算法,该算法除了考虑数据块的最近访问时间和最近访问频率,同时还考虑该数据块在存储系统中的重复引用次数,这是因为存储系统中被重复引用次数高的数据块在用户访问的文件中被包含的可能性也更高,而在用户的数据访问模式更加扁平化的环境下,这一趋势变得更加明显。 对提出的云存储环境下的缓存系统进行了缓存效率测试,测试结果表明缓存系统在引入数据块重删技术之后的文件命中率明显优于传统的缓存系统,在缓存大小为40MB,数据集远大于缓存的情况下文件命中率可提升83%,引入数据块重删的缓存系统在采用LRFDU缓存替换算法时的文件命中率也优于采用LRU缓存替换算法时的文件命中率,在缓存大小为40MB,数据集远大于缓存的情况下文件命中率可提升26%。