论文部分内容阅读
随着互联网的发展,尤其移动互联网的发展,Web用户快速增长。但因网络带宽和服务器的数量增长相对滞后,造成了用户使用互联网服务的时间延迟。由于硬件投入的成本较大,缓存系统因此成为解决网络延迟的有效方式。 缓存替换算法对缓存系统的性能有较大影响。本文在对经典的GDSF替换算法进行研究的基础上,结合Web日志挖掘生成的预测队列,对GDSF进行改进,提出了基于预测的缓存替换算法——IWAP-GDSF算法,以此来提高缓存算法的命中率。 本文首先对Web日志挖掘算法进行研究,在经典的WAP挖掘算法的基础上,结合Web对象的时间局部性特征,对WAP算法进行改进形成IWAP算法,使其更适合替换算法的预取模型使用。通过对IWAP的日志挖掘结果建立预取模型,本文提出了一种新的预取模型,模型中考虑了预测对象未来在预测序列中的位置和计数信息,作为该对象未来被访问概率的权重,模型生成的预测队列为替换算法提供决策依据。结合预测模型,本文提出了基于预测的缓存替换算法——IWAP-GDSF。新算法在计算目标函数权值时使用预测队列,综合考虑对象的访问频率、取回代价以及未来可能被访问的概率,做出替换决策。最后本文实现了仿真程序模拟用户访问情况,对IWAP-GDSF算法和GDSF算法进行实验。实验结果表明IWAP-GDSF算法在一定缓存空间大小时可以有效提高缓存的文档命中率和字节命中率。