论文部分内容阅读
由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥挤,用户的服务质量(Qos,Quality of Service)得不到很好的保证。现在的服务器普遍都使用缓冲机制。它利用WWW访问的时间局部性,将曾经访问过的文档保存在高速缓存中,避免向本地硬盘或者其他服务器发送请求,从而加快服务器端的响应速度。
本文发现越来越多的缓存技术开始考虑用户的访问模式以及大量的日志中存在的知识。随着Web数据挖掘技术的发展,我们可以充分的利用这一技术,将日志中隐藏的模式挖掘出来应用到缓存策略中,提高缓存的命中率以及服务器的响应速度。本文介绍一种应用Web请求预测模型的智能Web缓存算法;这种算法是对Web和代理服务器的LRU策略的拓展,使其对使用数据挖掘技术从Web日志数据中提取出来的Web访问模型敏感。
我们主要研究了使用决策树的方法。新算法的试验结果显示,在点击率上它比现有的基本LRU缓存技术有了显著的提高。在本文中我们分析了许多现有的缓存策略的特性。结合Web代理服务器业务流的特点,提出了一个基于ORCL算法的新的缓存替换算法ORS2。