论文部分内容阅读
随着互连网技术和电子商务的迅猛发展,Internet正在前所未有地改变着我们的生活。越来越多的商品交易和服务通过Web来进行,如何更好地适应市场的变化、更好地为顾客服务成为各个网站关注的热点。为了更好地解决经营者和顾客的关系,自适应站点成为当前研究的热点。 用户访问站点的日志文件为我们提供了一个观察用户与站点交互的机会。本文就是通过对web日志文件的分析和挖掘来研究和构建自适应站点。 本文对构建自适应站点的基础理论和算法进行了全面的研究:分析了网站的类型和用户的浏览习惯;提出了全新的基于含弹出式页面的树形站点的会话识别和路径补充算法;给出了改进的最大向前频繁路径挖掘算法和目标页关联算法。 为了应用和验证以上算法,实现了基于J2EE的自适应站点系统MAWSS。该系统由数据预处理、站点调整、页面推荐和目标页关联四个模块组成,数据预处理是基础,站点调整是核心。