论文部分内容阅读
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题。本文以Web日志中的点击流数据为基础,从统计分析和智能分析出发,引入Web挖掘技术对网站上用户的浏览数据-点击流数据进行概化分析,生成相应的量化规则;并进行浏览兴趣路径的研究,提出了用户浏览兴趣路径挖掘算法。这种算法能准确地反映用户浏览兴趣,而且可扩展性较好。可以应用于电子商务网站的站点优化和个性化服务等。
本文首先介绍了Web挖掘、Web日志及Web日志挖掘的意义和主要任务,接着设计了对点击流数据进行实时预处理的方法和算法。在数据挖掘即数据分析部分,研究和设计了用于数据概化分析的面向属性规约的算法,在分析目前用户浏览模式挖掘算法存在的问题的基础上,提出了支持-兴趣度的概念,设计了网站访问矩阵,并基于这个矩阵提出了用户浏览兴趣路径挖掘算法。