论文部分内容阅读
随着网络技术的高速发展,Internet上的信息呈指数增长。人们要想在众多的信息资源中找到自己需要的信息非常困难,有时即使找到也是混有“噪音”的信息。如何能够快速地找到用户所需要的信息,是目前学者所研究的热点。WEB个性化正是应这种需要而产生的,Web个性化即一个Web网站根据发现的用户喜好,动态地为用户定制观看的内容或提供浏览建议,其最直接的实现方式就是向用户进行推荐,为用户导航。目前存在许多个性化服务系统,根据其实现技术主要有关联规则方法,协作过滤方法,内容过滤方法。本文主要是对个性服务中的关联规则方法和协作过滤方法进行研究。本文首先介绍了数据挖掘、WEB挖掘、个性化服务等概念和定义,针对当前用于计算兴趣度的方法,分析其优点和不足,提出了运用显式和隐式相结合的方法计算用户的兴趣度,增加了当前常用方法中没有考虑的因素,并给出了相应的计算公式。其次,介绍了数据预处理,关联规则挖掘等相关方法,分析了关联规则挖掘存在一些不足,提出了基于兴趣度的页面关联规则挖掘,主要是将用户兴趣度和页面关联规则挖掘相结合,并将它用于个性化服务之中,通过实验证明该方法在推荐准确率上有一定的提高。然后介绍了协作过滤的定义,协作过滤的算法,协作过滤的实现,利用兴趣度来处理协作过滤技术,将兴趣相似的用户聚在一起,形成相似用户群体,从而实现个性化服务,并通过实例说明了协作过滤在个性化技术中的应用。最后针对协作过滤中存在稀疏问题,本文提出了利用聚类分析方法来形成相似兴趣度的用户群体来解决稀疏性问题,并给出了基于兴趣度的K-means聚类算法。