论文部分内容阅读
随着互联网的普及和发展,网站的数量和规模越来越大,用户在站内寻找自己想要的信息变得越来越麻烦,如何实现一个智能的个性化推荐网站成为当前的一个研究热点。
针对目前Web挖掘和个性化研究的现状,本文将研究重点放在个性化推荐系统的研究上。本文探讨了根据Web日志分析出用户对页面的兴趣,从而实现用户数据的隐式获取。由于协同过滤推荐算法是针对所有用户计算最近邻居和计算推荐页面的,存在实时性较差的缺陷,本文提出先对用户进行聚类,在类内进行协同推荐的思想,提高了推荐速度。
在Web日志预处理的研究中,提出了针对个性化推荐的预处理方法,提出了用用户浏览页面时间长短和页面大小比值来计算用户对页面的兴趣度方法。
在用户聚类的研究中,作者采用了k-means聚类算法。针对传统的k-means聚类算法产生的孤立点比较多的情况,作者提出了把访问频率比较高的用户作为初始聚类中心,减少了孤立点。
在个性化推荐研究中,作者采用离线数据处理和在线推荐的思想,并把协同过滤推荐算法分成类内相似系数计算和产生推荐两个阶段来完成,把相似系数的计算放在离线数据处理部分来完成,减少了推荐时的计算量,从而提高了推荐速度。