论文部分内容阅读
互联网技术的迅猛发展把我们带进了一个信息爆炸的时代,海量信息使用户很难从中发现自己感兴趣的部分,容易导致信息过载和资源迷向,这使针对用户的个人特定需求而为其提供针对性服务的个性化推荐系统应运而生,将用户可能感兴趣的信息传送或优先传送给用户。为了在更深的层次上理解用户的行为,而不需要用户的参与,需要用到Web日志挖掘,Web日志记录了用户的访问行为。通过Web日志挖掘,比较用户间的访问相似度,找出相似用户组,可以主动地向用户推荐相似用户组访问过而用户本身还没有访问过的网页。基于Web日志挖掘的个性化信息推荐日益成为一个重要的研究课题。本文主要介绍了国内外个性化推荐技术的现状,提出了个性化推荐技术需要改进之处。阐述了Web日志挖掘的概念和步骤,描述了个性化推荐的概念、分类、核心技术和步骤。分别对基于Web日志挖掘的个性化推荐算法进行中的个性化浏览推荐算法和个性化搜索推荐算法进行了介绍和改进,通过分析Web日志记录的用户的行为特征,对基于向量聚类算法提出了改进的思路,提出基于共同点击网页的用户聚类算法,增加了用户聚类和推荐的准确性,还提出了基于当前点击页的推荐算法,并且通过对查询关键词扩充算法的研究,提出了基于用户兴趣度的结果扩展查询算法和基于用户相似度的个性化搜索推荐排序算法。并将这些算法引入到一个基于Web日志的个性化推荐(包括个性化搜索)原型系统中并给予实现,通过这种界面形式向用户推荐其可能感兴趣的但又未浏览过的网页,并给出了该系统的详细模块设计和功能介绍,对系统的功能进行了测试和评价,证明了算法的准确性。最后总结了本文工作中存在的问题,提出了今后的工作。其中基于共同点击网页的用户聚类算法、基于用户兴趣度的结果扩展查询算法和基于用户相似度的个性化排序方法是本文及本系统的难点与创新点总之,本文全面系统地总结了目前国内外个性化推荐技术的现状,为系统的个性化推荐功能提供了很好的借鉴。同时,本文中采用的基于Web日志挖掘的个性化推荐算法,经测试结果证明,具有较高的查准率,有一定的实用价值。