论文部分内容阅读
随着W曲数据的快速增长,人们希望快速而准确的找到自己感兴趣的信息,同时网站也希望针对不同用户的兴趣推荐不同信息,从而提高用户的使用体验,这些促使了个性化推荐系统的产生。但是,如何准确的描述用户的兴趣,推荐用户最可能感兴趣的信息,并帮助用户发现新的兴趣点,是个性化推荐系统面临的主要问题。本文将基于这些问题来讨论个性化推荐系统的设计。
首先,对于用户兴趣地描述:用户模型,有的系统采用关键字向量或者类别向量的方式进行描述,前者有时比较偏颇,后者又过于广泛。本文采用“类别+关键字”,从而将用户的兴趣精确到某类中和某个关键字相关的信息。同时,为.了区分用户的关注程度,本文为“类别”和“关键字”添加了“权值”的概念,从而进一步精确的描述用户的兴趣。
其次,如何发现用户最可能感兴趣的信息也是本文讨论的重点。首先将待推荐文档进行分类和关键字提取,然后计算获得的关键字向量与用户模型中对应类别的关键字向量的相似度,从而获得文档的推荐度,最后将推荐度较高的文档推荐给用户。
最后,本文将讨论如何帮助用户发现新的兴趣点。首先,我们根据用户模型描述进行聚类分组,然后将同组用户浏览过的信息进行聚类,最后将包含文档数最多的聚类在同组用户间相互推荐。