论文部分内容阅读
随着互联网上信息爆发式的增长,用户对信息也呈现出个性化的需求。推荐系统通过用户偏好数据获取用户兴趣取向,从而为用户提供个性化的信息或商品推荐服务。SVD++算法由于其良好的精确度与可扩展性,非常适合用于大型互联网系统,已成为推荐系统领域的研究热门。但冷启动与候选集生成问题一直是SVD++算法应用的瓶颈。 推荐系统需预测用户对商品子集即候选集的偏好从而形成推荐。而SVD++算法基于随机抽样的候选集生成方法不能生成符合用户兴趣的候选集,推荐结果的个性化程度不高,这便是候选集生成问题。另一方面,系统扩展引入的新用户、新商品不存在评分数据,SVD++算法不能训练新用户新商品的特征参数,产生新用户、新商品无法加入推荐系统的冷启动问题。 针对候选集生成问题,考虑到用户历史行为与候选集之间的关联,本文利用关联挖掘方法解决候选集生成问题,提出了基于FP-Tree的候选集生成方法。本文利用FP-Tree存储商品间的关联关系,挖掘与用户的浏览历史相关联的商品形成候选集。 针对冷启动问题,本文利用标签模型描述用户特征与商品特征,将标签模型融入SVD++算法,给出了Tag-Based SVD++算法。该算法利用现有评分数据训练标签的特征参数,系统利用新用户新商品提供的标签为其生成特征参数,从而解决冷启动问题。 实验结果表明,相比SVD++算法,基于FP-Tree的方法生成的候选集更符合用户兴趣。Tag-Based SVD++算法能有效解决系统的冷启动问题,能提供较高的预测精度。