论文部分内容阅读
推荐系统就是帮助用户方便快捷的找到其所需求的信息,起到连通用户和信息的桥梁作用。现实情况下,由于用户难以对数量庞大的物品都进行评价,无法形成稠密的评分矩阵,不利于推荐运算操作。在基于邻域的协同过滤中需要计算相似度时,可能会因为缺少共同的历史行为信息,使得推荐效果大打折扣。在此基础上本文采用基于模型的协同过滤算法来挖掘出用户与物品之间的隐藏潜在信息,能够有效地缓解数据稀疏性问题。尽管如此依然存在着冷启动问题,当在新电影进入系统后,难以将其推送给需要它的用户。另外,用户的兴趣爱好也会随时间的流逝而发生相应的变化。对于存在着冷启动问题,当在新电影进入系统后,难以将其推送给实际需求者,为此提出了基于融合聚类和矩阵分解的协同过滤推荐算法。通过将聚类的思想融入到传统的矩阵分解推荐算法中从而达到可以缓解该现象的效果,先把一个大且稀疏的评分矩阵分解为两个较小的稠密矩阵,找出目标物品的近邻集合,再使用它们对应的属性通过一定方式填充新物品属性,然后更新矩阵数据信息,进而为用户做出有效的推荐。对于用户的兴趣爱好随时间而会发生变化的问题,提出基于时间因子和物品属性的协同过滤推荐算法。对于人们的兴趣偏好会随着时间的流逝而发生变化的特点,本文用遗忘函数曲线模拟人脑遗忘的过程,在传统的协同过滤推荐算法中,把用户的评分时间因素融入到物品的相似度计算中,再与物品属性相似度结合得到综合的物品相似度计算方式,从而能更加真实的表现出目前的兴趣爱好状态。本文在Spark平台构建一个关于电影的推荐系统,同时也借助Spark MLlib生态库,并将之实现,此系统将从离线、在线以及热门推荐等方面进行设计。本文系统能充分运用用户的隐式和显式行为信息,向用户提供符合其自身特点的推荐。通过进行相应的实验,可以看出本论文所提出算法改进的有效性,以及设计出的推荐系统的可行性,能够满足用户的需求。