论文部分内容阅读
随着信息的快速增长,用户无法快速获取个人所需的信息,推荐系统的出现,有效的解决了这一问题。推荐算法是推荐系统的核心,研究推荐算法对于提高推荐系统的性能和用户的满意度具有重要的意义。
度量分解推荐算法的提出,解决了矩阵分解推荐算法因向量点积而导致模型出现次优解的问题,其用欧氏距离代替向量点积的思想,为近几年推荐领域提供了新的研究方向。但是,该算法也会受到用户兴趣随时间变化和冷启动问题的影响,另外其只考虑了单一的评分数据,使得模型无法学习到更多的特征信息。为了提高度量分解算法的推荐准确性,并解决冷启动问题,本文提出了如下的改进策略:
(1)针对信息单一和用户兴趣漂移的问题。首先本文考虑用户行为信息,挖掘用户行为隐反馈信息对模型本身的影响;其次考虑到用户兴趣会随着时间的改变产生漂移的问题,本文利用艾宾浩斯遗忘曲线拟合用户的兴趣变化趋势,描述用户在不同时段评分的不同比重以解决用户兴趣漂移问题,提出了TFML++算法。在MovieLens数据集上的实验结果表明,TFML++算法相比于其他算法在评分预测任务中的预测准确率有明显的提升。
(2)针对冷启动问题。本文在使用TFML++算法进行推荐的基础上,首先利用社交正则项和用户信任关系的隐反馈信息对用户位置向量进行约束;其次,通过关联规则构建项目之间相似度的度量方式,挖掘项目之间的关系,并根据相似度为每个项目筛选出Top-K个近邻集合,用正则项对项目的位置向量进行约束,建立了TFMLReg++模型。通过在CiaoDVD数据集上与其他算法的实验比较,验证了改进后的算法能够有效缓解冷启动问题,并具有更高的推荐准确度。
最后,本文将上述改进之后得到的TFMLReg++算法应用到Yelp提供的餐饮相关数据集的推荐中,实现对用户的个性化推荐。
度量分解推荐算法的提出,解决了矩阵分解推荐算法因向量点积而导致模型出现次优解的问题,其用欧氏距离代替向量点积的思想,为近几年推荐领域提供了新的研究方向。但是,该算法也会受到用户兴趣随时间变化和冷启动问题的影响,另外其只考虑了单一的评分数据,使得模型无法学习到更多的特征信息。为了提高度量分解算法的推荐准确性,并解决冷启动问题,本文提出了如下的改进策略:
(1)针对信息单一和用户兴趣漂移的问题。首先本文考虑用户行为信息,挖掘用户行为隐反馈信息对模型本身的影响;其次考虑到用户兴趣会随着时间的改变产生漂移的问题,本文利用艾宾浩斯遗忘曲线拟合用户的兴趣变化趋势,描述用户在不同时段评分的不同比重以解决用户兴趣漂移问题,提出了TFML++算法。在MovieLens数据集上的实验结果表明,TFML++算法相比于其他算法在评分预测任务中的预测准确率有明显的提升。
(2)针对冷启动问题。本文在使用TFML++算法进行推荐的基础上,首先利用社交正则项和用户信任关系的隐反馈信息对用户位置向量进行约束;其次,通过关联规则构建项目之间相似度的度量方式,挖掘项目之间的关系,并根据相似度为每个项目筛选出Top-K个近邻集合,用正则项对项目的位置向量进行约束,建立了TFMLReg++模型。通过在CiaoDVD数据集上与其他算法的实验比较,验证了改进后的算法能够有效缓解冷启动问题,并具有更高的推荐准确度。
最后,本文将上述改进之后得到的TFMLReg++算法应用到Yelp提供的餐饮相关数据集的推荐中,实现对用户的个性化推荐。