论文部分内容阅读
推荐系统通过对内容和用户行为的分析,建立适当的模型,帮助用户从海量的数据中找到自己感兴趣的内容。推荐系统中用户的行为反馈包括显式反馈和隐式反馈,其中隐式反馈信息在推荐系统算法中被广泛应用。隐式反馈体现着用户的兴趣爱好,对隐式反馈信息的挖掘有助于提高推荐系统的效果,从而能够更好地设计推荐系统。 本文对隐式反馈中个性化推荐的关键技术进行了深入的研究,包括隐式反馈中的评分预测问题和TopN推荐问题。本文的主要工作和贡献如下: 1.提出基于隐式反馈的隐特征FM模型,并把模型应用于评分预测中。用户的隐式反馈对用户当前的评分是有影响的,但是用户的隐式反馈是个高维稀疏的向量。我们利用Latent Dirichlet Allocation(LDA)模型对隐式反馈进行降维,并把降维后的隐式反馈表示应用于Factorization Machine(FM)模型中,使隐式反馈信息在评分预测中发挥作用;进一步我们运用word2vec模型学习出用户的具有浏览顺序特性的隐式反馈表达,同样应用于FM模型中。实验表明,以上两种方法有效地提高了评分预测的精度,对隐式反馈进行了降维,并把浏览顺序这个信息应用于隐特征的学习上,提高了方法的效果。 2.提出基于隐式反馈的协同聚类(co-cluster)模型,CCCF模型,并把模型应用到TopN推荐中。统的协同过滤(Collaborative Filtering,CF)算法是在整个物品(item)空间上衡量用户(user)的兴趣,然而实际的互联网中用户可能在不同类的物品中有不同的兴趣。本文利用隐式反馈,提出了一种基于“用户-物品”的协同聚类算法,并在每个子类中分别独立实现协同过滤算法,最后把每个类别中的推荐结果融合以提升TopN推荐的精度。在我们的模型中,类别与类别之间可以交叉,同时我们的模型可以描述用户(物品)与类别之间的连接强度。我们的模型复杂度低,具有可解释性、灵活性和可拓展性等优点。大量的实验结果表明,CCCF模型可以提高各种协同过滤算法的效果,并且推荐结果具有可解释性。