论文部分内容阅读
在信息过载的时代,用户如何从海量的信息中找到自己感兴趣的内容,以及信息提供者如何精准地为用户提供信息,都是比较困难的事情。个性化推荐系统能够自动跟踪用户的兴趣特征,并精准地为用户推荐可能感兴趣的商品、网页等,从而解决用户获取信息的效率问题。传统基于用户(User-based)和基于对象(Item-based)的个性化推荐算法面临数据稀疏性问题和冷启动问题,在数据稀疏的情况下,推荐系统没有足够的信息为用户进行准确推荐。为了解决个性化推荐中的数据稀疏和冷启动问题,本文将个性化推荐问题看成是一个概率分类问题,结合传统的Item-based算法思想,将用户过去的评分信息作为一个重要的分类依据建模到该分类模型中,并且引入用户信息、对象信息、时间等上下文信息到模型中作为分类依据。在对用户过去的评分信息进行处理的时候,同样可能因相似度不能计算导致算法无法继续的问题,本文采用一种模拟随机填充的方式来解决。本文使用经典的广义线性概率分类方法:Logistic分类方法和最大熵分类方法来对本文的概率分类模型进行学习。先对Logistic分类模型和最大熵分类模型的原理进行介绍,然后通过Logistic分类方法和最大熵分类方法来对前面提到的概率分类问题进行建模,得到基于Logistic的个性化推荐分类模型(LC)和基于最大熵原理的个性化推荐分类模型(MaxEnt)。最后在实际的交易数据集上进行实验,先对本文的LC模型和MaxEnt进行参数调优,然后与传统的算法进行对比,本文的LC模型和MaxEnt模型在该数据集上较传统的算法在准确性上分别提高了4.85%和5.42%。LC和MaxEnt模型在不同稀疏度的数据集上的表现更加稳定。