论文部分内容阅读
我们生活在一个信息过载的时代,网络技术的迅速普及和各种应用的丰富发展,使人们越来越多的使用互联网的服务,在互联网上积累了过于庞大的数据。“信息爆炸”是一个越来越引起人们重视的话题。搜索引擎的出现一定程度上缓解了这个问题,但是关键词检索对用户要求过高以及无法向用户提供个性化的服务,使用户的很多需求得不到满足。推荐技术应运而生,推荐系统发掘用户的兴趣和行为模式,进而向其推荐可能感兴趣的资源。这一方面能向用户推荐最新的或者不热门的物品,大大缓解长尾现象,另一方面也使用户能获取到更加满意的信息。 传统的推荐技术由于只能利用有限的信息往往会遇到数据稀疏和冷启动的问题而使推荐的准确度急剧下降,并且大部分方法不能给出很好的推荐理由。有解释的推荐结果更能够让用户信服,因此也得到了越来越多的重视。这些都是当今推荐系统在实际应用中遇到的问题,也是学术界最热门的研究方向。 针对上述问题,我们提出了基于主题模型的自适应混合推荐算法。具体来说,除了评分信息以外,我们考虑充分利用丰富的文本信息,对这些信息采用主题模型的方法进行建模,能很好的缓解数据稀疏问题,另外由于新物品的主题构建并不需要用户数据,从而缓解冷启动的问题。接着我们将主题模型与传统的协同过滤算法进行结合形成了一个自适应的混合推荐算法。 最后,本文设计了详细的实验来验证我们的算法。实验数据集基于被学术界广泛使用的Amazon数据集和Movielens数据集并做了一些扩充,实验结果充分证明了我们模型的有效性和稳定性。