论文部分内容阅读
互联网的普及使得人们可以很方便的获取电影资源,但是随着电影资源越来越丰富,人们很难方便快捷的找到自己喜欢的电影。所以,对于视频网站而言,需要一个好的推荐系统来向用户推荐其可能感兴趣的电影。为了让用户可以准确及时的找到自己喜欢的电影,本文引入了 LDA主题模型对电影推荐进行研究。LDA的出现最开始是为了解决文本挖掘的问题,本文类比文本挖掘的过程,将用户看作是文档,电影看作是词,将用户给电影的评分看作是词频,从而将LDA给文档-词的建模过程迁移到电影推荐系统当中给用户-电影的建模过程,用户-电影的建模过程可以看成用户以一定的概率选择一个主题,再基于这个主题以一定的概率选择选择一部电影。在模型建好之后,本文又提出了两种改进策略:第一,为了进一步提高LDA主题模型推荐算法的推荐质量,本文提出了一种基于负样本进行学习的方法negLDA。LDA通过正样本的学习可以提取出用户喜欢的潜在主题元素,然后对电影进行正面预测评分,negLDA通过创造出负样本,进而从负样本的学习中来提取用户不喜欢的主题元素,对电影进行负面预测评分,该算法不单单只考虑用户喜欢的元素,也考虑用户不喜欢的元素,从而可以更加立体的评价用户对电影的喜欢程度,通过实验也证明了改进算法的有效性。第二,很多研究者都提出了基于LDA拓展和改进的概率图模型,本文重点研究了其中的两种模型并从中受到启发,也提出了自己改进的概率图模型—双重主题LDA模型(dual topic LDA,dtLDA),并将其应用在电影推荐系统当中,双重主题LDA模型在原有的LDA模型的基础上加入了用户主题的概念,用户-电影的建模过程就可以看成用户以一定的概率选择一个用户主题(或者说一个用户小组、用户社区),再以一定的概率选择一个电影主题,最后以一定的概率选择一部电影,这样的建模过程考虑到了单个用户的兴趣会被小集体所影响,实验结果证明改进后的算法可以提高推荐的精度。