基于LDA主题模型的电影推荐算法研究

来源 :中国计量大学 | 被引量 : 2次 | 上传用户:swatsee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的普及使得人们可以很方便的获取电影资源,但是随着电影资源越来越丰富,人们很难方便快捷的找到自己喜欢的电影。所以,对于视频网站而言,需要一个好的推荐系统来向用户推荐其可能感兴趣的电影。为了让用户可以准确及时的找到自己喜欢的电影,本文引入了 LDA主题模型对电影推荐进行研究。LDA的出现最开始是为了解决文本挖掘的问题,本文类比文本挖掘的过程,将用户看作是文档,电影看作是词,将用户给电影的评分看作是词频,从而将LDA给文档-词的建模过程迁移到电影推荐系统当中给用户-电影的建模过程,用户-电影的建模过程可以看成用户以一定的概率选择一个主题,再基于这个主题以一定的概率选择选择一部电影。在模型建好之后,本文又提出了两种改进策略:第一,为了进一步提高LDA主题模型推荐算法的推荐质量,本文提出了一种基于负样本进行学习的方法negLDA。LDA通过正样本的学习可以提取出用户喜欢的潜在主题元素,然后对电影进行正面预测评分,negLDA通过创造出负样本,进而从负样本的学习中来提取用户不喜欢的主题元素,对电影进行负面预测评分,该算法不单单只考虑用户喜欢的元素,也考虑用户不喜欢的元素,从而可以更加立体的评价用户对电影的喜欢程度,通过实验也证明了改进算法的有效性。第二,很多研究者都提出了基于LDA拓展和改进的概率图模型,本文重点研究了其中的两种模型并从中受到启发,也提出了自己改进的概率图模型—双重主题LDA模型(dual topic LDA,dtLDA),并将其应用在电影推荐系统当中,双重主题LDA模型在原有的LDA模型的基础上加入了用户主题的概念,用户-电影的建模过程就可以看成用户以一定的概率选择一个用户主题(或者说一个用户小组、用户社区),再以一定的概率选择一个电影主题,最后以一定的概率选择一部电影,这样的建模过程考虑到了单个用户的兴趣会被小集体所影响,实验结果证明改进后的算法可以提高推荐的精度。
其他文献
近年来,随着泰国“汉语热”的升温,学习汉语的泰国学习者日益增多,其中翻成泰语的现代汉语小说也成为泰国学习汉语者了解中国文化的重要途径之一。目前,除了学习汉语的学习者
黄秋葵不仅含有丰富的矿物质、维生素、膳食纤维、脂质等营养成分,还含有多酚、黄酮、多糖等活性物质。因此它是一款具有抗疲劳,抗氧化,抗肿瘤功能的药食兼用型蔬菜。黄秋葵
随着电力体制改革的不断深入,内蒙古电力集团公司也进入了公司发展的快车道。近几年公司的售电量逐年攀升,2009年更是一举跨入“售电量千亿俱乐部”,实现售电量全年达到1007.
在阳明学中,“真诚恻怛”是一个十分重要却未受足够重视的概念。这一概念由真切等词发展而来。真诚指刻意努力去除私欲之蔽(去恶)的工夫,及其达到的意识与本体一致的状态。在
分析了锅炉运行数据监测系统的在燃气锅炉房成本核算和经济运行中的重要性、必要性;同时论述了监测系统原理、组成、硬件系统、监测软件、元器件选型以及运行效果。
1000万粒青蛤苗种播种东台“母亲海”,浙江省资源增殖土作有序开展,大鲵人工繁养殖技术应用研究项目通过省级技术成果鉴定,广东阳江养蚝业再创佳绩,国内唯一潭紫菜原种场落户福
叶公超经历了从比附西学到中西比较的转变。自任职清华以后,叶公超开启了他的比较文学实践。他丰硕的比较文学成果受艾略特(T.S.Eliot)和瑞恰慈(I.R.Richards)等欧美学者的影
非物质文化遗产纪录片作为传播“非物质文化遗产”的有效途径之一,近些年来,尤其受到纪录片导演们的青睐。其本身自带的文化属性,在新时期对“非物质文化遗产”的传播起到了
1.主要养殖品种及市场消费特点欧洲的贝类养殖品种主要以贻贝和牡蛎为主,初步预计占到整个贝类养殖产量的90%以上。养殖贝类产量、规模、品种与中国相比有较大的差距。市场上消