基于协同过滤的电影推荐系统的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:fyfy76
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的迅速发展,互联网给用户带来了大量的信息,满足了信息时代用户对信息的需求,但由于信息量的大幅增长,导致网络信息冗余问题严重,使得用户无法从大量数据中获取真正需要的信息。如何通过用户数据找到用户所需信息和商品是一个值得研究的问题,推荐系统为解决该问题应运而生。协同过滤推荐技术是目前推荐系统中应用最广泛的技术之一,主要思想是找到相似的用户或者商品进行推荐。SVD和Slope One算法属于协同过滤算法,能有效的实现推荐预测功能。但推荐系统中也存在大量文本数据未被有效利用,比如用户评论,用户标签等。而用户数据中的不平衡性,稀疏性等缺点是推荐系统的另一大问题。为解决这些难题,本文主要工作如下:第一,探索协同过滤算法中Slope One算法的原理,针对Slope One算法忽略用户之间相似关系的问题,通过实验,分析了不同用户相似度刻画的用户关系对Slope One算法预测精度影响,提出一种加权的用户相似度计算方法,引入用户关系,改进Slope One算法预测精度。第二,深入研究了SVD算法的原理,针对SVD模型,未考虑用户样本不平衡的问题,融合Slope One算法增强信息缺失用户数据,提出Slope-SVD算法。该算法在初始阶段对数据不平衡用户问题进行处理,同时也在一定程度上减弱了矩阵稀疏性的问题,增加了预测的准确性和算法的可用性。且因为Slope One算法简单、高效,所以该算法适用于在线等实时性要求较高的场景。第三,传统的协同过滤算法忽略文本标签数据。为解决该问题,融合Word2vec算法,将用户和电影文本标签融入本文所提出的Slope-SVD模型的训练过程,使得训练过程能提供更多有效数据,且根据每个样本中隐因子和文本标签因子提供信息量不一致的情况,加入权重向量进行选择。基于MovieLens数据集设计算法实验,通过对比不同算法的MAE指标阐明上述改进算法具有很好的预测精度。
其他文献
现今的小学数学的教学,对小学生逻辑思维能力的培养十分重视,它不仅有利于夯实小学生的数学基础,更可以有效促进小学生数学综合素养的提高.逻辑思维能力是数学的核心能力,在
<正> 信息哲学所阐释的物质(直接存在)和信息(间接存在)双重存在和双重演化的理论,为哲学的价值论研究提供了某种全新研究视角。这一全新研究视角不仅涉及对价值存在范围和价
会议
我国家族企业还比较年轻,缺乏完善的继任管理机制和程序。如今家族企业正处于从创业到成长、实施代际传承重要时期,其继任管理问题就显得十分复杂和独特,甚至关系到企业的生死存
随着计算机技术、互联网和移动通讯的快速发展,人们生活中的信息量呈指数级的激增,在给人们带来方便的同时,也造成了“信息过载”的现状。如何从这些海量信息中找到自己所需
<正>书名:区域城市——终结蔓延的规划作者:[美]彼得·卡尔索普威廉·富尔顿译者:叶齐茂倪晓晖出版:江苏凤凰科学技术出版社出版日期:2018年09月开本:16开页码:352页定价:$88
乡村文明是自然、历史、文化、生活的和谐存在,是乡村群众价值体系、道德原则赖以维系的纽带。在城镇化发展背景之下,鲁西乡村处于“边缘化”发展状态,村落不断消失,乡村价值体系
随着市场经济的发展,大学生作为现代市场中一个特殊的消费群体,有着独特消费方式和消费心理,其品牌消费日益成为他们的一种消费方式,也越来越受到社会各方面的关注。品牌是企
<正>信息作为世界的基本存在领域之一,对人类社会的发展与进步无疑具有巨大的价值。其实,人类自其从动物领域脱胎出来之后,就须臾离不开对信息的处理、创制和传播。随着人类
会议
【正】高中数学教学中加强思想方法的教学,已成为数学教学中的重要内容,而化归思想是教学中的一种重要、常用的数学思想方法,从代数到几何,无不渗透着"化归思想"。而新知识的
<正>天井岸汉代礼制建筑遗址位于陕西省三原县西北部的天齐塬上,东南距县城15公里,西北距嵯峨山9.5公里,西距唐崇陵约4.5公里(图一)。该建筑遗址由天井坑遗址和五处夯土台遗