基于组合策略的电影推荐系统的研究

来源 :天津商业大学 | 被引量 : 0次 | 上传用户:killlikk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展使人们从当初的信息匮乏时代迈入了信息过载的时代。在电影为代表的互联网视频资源信息平台中,传统的搜索引擎通过关键字来获取信息,如果关键字的准确度高则可能得到自己想要的答案,如果准确度不高,那么搜索结果就会出现大量选项信息,用户不仅会花费大量时间,而且不一定能得到自己需要的信息,因此,通过输入关键字搜索技术已满足不了用户个性化的需求。个性化网络时代是希望系统能从用户的数据中分析用户的行为,发掘用户的兴趣偏好,为用户找出符合其需求的信息资源。推荐系统的出现满足了用户的这一需求。首先,本文分析了国内外相关文献资料,了解到早期的推荐技术是通过用户对物品的评分,得到评分矩阵建立相似性来划分近邻,依据与他相邻的用户喜好也类似的思想,完成推荐。然而,随着电影数量不断的增加,用户仅对少量电影进行评分,建立的评分矩阵较稀疏,导致推荐算法的准确度下降。因此,本文通过组合策略的思想来对电影推荐进行研究。然后,文章介绍了目前广泛应用的几种推荐技术。讲述了这几种推荐技术研究的内容及应用现状,针对稀疏数据推荐效果不佳问题,利用GroupLens提供的MovieLens 20m数据集,设计了改进的基于内容和协同过滤组合推荐算法模型。该算法的思想是利用电影的特征信息和用户的评分信息,得出每个用户对电影不同特征的评分数值,通过每个用户喜欢的项目特征情况,将喜好相同的特征用户聚类。给出推荐时,第一步通过数据分析确定用户喜欢的特征类型,并将相同用户聚为一类,之后计算用户与类中其他用户的相似性,最后,根据近邻来完成推荐。最后,介绍了基于SVD的协同过滤推荐,通过奇异值分解,将评分矩阵分解成两个正交矩阵和一个对角矩阵的乘积,利用奇异值分解后的数据集来表示原始数据集,去掉那些线性相关的冗余数据,从而在数据处理过程中减少不必要的属性和特征,然后,借助基于用户的协同过滤思想完成推荐。最终,通过RMSE(均方根误差)、MSE(均方误差)、MAE(绝对值均方误差)的比较,表明论文的组合算法策略优于传统的推荐算法。
其他文献
在日内高频环境下检验基于兼容法的柯尔莫哥洛夫熵、样本熵和模糊熵等复杂度测算方法对我国沪深300股票指数的测算效率,并运用筛选后的有效算法分阶段研究和比较了序列复杂度
目的:探索系统心理干预对初中生自杀意念与抑郁的影响情况。方法:采用分层整群随机抽样的方法,对上海市松江区某所初中的609名初中生进行一般情况问卷、自杀意念自评量表(SIO
目的观察脑蛋白水解物片对脑梗死恢复期的临床疗效,分析其可能的作用机理,以求为临床治疗提供有效的药物。方法选择2008年10月~2010年9月符合脑梗死恢复期诊断标准的患者92例,
挤压铸造又称液态模锻,是一种介于压力铸造与锻造的成形工艺,金属在压力下充型和凝固,并进行强制补缩,使得挤压铸造件具有晶粒细小、组织致密以及无缩孔缩松等特点,其力学性
长篇小说《红岩》中的叛徒甫志高形象,是由"重庆地下党破坏案"中任达哉、刘国定、冉益智、涂孝文、蒲华辅等真实叛徒"综合"而成。对于真实本事的"综合"办法包括接近实录、彻
目前,我国扶持小微企业发展的财政政策存在资金规模较小、支持小微企业科技创新和融资政策力度不够、税收政策不完善等问题。为促进小微企业的快速发展,我国应加大政策性财政
目的:观察益智宁方煎剂对注意缺陷多动障碍(ADHD)动物模型——自发性高血压大鼠(SHR)前额叶皮质及纹状体中多巴胺(DA)及其代谢产物——3,4-二羟苯乙酸(DOPAC)、高香草酸(HVA)含量的影响。
湿地资源是我国极为重要且分布较广的一类地理资源,特别是在当今乡村振兴的大环境下,湿地及其周边乡村地区的生态环境和综合开发利用越来越受到人们的关注。本文以山东章丘白
通过对卡拉麦里~莫钦乌拉成矿带区域地质背景、成矿地质特征、矿床地质特征等的研究总结,初步认为苏吉金矿具有有利的成矿地质条件与找矿前景。
电火花加工可加工任意导电材料,并且在加工过程中工件与工具电极不接触,为非接触加工。微细电火花可加工微型孔及其他形状的微型腔,且加工能力与工件材料的硬度、强度无关。