基于标签和评分联合学习的协同过滤推荐算法研究

被引量 : 8次 | 上传用户:XT327768823
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息技术的飞速发展和互联网络的普及,推动了电子商务的发展。这在方便用户生活和生产的同时,也带来数据过载的问题。推荐系统正是解决这一问题的有效途径,它可以模拟销售人员帮助用户进行购买,减少用户搜索商品的时间;同时也可以帮助电子商务提供商快速发现自己的潜在客户,提高利润。因此,推荐系统成为国内外学者研究的热点问题。推荐系统基于用户的历史行为推测用户的兴趣模型,进而从海量信息库中筛选合适的对象推荐给用户。推荐算法是推荐系统的核心部分。推荐算法大体上可分为基于内容的推荐算法、协同过滤推荐算法、基于网络结构的推荐算法以及由不同推荐算法组合而成的混合推荐算法等。其中,协同过滤算法是主流的推荐算法之一,已被广泛应用于一些商业推荐系统。而基于评分的协同过滤算法备受关注,研究者对基于评分的协同过滤算法进行了深入的研究,取得了可喜的进展。但因数据的稀疏性、冷启动等问题,推荐算法的准确性仍有待改进。因用户及项目的相似度度量是影响推荐质量的主要因素,因此寻找利用其他辅助信息(如:标签信息的利用)来改进相似度度量成了研究者的主要任务之一。为此,本文侧重针对评分数据,围绕用户及项目的相似度度量策略设计、如何有效利用标签信息这两个方面展开研究。论文的主要工作如下:1.提出结合标签和评分的协同过滤推荐算法(UTR-CF).该算法结合标签信息和评分数据设计了一种新的用户及项目的相似度度量策略,克服了仅利用评分数据进行相似度度量的不足。在MovieLens数据集上的实验结果表明,UTR-CF算法可有效提高推荐的准确性,克服数据的稀疏性问题。2.提出嵌入LDA主题模型的协同过滤推荐算法(ULR-CF)。该算法在文档-标签分布上利用LDA主题模型挖掘潜在主题信息,从而获得文档-主题分布,进而基于文档-主题分布与评分数据设计了一种新的相似度度量策略。在MovieLens数据集上的实验结果表明,ULR-CF算法可有效克服数据的稀疏性问题,有效提高推荐系统的推荐准确性。3.提出嵌入局部相似性的矩阵分解算法(ELS-MF)。该算法通过在最小化平方误差函数上嵌入局部相似性约束条件对已有矩阵分解算法进行改进,从而得到隐空间中更加精确的隐变量,获得更准确的推荐结果。在MovieLens数据集上的实验结果表明,ELS-MF算法可有效降低推荐系统的预测误差。
其他文献
本论文针对氨酸工艺生产复合肥在实际生产中所出现的问题进行了探究,采用工厂实地试验与实验室分析相结合的方法,对复合肥生产工艺中除尘、配料、烘干工艺进行了技改升级与实
油田投入生产之后,其产量会随着地层含油饱和度的变化而变化,油、气的产量将减小,水的产量将大幅上升。实时准确地了解地层的动态变化情况,监测地层的含油饱和度,采用测井分
随着互联网的兴起和传播技术的不断革新,特别是随着以智能手机为主的各种移动终端的迅速普及,各种社会化媒体风起云涌,大众传播格局正发生着有史以来最深刻的变化。在新闻门
企业思想政治工作面临认识新常态、适应新常态、引领新常态,要增强企业思想政治工作的实效性和吸引力、感染力,把继承与创新统一起来,把解决思想问题和解决实际问题结合起来
三维CAD系统的快速发展使得三维模型在产品设计中的应用越来越广泛,加快了产品设计的周期,但在实际设计生产中二维工程图仍是主要参考依据。目前的三维CAD软件如SolidWorks,
随着真人秀节目的发展,电视广告也高速发展,为节目方和广告主提供了一个双赢的平台。两者为了更高效的企业营销和节目推广,不断寻求更高效的广告方式,植入式广告也就应运而生
随着社会经济的高速发展,食品行业出现了诸多问题,作为食品企业,不但应该从食品原材料的供给、生产环境、生产加工过程、包装及销售等环节进行严格把控,而且应该对食品企业相
目的:研究大叶车前子胶胶囊对小鼠便秘的影响。方法:将40只小鼠随机分为4组,除正常组外,其他3组造模,造模成功后模型组予面糊,对照组予麦麸溶液,治疗组予大叶车前予胶胶囊溶液,治疗后
石油工业的演化发展将经历常规油气突破、常规油气与非常规油气并重、非常规油气发展等三个阶段。1934年McCollough提出“圈闭学说”标志着常规油气地质理论形成,而二十世纪
室内外空间中古往今来不乏陶瓷艺术的身影,中国陶瓷作为华夏文明的瑰宝闻名于世,在英文中“china”拥有着“中国”与“陶瓷”双重含义,所以从某种程度上陶瓷代表了中国文化在