基于近邻协同过滤算法中相似性度量的研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:raoxinyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web2.0的快速发展,信息过载替代原有的信息匮乏已成为用户在互联网获取信息时所面临的最大问题。推荐系统正是为解决这一问题而产生的,而推荐算法是整个推荐系统的核心。近年来,协同过滤推荐算法由于其独特的优越性在很多领域受到人们的关注。基于近邻的协同过滤推荐算法是协同过滤算法中最为直观的一种算法,其构建主要依赖于两个方面的因素:相似性度量和近邻的选择。近邻协同过滤算法存在一个内在的假设,即相似性越强的两个用户对同一项目的评分越一致,同一位用户对于相似性越高的项目对评分越一致。相似性是利用评分矩阵、用户以及项目特征确立的用户之间和项目之间的潜在关联程度,也是构建近邻集合的基础。准确衡量用户之间和项目之间的相似度关系,进而确定合适的最近邻集合,对最终推荐结果起到至关重要的作用,也是推荐算法需要解决的一个重要问题。本文对八种不同的相似性度量分别取不同规模的近邻来进行评分预测,在分析它们对模型精度的影响后,选取其中的部分预测模型构建一个混合评分预测模型,并进行性能对比分析。在标准的Movielens数据集上进行交叉实验。单个模型在数据集上的实验结果表明相似性度量与近邻规模对评分预测模型的影响很大;融合后的评分预测模型在数据集上的实验结果表明混合的评分预测模型在稳定性、预测精度等方面均有所提升。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
本文考虑二维波动方程组的柯西问题,在小初值的前提下,研究了其经典解的生命跨度,推广了前人已有的结果.  在绪论中介绍了二维波动方程及方程组的研究背景和研究现状,并给出了
时滞现象在实际工程问题中是普遍存在的,如通讯系统、生物系统、化工过程以及电力系统中均存在时滞。时滞的存在使得系统的分析与综合变得更加复杂和困难,同时时滞的存在也往往
青年教师是一所学校的未来,特别是在延迟退休基本已成定局的社会大背景下,青年教师能否快速成才、成材率的高低、年轻一代的名师团队能否形成,将决定着学校的生存与发展!
乡镇党委是发展农村经济、维护社会稳定的直接指挥者,其领导能力的高低,直接影响到农村经济发展和社会稳定;乡镇党委面对广大农民群众,与群众联系最经常、最直接,干部的一言
萍乡市因煤而兴。但随着时间的推移,萍乡的煤资源已近枯竭,是全国首批12个资源枯竭城市之一。2009年以来,萍乡市委、市政府在省委、省政府的正确领导下,实施了“坚 Pingxian
线性空间、Riesz空间(Banach格)、赋范空间(Banach空间)的分解(含直和),一直是空间结构性质研究的重要方面,比如n维欧几里得空间Rn就是n个实数空间的直和,经典的数列空间lp可视为可数
伴随着科学技术现代化和信息化技术的迅速发展,公共图书馆也进入了自动化、网络化、现代化、数字化的信息资源创新时代,在建立健全公共文化服务体系的召唤下,公共图书馆服务
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着由传统教育机制向素质教育机制的转变,规章制度的约束已经不能成为学校管理模式的中心,因为我们看到了人在整个管理系统中的中心地位。所以,学校管理尚须以人为本,用人文精神