基于项目分类和K-means聚类的加权Slope One算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:jiangjuexin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐算法是现实世界应用最广泛、最成熟的算法之一。本课题研究的Slope One算法就是一种基于项目的协同过滤推荐算法,该算法因其简单高效的特点受到众多学者的青睐。但该算法将所有用户和项目看的同等重要,当数据集过于稀疏时算法的预测精度和可扩展性都面临严峻挑战。针对这些问题,本课题提出了相应的改进措施。首先,简单介绍了推荐系统产生的背景和研究现状,描述了协同过滤推荐算法的相关知识。紧接着重点讲解了Slope One算法的相关内容,总结了算法的优缺点,并提出相应的改进方案。其次,随着用户和项目数量的急剧增长,计算量也随之增加,该情况会导致算法的可扩展性差。因此本文考虑利用项目分类信息划分评分矩阵,使Slope One算法的相关计算在目标项目所在的分类矩阵中进行。为了区分用户,引入分类专家,即利用专家用户的评分计算项目间偏差;为了区分项目,引入项目动态k近邻,即利用用户对近邻项目的评分计算偏差和预测评分。这种改进方案不仅减小了计算量,同时还过滤了不相关用户或项目对预测结果的影响,提高了推荐精度。然后,考虑到有的数据集不包含项目属性信息,此时采用K-means聚类方法,利用评分信息分别对用户和项目聚类。对于基于用户聚类的方法,需要在目标用户所在的聚类中寻找该用户的k近邻,然后根据近邻用户的评分计算项目偏差;对于基于项目聚类的方法,需要在目标项目所在的聚类中寻找该项目的k近邻,然后根据用户对近邻项目的评分计算偏差和预测评分。该方案同样可以减小计算量和提高预测准确性。最后,通过实验验证本文提出的改进算法的预测准确性优于原算法。
其他文献
目的:通过讨论脑梗死的临床护理措施及体会从而提高自身的护理水平。方法:回顾性分析上蔡县人民医院在2012年9月至2013年7月期间收治的经诊断明确的78例脑梗死患者的临床资料
"灵性课堂"追求的是学习内容、学习方式、学习情感等维度的一种最佳平衡状态。将数学绘本与教材整合,课堂情境与绘本故事整合,课堂问题与绘本问题整合,能让数学像艺术一样触
液压打桩锤是一种新型打桩设备。设计出这种桩锤的新型液压系统, 建立系统的数学模型, 并运用软件里的Simulink工具箱在计算机上进行数值仿真求解, 绘出相应曲线图, 从理论上
就常规水提法和超声波辅助提取法提取紫山药多糖的最佳工艺条件与影响因素进行筛选与优化,并对所提取的粗多糖进行了自由基清除能力评价。结果表明,常规水提法的最佳工艺参数
<正> 腱鞘炎是由长期从事手指和腕力劳动过度劳累或兼感受寒湿引起的腕部腱鞘病。本病在祖国医学中属于“伤筋”、“筋痹”的范畴,认为是劳伤经筋,气血运行不畅所致。鉴于本
英语课堂沉默现象是困扰诸多教师的难题,沉闷的课堂严重影响教学效果。该文从教师因素分析了形成英语课堂沉默的主要原因,立足于教师话语,探析打破英语课堂沉默的有效途径,在
<正> 茶树喜温暖湿润,对低温较敏感。生长在长江以北,秦岭淮河以南以及长江中下游南部部分地区的茶树,都有可能遭到低温的威胁。茶树一般在极端最低气温低于-12℃(大叶品种稍
主要运用功能对等翻译理论对当代中文电影片名的英译进行研究,通过文献阅读、文本研究、综合分析的方法,对当代电影片名英译的现状进行分析。除此之外,进一步对电影片名翻译
目的 :研究肿瘤病人舌苔变化与唾液中人上皮生长因子h -EGF含量的关系。方法 :采用1 2 5 I放射免疫分析法 (RIA )。结果 :15 2例肿瘤病人唾液中h -EGF含量为 (4.0 70± 1.0 )
<正> 一九八六年四至五月期间,我应千叶县日中友好协会邀请,到日本访问,调查日本收藏的中国古代版画,在日本呆了一个月,访问之外,也为中日文化交流进行了一些有益的活动,包括