基于邻域关系的协同过滤算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:liongliong480
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,互联网已经成为人们日常生活中不可或缺的一部分。然而互联网的信息过载问题,使得人们无法从海量信息中提取自己需要的信息。为解决该问题,推荐系统应运而生,其核心思想是通过用户历史行为数据猜测出用户的兴趣爱好,并且根据猜测的爱好推荐相匹配的商品信息。协同过滤是推荐系统应用得最为广泛的技术之一,其关键步骤包括为目标用户选取近邻和对商品进行预测评分。但大部分用户的行为数据具有稀疏性,这为近邻的选取以及商品的预测带来了挑战。本文在稀疏的用户行为数据上,结合近邻的快速搜索方法以及近邻的传播方式来研究协同过滤方法,较好地解决了数据稀疏性和预测准确性的问题。本文的创新工作总结如下:(1)提出基于快速近邻搜索的协同过滤算法。在协同过滤算法中,组合相似度相比于简单相似度具有更高的推荐准确率。但在近邻搜索时,采用组合相似度的时间开销比采用简单相似度的要大很多,从而降低了推荐效率。为此,本文提出基于快速近邻搜索的协同过滤算法。首先,根据用户的评分习惯,将行为数据划分为高、中、低兴趣三个部分,反映了不同兴趣程度的物品空间。然后,在相对应的物品空间中分别选取近邻,并且通过近邻传播获取间接近邻。最后,对三个物品空间中的近邻用户进行合并作为目标用户的最终近邻集。在三个电影数据上的仿真实验验证了本文算法既可以提升时间效率,又能在一定程度保证推荐准确性。(2)提出基于子空间集成的近邻搜索的协同过滤算法。一般来说,快速算法会带来某种程度的性能损失。为了提高基于快速近邻搜索的协同过滤算法的性能,本文提出了基于子空间集成的近邻搜索协同过滤算法。在划分了三个物品空间之后,本文定义了共同评分支持度来计算用户之间的可信任度。通过加权把三个物品空间融合为一个空间,在此空间中进行近邻搜索。由此生成的近邻用户集体现了不同物品空间之间的差异性,又减少了无效近邻用户的影响。在三个实际数据集上的实验结果表明所提方法具有较好的推荐性能,不仅能提供好的近邻用户且所花时间代价也不大。(3)提出基于近邻迭代预测的协同过滤算法。数据稀疏性问题不仅对近邻的选取有影响,而且对商品的预测也有很大的影响,这两个步骤正是协同过滤推荐算法的核心。为了进一步提高推荐算法的性能,本文引入邻域传播的思想,提出了基于近邻迭代预测的协同过滤算法。该算法通过利用近邻的传播来传递信息,从而实现迭代地更新物品的预测评分。在迭代过程中,考虑近邻用户所提供评级信息的可靠性,加入了传播权重,且传播权重是随着迭代次数衰减的。实验结果表明,所提出方法有较好的预测能力,能够提高了推荐的准确度,较好地解决了协同过滤算法中存在的数据稀疏性的问题。(4)基于上述提出的算法,本文开发了一款电影推荐系统。该系统通过用户的注册与登陆记录用户历史评分与推荐结果,并且会根据用户对所给出电影提交的评分,自动生成新的、更加符合其兴趣爱好的电影集合。另外,在主界面上,通过对用户推荐当前热门电影,可以收集到用户的偏好,这样也为用户能够获得更加准确的推荐提供有效的信息。
其他文献
【正】一、德国的双元制职业教育模式德国双元制教育模式是目前世界上比较成功的职教办学模式之一,被誉为德国二战后经济腾飞的"秘密武器"。所谓双元制,是指学生在企业接受实
【正】21世纪是信息时代,在这数字时代里网站作为信息的传播工具正发挥着越来越重要的作用,这就要求我们培养出更多能够从事网站制作的工作人员。但学习网站设计制作的学生在
运用常规气象观测资料、NCEP/NCAR六小时再分析资料、风云卫星气象资料以及多普勒天气雷达资料,对1522号台风"彩虹"登陆后广西风雨成因进行诊断分析,结果表明:进入广西境内后
<正>在水热合成条件下,3-(4-羟基吡啶鎓-1-基)邻苯二甲酸与稀土金属Nd的盐以及草酸钠反应,得到了具有三维框架结构的稀土金属Nd的配位聚合物,它的化学式为{[Nd2(DPPA)2(C2O4)
目的:为了使瑶医药研究更为丰富与完善,本文在系统整理瑶医药学派相关文献的基础上,通过介绍瑶医药学派的概念、特点、形成与发展、代表人物及其学术贡献、学术特色、成就和
目的分析缬沙坦联合阿托伐他汀治疗高血压伴高血脂患者的疗效。方法选取2014年5月~2014年8月我院收治的高血压伴高血脂患者120例作为研究对象,将其随机分为对照组和研究者,各6
作为城市老年人最常用的户外活动空间,城市绿地是实现“老有所乐”最为重要的场所。而在城市绿地中,绿道又是深受老年人喜爱的一种,相较于传统的城市公园,城市绿道在运动康养
目的 分析颅脑术后并发急性脑积水的早期观察与护理方式。方法 研究的实验对象为2013年5月至2015年7月100例颅脑术后并发急性脑积水患者,根据患者住院编号奇偶随机分成护1组
基于2006年CHNS数据,本文采用分层模型对我国居民家庭教育支出进行实证分析。在对家庭教育支出的变异进行分解时,我们发现社区间家庭的教育支出存在着显著的差异。研究还发现
用HPLC法预测氟哌酸滴耳液的有效期。色谱条件:ODS柱,甲醇:0.008mol/L,磷酸盐缓冲液:0.5mol/L,四丁基溴化铵(25:75:3)为流动相,吡哌酸为内标物,于280nm处检测。结果表明:氟哌酸滴耳剂的有效期为3.47年。