基于SVD和用户聚类的协同过滤算法研究

来源 :青岛理工大学 | 被引量 : 0次 | 上传用户:heheaixixi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和电子商务技术的快速发展,与日俱增的交易、事务得以在网上完成。伴随着的是产生了巨量数据,这些数据是研究用户行为、挖掘深层次信息的巨大财富。这些数据除了具有数据量巨大的特征之外,同时还有数据缺失、不规范,不便于直接分析的特点。为了处理这些数据,推荐算法得到了越来越多的应用研究,其中以协同过滤算法最具研究代表性。随着推荐系统的广泛使用,系统的缺点也不断暴露出来,如数据稀疏,可扩展性差等问题。本文为了解决推荐系统中存在的问题,特别是数据稀疏和可扩展性差的问题,提出了一种基于矩阵分解和聚类的推荐算法。同时为了考虑项目的评价时间对推荐结果的影响,提出了一种时间模型,并将该模型结合到评分预测算法中。实验证明,这两种算法均可以提高推荐算法的性能和推荐质量。本文做的一些研究工作如下:(1)针对数据稀疏、可扩展性差问题,本文提出了一种基于SVD和用户聚类的协同过滤推荐算法。首先对稀疏的评分矩阵的空缺值进行填补。然后对系统中“肥尾效应”的数据进行删除以保证数据质量。在计算相似度时,考虑用户的隐式信息相似性对整体相似性的影响,以保证在相似性计算上结果更为准确。(2)分析了时间因素对推荐结果的影响。在基于用户特征的评分预测中将用户按照年龄、性别和职业进行聚类,然后提出了一种时间影响函数,该函数可以提高近期评分的权重。在基于项目的评分预测中按照项目进入系统的时间,将项目进行聚类。提出增加权值Lu,i来区别对待不同时间属性内的项目评分预测。最后将两种评分预测方法结合起来,综合考虑基于用户和基于项目的融入时间因子的评分预测值计算方法,使得评分预测值更加准确和富有说服力。(3)实验部分使用在MovieLens数据集上验证算法的性能。在基于SVD和用户聚类的实验中对比分析了与其他传统协同过滤算法的差异。验证了该算法在处理数据稀疏和可扩展性问题上效率更高。在融入时间因子的算法实验中,验证了该算法进一步提升了准确率和覆盖率。
其他文献
这篇通讯记述的是内蒙古军区某边防巡逻艇大队政委皇甫建怎样用自己"讲学习、讲政治、讲正气"的表率作用,带出了一个过得硬的领导班子和整个巡逻艇大队的先进事迹。皇甫建同
针对当前国内散客自助游大众化、频繁化的现状,人们对顺畅出行的需求持续增长并日益迫切。本研究从旅游景区视角切人,对景区的标识系统设计进行了综合研究,并据此提出了改进
2009年,北京市委教育工委在北京高校中大力推进辅导员深度辅导工作并明确提出要求“每名学生每年得到至少一次有针对性的深度辅导”后,各高校结合文件要求根据自身情况制定深
阐述了内部公共关系理论在酒店员工管理中的功能和作用,提出了具体的运用过程以及要注意的几个问题。
微电影取材广泛、内容丰富,随着传播平台的网络化和手机化,越来越受到现代人的青睐。本文以情境学习理论为依托,在分析课程目标的基础上,组织中外师生自编自演校园英语微电影
目的:探讨渐进式康复护理在冠状动脉内支架植入术患者心脏康复中的应用效果。方法:选择2013年10月-2015年10月于我院行冠状动脉内支架植入术患者138例,将其随机等分为对照组和
清教主义是美国历史上的一个重要现象。本文探寻清教主义对美国文学的影响。通过对清教主义代表作家霍桑的概略分析,从中发现清教主义在写作素材、写作态度、写作技巧等方面
素质教育是以全面提高教学质量为目标的基础教育。素质教育注重发展学生的个性特长,从多方面培养学生的应变能力。歌唱教学对健全学生的素质,促进健康成长有着巨大的作用。与
国内外高校近年来组建越来越多的跨学科平台来承担和完成重大科研任务。但是,现行的跨学科平台评价模式和教师评价模式在一定程度上阻碍了跨科学研究可持续发展。本文根据若
改革开放以来,随着我国工业化、城市化进程的不断加快,青壮年农民成为社会流动最大的主体。而由于经济、生活等方面的原因,他们的未成年子女只能呆在农村沦为“留守儿童”。随着