基于K-means聚类的协同过滤推荐算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:qinlufang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和信息服务的飞速发展,网络当中会充斥着大量的冗余信息。这些内容会呈现出指数增长的态势,从而产生了信息超载的问题。个性化推荐系统的出现很好的解决了这个问题,也给人们带来了很大的方便。但是,传统的协同过滤推荐算法由于系统规模的增大,会出现很多的问题。本文则对其中的数据稀疏性以及算法扩展性问题进行了优化。首先,针对数据的稀疏性问题和算法的扩展性问题,本文提出了一种优化聚类中心的用户聚类推荐算法。该算法首先基于Weighted Slope One算法消除掉评分数据矩阵当中的未评分项,对原始数据通过预处理来减小其稀疏性;然后对预处理后评分数据采用基于最小方差的K-means算法进行聚类,通过将相似的对象聚到一起来减小目标用户之后的最近邻搜寻空间,提高了算法扩展性;最后利用传统的推荐算法生成最终的结果。其次,针对数据的稀疏性问题,本文提出了一种改进相似度计算的用户聚类推荐算法。针对传统相似度计算所存在的缺陷,算法首先对初始的评分数据矩阵基于时间遗忘函数进行修正,以解决用户兴趣随时间衰减的问题;然后对传统的相似性度量方式基于用户偏好度以及用户特征向量进行改进,通过引入一些隐性因素,使得最近邻的搜寻更加准确,缓解了数据的稀疏性;最后在基于最小方差的K-means簇类当中利用传统的推荐算法做出推荐。最后,基于Movielens数据集实现优化聚类中心的用户聚类推荐算法。通过对比实验表明,该算法可以在一定程度上缓解数据稀疏性以及算法扩展性问题,具有较高的推荐精度。另外,基于Movielens数据集实现改进相似度计算的用户聚类推荐算法。通过对比实验表明,该算法能有效的处理数据的稀疏性问题,推荐精度方面也有所提高。
其他文献
解放以后,我国人口增长迅速,过多的人口严重制约着经济社会的可持续发展。面对日益严峻的人口形势,作为党和国家领导人,周恩来率先提出一系列正确的人口控制思想,有效遏制了
动态变形是动画创作中重要的组成部分。本文以动画创作中动态变形的应用为研究载体,通过对动态变形的分类和表现形式、艺术特征、风格等方面进行比较和论证,重点对动态变形在
随着宽带技术的逐步发展,越来越多的业务承载于家庭宽带网络中。用户足不出户就可体验到视频点播、宽带上网和IP语音等多种服务。用户对于带宽容量及网络稳定性的要求逐步提
2009年2月28日,我国《刑法修正案(七)》增设利用未公开信息交易罪,标志着我国开始运用刑罚手段震慑严重危害社会的“老鼠仓”犯罪。利用未公开信息交易罪与内幕交易、泄露内
亚太经济合作组织(APEC)是目前亚太地区最大的区域性经济组织。中国作为APEC中最大的发展中国家,深受该组织的影响。一方面,利用APEC,中国可打破国外某些集团对中国的封锁,缓冲作为非WTO(世界贸易组
影片《暗恋桃花源》是对互文性理论极佳的艺术注解,在《暗恋》和《桃花源》之间的互文性演绎关系中叙述了一个永恒的情感困境。该剧作之所以能够风行20多年,不仅在于其突破性
<正> 一、关于抽象力和抽象法问题《资本论》第一卷第一版序言中说:"分析经济形式,既不能用显微镜,也不能用化学试剂。二者都必须用抽象力来代替。"这里所说的抽象力同抽象法
体育作为人类生活的重要现象,随着当前社会的不断发展中,逐渐在体育中显示了人类文明的进步。而电影作为人类传播文明与精神的载体之一,能够与体育有着很好的契合点,自然而然