基于聚类的协同过滤个性化推荐算法研究

被引量 : 0次 | 上传用户:yec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的快速发展,信息资源成指数级别增长,面对严重过载的信息,用户很难快速定位到对自己有用的信息资源,从而耗费大量的时间搜寻自己想要的内容。这使得推荐系统应运而生,它能够根据不同用户的喜好来有针对性地为其提供个性化推荐服务。目前,在众多的个性化推荐技术中,协同过滤算法表现出其独有的优势,以致它被广泛的应用,特别在电子商务领域取得了相当大的成功,但是传统的协同过滤算法存在数据稀疏性、冷启动、实时性等问题,如果能有效的克服,不仅能够提高用户满意度,同时还提高销售利润。本文以推荐系统为基础,以推荐技术为主线,研究了个性化推荐系统,个性化推荐算法及相关技术,并进行比较分析;接着针对目前应用较好的协同过滤算法的问题,引入了项目属性和用户特征来构建项目属性矩阵和用户特征矩阵,提出基于用户相关相似性和基于项目相关相似性计算方法;另外,对聚类技术进行了相关研究,利用Kruskal算法对传统K-means聚类进行改进,实现自动确定初始聚类中心;最后对基于用户和项目方向的聚类进行了相关研究,提出将基于项目属性聚类的初始预测结合基于用户特征聚类的最终预测来做出推荐。主要在如下几个方面做了研究工作:第一,针对传统协同过滤算法过度依赖于用户—项目评分矩阵会面临严重的数据稀疏性问题、冷启动问题,本文将用户特征信息和项目属性信息有效利用,避免出现“相似而不相同”的现象的同时也克服了新项目和新用户问题,提出了分别基于项目属性和基于用户特征相关的相似性计算方法;第二,对传统K-means聚类进行了深入研究,针对其初始聚类中心人为随机选择敏感的问题,提出了一种能够自动生成相对比较均匀分布的K个初始聚类中心的改进聚类算法;第三,为有效的降低了协同过滤算法中近邻查询空间,同时在项目属性和用户特征矩阵上分别采用改进后的聚类算法进行聚类,明显能降低计算维度,提高推荐效率;第四,针对用户评分稀疏性问题,结合基于项目聚类的邻居查找结果和原始评分矩阵做基于项目的初始预测填充原始评分矩阵。其中,缺乏评分的新用户或新项目用本文前面改进的相关相似性计算方法代替传统评分相似性查找邻居,克服了冷启动问题;最后,将基于用户聚类的邻居查找结果结合填充完好的评分矩阵做基于用户的最终评分预测,使推荐精度较高。第五,为了验证本文提出的改进算法的有效性,在所选MovieLens数据集上分别将该改进的协同过滤算法与一些传统的协同过滤算法进行了分析和对比实验。实验结果表明该方法最终推荐质量优于其他传统推荐算法。
其他文献
本文运用对比法,从中美两国教育哲学的定义、发展历程、研究人员三个方面进行了研究,最后得出结论:中国教育哲学的发展要重视教育哲学思想的建构、努力推动教育实践及提高研
党的十八届三中全会要求加快形成科学有效的社会治理体制,推进国家治理体系和治理能力现代化。本文将创新社会治理放到国家治理体系和治理能力现代化的大战略中去认识,注重跟
中药之毒有广义(药物偏性)和狭义(毒副作用)之分,“含毒中药”即指后者。一般而言,中药毒性是由药物所含有毒成分引起的毒性反应,毒性成分不同,其毒理机制及毒性反应的表现亦不同。含
现如今,初中生处于懵懂的青春期,他们站到人生的十字路口上,教师是学生的引路人,有责任和义务引导初中生们树立正确的世界观、人生观、价值观和学习的观念。语文学科因其独有
为解决目前大学生就业指导课程教学模式缺乏新意、就业指导观念落后、课程体系保守陈旧的问题,本文提出了建立以学生情商建设为重点,以课程情景化教学互动与学生情趣化学习为
随着城市的发展,我国大量人口聚集城市,城市土地的需要也持续增长。专家称到2014年,我国的城市化水平虽将超过54%,但远低于世界平均水平,与发达国家相去甚远,我国的城市化道
面对新课程的新要求,教师自身对"假说—演绎法"的认识程度,将关系到学生领悟"假说—演绎法"的深刻与浅薄。教师对"假说—演绎法"的认识提高了,才能做到教学中有意识引导学生
使学生获得数学活动经验是义务教育数学课程标准所提出的数学课程目标之一,但在实际的教学中这一目标并未得到重视。从教育哲学、数学、数学学习心理学及新课程实施等角度来
2009年1月1日起,我国义务教育学校开始实施绩效工资,主要是通过制度变革,提高教师待遇,强化教师激励,促进教育均衡。自2010年1月1日,包括高中及其他大中专院校在内的其他事业
公共交通是城市经济和社会发展的重要基石,其管理模式理应与城市交通需求的增长和居民生活水平的提高相适应。为满足和实现城市和社会的可持续发展,倡导低碳生活模式,落实低