论文部分内容阅读
个性化推荐系统是互联网时代以及人类文明发展的必然产物。面对复杂繁多的互联网信息,人们往往会觉得不知所措,找不到自己需要的东西,于是在这种需求环境中,推荐系统诞生了。推荐系统是能够自动为人们提供满意信息的智能系统,而个性化推荐系统是为人们提供满意信息的同时,满足人们的个性化需求的智能系统。协同过滤推荐技术是个性化推荐系统中最为成功的技术,它是利用用户项目评分数据,以用户之间或者项目之间相互协作的方式来产生推荐。然而,由于信息的不断膨胀,协同过滤推荐技术依然有很多问题需要研究与解决。其中,评分数据的稀疏性、冷启动等问题一直是阻碍推荐系统的推荐精度与推荐效率进一步发展的主要因素。本文从数据的稀疏性及冷启动问题出发,从推荐的准确性角度展开研究,主要做了两点工作。(1)针对数据稀疏性问题,提出了一种改进的基于K均值项目聚类的协同过滤算法。由于传统的基于K均值项目聚类的协同过滤算法忽略了数据稀疏情况下计算项目间相似性的不准确性,而导致推荐精度不高的问题。本文提出改进方法,首先经过数据预处理过程,保证数据在进行项目聚类时的完整性;然后结合K均值聚类算法划分出项目的类簇;接着,在最近邻居查询过程中,依据目标项目所处类簇中的项目数量大小,选择是否对目标项目进行再次相似度计算,从而选出最近邻居集合;最后,根据相似度加权评分公式进行评分预测,最终产生推荐。(2)针对新用户冷启动问题,提出用信息扩展的概念来解决新用户冷启动问题。主要采用全局项目的用户信息扩展技术,提高新用户由于评分极少导致的推荐精度不高问题。首先获得目标项目的相似项目集合,通过相似项目的评分数据扩展新用户的评分信息,然后通过用户之间相似度的计算,得到目标用户的最近邻居集合,最后,根据最近邻居用户的评分,利用相似度加权评分公式预测评分,最终产生推荐。本文在基于用户的协同过滤算法的基础上,采用对新用户进行信息扩展的方法,提高新用户相似度的可计算性,从而提高算法的推荐精度。