论文部分内容阅读
基于协同过滤的推荐系统是解决信息过载问题的一种很好的方案,而且能够提供一对一的个性化服务。但是基于协同过滤的推荐算法同样也而临着一系列的瓶颈问题,其中对于协同过滤算法的性能影响最大的因素之一是数据稀疏性问题。推荐系统中存在大量的项目,而每个用户只对其中很少一部分项目进行了评分,从而导致评分数据的稀疏,而由于评分数据的稀疏给最近邻居的准确选取增加了难度,从而导致推荐的不准确。本文针对现有推荐系统中的数据稀疏性问题进行深入研究,主要工作如下:1、从相似度计算的角度出发,分析传统相似性度量方法存在的弊端,根据主体(用户或者项目)问的共同评分项数确立目标主体与其他主体之间的邻居等级,并在邻居等级的基础上改进相似度计算方法,使相似性的度量能够更加的准确,继而提出基于改进余弦相似性的协同过滤算法。实验结果表面,该算法能够有效提高推荐的准确度。2、从缓解稀疏评分矩阵的角度出发,分析数据稀疏性产生的原因,并提出了基于项目与众数法空缺评分填补的协同过滤推荐算法,该算法在进行目标用户最近邻居选取之前,先对原始的数据集进行空缺评分填补的预处理,以降低数据集的稀疏性。空缺评分填补以原始数据集作为基础,先使用改进的余弦相似性度量方法计算项目之间的相似度,再根据项目的相似度对原始数据集进行众数法评分填补,缓解评分数据的稀疏性。在填补后的评分矩阵上同样采用改进的余弦相似性度量方法来计算用户之间的相似度,提高用户相似度的准确性,最后,以此相似度选取用户的最近邻居。实验结果表明,该算法可以在一定程度上有效的改善因数据稀疏性而带来的最近邻搜寻不准确的问题,提高推荐系统的准确度。3、分析推荐系统冷启动问题所产生的原因,提出基于评分众数的协同过滤推荐系统中冷启动问题解决方法,该方法采用不同的评分众数选取方法来解决新用户和新项目问题。实验结果表明,该方法能在一定程度上解决冷启动问题。