论文部分内容阅读
协同过滤是到目前为止最成功和应用最广泛的推荐技术,然而,由于用户-项目矩阵极端稀疏导致推荐不精确.针对该问题,本文提出了三种数据填充方法和两种推荐策略.对评分矩阵中未评分数据的三种数据填充方法是:(1)采用行和列数据的加权平均值填充;(2)采用行和列数据的众数的平均值填充;(3)采用行和列数据的中位数的平均值填充.一种推荐策略是直接用填充数据作为预测评分进行推荐;另一种推荐策略是将填充数据后的评分矩阵作为伪评分矩阵应用Pearson相关相似性进行协同过滤推荐.采用GroupLens数据集进行的实验结果表明:上述几种推荐策略均可有效地缓解评分数据稀疏性问题,提高推荐精确度.从平均的预测精确度来看,直接采用三种填充数据作为预测评分进行推荐比传统的基于Pearson相关相似性的协同过滤推荐算法分别提高了3.76%、6.46%和7.63%.;而将填充数据后的评分矩阵作为伪评分矩阵应用Pearson相关相似性进行协同过滤推荐则比传统的基于Pearson相关相似性的协同过滤推荐算法分别提高了6.57%、6.52%和7.60%.