论文部分内容阅读
推荐系统的信息来源具有多样性和特殊性,如何高效挖掘用户偏好信息一直都是推荐系统研究的重点。然而大规模增加的用户和项目信息必然给推荐系统带来冷启动、稀疏性以及用户兴趣偏移等问题。因此,充分利用用户、项目、用户-项目评分矩阵等信息对评分矩阵进行填充能有效改善推荐系统面临的冷启动和稀疏性等问题。本文针冷启动、用户-项目评分矩阵高缺失值等问题进行改进,提出了不同源聚类集成算法,在集成过程中除了使用用户-项目评分信息,还充分利用了用户、项目信息,并进一步提出了面向推荐系统的稀疏矩阵填充算法。首先使用不同源聚类集成算法去整合用户、项目以及评分信息聚类的结果,得到改进后的用户、项目近邻集合。其次,在保证矩阵分解前后用户(项目)间相似性一致时,本文对经典正则化矩阵分解模型的目标函数进行改进,将用户(项目)的前k个近邻集合作为优化的约束条件加入目标函数中。该方法使得模型在遇见新用户、新项目以及评分矩阵稀疏的情况下,可以利用用户信息、项目信息计算用户、项目的相似度,以此缓解冷启动、稀疏性问题。最后使用梯度下降法进行优化求解,解得因子矩阵P和Q,并用二者乘积作为预测评分结果对评分矩阵进行填充。在该算法中,融合用户、项目近邻模型的矩阵分解以及对不同源聚类集成算法进行改进,从理论上缓解了冷启动、稀疏性等问题,且一定程度上提高了评分矩阵填充的准确性。本文在经典的MovieLens数据集和电商真实数据集上进行实验,将本文提出的k-CE-MF算法和其他基于矩阵分解模型推荐算法的评分矩阵填充结果进行比较和分析。实验结果表明,提出的面向推荐系统的稀疏矩阵填充算法能够更准确的对用户-项目评分矩阵进行填充,较好的缓解冷启动、稀疏性问题,而且在较丰富、全面的用户、项目信息数据集上具有更好的效果。