论文部分内容阅读
近年来,随着信息技术的飞速发展以及移动设备的全面普及,互联网中的信息呈爆炸式增长,造成了“信息过载”问题。为了缓解这一问题,推荐系统利用用户信息、项目信息等相关内容来预测特定项目对用户的实用性或相关性,为用户提供推荐服务。这种方式主动挖掘用户的兴趣偏好,帮助用户发现感兴趣的内容,提升了用户体验,缓解了“信息过载”问题,已经成功应用到电子商务、音乐、视频等领域。目前,为了进一步提升推荐系统的性能,针对个性化推荐算法的研究不断深入,不同场景下的推荐算法相继被提出。其中基于矩阵分解的推荐算法凭借其推荐准确率高、可扩展性强、运行速度快等优点,成为推荐算法领域中的研究热点。本文分析了传统矩阵分解推荐算法中存在的一些问题,提出了两种改进的矩阵分解推荐算法,以提升推荐效果。本文的主要工作和贡献如下:(1)提出了基于评分可信度的矩阵分解推荐算法。在传统的矩阵分解推荐算法中,通常认为用户的评分是真实可靠的,每一个用户都会根据自己的状况做出真实的评价。然而,在实际情况下,用户做出的最终评价可能会受到多种因素影响,不能完全反映出用户的真实偏好,评价质量难以保证。针对以上问题,本文提出评分数据可信度的定义,实现对每一个用户评分数据的可信度衡量,并设计了一种基于评分可信度的矩阵分解推荐算法,使可信度高的评分在模型建立过程中获得更多关注,减小可信度低的评分对模型的影响,让矩阵分解算法更精准的从整体上把握用户和项目的特征信息。在四个真实数据集上的实验结果表明,本文所提出的基于评分可信度的矩阵分解推荐算法可以从海量用户与项目的交互数据中进一步挖掘用户与项目的特征信息,提升推荐系统的整体性能。(2)提出了基于簇间关系的矩阵分解推荐算法。在推荐系统中,用户和项目的规模较大,整体矩阵分解容易忽略强相似用户或者强相似项目之间的关联关系。目前,基于聚类的矩阵分解推荐算法可以解决这一问题,但是对用户与项目之间数据的局部关系和整体关系缺乏有效处理,加剧了数据的稀疏度。针对以上问题,本文提出一种改进聚类算法,使聚类算法更精准地发现相似用户与相似项目,并考虑聚类后簇间数据的关联关系,提出一种基于簇间关系的矩阵分解推荐算法,从局部和整体两个角度综合了用户与项目的特征信息,使孤立的子矩阵分解模型相互关联。在四个真实数据集上的实验结果表明,本文所提出的基于簇间关系的矩阵分解推荐算法能进一步从局部与整体两个角度挖掘用户与项目之间的关联关系,并在推荐准确度方面优于最新的矩阵分解推荐算法。