论文部分内容阅读
互联网的快速发展让人们进入了信息过载时代,用户在网络上寻找信息犹如大海捞针一般,而推荐系统则可以主动为用户推荐其感兴趣的信息,作为推荐系统的核心组成部分,推荐算法备受重视。协同过滤算法作为目前应用最广泛的一种推荐算法,受到国内外众多学者研究,提出了很多优化和改进方法,并获得了不错的效果,但是数据稀疏、片面关注用户评分信息、用户兴趣漂移等问题仍然存在并且长期存在。本文提出了一种基于用户评分与类别聚类的个性化推荐方法(URCC-CF),对传统的基于用户的协同过滤算法进行优化。主要研究工作包括:(1)用户的兴趣偏好会随时间推移而发生变化,即存在用户兴趣漂移问题。本文基于艾宾浩斯遗忘曲线来构建时间因子对用户评分进行加权修正,早期的评分赋予较低权,近期评分赋予较高权重。采用SVD算法对用户-项目评分矩阵进行降维填充,一定程度上缓解了稀疏性,提高相似性计算的准确性。(2)传统的用户相似性计算仅考虑用户的评分,然而用户评分不是衡量用户偏好的唯一因素,用户对项目类别的偏好在很大程度上也体现了用户的相似性。本文综合项目类别偏好、项目类别比例和主观评分偏好三个指标构建用户-类别评分矩阵,并根据其结果为用户进行偏好聚类,提高了用户分类的准确性。综合用户-项目评分相似性与用户-类别评分相似性生成综合相似性,提高了预测评分的准确性。(3)协同过滤推荐中常用的聚类算法普遍存在因为聚类中心的随机性而产生的目标函数陷入局部最优解问题。本文采用花朵授粉算法确定聚类中心,优化模糊C均值聚类算法,对用户进行基于项目类别偏好的聚类,有效解决的局部最优解的问题,同时仅在类簇内进行最近邻查找,缩小了查找范围,有效提高了推荐方法的计算效率和可扩展性。通过在公开的MovieLens数据集上进行检验,证明本文推荐方法有较好的推荐性能。首先通过对比研究确定算法涉及到的最优参数,之后将本文算法与其他三种推荐算法进行对比,证明本文算法在准确度和覆盖率上均优于其他算法。后对比分析了本文提出的基于花朵授粉算法优化的模糊C均值聚类与K-means聚类,实验结果表明本文所用聚类算法能够有效提高用户聚类的准确性。