论文部分内容阅读
随着互联网技术的快速发展,互联网上信息数量成指数级别增长,网络信息的产生速度超过人们能接收的程度,信息过载情况严重,而信息质量参差不齐导致有用信息淹没在信息海洋中。以搜索引擎为代表的信息检索技术存在着需要用户主动提供明确的检索目标的局限性,以协同过滤思想为代表的个性化推荐技术应运而生,成为解决互联网信息过载问题的有效途径。传统的协同过滤算法根据其他用户对项目的评价来预测目标用户对项目的偏好,在用户项目评分矩阵上寻找最近邻居进行推荐,并没有将电子商务系统中存在的用户属性信息和项目属性信息有效利用,导致准确率差;在查找目标用户的最近邻居关键步骤中需要在整个用户空间查找,存在着推荐实时性差的问题;对用户评分矩阵稀疏度敏感,在稀疏度高的系统中存在着准确率急剧下降的问题。聚类技术能有效对对象划分成组,使得同组对象之间属性相似度高,处于不同组的对象相似度低,而协同过滤推荐算法的核心步骤也是通过计算相似度寻找目标用户的相似邻居,将聚类技术应用到推荐当中能有效的提高推荐系统的性能。首先,针对协同过滤推荐的实时性问题,介绍了在用户项目评分矩阵上先对用户聚类,在与目标用户相似度高的聚类簇中查找最近邻居的方法,有效的降低了查询空间,提高推荐实时性。上述方法是在用户项目评分矩阵上进行,没有结合项目属性信息,提高实时性的同时带来准确率下降,本文提出了一种衡量用户对项目属性喜好程度的方法,将其用于上述聚类过程中,在保留了查询空间降低的优点同时,提高了推荐准确率。其次,针对推荐准确率差的问题,本文提出了将引入模糊化改进的K-means算法在商品属性矩阵进行对项目进行聚类,然后融合模糊聚类中项目对聚类簇的归属度相似度和用户评分矩阵上计算出的相似度,通过实验表明本方法在准确率上优于传统的混合推荐。最后,针对用户评分稀疏性问题,本文提出用Fuzzy K-means模糊聚类算法分别在用户属性矩阵、项目属性矩阵上聚类,将聚类簇中的平均值加权融合作为对稀疏矩阵的填充值。实验表明该方法能有效的解决数据稀疏性带来的准确率降低的问题,相对于其他对稀疏矩阵填充方式具有优势。针对Fuzzy K-means聚类对初始聚类中心的选择敏感的问题,本文提出了一种计算初始聚类中心的方法对其改进,并将改进后的算法应用到上述推荐过程,实验结果表明改进的模糊聚类在上述基础上推荐效果仍有提高。