论文部分内容阅读
随着信息技术和移动终端的发展,互联网的使用越来越普及,随之产生的信息量也爆炸性地增长,信息爆炸问题已经突显。近些年来,各种类型的推荐系统已广泛用于各种领域。其中,最广泛使用的是基于协同过滤推荐算法的推荐系统,但也存在一些问题,例如随着用户和项目的爆炸性增长,用户评分的稀疏度会越来越高,数据稀疏度会影响协同过滤算法的推荐质量;新用户进入系统,由于没有历史偏好记录,因此难以对其偏好进行有效推荐。近些年来,一些学者将聚类方法引入到推荐模型中以解决部分问题。基于聚类的推荐模型虽然降低了最近邻搜索的规模及其复杂度,但通常基于聚类的推荐模型容易忽略社交关系带来的影响,并且由于这类模型也会受到数据稀疏度的影响。 基于上述问题,本文通过用户相似度的提取、信任模型的构建、聚类相关算法的等方面的研究,提出了融入信任传播与用户集群构建的个性化推荐模型。该模型通过利用用户的多个属性和用户的评分信息来计算出用户的属性相似度,从用户评分矩阵中提取出用户的直接信任和间接信任值,将用户通过相似-信任融合矩阵聚类方法进行聚类,从一定程度上缓解了用户冷启动问题和数据稀疏度问题,并且使得模型推荐速度提升,可以更好地对用户兴趣进行项目推荐。本文的主要研究内容和结论如下: 首先,论文对信任传播、推荐算法等方面的国内外研究现状进行了比较详细的综述分析,提出了目前研究存在的一些问题。此外,论文对推荐模型中所涉及的相关理论和技术进行整理和分析比较,主要包括相似度测量方法、个性化推荐方法以及聚类方法等。 第三章,搭建用户信任模型。推荐系统中的信任模型利用社交网络中用户的信任信息来帮助弥补评分数据的稀疏度,通过用户-项目评分矩阵隐式提取出用户之间的直接信任值。结合信任的弱传递性和本文提出的多路径传递信任度计算的最短路径平均值方法,得出没有直接关系用户之间的间接信任值,将直接信任值和间接信任值结合形成用户的信任矩阵。为整体的推荐模型做出了有力的数据支撑。 第四章,通过对已有推荐模型的分析,提出了一种融入信任传播与用户集群构建的个性化推荐方法。首先利用用户的年龄、性别、职业和地域属性计算出不同用户各个属性的相似度,再利用评分矩阵中用户对项目的评分计算出不同用户的评分相似度。再将这些相似度进行加权求和得到了不同用户之间的属性相似度,形成用户相似度矩阵。同时,利用已生成的用户信任矩阵,将两个邻接矩阵进行合并,形成二维权值的邻接矩阵。之后,利用相似-信任融合矩阵聚类算法以用户之间的距离总和最短为评价指标,将相似度较高的用户划分到一个集群。在线推荐阶段,计算目标用户与其所在集群中其他用户之间的综合相似度,再结合其他用户对目标项目的评分预测出目标用户对项目的评分值。 通过对于公开数据集进行实验分析,对比了不同个性化推荐算法的各个评价指标以及不同推荐算法的优劣性。本文提出的融入信任传播与用户集群构建的个性化推荐方法在推荐效果、数据稀疏度和冷启动问题上都有着较好的改善,可以广泛应用在商业客户聚类分析和含有评分的个性化推荐等相关领域。