论文部分内容阅读
在互联网时代,社会化标签作为资源分类和索引的重要方式之一,开始被用来组织、管理和共享资源。社会化标签不仅能反映用户自身的兴趣偏好,又能体现资源本身的特征。为了能够实现个性化推荐技术效率的提高,学者开始将标签与推荐算法结合起来。而作为当前热门的推荐方法——协同过滤推荐算法,算法基础是目标用户对标注资源的评分,然而用户的评分矩阵下很多的数据都是稀疏的,少量的评分数据并不能很好将用户和资源的特点表现出来。为了能够解决此问题,本文基于社会化标签系统提出一种改进的协同过滤推荐算法。 基于现有的个性化标签系统理论基础,本文将标签系统与协同推荐系统有效的结合在一起。该算法以社会化标签系统为基础,从标签出发,将用户—标签—资源之间的三元关系图拆分为标签与用户、标签与资源的两个二维关系图,构建用户的兴趣模型,同时缩小并优化评分矩阵,最终生成了基于 Top-N的推荐集。在公开数据集MovieLens上,与传统的基于内容的协同过滤推荐算法进行对比,能够解决传统推荐方法中存在的兴趣模型单一问题,提高了推荐准确度。本文主要完成了如下的工作: (1)提出基于标签系统的协同过滤资源推荐模型。基于标签系统的内在结构,将标签集与用户集、资源集很好地结合起来,实现了标签系统与基于用户和基于项目(即资源)的协同过滤推荐算法有效结合。 (2)对传统的基于内容的协同过滤推荐算法进行分析与讨论,介绍了协同过滤推荐算法的关键技术及模型构建方法,并对其存在的评分矩阵稀疏性、兴趣模型单一等问题进行深入探究,对评分矩阵部分的算法进行了优化。 (3)介绍MovieLens公开数据集并进行实验,基于MAE、HR/ARHR指标,对传统的两个算法与改进后的两个算法进行评估。