论文部分内容阅读
随着信息技术的迅猛发展和信息资源的不断膨胀,电子商务也随之蓬勃发展,推荐系统被越来越广泛地应用于电子商务的网站中。推荐系统是电子商务个性化服务的重要组成部分,它打破了传统的商业运作模式,扮演着传统商业中销售人员的角色。对于增加商品的销售量,提高顾客的忠诚度等都有较大的贡献。目前协同过滤技术是推荐系统中最为成功的技术之一,并且获得了比较广泛的应用。但是随着用户人数的不断增加和商品本身的因素限制,现有大多数协同过滤算法普遍存在着几点弊端,主要有数据稀疏性问题、系统可扩展性问题、冷启动问题以及同义词问题等。几乎所有的推荐系统中,每个用户涉及的信息量相当有限,而在这些系统中一般用户购买商品的总量却仅占网站所有商品数量的1%甚至更少,因此造成了用户对商品评分的数据非常稀疏。因此,为了提高推荐质量,许多研究人员都试图从不同的角度对用户和商品信息进行分析、处理。本文首先对推荐系统的基本知识进行详细介绍,接着通过阐述协同过滤推荐系统中的问题引出数据稀疏性问题,总结目前解决数据稀疏性问题的几种方案。然后通过对基于项目和基于用户的协同过滤算法的比较与分析,分别从两个不同的方面针对数据稀疏性问题提出改进算法:其一是对提高算法精度的算法引入项目的属性,加入了基于项目类别的用户偏爱度,针对用户更喜爱的项目类别计算与目标项目的相似性,使得计算项目相似性方面减少计算数据,提高计算速度,计算的准确性更高;其二是对降低数据集稀疏性方法采用Slope One方法预测填充未评分的项目,降低数据集的稀疏性,计算目标项目与其他所有项目的相似性,然后对目标项目进行推荐。对改进算法进行了相似的理论分析,阐述其可行性,给出了改进算法在标准数据集上的实验结果,并对改进算法与原算法进行了相关性能的比较分析。实验表明,改进的算法能够有效缓解数据稀疏性问题,提高推荐系统的推荐质量。