论文部分内容阅读
信息技术的日新月异和Internet的迅猛发展在给人类生活带来便利的同时,也随之衍生出了信息过载问题,浩瀚的海量信息使得以往单纯依靠用户主动寻找的服务模式已不能满足实时、高效的需求,于是各种适用于个性化服务的推荐系统应运而生。推荐系统通过预测用户对项目的喜好程度来为用户进行信息过滤,应用知识发现技术来形成个性化推荐。协同过滤是一种常用的裁剪过载信息的技术,已经成为个性化推荐系统的一种主要技术。传统的Item-based协同过滤推荐算法在目标项目最近邻查询时计算项目间的相似性仅仅只考虑用户对项目的已有评分,并不考虑项目本身的属性,因此在用户评分数据非常稀疏的情况下难以准确找到最近邻居项目集,并且在形成目标项目的最近邻居集时,往往会造成信息的丢失,从而导致推荐精度的降低。针对传统Item-based协同过滤推荐算法存在的问题,本文提出了基于项目特征模型的协同过滤推荐算法(简称ICM-based算法)。ICM-based算法首先在离线环境下根据项目的属性特征形成项目的特征模型;然后基于用户_项评分矩阵和项目的特征模型,采取一种新颖的选取未评分项方法对其中没有被用户评价的项进行预评分,并计算出项间相似性;最后形成目标项的最近邻居并产生推荐。选取公开的MovieLens数据集提取出实验数据库,在此基础上实现了基于项目特征模型的协同过滤推荐算法实验,并且与传统的以相关相似性作为相似性度量标准的Item-based协同过滤算法进行了比较。实验结果表明本文提出的基于项目特征的协同过滤推荐算法在推荐精度上优于传统的Item-based协同过滤推荐算法。通过对实验数据集的测试和分析,证实该算法综合考虑了项目自身属性和用户评价的影响,增加了项目相似性度量的精确性,计算出项的最近邻居比较准确,在用户评分数据稀疏性的情况下能产生较好的推荐精度,从而有效地提高推荐算法的推荐质量。此外,由于未评分项的预评分是依据其特征相似项的评分得到,对于新项目也是如此,所以在一定程度上可以缓解传统协同过滤推荐算法中的冷启动问题。