论文部分内容阅读
随着互联网和信息服务的飞速发展,网络当中会充斥着大量的冗余信息。这些内容会呈现出指数增长的态势,从而产生了信息超载的问题。个性化推荐系统的出现很好的解决了这个问题,也给人们带来了很大的方便。但是,传统的协同过滤推荐算法由于系统规模的增大,会出现很多的问题。本文则对其中的数据稀疏性以及算法扩展性问题进行了优化。首先,针对数据的稀疏性问题和算法的扩展性问题,本文提出了一种优化聚类中心的用户聚类推荐算法。该算法首先基于Weighted Slope One算法消除掉评分数据矩阵当中的未评分项,对原始数据通过预处理来减小其稀疏性;然后对预处理后评分数据采用基于最小方差的K-means算法进行聚类,通过将相似的对象聚到一起来减小目标用户之后的最近邻搜寻空间,提高了算法扩展性;最后利用传统的推荐算法生成最终的结果。其次,针对数据的稀疏性问题,本文提出了一种改进相似度计算的用户聚类推荐算法。针对传统相似度计算所存在的缺陷,算法首先对初始的评分数据矩阵基于时间遗忘函数进行修正,以解决用户兴趣随时间衰减的问题;然后对传统的相似性度量方式基于用户偏好度以及用户特征向量进行改进,通过引入一些隐性因素,使得最近邻的搜寻更加准确,缓解了数据的稀疏性;最后在基于最小方差的K-means簇类当中利用传统的推荐算法做出推荐。最后,基于Movielens数据集实现优化聚类中心的用户聚类推荐算法。通过对比实验表明,该算法可以在一定程度上缓解数据稀疏性以及算法扩展性问题,具有较高的推荐精度。另外,基于Movielens数据集实现改进相似度计算的用户聚类推荐算法。通过对比实验表明,该算法能有效的处理数据的稀疏性问题,推荐精度方面也有所提高。