论文部分内容阅读
互联网的飞速发展,让更多的信息出现在人们身边,与日俱增的信息量为人们的生活提供了极大的便利,使人们在一定程度上摆脱了信息匮乏的困扰。但是在面对如此大的信息量时,要怎么样精准地获取人们自己想要的信息却成了一个令人困惑的问题。现有的搜索工具在这样海量的信息面前也显得无能为力,而推荐系统的出现为人们的个性化需求带来了福音,并且使得信息的获取更加高效和便捷。本文分析了基于协同过滤的推荐、基于内容的推荐、基于图的推荐、基于关联挖掘的推荐等常用推荐算法。虽然这些算法在不同领域中都有应用,但是仍然存在自适应能力不强、个性化能力不足等问题。基于此,本文尝试对现有的算法进行改进,将改进后的算法按照一定的规则进行混合。在分析了 MovieLens数据集的基本特征后,本文用基于改进后的个性化混合推荐算法在该数据集上进行验证,最终的结果证明,推荐的准确率和覆盖率都优于传统的推荐算法。在算法改进方面,本文将融合相似度后的基于项目的推荐、基于关联挖掘的推荐和基于加权二部图的推荐混合在一起以提高推荐的效果。传统的基于项目的推荐只用到了用户的评分数据,并没有考虑到物品的属性,比如对于电影来说,它的属性可以有导演、演员、电影类型、电影的热度、电影的质量等。因此,本文在基于项目的协同过滤的基础上,融入了基于内容的推荐,并且在基于内容的推荐时对不同的属性赋予不同的权值,然后分别根据内容信息和用户评分数据计算出的相似度进行混合。在解决用户的冷启动问题方面,本文融入了基于关联挖掘的推荐。因为基于关联挖掘的推荐是根据找出的频繁项集后通过设定的置信度来产生推荐,所以推荐出来更多的是一些热门的产品,这样用户的冷启动问题便得到了很好的解决。基于二部图的推荐作为近几年研究新的推荐系统的分支也逐渐兴起,它是将用户和项目作为二部图网络的节点。在传统的基于二部图的推荐中,连接用户和商品的连边是没有赋值权重的,不能体现用户对项目的细微心里反应。本文将用户对项目的评分赋权值,并和上述两种算法混合,以提高推荐系统准确率和多样性。同时,本文针对传统协同过滤计算相似度的问题做了改进,使优化后的算法计算出来的项目间的相似度更准确。本文最后还考虑了用户的兴趣随时间衰减的问题,加入了时间指数修正模型,进一步提高了推荐的准确率。