论文部分内容阅读
在这个信息过载的时代,个性化推荐技术能够帮助用户找到其感兴趣的信息,将用户可能感兴趣的信息主动推送到用户面前。近年来,个性化推荐系统的研究得到了学术界和商业界的广泛关注,并且应用在实际中取得了很好的效果。但是个性化推荐系统还存在一些问题和挑战,理论研究应用到实际中还有一定的距离。本文从实际需求出发,对推荐引擎的整体架构及工作原理进行分析研究,并重点研究了其中最核心的推荐算法部分。本文的主要工作和创新点如下:1.一般对个性化推荐的研究都集中在推荐算法,而没能从个性化推荐系统整体上去做探讨。本文通过对个性化推荐系统的各个模块整体把握,构建了一个实用性比较强的个性化推荐系统框架。考虑到大量数据的计算复杂性和系统实时响应能力,将该系统分为在线部分和离线部分,离线部分负责对大量数据的计算和生成中间结果,在线部分则调用这些中间结果实时计算从而为用户做出推荐。而后,从技术要求和实现功能方面对各个模块进行了分析介绍,并着重分析了冷启动问题的可能解决方案和怎样通过用户反馈信息实时计算推荐结果的排名。2.针对协同过滤算法在线计算量较大且可扩展性较低的缺点,并为提高协同过滤算法的预测精度,提出了基于K-means聚类的多兴趣协同过滤算法,该算法包括两个方面的应用,分别是评分预测和TopN推荐。首先通过K-means算法对用户聚类,而后将当前用户归类到某一用户集中,通过协同过滤算法为用户计算推荐结果,在计算用户相似度时,考虑了用户具有多兴趣性,对相似度计算公式做了改进。在评分预测问题上,为解决评分矩阵稀疏问题引起的预测精度降低,本文先通过SVD降维方法对稀疏矩阵进行填充,从而提高评分预测的准确性。在TopN推荐上考虑时间因素的影响,改进了用户相似度的计算公式。通过实验表明,相比传统的协同过滤算法,改进的算法能得到更好的结果。3.如果把用户和项目看成是图模型中的点,则为用户做推荐的过程就是找出与用户节点关联性最大的项目节点,这个过程不会受到信息挖掘技术的制约。而且图模型具有很好的扩展性,所以我们在用户-项目二部图上进行了个性化推荐算法的研究。考虑到传统基于图模型的算法具有很高的时间复杂度,对算法做了一定的改进。而后,考虑到时间信息对用户兴趣的影响,将时间信息引入到用户-项目二部图中得到时间段用户-项目二部图,在该图模型上进行推荐计算。通过实验表明,考虑时间信息的图模型的推荐精度要好于不考虑时间信息的图模型的推荐精度。