论文部分内容阅读
互联网的出现和普及为人们带来了大量的信息。但随着网络中信息量的大幅增长,使得互联网用户在面对大量信息时,无法从中获得对自己真正有用的信息,从而降低了用户对信息的使用效率,这就是所谓的“信息超载(InformationOverload)”问题。个性化推荐(Personalized Recommendation)是解决“信息超载”问题众多技术中应用较好的一个,它通过对不同用户的兴趣进行研究,将满足用户兴趣和需求的资源主动推荐给用户,进而较好的满足了“大数据”时代用户的信息需求。协同过滤(Collaborative Filtering)推荐作为目前较为成功、应用较为广泛的个性化推荐技术之一,受到电子商务商家和学者的广泛关注,成为个性化推荐领域研究中的一个热点问题。及时准确的获取用户兴趣、偏好是实现个性化推荐的基础。用户的兴趣、偏好会随着时间的推移,产生某种程度上的变动,这就是用户兴趣变化问题。现有的协同过滤推荐都普遍存在着不能及时根据这种用户兴趣的变化,为用户提供准确的推荐,从而降低了推荐系统的应用效果。本文针对上述问题做了如下工作:1、对推荐系统的概念、原理以及分类进行了分析和梳理,进一步总结协同过滤推荐的思想、原理和方法,给出了协同过滤推体系的基本框架。以此为基础,深入剖析了协同过滤推荐的优点与面临的问题,明确进行基于用户兴趣变化推荐所需要解决的关键问题。2、从用户角度和系统角度对用户兴趣变化问题进行阐述。从心理学、行为学两个方面阐述用户兴趣变化的成因,以此作为协同过滤推荐系统解决用户兴趣变化问题的关键依据。3、分析用户兴趣变化问题如何影响协同过滤推荐最核心的两个过程,即最近邻集合产生过程和用户预测评分计算过程,进而从这两个过程对协同过滤推荐算法进行改进,提高推荐的准确性。4、归纳总结了现有解决用户兴趣变化问题的研究方法和研究思路,根据处理用户-项目评分矩阵方式的不同,给出基于用户兴趣变化的协同过滤推荐的分类:评分加权方法、评分选择方法、基于其他领域知识方法。并对每一类推荐进行了阐述,总结了其优缺点。5、在归纳总结的基础上,以艾宾浩斯遗忘曲线为理论基础,给出权重设计的原则。引入用户访问时间和用户访问频率来描述用户兴趣变化,提出一个新的衡量用户兴趣变化的权重模型。将新权重模型与基于项目的协同过滤推荐算法相结合,给出实现推荐的具体算法和步骤。6、以MovieLens数据集为实验数据集,将本文提出的新算法与传统的基于项目的协同过滤推荐算法进行多组比实验。新算法的推荐效果优于传统的基于项目的协同过滤推荐算法。本文的创新点有以下三个方面:1、深入剖析用户兴趣变化问题,归纳影响用户兴趣变化的因素,总结用户兴趣变化问题对协同过滤推荐的影响,为协同过滤推荐系统如何解决用户兴趣变化问题提供关键依据。2、按照对用户-项目评分矩阵的处理方式的不同,将现有解决用户兴趣变化的协同过滤推荐算法分为三类:评分加权方法、评分选择方法和基于其他领域知识方法。突出了如何处理用户-项目评分矩阵获取用户兴趣这一解决用户兴趣变化的关键核心。3、以艾宾浩斯遗忘曲线为理论基础,引入用户访问时间和用户访问频率建立新的权重模型来描述用户兴趣变化,将新权重模型与基于项目的协同过滤推荐算法相结合给出了新的算法。本文的研究意义如下:1、理论上,可以充实协同过滤推荐在探索用户兴趣偏好方面的理论,并且为研究基于用户兴趣变化的协同过滤推荐提供一个新思路、新方向;2、在实际上,可以使电子商务网站更好的完成推荐任务,满足用户的需求,提高用户对电子商务网站的忠诚度,促进电子商务网站更好的发展。