论文部分内容阅读
随着Internet的迅速发展,电子商务蓬勃兴起。电子商务站点在为用户提供越来越多选择的同时,其结构也变得更加复杂,电子商务的发展面临了新的挑战:一方面,用户对站点提供的众多产品信息并非完全感兴趣,通常需要经过多次浏览才能找到满足自己需求的产品;另一方面,站点没有了解用户的个人需求,提供给用户的是千篇一律的界面,无法有效地提高其产品的吸引力,维护稳定的客户关系。向用户进行个性化的产品推荐是解决这个挑战的最有效的方法。协同过滤是目前在电子商务推荐系统中应用较为成功的个性化推荐技术。但是随着站点结构、内容的复杂度和用户人数的不断增加,协同过滤算法也遇到了数据稀疏性、冷启动等种种问题。本课题针对传统协同过滤的不足,提出了一种结合用户日志聚类和协同过滤的个性化推荐技术。该技术充分挖掘用户的信息,结合用户隐性兴趣和显性兴趣,推荐结果更符合用户需求。首先基于用户浏览电子商务站点的日志信息,使用聚类算法将用户归类。然后,在协同过滤过程中,利用用户的潜在偏好代替用户显性评分,从而消除用户评分习惯的影响。最后,在用户日志聚类结果的基础上,使用基于用户的潜在偏好协同过滤,从而使得用户的数据稀疏性问题、冷启动问题得到缓解,提高了推荐的质量。在具体的研究过程中,本论文所作的主要工作如下:(1)用户日志聚类。先将原始的用户Web日志进行数据预处理,根据需要将其转换成适合进行分析处理的有意义的数据,然后使用聚类算法把有相似浏览行为的用户聚成一类,为下文的最近邻寻找工作奠定基础。(2)基于用户潜在偏好的协同过滤。为了避免用户评分习惯不一致,相似兴趣的用户可能会有不同的表面评分的问题,本论文将用户的表面评分转换成用户潜在偏好,计算用户的潜在偏好相似性,使得最近邻的形成更为准确。(3)结合用户日志聚类和协同过滤的推荐技术。这种混合的推荐技术可以先离线的对用户进行了一次聚类,在进行协同过滤时能有效的降低用户稀疏性,提高推荐系统的推荐速度和质量。并且这种推荐技术还可以针对评分较少甚至没有评分的用户进行推荐,在一定程度上弥补了传统协同过滤算法无法解决冷启动问题的遗憾。最后,本文进行了相关实验及分析,结果表明,本文提出的结合用户日志聚类和协同过滤的个性化推荐技术比较传统的推荐方法,能有效提高推荐的质量,更好的满足用户的需求。