论文部分内容阅读
近年来电子商务以其商品廉价性和方便快捷的特点越来越成为人们所喜爱的一种消费方式,也从最初单一的普通实体商品逐渐包括许多虚拟商品和服务,如彩铃订购,在线影院等。虽然电子商务的迅猛发展带给人们的生活极大的便利,但与此同时,面对网上如此众多的商品,顾客陷入了商品信息的海洋,尤其是一些没有明确购买目标的顾客也许经常上网浏览商品,但过多的信息会让顾客产生选择疲劳,而最终导致交易流失。所以如何针对顾客的兴趣偏好为顾客提供个性化的商品信息以便顾客快速找到自己感兴趣的商品,这是提高电子商务网站交易量和破解当前电子商务销售瓶颈的一种有效手段。本文首先介绍了推荐的意义和原理,还有一些传统的推荐方法如协同过滤和基于矩阵因式分解的推荐算法,以及它们各自的优缺点,以Netflix提供的销售记录为实验数据,着重比较了各种推荐算法的性能。接着,本文引入了集成学习算法,并且以boosting作为本文的算法框架,根据boosting算法的特性说明了应该如何筛选基本推荐算法,然后通过上面试验比较的结果,合理选择了两种推荐算法应用于boosting框架,通过实验确定了算法的主要参数的取值,最终得到一种比较有效的集成推荐算法。本文的主要工作体现在如下几个方面:(1)总结了现在流行几种推荐技术,介绍了它们的基本原理,通过实验分析比较了各种推荐算法性能,尤其对diffuse算法和经典相似度公式进行比较。(2)集成学习算法在很多领域的应用都能使性能进一步提高,所以将它作为本文算法的框架并依据准确率指标选取了两种基本推荐算法。(3)通过实验确定了算法中主要参数的取值,对两种基本推荐算法进行集成实验,并设计实验证明了本文算法对传统集成算法改进的有效性。(4)提出了未来推荐算法的多个改进方向。