论文部分内容阅读
随着电子商务的发展,网上购买成为了时下一种主流的购物方式,消费者在面对海量信息时,需要付出大量时间来找寻自身感兴趣的商品。在此情况下,个性化推荐系统应运而生,被认为是一种有效且符合消费者商品需求的营销方法,它能解决电子商务网站中消费者购物选择问题,是目前网络信息服务领域的热点之一。个性化服务系统通过分析使用对象的行为信息,来分析消费者个人的兴趣差异习惯,从而提供“一对一”精准营销服务。要实现个性化推荐系统,必须建立用户兴趣模型,用户建模在个性化推荐中处于核心地位,建模的质量直接影响到推荐系统的质量。对此,通过捕捉多源用户兴趣数据并进行数据融合,是提高用户兴趣建模质量的一条重要途径。本文研究的目的在于针对B2C网站环境下,传统协同过滤推荐精度不够高的问题,提出和实现基于用户树型网络的多源用户兴趣数据融合方法,以改善和优化原有方法的推荐质量。全文主要研究内容如下:首先,本文以建模流程为研究视角,从用户信息收集、信息表示、技术处理、更新方式四个方面对个性化推荐系统中的用户兴趣模型建立的现有研究成果进行比较分析,将信息收集归纳为信息来源、信息存储两个方面,用以获取建模的信息来源;将信息表示归纳为语义表示、量化表示两类方法,用以表征具体的用户兴趣偏好;将数据处理归纳为两类技术,即特征词权重、聚类技术,用以加工用户信息而生成用户兴趣模型;将数据更新归纳为时间窗口法、遗忘算法、混合模型等三类方法,用以体现模型中的用户兴趣漂移。其次,从用户购物流程角度出发,总结出能最大程度反映消费者兴趣偏好的4个因子:商品点击行为、商品收藏行为、放入购物车行为、下单行为。然后具体量化每种指标因子的计算,设置相应规则实现静态用户兴趣权重。考虑到用户兴趣变化,设计了随时间变化的兴趣值,弥补了静态系统推荐的不足。针对每个个体,进一步把兴趣区分为长期、短期兴趣,同时给出不同的指数衰减方法。通过上述处理,实现了用户多源兴趣数据的有效融合,可以更好地提高推荐精度。最后,实验基于阿里巴巴集团旗下天猫商城提供的真实用户数据集,通过实施数据融合,训练得到每个用户的兴趣模型,并计算出每位用户的长期、短期兴趣,以及各自的兴趣周期。本文共完成了三组实验,第一组为探讨各指标属性因子值;第二组为周期衰减模型与不区分兴趣周期的指数衰减模型作预测精确度对比实验;第三组为经典协同过滤算法与本文提出的带周期衰减过滤算法对比实验。实验结果表明,多源用户兴趣数据融合的推荐效果优于经典的协同过滤推荐效果。