论文部分内容阅读
随着互联网的快速发展,推荐系统在帮助商家提升销量方面扮演着越来越重要的角色。现有工作通常仅仅挖掘了数据中的用户个人喜好或时间信息,而忽略了大众情感对用户购买决策的影响,这造成当推荐系统将一件来自历史购买者给出的总体评价为负面的商品推荐给当前的用户时,即使这件商品很符合用户的喜好或者当下非常流行,用户也会倾向于最终拒绝购买它。因此,构建一个既能够捕捉用户个人喜好,又能时序-情感背景感知的用户行为模型显得格外重要。但是,如何以统一的方法从历史数据为当前用户进行推荐是一项具有挑战的任务。另外,由于用户一般只会对少数物品进行评价,这就造成了数据的稀疏性问题,使得为用户建模带来了难处。 为了解决上述问题,本文首先根据真实数据集的分析,提出了有关用户在线行为的几个观察,进而提出了一个时序情感感知的推荐系统-TSARS。首先,为了从交互型数据集中建模用户行为,本文提出了基于概率图模型的TSARS-Ⅰ模型,其能够很好地对用户的点击和收藏等交互行为进行建模,同时本文为TSAUB-Ⅰ设计了一个基于EM的算法对模型参数进行估计。其次,为了从文本型数据中建模用户行为,本文提出了同样基于概率图模型的TSAUB-C模型,它能够对用户的撰写评论行为进行建模。本文为TSAUB-C设计了一个基于Gibbs采样的算法以对模型参数进行估计。这两个模型均融合了时序和情感信息,因此较好地缓解了数据的稀疏问题。之后,TSARS的推荐模块则根据网络平台的特点自动选择TSAUB-Ⅰ或TSAUB-C用户行为模型学习到的知识,根据特定的算法为每件候选物品计算分数,最后为当前的用户查询挑选出分数最高的k个物品,生成推荐列表。用户行为模型的参数较多,因此随着日益增长的数据量,单机运行的模型参数估计算法会变得非常耗时,为了提高推荐效率,本文利用Spark框架将用户建模的训练算法分布式化,从而使TSARS成为一个高效和可扩展的系统。最后,在数个大规模真实数据集上的大量实验结果证实了TSARS确实能够为用户高效且有效地进行推荐,而且其效果超过了当前主流的推荐方法。