论文部分内容阅读
互联网的到来促进了信息的爆炸性增长,人们从海量信息中定位自己感兴趣的信息变得越来越困难,“信息过载”现象严重。个性化推荐技术通过挖掘海量数据获取用户的偏好,并根据用户的偏好为其推荐相应的内容,有效解决信息过载问题。然而,个性化推荐技术仍然面临着数据稀疏性、用户冷启动等挑战。社交网站为挖掘用户兴趣提供了额外的信息来源,不少研究通过跨域引入用户社交信息的方式解决传统个性化推荐面临的相关问题。然而,大多数研究只考虑了引入用户的个人信息和社交关系信息,却很少考虑到引入同样包含用户兴趣的社交行为信息。同时,跨域引入社交行为信息存在三个方面的挑战:1)社交域和电商域的数据通常来自不同的网站,需要找到领域间的重叠用户,并通过这些用户对齐不同领域的信息。2)不同领域数据的形式不同,从不同领域构建的特征既要能够输入到同一推荐模型中,也要保证原有数据中的信息完整性。3)社交行为和购物行为发生的时间是不同步的,引入时序信息时行为不同步会对挖掘用户时序兴趣产生一定的干扰。为了应对这些挑战,本文提出了一种跨域时序偏好挖掘算法,有效引入时序社交行为信息,缓解用户冷启动、用户兴趣变化等问题,主要贡献如下:1、提出了一种跨域时序偏好挖掘算法。首先改进矩阵分解技术提出了跨域偏好预测模型,构建社交行为特征与商品购买偏好之间的跨域映射关系。然后从时间维度上假设用户在不同时间段的兴趣不同,根据社交、购物行为发生的时间将这些行为划分到不同的时间段内并构建相应的时序特征。最后提出跨域时序偏好预测模型,从用户的时序社交行为中挖掘用户的时序购买偏好,推荐用户感兴趣的商品,解决用户冷启动、用户兴趣变化等问题。2、通过微博开源API获取用户的微博数据,从国内大型电商平台获取用户的购买数据,通过重叠用户连接不同领域的数据构造真实环境下的跨域数据集。然后在该数据集上进行了实验,验证所提出的模型的有效性。3、基于上述提出的跨域时序偏好挖掘算法,进一步提出了一个用于线上环境的基于跨域偏好挖掘的潜在客户挖掘与推荐系统构建方案。该系统方案能够根据用户的社交信息有效解决通过社交账号登录的新用户的偏好预测与推荐问题,同时根据用户社交信息的变化及时更新预测结果,为系统的精准推荐提供保障。本研究验证了所提出的跨域引入用户社交文本行为能够有效提升推荐效果的假设,同时也验证了所提出的跨域时序偏好挖掘算法能够较好的解决用户冷启动、用户兴趣变化等问题,有效提高推荐系统的推荐质量。