论文部分内容阅读
随着信息技术的发展,PC、移动端设备的普及,人们通过电商平台进行商品采购越来越方便、快捷。这也使得电商平台不断扩张,为消费者带来琳琅满目的商品的同时,也为用户带来了信息过载的难题。在过去的十几年中,推荐系统作为解决信息过载的重要手段已经在电商领域取得了一定的成绩,但是也不可避免地受困于数据稀疏性与用户冷启动问题。物质生活水平的提升使得人们对购物的需求越来越多样化、精细化、个性化,这引导着电商平台往精细化运营的方向发展。各大电商平台不断细化丰富商品领域,同时也不断激励用户提供更多的反馈方式,包括文本评论反馈和评分反馈等。这使得电商平台能够获得的关于用户在多个商品领域中的信息越发丰富,为解决传统推荐中的数据稀疏性与用户冷启动问题提供了可能性。基于以上的两点,本文围绕数据稀疏性与用户冷启动问题,从评论文本挖掘以及充分利用用户在不同商品领域的评论信息的角度出发,针对不同的应用场景提出了两个基于评论文本的跨领域用户兴趣模型,并设计了相应的商品推荐算法。首先,本文针对在多领域之间共享用户兴趣信息,以缓解数据稀疏性的推荐场景,设计了 CCoNN算法。该算法以CNN文本处理为基础,从多个领域的评论文本中提取领域共享的用户兴趣向量,以及领域独有的商品特征向量,利用因子分解机挖掘用户兴趣向量于商品特征向量之间的关系,提升了商品评分预测的精度。其次,本文针对完全冷启动用户商品推荐问题,设计了 DSNRec算法。该算法基于编解码器结构,从多个领域的用户评论文本中提取领域独有的用户兴趣信息以及领域共享的用户兴趣信息,通过不同领域之间共享用户兴趣信息实现领域间的用户兴趣迁移,并结合评论文本中提取的商品特征向量,利用传统矩阵分解的形式为目标领域中完全冷启动用户进行评分预测。最后,本文在亚马逊电商数据集上设计实验并验证了 CCoNN以及DSNRec在各自推荐场景中,相较于传统单领域推荐算法的有效性。