论文部分内容阅读
近些年来,随着互联网技术的高速发展,网络上的数据呈爆炸式增长。海量的数据一方面使人们更加容易的获取到丰富的信息,另一方面人们却不得不花费大量的精力和时间来搜索对自己有用的信息,信息过载问题越来越严重。面对海量的数据资源,传统的搜索引擎已经不能够满足用户的多样化需求,推荐系统成为时代的新宠。推荐系统通过分析用户数据,捕获用户的兴趣,向用户推荐其感兴趣的信息或商品。协同过滤是一种流行的推荐算法,通常基于用户的评分或行为进行用户评分预测或商品推荐。在现实生活中,常见的推荐系统(如电影网站的推荐系统)根据所有用户对已经购买过的商品(观看过的电影的评分),计算出评分矩阵中的空缺元素,向用户推荐具有较高评分的商品(电影)。但是当预测用户将要消费一个具体的商品时,传统的协同过滤算法无法捕获用户兴趣的演变或上下文相关的兴趣。本文通过对用户的消费历史进行建模,可以提供更加准确的推荐。首先提出一个引入商品评分信息的基于循环神经网络(Recurrent Neural Network,RNN)推荐算法的模型框架Rating-RNN,对用户将要消费哪一个商品作出更准确的预测。利用局部敏感哈希对数据进行处理,并针对电影推荐的问题对经典的循环神经网络进行修改,增加输入门(Input Gate)以引入用户评分信息;通过增加遗忘门(Forget Gate)以根据当前商品评分高低来决定从当前网络记忆中丢弃信息的量;针对用户数据的序列长度不等问题进行时序规整;通过对输出层进行层次化设计以提高输出层计算效率。同时,提出一个引入商品类别信息的基于循环神经网络推荐算法的模型框架Category-RNN,对用户将要消费哪一类别的商品作出预测。然后,将Rating-RNN与Category-RNN输出层合并,形成能够并行训练的Mixing-RNN。最后,在常用的大规模公开数据集MovieLens上的测试结果表明,本文提出的方法在准确率、召回率方面取得了较优的结果。