论文部分内容阅读
传统的协同过滤推荐算法使用观测到的评分值预测缺失的值,方法简单且快速,但它忽略了数据集中变量之间可能发生的交互,不能很好的反映用户和项目之间的非线性关系,预测评分和真实评分之间的误差较大,不适当的估算会增加数据集中的噪声,随着稀疏度的增加会变得越来越糟糕。而且易受到冷启动问题的困扰。针对这些问题,本文将深度神经网络引入到推荐算法,提出两种混合推荐模型,利用多层感知机来学习用户和项目之间的非线性关系,以缓解传统推荐算法中的数据稀疏和冷启动问题,提高推荐性能。第一种推荐模型结合用户和项目的信息的深度神经网络的推荐模型DNCF。通过神经网络提取用户和项目的属性特征,针对使用词袋模型处理文本信息,不能很好的区分词在文本中的语义特征,提出使用卷积神经网络处理文本辅助信息,生成可有效表示文本深层语义的潜在特征,同时将文本特征结合与其对应的项目特征。对于传统模型中使用户和项目特征的内积不足以预估用户和项目之间的复杂交互问题,提出使用多层感知机来学习用户和项目之间的交互关系,将用户和项目特征输入多层感知器来预测评分,并根据评分为用户提供推荐。第二种推荐模型m DAE结合用户和项目信息与评分数据,由于评分数据稀疏,使用栈式降噪自动编码器处理评分数据,得到低阶稠密特征,并将用户和项目属性信息输入栈式降噪自动编码器,获得用户和项目的隐藏特征,仍使用卷积神经网络处理文本辅助信息,将文本特征结合与其对应的项目特征,最后将用户和项目特征作为多层感知器的输入数据,用于预测评分,并根据评分为用户做出推荐。根据模型的原理进行了实验设计,在Movielens数据集与Amazon数据集上对提出的两种算法模型进行线下实验,实验结果表明本文提出的两种模型与传统常用的CMF、PMF、SVD、item-based算法相比,均方根误差有所降低,召回率提高。并对所提出两种模型进行了对比分析,第二种模型相对于第一种算法,在四种数据集上的RMSE降低,Recall和MAP提升。说明结合用户-项目评分数据以及用户和项目信息能够很好的提高推荐的准确度,增强模型的稳定性,具有更好的推荐性能。同时表明由于采用了用户和项目辅助信息作为数据补充,能够有效地改善了数据稀疏的情况,解决冷启动现象,进一步提高了推荐效果。本文主要研究了深度神经网络在推荐模型中的应用,针对数据稀疏和冷启动问题进行研究,提出了两种推荐模型,通过实验表明本文提出的模型的有效性。