论文部分内容阅读
推荐系统是解决信息过载问题的有效手段之一,它能提高用户获取有效信息的效率、消除信息壁垒、增加信息价值。近年来,随着网络中抽象的非结构化数据以几何速度增长,传统电影推荐系统在新的数据环境中已经不能针对特定用户进行精准的推荐,而深度学习模型是逐层加工的、非线性的网络结构,对抽象的非结构化数据有着很强的学习能力。因此,将深度学习引入传统电影推荐系统中有着重要的研究意义。通过梳理现有的研究成果发现,基于内容的推荐以及基于矩阵分解的推荐都有着对抽象的电影项目特征提取困难的缺陷,而基于协同过滤的推荐虽然在用户与项目评分矩阵稀疏时推荐困难,但能通过引入深度学习模型来有效解决这一问题。经综合分析,本文根据基于模型的协同过滤推荐策略开展了以下几个方面的研究工作:(1)针对电影个性化推荐场景中数据的特点,对电影推荐数据的特征工程开展研究,通过引入词嵌入以及Word2vec解决了One-Hot编码带来的维度爆炸以及文本特征提取困难的问题。(2)全面分析了单一浅层学习模型与深度学习模型的数学原理及其优缺点,并从特征融合和模型训练两个角度出发,改进了Wide&Deep模型。在Wide侧引入因子分解机,自动学习全部的二阶显式关联特征,弥补了原来线性模型依赖人工构建关联特征的不足;在Deep侧引入残差结构,缓解了深层次神经网络梯度消散的现象,构建了适用于电影个性化推荐场景的Resnet&FM融合模型,并与Wide&Deep模型开展对比实验,RMSE提升了1.6%、MAE提升了0.7%。(3)开展Resnet&FM模型激活函数与权重初始化策略选择的研究。深度学习模型对高维抽象特征的学习能力主要由非线性的神经元个数以及整个网络的参数所决定,通过对神经元以及参数初始化策略的数学原理进行分析,并通过实验对比,证明了基于Kaiming初始化以及Relu函数的Resnet&FM模型效果最佳。与标准初始化配合Sigmoid函数相比,RMSE提高了3.3%、MAE提高了3.6%、与Xavier初始化配合Tanh激活函数相比,RMSE提高了4.3%、MAE提高了4.4%。(4)Resnet&FM模型的优化算法决定了是否能够找到最佳的参数拟合电影个性化推荐场景中的用户数据以及电影项目数据的一般规律。因此,本文通过对不同种类的梯度下降算法原理进行比较分析,并结合Renset&FM模型开展对比实验,确定了Adam算法为该推荐模型的最佳优化算法。