论文部分内容阅读
信息过载已经成为大数据时代不可回避的问题,推荐系统的出现,使得信息过载得到了有效的缓解,推荐系统的研究与改进受到广泛的关注。各种推荐算法都有自己适应的领域,基于不同的应用和问题,各种改进推荐算法层出不穷。单一的推荐技术已不再能解决问题,各种混合推荐算法也应运而生。本文采用文本分类模型,划分去掉评分低的商品,避免将评分低的商品推荐给用户。然后输入用户的行为词向量均值和推荐商品词向量,通过基于深度神经网络的Word2Vec推荐模型推送商品,主要研究内容如下。对商品的评价分类问题,属于文本分类过程。MDSMOTE算法在生成新样本时将错分样本修正的方法加入MDSMOTE算法,用以解决在生成部分新样本时不将错分样本合并的问题。超平面偏向少数类的问题,是传统FSVM分类算法一直存在的问题。针对这个问题在FSVM中,引入了正负惩罚系数以及模糊因子。将MDSMOTE和FC-SVM结合得到MDSMOTE+FC-SVM分类模型,使得不平衡数据集的辨别率变高,实验表明该模型具有更高的准确性。使用Word2Vec模型训练用户行为词向量。Word2Vec词向量训练领域有广泛且较优的应用,在本文中将该技术引用过来,通过Word2Vec框架,把每个用户看作一篇文章,用户购买物品按照时间序排序,物品看作词,通过Word2Vec得到用户向量均值。使用CBOW模型实现Word2Vec,同时优化了 Hierarchical Softmax层,降低了每一个词的概率计算速度。然后,对输入层和隐含层以及模型结构进行了调整,降低了模型训练的时间复杂度。构建了基于Work2Vec词向量训练模型的商品推荐模型。将用户行为词向量均值和推荐商品向量作为输入,中间使用深度神经网络,结果输出推荐商品的评分。然后,优化了推荐模型。第一方面,依据SWEM简单词向量模型得知均值可以更好的表现出每一个词的信息,将原来的用户行为词向量改为用户行为词向量均值作为输入。第二方面,训练过程使用两层的ReLU函数,使一部分神经元失活降低了训练过程中神经元的数量。将商品分类模型和基于Word2Vec的深度神经网络推荐模型结合。通过推荐模型得到曝光商品的评分,按照评分的降序依次推荐给用户,此时可能会将评价差的商品推荐给用户,用户浏览商品的评价时发现评价价差,会放弃购买。本文最后通过文本分类模型去除评价差的商品,避免将其推荐给用户。最后,本文的推荐模型同基于PMF、LibMF的两个推荐模型做对比。比较了 MAE与RMSE的值,发现本文的推荐算法具有更准确的推荐效果。