论文部分内容阅读
在网络技术和电子商务快速发展的今天,互联网上出现了越来越多的在线服务,这些在线服务给人们带来便利的同时,也导致网上信息量的急剧增加,用户不得不花费更多的时间,在大量的信息中选择他们感兴趣的内容,这就是信息过载问题。推荐系统作为处理信息过载问题的主要手段,是一种采用机器学习技术,对用户偏好分析的基础上,在合理的时间内向用户推荐合适内容的智能决策系统。当前,尽管在各种不同的社会领域,个性化推荐技术已得到普遍使用,但已有推荐系统仍然存在数据稀疏性、冷启动、长尾物品难以被推荐、不能有效处理图结构数据等问题,导致推荐的性能不高,用户的体验较差,制约了个性化推荐系统的发展。作为一种非线性的深度神经网络技术,深度学习与传统浅层学习完全不同,它能自动进行特征学习,可以挖掘推荐系统中用户及物品间隐含的、潜在的许多特征。基于深度学习的个性化推荐研究与应用,已受到产业界及学术界的日益重视。如何利用深度学习相关原理及技术,去缓解、克服已有个性化物品推荐系统中存在的问题,以提高推荐系统的性能,是一个非常值得研究的课题。论文研究运用深度学习相关原理与技术,针对已有个性化物品推荐系统中存在的数据稀疏性、冷启动、长尾物品难以被推荐及图结构数据处理的不足等四个方面问题,进行了相关研究。主要研究工作及成果如下:(1)针对已有个性化推荐技术中存在的数据稀疏性问题,运用卷积神经网络(Convolutional Neural Networks,CNN)具有较强捕捉局部特征能力的优势,通过加入一个调节层,提出了一种改进的CNN局部相似性预测的物品个性化推荐模型(Local Similarity Prediction of CNN)—LSPCNN。新模型在对初始用户——物品评分矩阵进行迭代调整的基础上,使用户兴趣偏好局部特征化,再融合CNN对缺失评分进行预测,从而实施个性化推荐。实验结果表明,LSPCNN模型在不同数据稀疏度下的MAE值较已有推荐方法均有所下降,一定程度上缓解了个性化物品推荐过程中数据的稀疏性。(2)针对已有物品冷启动推荐相关研究中,很少考虑用户的时序偏好,导致推荐的准确度不高,用户体验不佳等问题,构建了一种基于TextRank和长短期记忆网络(Long Short Term Memory,LSTM)的物品冷启动个性化推荐模型—TextRank-LSTM。该模型首先引入平均信息熵改进TextRank算法,分别对新物品内容信息与用户行为物品相关信息等进行相应的物品特征关键词提取;然后引入用户正负向行为影响因子,对LSTM门逻辑进行改进,并将用户行为物品特征向量,按时间先后序列,作为改进LSTM的输入,以获取目标用户偏好经验的知识序列;最后运用TextRank-LSTM个性化推荐模型,实现对新物品的推荐。实验结果表明,与已有一些推荐模型相比,TextRank-LSTM模型在推荐的准确度、召回率得到提高的同时,推荐的新颖度也得到明显提升,在一定程度上有效缓解了新物品的冷启动问题。(3)针对已有个性化推荐技术中存在的长尾物品难以被推荐问题,特别是由于很多处在长尾部分的物品,其用户评分、评论等数据少,导致已有的、以评分预测为基础的个性化推荐技术,难以推荐处在长尾的冷门物品,严重影响了这些物品的销售。论文提出了一种融合主题模型与深度受限玻尔兹曼机(Deep Restricted Boltzmann Machines,DBM)的长尾物品推荐方法(Long Tail Items Recommendation Model Based on DBM)—LDBM。该方法通过挖掘物品信息的主题特征及用户偏好主题特征,构建用户和物品之间的联系,结合改进的深度受限玻尔兹曼机,对用户未知的、潜在的偏好主题进行预测,以达到提高长尾物品推荐性能的目的。实验结果表明,LDBM模型具有一定长尾物品推荐能力,提升了个性化推荐的效果。(4)针对已有个性化推荐技术主要处理常规的用户——物品评分矩阵及相关文本等数据,难以直接处理图结构数据问题,在对图神经网络(Graph Neural Networks,GNN)研究的基础上,论文提出了一种基于图神经网络链路预测的个性化推荐模型(GNN Link Prediction Recommendation)—GNNLPR。由于图数据的不规则性,图节点的无序可变性,且各个节点都有数量不等的邻居节点,给基于深度学习技术的个性化推荐研究,带来一定的挑战。作为一种直接运行在图结构上的神经网络,图神经网络是深度学习理论与技术在图领域的最新发展,它能通过图的节点之间的消息传递来捕捉图上的依赖关系,在分析非欧几里得形数据和推荐系统不同实体及其相互间的关系具有更好的优势。GNNLPR模型通过图神经网络的聚集与更新操作,对节点信息进行重构;在此基础上,同时考虑节点信息与路径信息,实现GNN图中节点对间链路预测推荐。实验结果表明,GNNLPR模型在处理图结构数据的链路预测推荐方面,表现出了较好的结果,进一步提升推荐系统的性能。论文主要创新点包括:(1)从卷积神经网络CNN具有较强捕获局部特征能力的视角,研究了基于深度学习个性化物品推荐中的数据稀疏性问题。论文通过在CNN中加入一个调节层,提出了一种改进CNN的、局部相似性预测的个性化推荐模型—LSPCNN。该模型改变了已有个性化推荐方法从全局的、稀疏的数据中计算用户偏好特征的不足,提升了个性化物品推荐的效果,具有一定的创新性。(2)从反映用户偏好时序行为的视角,研究了基于深度学习的物品冷启动推荐问题。论文针对已有个性化物品冷启动推荐研究中,很少考虑到用户的兴趣或者偏好是有时序的,导致推荐的准确性不高,提出了一个反映用户时序偏好行为的物品冷启动推荐模型—TextRank-LSTM。该模型有效缓解了个性化推荐中的物品冷启问题,具有一定的创新性。(3)从图神经网络GNN的视角,研究了基于深度学习链路预测的个性化推荐问题。论文针对已有个性化推荐方法,难以直接对图结构数据进行处理方面的不足,提出了一个基于GNN链路预测的个性化推荐模型—GNNLPR。该模型运用GNN直接在图结构上进行聚集与更新操作的优势,并充分融合GNN节点信息以及拓扑结构信息的基础上,实现相关链路预测及推荐。