论文部分内容阅读
目前,我们正经历着从信息时代到数据时代的变迁,运用数据时代大量的信息,可以为我们生活带来许多便利,然而如何去使用这些信息却成了一大难题。而推荐系统则可通过技术手段,利用数据信息帮助用户快速定位到目标信息或物品,使信息得到充分利用。然而,传统协同过滤推荐算法如潜在因子等模型的本质是线性模型,这些模型未能解决数据的稀疏问题以及线性模型的局限问题。因此,设计非线性深度神经网络模型成为推荐系统的重要研究问题之一。本课题在此背景下提出,主要研究如何建立有效的、非线性深度学习模型,从而能够解决大规模、稀疏数据的推荐问题。针对这一研究问题,本文提出了一种基于Wasserstein的新型自编码模型,来缓解数据稀疏问题以及线性模型的表达能力问题。在模型设计方面,论文基于Wasserstein编码器的结构特点,利用神经网络来捕捉隐藏非线性特征,并对模型结构进行改进,以解决推荐系统数据的稀疏性等问题。所提模型引入了稀疏正则化项、并对Wasserstein自编码的隐变量分布距离以及重构误差损失函数进行重新的设计。最后将改进的模型应用于隐式反馈的实验之上。同时,考虑到用户之间的相关性关系,为了将用户评分的相关性用于协同过滤推荐问题当中,本文对模型进行了拓展。论文从简单的无向、无环图出发,将用户之间的关系看成一幅图,根据用户之间的关系在自编码器模型中引入相关性,并以此为基础拓展到广义有环图的情况,并推导了具有相关性的新型自编码器模型。为了使模型预测结果更加准确和高效,本文在模型设计中使用负采样策略,并对模型的算法进行了优化,最后应用于链接预测问题之上。最后,论文在多个大规模、稀疏的数据集上进行隐式反馈推荐及链接预测的实验验证。实验结果表明,本文所提两种方法具有较好的预测精度,并对稀疏数据有较强的适应性,从而验证了所提模型的有效性以及鲁棒性。