论文部分内容阅读
近年来,随着互联网和计算机技术的飞速发展,互联网上涌现大量的数据资源,这为用户提供了很多便利.但是,由于海量的数据资源,用户很难从这些数据中快速找到满足自己需求或者感兴趣的信息,从而导致严重的信息过载问题.为了解决这个问题,人们提出了很多的解决方案,其中推荐系统是最有效的解决方案之一.它作为一种个性化的信息推荐服务,能够在用户和信息之间进行有效地沟通.它主要通过分析用户数据来获得用户的兴趣和需求,从而向用户推荐他们感兴趣的信息资源.然而,在推荐过程中,由于数据本身的数据稀疏性、冷启动,算法的设计缺陷(如:隐含特征初始化)以及难以处理图结构类型数据问题,导致推荐准确率低和用户体验的效果极差,从而限制了推荐系统的发展.幸运地是,随着深度学习在各种应用中取得不错的成功,如:自然语言处理,机器翻译和图像处理,以至于基于深度学习的模型已经被用于推荐系统中,从而通过解决传统推荐系统模型的各种挑战来提升推荐系统的性能.此外,在推荐系统中利用深度学习技术也已经变得更加流行.与传统的推荐体系结构相比,基于深度学习的推荐模型提供了更好的用户权限交互表示学习能力.因此,开发基于深度学习技术的个性化推荐系统成为一个种趋势.与此同时,如何使用深度学习的相关技术以及原理来克服或缓解已有的个性化推荐方法中存在的问题,以提升推荐系统的推荐性能,是一个非常重要以及值得研究的课题.针对上述提到的现有的个性化推荐系统中存在数据稀疏性、随机给定用户和物品隐含特征向量初始值(如:随机或零初始化)、冷启动和难以处理图结构数据等问题,进行了相关研究,提出了以下的解决方法:(1)针对数据稀疏性问题,提出一种基于迁移学习的跨域推荐方法(TCD-CF).该方法主要是运用迁移学习能将在某个领域或任务上学习到的知识或模式应用到其他不同但相关的领域或问题中的特性来缓解目标域中存在的数据稀疏性问题.该方法是通过码本拓展的方式,从电影推荐模型中(即:源域)学到的知识迁移到书籍推荐中(即:目标域),进而预测书籍数据中缺陷的评分.在两个数据集中(即:Movie Lens和Book-Crossing)进行一系列实验,结果表明,该方法在一定程度上能够减缓数据稀疏性问题,从而进一步提升了推荐系统的推荐性能.(2)针对现有个性化推荐系统中存在随机给定用户和物品隐含特征向量初始值(例如:随机或零初始化)的问题,提出一种信任感知初始化推荐方法(DLIR).由于在实际推荐过程上,现有大部分推荐方法都是基于矩阵分解(Matrix Factorization,MF).然而,在求解推荐损失函数时,它们都是随机或零初始化给定用户和物品隐含特征因子矩阵(即:0和(10).遗憾地是,从优化的角度来看,基于MF的方法的最小化过程是非凸的,以至于它对用户和物品隐含特征矩阵的初始化很敏感.因此,一个良好的初始化可以导致更好的局部最小值,并提高学习过程的效率和准确性.(3)针对现有个性化推荐系统的冷启动问题,提出一种基于知识蒸馏的社交推荐算法.该方法首先利用堆叠式去噪自编码器来减少用户反馈数据的噪声,以及将用户反馈和用户信任信息生成软目标(称为:Pre-training过程).然后,利用知识蒸馏方法从生成的软目标中学习可靠的信息(称为:Re-training过程).最后,结合Pre-training网络和Re-training网络来为每一位用户提供最终推荐.实验结果表明,该方法为从日常生活中常见的离散输入数据中学习鲁棒表示提供了一种新的解决方法,以及能够很好地解决用户冷启动问题.(4)针对现有的个性化推荐系统方法主要处理欧几里德数据,而难以处理图结构类非欧几里德型数据的问题,提出一种基于图卷积网络的预测推荐方法(SR-GCN).图卷积网络(Graph Convolutional Network,GCN)作为一种能够直接处理图结构类型数据的神经网络,以至于能够很好地对图结构型非欧几里德型数据进行模型的构建,并且能够较好地保证数据原有内部结构不被破坏,以更好地捕获其内部数据间的依赖关系.在SR-GCN方法,以(用户-物品)和(用户-用户)二部图为基础,运用GCN聚集以及其独特地更新方式(即:保留每个节点之间的信息的特有拓扑关系),以进行Top-N推荐,从而达到进一步解决图结构型非欧几里德型数据的问题,进而提升推荐系统的推荐性能.在三个数据集上(即:Gowalla、Ciao和Amazon)进行实验,其结果表明,SR-GCN方法在处理图结构型数据表现出很好的结果,以及进一步提升推荐系统的性能.