论文部分内容阅读
推荐系统(Recommendation System,简称RS)利用用户-项目历史交互记录来学习用户潜在个性化偏好以及项目潜在属性特征,从而帮助用户准确快速地定位到目标内容信息。协同过滤是在推荐领域应用中应用最早、影响范围最广泛的方法,其中,矩阵分解算法是协同过滤推荐中最具有代表性的算法,矩阵分解技术将用户和项目的信息映射到同一维度的潜在因子向量空间中,通过内积的形式来结合用户以及项目的潜在特征,然而通过内积来拟合用户偏好与项目特征之间的关系在一定程度上限制了模型的表现力。神经协同过滤使用神经网络结构来建模用户和项目的潜在特征,神经网络结构代替内积,可以从数据之中学习任意函数,突破了内积所带来的限制,从而提高了模型的非线性建模能力。辅助信息在推荐系统完善用户-项目交互起着至关重要的作用,如能将更多的辅助信息引入到神经协同过滤模型中,则可以从更多的维度完善项目的属性特征,建立更具语义、更准确、更个性化、有效缓解冷启动问题的推荐模型。如,邻域信息在电影推荐中可以帮助用户发现新的题材或新演员及导演的电影,基于邻域信息的方法通常简单、有效,并且能够提供准确及个性化的推荐,而广泛用于协同过滤推荐中。因此,我们考虑将邻域信息融入到神经协同过滤系统中。标签信息既可以反映出用户的兴趣特征,又能够描述资源本身具备的特点。基于标签的算法会为推荐的物品提供标签说明来解释推荐行为,同时,项目自带的标签是对新项目内容属性的粗粒度描述,因此在一定程度上能够缓解模型的冷启动问题。因此,我们考虑将标签信息融合到神经协同过滤模型中。新项目附带的项目描述文本是对项目内容的概要说明,能够反映项目的内容特征,是对项目内容更细粒度的刻画。本文利用卷积神经网络来挖掘项目描述文本中的属性特征,并融入到神经协同过滤模型中,从而更进一步缓解模型地冷启动问题。在本文中,我们不仅考虑了邻域因素对结果的影响。还重点研究对项目辅助信息的挖掘,包括文本信息,标签信息等,旨在充分完善项目的属性特征。本论文主要的创新点及研究成果如下:(1)基于邻域的方法通过寻找用户或项目之间的相似性,挖掘出用户与用户、项目与项目之间的内在关联,从而完成推荐。基于邻域的方法已被广泛地应用于经典的协同过滤推荐方法中,然而在神经协同过滤模型中却鲜有应用,为了增强神经协同过滤模型的个性化和准确性推荐能力,我们开展的第一部分工作,是将邻域信息引入神经协同过滤模型中。(2)考虑到项目的标签信息能够粗粒度的描述项目内容特征,为推荐的物品做出标签说明来解释推荐行为,从而增强了模型的语义可解释性,同时标签的引入能够缓解模型的冷启动问题。为了有效提升神经协同过滤模型推荐结果的语义可解释性并缓解模型的冷启动问题,我们第二部分工作是将将标签信息引入神经协同过滤模型中。(3)一个新项目在进入多媒体资源平台时通常都会附带相关项目的描述文本,该文本主要是对项目内容的概括说明,能够反映项目的内容特征。我们第三部分工作将利用卷积神经网络对项目描述文本进行处理,并引入到神经协同过滤模型中。由于项目描述文本能够高度概述文本内容信息,因此可更细粒度的刻画项目内容属性特征,更进一步缓解项目冷启动问题。(4)基于上述三部分工作,最终我们提出了一个全新的推荐模型TTNNCF(Text,Tag,and Neighborhood-based Neural Collaborative Filtering Model),并针对不同的冷启动场景以及一般场景,在真实数据集上进行了多角度实验评估。实验结果表明,在不同的实验场景,对比现有的优秀模型,TTNNCF能够进行更有效的项目推荐,并能更有效缓解推荐所面临的冷启动问题。