融合多因素信息的神经协同过滤推荐模型研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wg_fo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统(Recommendation System,简称RS)利用用户-项目历史交互记录来学习用户潜在个性化偏好以及项目潜在属性特征,从而帮助用户准确快速地定位到目标内容信息。协同过滤是在推荐领域应用中应用最早、影响范围最广泛的方法,其中,矩阵分解算法是协同过滤推荐中最具有代表性的算法,矩阵分解技术将用户和项目的信息映射到同一维度的潜在因子向量空间中,通过内积的形式来结合用户以及项目的潜在特征,然而通过内积来拟合用户偏好与项目特征之间的关系在一定程度上限制了模型的表现力。神经协同过滤使用神经网络结构来建模用户和项目的潜在特征,神经网络结构代替内积,可以从数据之中学习任意函数,突破了内积所带来的限制,从而提高了模型的非线性建模能力。辅助信息在推荐系统完善用户-项目交互起着至关重要的作用,如能将更多的辅助信息引入到神经协同过滤模型中,则可以从更多的维度完善项目的属性特征,建立更具语义、更准确、更个性化、有效缓解冷启动问题的推荐模型。如,邻域信息在电影推荐中可以帮助用户发现新的题材或新演员及导演的电影,基于邻域信息的方法通常简单、有效,并且能够提供准确及个性化的推荐,而广泛用于协同过滤推荐中。因此,我们考虑将邻域信息融入到神经协同过滤系统中。标签信息既可以反映出用户的兴趣特征,又能够描述资源本身具备的特点。基于标签的算法会为推荐的物品提供标签说明来解释推荐行为,同时,项目自带的标签是对新项目内容属性的粗粒度描述,因此在一定程度上能够缓解模型的冷启动问题。因此,我们考虑将标签信息融合到神经协同过滤模型中。新项目附带的项目描述文本是对项目内容的概要说明,能够反映项目的内容特征,是对项目内容更细粒度的刻画。本文利用卷积神经网络来挖掘项目描述文本中的属性特征,并融入到神经协同过滤模型中,从而更进一步缓解模型地冷启动问题。在本文中,我们不仅考虑了邻域因素对结果的影响。还重点研究对项目辅助信息的挖掘,包括文本信息,标签信息等,旨在充分完善项目的属性特征。本论文主要的创新点及研究成果如下:(1)基于邻域的方法通过寻找用户或项目之间的相似性,挖掘出用户与用户、项目与项目之间的内在关联,从而完成推荐。基于邻域的方法已被广泛地应用于经典的协同过滤推荐方法中,然而在神经协同过滤模型中却鲜有应用,为了增强神经协同过滤模型的个性化和准确性推荐能力,我们开展的第一部分工作,是将邻域信息引入神经协同过滤模型中。(2)考虑到项目的标签信息能够粗粒度的描述项目内容特征,为推荐的物品做出标签说明来解释推荐行为,从而增强了模型的语义可解释性,同时标签的引入能够缓解模型的冷启动问题。为了有效提升神经协同过滤模型推荐结果的语义可解释性并缓解模型的冷启动问题,我们第二部分工作是将将标签信息引入神经协同过滤模型中。(3)一个新项目在进入多媒体资源平台时通常都会附带相关项目的描述文本,该文本主要是对项目内容的概括说明,能够反映项目的内容特征。我们第三部分工作将利用卷积神经网络对项目描述文本进行处理,并引入到神经协同过滤模型中。由于项目描述文本能够高度概述文本内容信息,因此可更细粒度的刻画项目内容属性特征,更进一步缓解项目冷启动问题。(4)基于上述三部分工作,最终我们提出了一个全新的推荐模型TTNNCF(Text,Tag,and Neighborhood-based Neural Collaborative Filtering Model),并针对不同的冷启动场景以及一般场景,在真实数据集上进行了多角度实验评估。实验结果表明,在不同的实验场景,对比现有的优秀模型,TTNNCF能够进行更有效的项目推荐,并能更有效缓解推荐所面临的冷启动问题。
其他文献
计算机辅助几何设计(Computer Aided Geometeric Design,简称CAGD),其核心的内容为:在电脑的造型程序中,表达、运算、解析和总结曲线曲面信息.其中曲线的降次一直是CAGD的热
随着高等教育的发展,我国的民办高等教育也进入了一个蓬勃发展的时期。民办高校学生的学习质量,决定了他们在民办高校里的学习收获,直接影响着他们毕业以后的就业,更对他们步
纳滤膜是一种具有独特分离性能的现代膜分离技术,在水软化、海水淡化、食品加工、生物制药等诸多领域有着广泛的应用,如何进一步提高纳滤膜的分离性能是目前研究的热点之一。
钛酸锶钡(BaxSr1-xTiO3)薄膜因具有优异的介电/铁电性能广泛应用于动态随机存储器、场效应晶体管、移相器等电子器件。在现阶段的研究中,钙钛矿型氧化物电极因其价格低廉、热
辽河坳陷西部凹陷兴-马潜山构造带含油面积广,石油地质储量十分丰富,自上世纪70年代发现以来开采了近半个世纪。由于该区域地质条件复杂,难以用原始的录井方法识别岩性,同时
1999年于云南芥菜型油菜中选育获得温(光)敏不育系K121S,该不育系在昆明的自然气候条件下表现稳定的夏播不育而秋播可育,夏播不育度高达100%,秋播自交结实率在70%左右。育性
会议
植物建模在农业指导、虚拟景观、古树名木保护等方面有着广泛应用,而如何快速低成本地对植物模型进行重建是计算机视觉领域中亟待解决的难题。基于深度图生成的多视图三维重
肉毒毒素(Botulinum neurotoxin,BoNT)是由肉毒梭状芽孢杆菌产生的一种蛋白类神经毒素,通过阻断神经-肌肉突触的传递进而引发松弛性的肌肉麻痹导致个体中毒。肉毒毒素可分为7种
本文针对工业生产中对特定工件的识别与定位问题,对基于三维激光扫描点云数据目标识别算法与定位方法进行了研究,主要研究的内容如下:1)分析了本文课题的时代意义,并对激光扫
乒乓球课教学中,为了使学生在一堂课的时间更好、更快地掌握好技术动作,在学生做正式的练习之前,加入一些辅助练习,这些动作类似于正式技术动作,且难度偏小,对学习和掌握一门