基于异构信息网络的推荐系统评分预测问题研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wuchen112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统旨在帮助用户寻找其感兴趣的事物(项目),正被应用到越来越多的互联网服务中。推荐任务通常可形式化为评分预测任务,即预测用户对候选项目的评分。基于协同过滤(Collaborative Filtering,CF)的推荐算法因其出色的性能成为推荐系统评分预测任务的研究热点,但目前仍存在以下问题:1)用户对项目的评分数据普遍偏少从而影响了推荐效果的数据稀疏性问题;2)根据用户最近的评分数据快速捕捉其近期兴趣变化的响应性问题;3)新用户和新项目无评分记录而导致的冷启动问题。这些问题对传统的CF算法提出了新的挑战。异构信息网络(Heterogeneous Information Network,HIN)因其对复杂异构数据的建模能力正越来越受到推荐研究领域的重视。本文针对CF算法存在的3个问题,利用HIN对推荐系统中多种类型的数据进行统一建模,并结合图卷积神经网络(Graph Convolutional Neural Network,GCNN)、注意力机制以及元学习等深度学习技术,提出了基于异构信息网络的推荐系统评分预测方法,主要贡献如下:(1)提出了异构信息网络的注意力感知多通道图卷积评分预测模型,有效解决了数据稀疏性问题。模型提出了评分约束的元路径,解决了传统元路径无法从HIN中精确捕获推荐场景下用户和项目之间的语义相似性的问题;设计了注意力感知的多通道图卷积评分预测神经网络,利用多通道的GCNN有效地表示出不同元路径的语义信息,并利用注意力机制区分各通道语义信息的重要性。对比实验结果表明,所提出的模型在数据稀疏的情况下均方根误差比基线模型最多减少50%。(2)提出了异构信息网络的元学习评分预测模型,有效地解决了推荐系统中的用户兴趣变化响应性问题和冷启动问题。模型借鉴元学习的思想,设计了异构信息网络的评分预测元学习器,该学习器通过历史交互数据学习泛化能力强的先验知识,通过先验知识快速适应根据用户最近的评分记录预测其对未交互项目评分的任务,从而实现及时捕捉用户兴趣变化;模型设计了嵌入表示生成器,利用属性为新用户和新项目生成良好的嵌入表示,从而提高了冷启动推荐的效果。对比实验结果显示,模型在平均绝对误差和均方根误差这两个指标上最高提升约7%,能够有效捕获用户最近兴趣以及提升冷启动推荐效果。综上所述,本文提出的评分预测方法能够有效解决CF算法中存在的问题,在推荐系统中具有实用价值,并且为异构信息网络和深度学习技术在推荐系统中的应用作出了一定的贡献。
其他文献
传统的中小学地理教学经常使用地球仪作为辅助教学工具,虽然地球仪能直观的展示相关地理区域,但是由于地球仪本身的限制而无法承载过多的信息,而增强现实(Augmented Reality,AR)技术能够将虚拟信息叠加到现实场景上进行实时交互,将AR技术与地理教学相结合可以使教学内容更加丰富、生动、有趣,能够激发学生的学习兴趣。目标检测算法具有较强的识别物体的能力,将目标检测算法与AR技术相结合,可以提高
学位
随着互联网行业的发展,深度学习技术在各个研究领域得到了广泛的运用,特别是在计算机视觉相关领域。人脸表情识别属于学科交叉的领域范畴,它的研究可以让机器学习人类的情感,有助于提高人机交互的效率,这一技术可以推广到医疗、交通、教育等不同的日常情景。但表情识别的准确率容易受表情图像中光线、角度、细节等因素影响。因此,为进一步提升表情识别网络模型的性能,本文共分三个方面对表情识别深度网络进行改进,主要工作包
学位
人脸表情识别作为情感计算重要的组成部分,在公共安全、智慧交通和医疗康复等领域有着巨大的应用前景。在过去的几年里,数据驱动的深度神经网络虽然将人脸表情识别准确率提高到了新层次,但是仍面临以下两个关键性难点:(1)头部的偏转造成了面部遮挡和配准误差,导致识别准确率再向上提升变得异常困难,并且难以运用到实际场景中;(2)现有数据集中存在一些不确定性表情样本,这些样本造成提取出的特征有害。为了解决以上问题
学位
近年来,基于相空间重构(Phase-Space Reconstruction,PSR)的时间序列图像化方法因能描述时间序列的非线性信息等优点,已被用于提升时间序列分类(Time Series Classification,TSC)的性能。然而,这类方法因需要将高维相空间中的轨迹投影到二维平面,往往会导致信息丢失或造成虚假的信息,从而导致分类准确率的下降。本论文的研究目的便是分别在单变量时间序列(U
学位
近年来,随着社会信息化程度越来越高,互联网改变了人们的生活,成为了人们生产生活中不可缺少的一部分。但是,随着网络安全问题日益凸显,人们的隐私和数据安全不断受到威胁。数字身份作为互联网的基础设施,是网络安全中的重要一环。而传统的身份管理方式下存在用户隐私泄露、身份管理效率低、数据共享困难等问题。为了改进数字身份管理方式,保障网络数据安全和用户隐私安全,本文进行了以下研究:1)为了解决集中式数字身份管
学位
目标跟踪是计算机视觉领域一项基础性挑战任务,具有重要的学术价值与实用意义。在给定初始帧标注信息后,其任务不仅要在后续帧中对目标中心进行粗略定位,还需要进行精确的目标状态估计。近来,基于孪生架构的方法因其能在保持良好速度的同时取得较显著的性能,引起了目标跟踪领域的广泛关注。然而,孪生网络分支通常是独立的,缺乏信息交互,这限制了模型性能的进一步提升。为了增强孪生网络分支的协作能力,本文提出基于孪生架构
学位
安防监控系统不仅能给居民提供安全保障,而且也常用于协助案件侦破。行人重识别(Person Re-identification,Re ID)技术作为计算机视觉领域的热门研究方向,旨在实现跨摄像头下快速自动地行人身份识别及检索,可以显著提高警务人员对监控数据的利用效率。然而监控视频中存在背景干扰强、行人姿态差异大等问题,夜间环境下还会进行红外模式成像,这些因素都给行人重识别带来了挑战。目前,在单模态场
学位
随着互联网和智能终端的普及,网络文本信息量增长迅速。传统的文档级、句子级情感分析已经无法满足当前文本研究对细粒度情感倾向的需求。方面级情感分析可以对实体进行多方面、全方位的情感描述,但由于文本语言环境的复杂性,现有方法在泛化等性能上仍然存在不足,本文从方面目标情感分析和方面类别情感分析子任务入手,以深度学习为基础展开研究,主要工作和贡献如下:(1)针对于现有方面目标情感分析模型存在的参数量过大、局
学位
旅行商问题(Travelling salesman problem,TSP)是一种NP问题,在物流路线规划等领域有着广泛的应用。目前,研究人员提出了不同的算法来解决TSP,主要分为精确算法和启发式算法。由于精确算法设计复杂和求解时间长,启发式算法受到了广泛关注。在启发式算法中,蚁群算法是一种经典且有效的启发式算法,然而由于蚁群算法的参数不能灵活设置和局部启发信息不足等原因,算法容易陷入局部最优,因
学位
在中国,患者去医院就诊的第一步是选择科室进行挂号,科室选择的正确与否直接影响患者后续的就诊流程。然而,绝大多数患者缺少相关的医学专业知识判断自己应该选择哪一个科室进行挂号,而且随着我国人口老龄化的加剧,这一问题尤为凸显。调查研究发现,大多数医院通过设立导医综合服务台为患者提供科室选择指导,但由于看病人数远远多于导诊工作人员、导诊工作人员医学专业水平参差不齐等因素,导致服务台时常人山人海,患者没有得
学位