基于深度学习的协同过滤推荐问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wooool123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据技术的发展,个性化推荐算法逐渐成为研究重点。在个性化推荐算法中,协同过滤方法使用最多。近年来,在机器学习的发展中,传统的协同过滤方法逐步与新技术结合,最近的一些工作开始应用深度学习方法,但主要是针对辅助信息进行建模。当要建模关键信息时,依旧使用矩阵分解的方法,用户和项目的隐含特征仍然用内积表示。因此,在嵌入过程中,对于互动中隐含的协同信号无法获得有效编码。在协同过滤中,用户和项目的嵌入表示是关键问题,然而,从过去到现在的方法,都是直接运用现存的特征进行嵌入表示。在嵌入编码过程中,隐藏在用户和项目之间的编码信息无法获得,因此无法充分利用互动信息,最终影响协同过滤推荐质量。获得更准确全面的推荐是推荐算法的目的,因此利用用户项目交互信息以及辅助信息进行建模是十分重要的。过去的研究方法中,都是将其看作监督性学习问题。该问题将用户、项目和交互关系作为实体进行分离,然后编码已经存在的边信息。然而,用户、项目与实体关系之间存在着其他高阶联系,忽略这些联系使得从交互行为中得到的协同信号是有限的。也就是说,这些方法忽略了用户和项目辅助信息的高阶连接关系,因此会忽略重要的相关信息。利用知识图,将用户、项目及其属性关系分解为独立的实体,将具有一个或多个属性关系的项目联系在一起,获取这些高阶关系,进而提高推荐的准确性。针对以上显式化表达不足问题,提出了一种基于注意力机制的协同过滤(ANCF)算法,采用注意力机制来划分与用户相关项目的不同权重,将每个节点参数化为向量。通过设计注意力传播层,学习嵌入表示。利用注意力机制分配不同的权重,将嵌入向量在注意力传播层上进行传播,学习并更新用户和项目的嵌入向量,从而将用户和项目之间的编码信息显式地表示出来,实现嵌入信息显式化。在此基础上,引入知识图谱,提出了一种融合知识图谱的协同过滤算法(KGACF),该方法将知识图谱中的高阶连接关系显式地表示出来。通过利用知识图谱获得用户项目辅助信息的高阶关系,将得到的关系权重进行递归传播。对于高阶关系中包含的信息可以通过叠加多层注意力传播层来获得,以此获得更多辅助信息的高阶关系。本文提出的ANCF和KGACF在概念上优于现有的基于知识图谱或注意力机制的推荐方法。在两个数据集上进行了实验,结果表明KGACF方法性能优比ANCF方法更好,KGACF方法明显好于最新方法。进一步的研究证明了引入注意力机制对于增强嵌入表示的方便性,引入知识图的嵌入传播对于高阶关系建模的有效性。
其他文献
学位
参考规范是指对专业知识点的相关文本描述,用于指导生成文本满足与参考规范的语义相关性和知识点匹配性,参考规范指导下的文本生成是自然语言处理领域中的一个困难问题。现有可控性文本生成方法主要针对情感、态度等通用性质,不适用于上述任务中对生成文本的复杂专业控制要求。在参考规范指导下的专业文本生成任务中生成文本需同时具备三个要求:语言连贯,符合语言学规范;内容与参考规范语义相关;知识点匹配性较好。针对这些要
目前,医疗健康进入大数据时代,很多医疗记录被电子化、数字化存储。随着大众对医疗健康水平要求的不断提高,医疗检查与检查报告的质量受到普遍关注,是科学医疗诊断决策的重要依据。但是医疗检查报告的生成是一项非常复杂且繁琐的工作。为了保证报告内容是对医疗检查过程的完整、准确和规范的记录,需要对检查项目、检查内容和检查方法等使用标准医学术语进行规范记录。然而目前检查报告基本都是在检查结束后,由负责检查的医生完
公共预算作为提供公共产品和服务的最重要的政策手段之一,历来受到政府和相关部门的高度重视。1999年开始的部门预算改革,将部门预算方式由自上而下改为自下而上,全面推行国库集中收付制度和政府采购制度,将政府各项资金纳入全口径预算,在各级地方政府建立了以控制为主要取向的预算制度。部门预算改革不仅是上述技术性的改革,其本质是政治性的改革,将改革前各个支出部门的预算权力集中到了财政部门手中,从而实现了财政部
网络规模日益庞大,网络基础设施愈加复杂,一系列网络安全问题随之凸显。不法分子通过安全漏洞侵入网络进行恶意攻击并传播病毒,造成服务器崩溃和网络瘫痪,给企业造成巨大的经济损失。在这种情况下,流量测量变得十分必要。网络流量测量在交换机等网络转发设备上对数据包进行统计和分析,实时收集流量特征既能够检测出潜在的网络安全威胁,维护网络稳定,还可以为网络性能诊断、拥塞控制、负载均衡、网络计费等网络功能提供重要信
图像的分辨率是指图像区域内像素点的数目,代表图像信息的存储量。日常生活中,由于采集环境和设备的限制或数据传输的要求,大量有价值的图像,以含有低信息量的低分辨率形式存在。而单幅图像超分辨率算法,就是使用数字图像处理技术,由一幅低分辨率图像自身,重建出包含更多图像信息和细节的高分辨率图像,最终满足生产和生活的需要。因其在医学成像、卫星遥感影像以及监控系统等领域的广泛应用,单幅图像超分辨算法一直是图像处
超像素分割作为重要的图像预处理操作在图像处理和图形学中有着广泛的应用,例如图像分割、显著性检测、目标轮廓提取、图像压缩等。边界的贴合性和形状的规整性是评价算法的主要指标,这两个评价指标很难同时兼顾,大多数分割方法更加重视边界分割准确性而忽视了超像素的紧凑性。传统的基于像素点的分割方法需要对每一个像素点进行分析和聚类,所以生成的每一个区域的边界贴合性很好。因为其边界是锯齿状的,这些超像素方法在一些视
深度神经网络的高效推断过程通常需要高性能计算设备,但在资源受限的移动端或嵌入式实时系统中难以推广。神经网络剪枝技术通过减少网络连接的数量,能降低网络的复杂度,推动神经网络在计算资源受限条件下的应用。深度网络中冗余神经元剪枝算法取得了较大研究进展,但存在两个关键问题:1、目前的剪枝算法缺乏理论分析方法,无法对预先设置的剪枝比例给出合理的解释;2、基于全局剪枝比例的权值或神经元修剪可能会导致神经网络中
可穿戴外肢体机器人通过给人体安装额外独立的机械肢体,为穿戴者提供支撑负载等辅助功能,提高单人作业能力及作业范围。具有四个外肢体的多肢体机器人比单肢体和双肢体机器人的稳定性更好,可实现的任务模式更多,作业能力和作业效率也会有极大的提高,可广泛应用于工业、建筑、医疗、军事、航天等领域,具有极其广阔的发展前景。对多肢体机器人肢体和背板的建模及运动控制方法等方面进行研究分析可以促进多肢体机器人的实用化,具
随着深度学习、大数据等应用对计算机性能的要求逐渐提高,传统的基于CPU的架构已难以满足这些应用的计算需求,将CPU与作为加速器的GPU结合构成的异构多处理器片上系统(Heterogeneous Multiprocessor Systems-on-Chip,HMPSoC)成为主流趋势,GPU除擅长处理3D图像渲染外,还能进行大规模通用并行计算。在CPU-GPU异构架构中,高速缓存(Cache)是缩小