基于知识图谱元路径的协同过滤推荐算法研究

来源 :南宁师范大学 | 被引量 : 0次 | 上传用户:passat168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和信息技术的迅速发展,信息过载问题已经严重地干扰人们对信息的选择。信息过载是指网络上的数据超过了人们可以接受和处理的范围。为了帮助人们快速获取所需信息,推荐系统应运而生。推荐算法是推荐系统的核心内容,传统的协同过滤算法基于用户-物品评分矩阵计算用户之间或者物品之间的相似性,实现推荐任务。但是传统的协同过滤算法存在以下问题:第一,由于用户-物品评分矩阵存在数据稀疏的问题,导致传统的协同过滤算法不能准确地获取相似的用户或物品;第二,传统的协同过滤算法忽略了物品本身的内在属性信息,从而不能明确用户具体的兴趣爱好;第三,传统的协同过滤算法不能对推荐结果做出解释;第四,传统的协同过滤算法存在冷启动问题。针对上述问题,本文以推荐算法为研究内容,在传统的协同过滤算法中引入了知识图谱和元路径的概念,提出了一种基于知识图谱元路径的协同过滤算法,以此来提升推荐结果的准确率,并对推荐结果做出相应的解释。本文的主要工作如下:(1)本文以电影推荐为例,构建一个电影领域的知识图谱。首先通过对电影领域的知识图谱进行分析,构建电影知识图谱的知识体系;然后基于电影数据集Moive Lens-1M,从开放链接数据库DBpedia中抽取所需的电影知识,将用户的交互行为记录和所抽取的电影知识融入到知识图谱中;最后使用图数据库Neo4j对知识进行存储,实现电影知识图谱的构建。(2)为了缓解传统协同过滤算法面临数据稀疏的问题,本文在传统协同过滤算法的基础上,引入了知识图谱和元路径两个概念,提出并实现一种基于知识图谱元路径的协同过滤算法(KG_User CF)。具体地,KG_User CF算法通过元路径在电影知识图谱上的映射,计算用户对电影各方面的兴趣分布矩阵,接着,综合考虑用户多方面的兴趣计算用户对电影的感兴趣程度,然后为用户生成一个推荐列表,最后将该推荐列表与传统基于用户的协同过滤算法生成的推荐列表进行融合,生成最终的推荐列表。本文最后通过在真实世界电影数据集Movie Lens-1M上进行实验,并与多个算法进行了对比,证实了本文提出的KG_User CF算法的有效性。
其他文献
封闭式复合材料桅杆因其卓越的隐身性能在舰船上的应用越来越多。在舰船的航行中,封闭式桅杆会受到风载、桅杆自身结构重量、仪器设备重量以及船舶横摇(纵摇)的作用。为了确保桅杆正常工作,需要保证桅杆具有足够的强度和稳定性。然而,由于复合材料的各向异性、力学性质在空间上的不连续等因素,复合材料结构的失效模式较钢结构更加复杂。这些问题给封闭式复合材料桅杆的结构设计带来了挑战。本文以封闭式夹芯复合材料桅杆为研究
工业生产中往往会产生大量热量,为保证产品和生产设备的安全运行,需采用冷却介质带走生产中产的部分热量,冷却塔就是冷却循环系统中常用的最重要构件之一。随着经济的发展,机
产能过剩问题已成为阻碍我国经济增长和产业结构优化的重要因素。产能过剩问题与我国制造业附加值低、核心技术匮乏有关,根本原因在于我国企业创新能力不足。本文聚焦于长江经济带企业,分析技术创新对企业产能利用率的影响。本文首先梳理了技术创新对企业产能利用率影响的相关文献;然后基于1998-2007年中国工业企业数据库数据,测度并分析了长江经济带企业产能利用率的现状;其次建立了技术创新影响企业产能利用率的理论
2μm激光处于“人眼安全”波段,因对大气有强穿透力以及水分子对其强烈的吸收等特性使它在测距、相干激光雷达、大气传感以及医疗手术等领域得到广泛的应用,同时大功率2μm激
由于MEMS加工工艺技术的局限性以及力的尺度效应,MEMS双稳态加速度开关中的结构参数和材料性能存在着不确定性,这些不确定性因素直接影响了双稳态加速度开关性能的稳健性,甚至可能导致开关功能的失效,因此在MEMS双稳态加速度开关的设计阶段进行稳健性优化具有重要的工程意义。由于MEMS双稳态加速度开关在设计阶段无法制作大量的测试样品,使得随机优化方法和模糊优化方法受到了限制。针对上述难题,本文使用区间
语义组合计算是将词语语义组合成句子语义的过程,是获取句子语义表示的主要技术之一,广泛应用于情感分析、机器翻译、句子匹配等自然语言处理任务。语义组合性原理表明句子语义是由词汇语义根据句法结构组合得来的,因此语义组合计算与词义和句法紧密关联。目前,大多数研究主要关注对词汇语义表示的改进,少数研究开始关注对句法结构信息的利用。但这些结构化方法仍存在如下问题:(1)目前汉语依存分析在长距离依存关系上的分析
随着信息技术的不断进步以及数据的爆炸式增长,人们越来越深刻的认识到数据的价值。如何从大量的数据中发现有用的信息尤为重要,关联规则是数据挖掘中的重要分支,可用于发现数据库中不同项之间的关联关系,有助于企业做出商业决策。本文主要围绕着关联规则展开研究,首先介绍了数据挖掘和关联规则的相关概念,然后对Apriori和FP-growth两种经典算法进行分析,对比了两种算法在数据挖掘过程中发现频繁模式的优缺点
无网格法是一种新的数值计算方法,在一定程度上克服了有限元与边界元等数值方法的网格局限性,在解决冲击、爆破,超大变形、裂纹扩展等问题中具有独特的优势。无网格介点(MIP)法是一种配点型的无网格方法,采用移动最小二乘核近似(MLSc)、移动最小二乘导数近似、介点原理、局部介点近似等,既具有传统配点法的高效性,同时,比传统的配点法的稳定性更好,精度更高。在基于无网格介点法的理论研究基础上,本文将无网格介
随着计算机视觉和人工智能技术的发展,针对表情识别的研究已成为一大热点。面部表情的变化在人机交互和非语言交流中发挥着强大的作用,因此表情识别对交互式计算机系统的发展具有里程碑式的意义。面部表情蕴含丰富的行为信息,是人类传达信息的信号,如何让机器充分学习表情特征,提高识别率,是目前研究的难点。本文对面部表情识别方法展开研究,具体工作如下:(1)研究传统的表情识别方法。首先是面部检测,介绍基于肤色分割的
在高含沙河流上修建水库,必然促使大量泥沙在库区淤积。随泥沙淤积发展至坝前,不仅减少水库的兴利库容,还可能导致水轮机磨损和闸门启闭困难。水库在泥沙淤积基本平衡后,主要依靠一定的坝前冲刷漏斗维持水库的长期安全运行。本文通过以某水库为原型的物理模型,模型按照几何相似、水流运动相似、泥沙运动相似、泥沙悬浮与沉降相似、河床变形相似等相似原则设计,开展以下研究:针对运行水位为756cm、流量为3L/s的水沙条