基于知识图谱的电影序列推荐模型研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:xieqi_1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术及互联网环境的不断发展,随之而来的信息过载问题亟待解决,常见的数据稀疏以及冷启动问题都在一定程度上影响了推荐质量。现有的大部分推荐算法更偏向于物品信息的考虑,而往往忽略了用户信息,同时更加侧重于挖掘用户与物品之间的静态相关性,但忽略了随着时间的推进而导致的用户兴趣的衰减以及偏好的动态变化,从而无法实现理想的效果。为了解决以上问题,本文提出了基于双端知识图的用户偏好推荐模型,主要研究内容如下:本文提出了一种融合知识图卷积网络的双端邻居推荐算法(Combining Knowledge graph convolutional networks for Double side recommendation,CKD),在用户端及物品端同时进行特征的提取。其中对于用户特征的提取通过用户偏好在知识图谱中的扩散过程获得。对于物品特征的提取,基于知识图卷积网络模型将其邻居信息聚合到物品节点生成嵌入向量。最后让用户兴趣传播与物品特征聚合交替进行共享当前已知信息,从而提高推荐质量。本文在CKD模型的基础上,给出了将用户长短期喜好(Long and Short term Preference)加以融合的推荐算法(CKD-LSP),并由此方法来解决了由于时间的推移所产生的用户兴趣的逐渐衰减,及其偏好的动态变化的问题。此模式首先使用CKD模型,来对用户的长期潜在偏好加以挖掘;再利用隐马尔可夫模型,来获取用户的短期兴趣偏好;最后,将上述二者加以融合后为目标用户提供了个性化推荐。算法中既涵盖了用户整体的个性化特点,也借助用户行为序列掌握了用户的时序特性,从而提高了推荐效果。该模型在Movie Lens-1M以及BookCrossing两个数据集上进行对比实验,通过AUC和F1值将其与基线方法进行对比,经实验后证明算法有效性获得显著提高。最后本文在研究的基础上,设计和完成了基于双端知识图谱和用户喜好的影片推荐体系,把已经训练好的CKD-LSP模型导入了推荐体系中,为用户提供满意的个性化影片推荐。经过对本文实现的整个电影推荐系统的需求分解,各个功能模块设计以及数据库的设计,经过开发实现了对整个电影推荐系统在用户端以及管理端的实现,从而进一步验证了算法应用的有效性。
其他文献
文字识别技术是为了将光学字符转变为计算机能够识别的文本字符,使得计算机能够对识别出的文字信息进行更深层次的操作,让人们的生活和工作更加便捷化和智能化。随着OCR技术的迅速发展,有关文字识别的软件层出不穷,应用于金融行业、汽车行业和快递业务等多个领域,但由于中文字符拥有庞大的字符集,其字型结构也较为复杂,因此中文字符的识别技术更加困难。开源引擎Tesseract不仅支持多种字符的识别,还可根据不同的
学位
无线通信技术的发展,给人类社会生活带来了极大的便利,每个人的社会活动都随时进行着信息传递,个人信息传输的效率和质量应是一个需要重点研究的问题。尤其在5G,6G等高频通信技术下,会有更多的终端接入互联网,需要传输的数据将是以前不可想象的。因此,对于无线通信系统信息传递的全过程,各个阶段的研究必须进行客观深入的开展,才能为人类生活提供更好的保障。在非正交多址(Non-Orthogonal Multip
学位
目前人工智能处于飞速发展时期,人类不断突破技术难点,更新人机交互方式。语音识别是语音交互的基础,因此语音识别技术成为国内外众多学者的研究热点。随着神经网络的兴起及计算机性能的提升,科学家将神经网络应用到语音识别中,使识别率有了显著的提高,同时推动了语音识别类产品的商业应用。本文主要研究基于Kaldi的中文语音识别。阐述了语音识别的基本原理及语音信号特征提取方法,介绍了开源工具Kaldi的WFST解
学位
随着全球移动互联网人口规模不断扩大、人均使用时长日渐增加,新时代的无线通信技术需具有更高的频谱效率(Spectral efficiency,SE)、满足更大规模的用户/设备连接、提供更快的数据传输速率等,传统的正交多址接入技术(Orthogonal Multiple Access,OMA)已逐渐不能满足用户的需求。与正交多址技术不同,非正交多址接入(Non-orthogonal Multiple
学位
随着人工智能技术的不断发展,异常检测技术拥有很高的应用价值,广泛应用于入侵检测、故障检测和安防监控等领域。然而,在大数据时代,信息系统产生的数据不仅规模庞大且复杂多变,再加上异常的不可预知性,使得异常检测成为一项非常具有挑战性的工作。近年来,深度学习在异常检测问题上取得巨大的成功。相比于传统异常检测方法,深度学习在无需复杂特征工程的前提下就可以获取大型高维数据中的复杂模式。深度自编码器是异常检测问
学位
电子材料作为整个材料行业不可或缺的一部分,被广泛应用于电子设备中。由于微型化和高度集成化的发展,大气环境下的腐蚀对其内部电子电路和元器件的性能造成严重的影响,导致电子设备失效。印刷箔层压板(PCB-Cu)与化学镀镍金处理技术(PCB-ENIG)以其优良的导电性,被应用于印制电路板(PCB)工艺中,因而PCB-Cu与PCB-ENIG在大气环境下的腐蚀成为学者们的研究热点。本文基于腐蚀机理与元胞自动机
学位
遗传性疾病严重威胁人类健康,破解基因和疾病之间的联系已经成为生物医学研究的重要目标,发现与疾病密切相关的基因对于疾病的预防、诊断及治疗具有极其重要的意义。随着各种生物数据的不断挖掘以及计算机技术的飞速发展,针对基因-疾病关联关系预测问题已经提出了很多方法。然而,现有的预测方法大多采用两步策略,即先进行特征融合,再进行关联关系预测,忽略了这两步之间的促进关系。同时,这些模型没有充分挖掘基因和疾病的多
学位
人的脸部表情是内心情绪的表达,是人与人之间交流情感的重要手段。随着人工智能的发展,人脸表情识别作为计算机视觉中的重要课题受到广泛研究,在人机交互,在线学习,医疗诊断和智能驾驶等领域有重要的应用。因此,如何获得人脸表情识别率更高、识别更快参数量更少的模型对于人脸表情识别任务至关重要。本文基于不同的特征提取方式,主要提出了四种改进的表情识别算法。首先,早期手工提取人脸表情特征的算法对于小型数据集有一定
学位
随着智能设备和新兴智能应用的普及,移动数据流量呈爆炸式增长。为了满足更高的数据速率和大规模无线连接的需求,引入了异构云无线接入网络(Heterogeneous Cloud Radio Access Network,HCRAN),但大量的低功率节点以及节点间的干扰导致能源消耗的急剧增加。因此,能效优化成为实现网络可持续发展的关键问题。基于上述背景,本文考虑在HCRAN中使用可再生能源与电网能源混合供
学位
微电子器件自出现以来就受到了人们的广泛关注,研究中发现,微电子器件在使用时会根据所选参数的不同而呈现出单周期、多周期或混沌等丰富的非线性动力学现象。本文基于极限学习机(ELM,Extreme Learning Machine)算法针对两种典型的微电子器件——Duffing振子和约瑟夫森结进行了非线性动力学的相关研究。具体工作如下:第一,我们对Duffing振子动力学状态的识别方法进行了研究。Duf
学位