基于知识图谱的电影推荐算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:rlhRLH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,互联网流量急速膨胀,用户在面对这些数据时,无法有效地获取自身所需信息,于是推荐算法应运而生。知识图谱对知识语义联系具有优秀的表示能力,将其运用于推荐算法能够有效地增强物品相似度以提高推荐效果。因此,基于知识图谱的推荐对于推荐算法的进步具有重要的意义。本论文在目前流行推荐算法和知识图谱相关技术的研究基础上,创新性地提出了基于包含客观物品内在知识和主观用户偏好的知识图谱的电影推荐算法。一方面,当前有些流行的推荐算法仅使用用户行为数据来实现推荐,过于依赖用户偏好,缺乏对物品内容的协同理解,忽略物品之间的语义联系,而且在数据稀疏的情况下,容易出现冷启动的问题,导致推荐效果不是十分理想。另一方面,在当前基于知识图谱的推荐算法中,知识图谱中包含物品内在语义信息,虽然很好地表示了物品之间的语义联系,但是未充分考虑用户偏好,在表示实体和实体之间的联系时忽略了用户的主观兴趣,导致推荐结果缺乏多样性。因此针对当前研究工作中面临的问题,本论文在研究工作中,将物品内在语义信息和用户偏好融入知识图谱。物品内在语义信息是通过将电影和电影特征实体以及它们之间的关系构造为实体关系三元组的形式来表示的,用户偏好是本文通过对用户行为数据进行建模得到用户实体、电影实体和它们之间的关系,创新性地利用实体关系三元组的形式来表示的。这样知识图谱就能够在语义层面上精确的表示电影物品之间丰富的语义联系、增强对物品的内容理解,并且能够对用户项目关联作很好地诠释,从而挖掘用户兴趣。然后利用知识表示学习算法建立知识表示模型,对知识图谱进行关联表示学习,将其中的实体关系表示为向量形式,根据训练得到的实体关系向量计算得出电影实体之间的相似度,与通过协同过滤推荐算法得出的电影物品相似度相结合,进而实现电影的推荐。如此,算法能够兼顾物品之间的语义联系和用户偏好,同时还具备协同过滤的优势。在知识表示学习中,TransE模型在表示复杂关系时表现一般,无法很好的区分具有同一关系的不同实体,而本文构建的知识图谱中实体之间的关系是复杂且类型多样的。另外,TransR等翻译模型虽然可以较好地表示多对多关系,但模型较为复杂,计算性能偏低。因此经过深入研究,本文创新性地利用适用于复杂实体关系表示,同时兼顾性能的TransH翻译模型来建立知识表示模型,以此进行知识图谱中知识的关联表示学习,进而完成向量化表示实体关系的工作。与多种主流推荐算法进行对比发现,本论文经过研究提出的推荐算法的精确度得到了很大的提升且具备很好的多样性。同时因为知识图谱中蕴含丰富的知识数据和各种知识间的联系,所以算法还能够有效避免数据稀疏和冷启动的问题。
其他文献
乳腺癌是现代女性最常见的恶性肿瘤之一,随着医学治疗手段的进步,乳腺癌的生存率已经得到了很大的提升,但是从二十世纪七十年代末起至今它的发病率一直在增加,已经严重威胁了女性的身心健康。在中国,乳腺癌在女性恶行肿瘤中位居榜首,具有发病年龄早,就诊病期晚的特点。乳腺癌的早期诊断对于后期的治疗很有帮助,但目前的确诊率并不理想。随着世界范围内各种新发癌症病例的增多,癌症患者的异质性愈发明显,因此癌症的研究和治
北大山地区位于阿拉善地块的西南缘,其晚古生代岩浆活动与东部的雅布赖—红古尔玉林—诺尔公构造带具有一定可比性,可能为雅布赖—红古尔玉林—诺尔公构造带的西延部分。野芨里基性—超基性岩体地处北大山弧形构造带内侧,野芨里北部岩体为超基性岩体,主要岩相为含长二辉橄榄岩,除此之外还有二辉橄榄岩,橄榄辉石岩,橄榄辉长岩等;南部基性岩体主要由辉长岩组成,其次为橄榄辉长岩。本文通过对阿拉善地块的北大山地区野芨里基性
能源是社会经济发展的基础,是人类生产生活的重要组成部分。煤炭、石油和天然气三大主要能源均不可再生,且燃烧产物污染环境,所以需要积极开发清洁能源。核能具有核燃料丰富
假设检验是统计推断研究的主要内容之一,在金融保险、医疗、工业等方面,检验过程中犯第二类错误所带来的损失,有时会远大于犯第一类错误所带来的损失,且样本容量的大小直接影响着对总体的估计效果.大多数学者研究了正态总体参数假设检验中,两类错误的控制与样本容量的确定,而双参数指数分布作为金融保险、医疗、工业方面的代表性分布,对其假设检验中两类错误的控制与样本容量的确定却少有研究.基于这一现象,本文对双参数指
本文以某企业基于永磁同步电机的内燃调车机车牵引控制系统开发为研究背景,目前该内燃机车已完成现场调试且已投入使用,但机车中未增设专门用于轮对空转检测及保护的装置。为了避免调车机车在作业时轮对发生空转对轮轨造成危害和提高轮对的粘着利用率,本文在既有的牵引控制系统之上增设轮对的空转检测及保护系统,做到及时检测轮对空转现象的发生并采取相应的保护措施。本文依据轮对空转形成机理、轮轨粘着基本理论对现有空转检测
目前,编队控制理论研究中提出的大部分编队控制算法都是针对单积分或双积分描述的运动体模型。本论文研究针对欠驱动轮式移动机器人的编队控制算法的设计与实验验证等问题,在
近年来,中国经济增速放缓,金融服务业也受中国宏观经济影响,整体增长速度呈现下降趋势。深商银行属于股份制商业银行,长春分行受经济下行压力影响,面临着激烈的竞争,对行内员工的服务标准不断提高,员工的工作压力上升,尤其是一线厅堂基层员工压力过大问题十分突出。因此,有效识别厅堂基层工作压力来源,提出科学的缓解压力对策,是深商银行长春分行人力资源管理部门亟需解决的问题。本文以深商银行长春分行厅堂员工为研究对
城市是由建设空间、生态空间和社会空间构成的一个动态系统。城市开放空间主要由生态空间与建设空间的要素组成,开放空间对于城市居民生活质量和城市的发展管理具有重要意义。探讨开放空间如何影响城市建设,不同类型的开放空间对城市土地开发利用是否有着不同作用,作用力有多强等问题,对于认识城市空间的相互作用、优化城市空间结构,促进城市可持续发展有重要意义。本研究以武汉市为例,探讨了不同类型的开放空间对城市土地开发
为了增加多用户天线分集效益,提高5G(The Fifth Generation,第五代移动通信)移动通信系统的频谱效率,需要对大规模MIMO-FBMC(Massive Multiple-Input Multiple-Output-Filter
物联网被称为继计算机、互联网之后世界信息产业发展的第三次浪潮。作为其核心技术之一的无线传感器网络(WSNs)在诸多领域内都具备广阔的应用前景。在很多的的应用场景中,WSN