面向知识图谱补全的嵌入模型研究

来源 :桂林电子科技大学 | 被引量 : 2次 | 上传用户:kingxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,知识的存储与表示变得尤为重要。知识图谱是知识表示最有效的方式之一,被广泛的应用于智能搜索、智能问答等智能化应用。虽然,现有知识图谱的规模已经十分庞大,但其距离达到知识的完备状态依旧十分遥远。知识图谱的完备程度将直接影响智能化应用的性能好坏。为此,知识图谱补全技术备受关注,已经成为当前的一个研究热点。知识图谱嵌入旨在利用连续的、稠密的、低维的向量来表示知识图谱中的实体和关系,以便使用低维向量进行知识的推理和补全。近年来,基于翻译的模型表现出强大的可行性和鲁棒性,在知识图谱补全任务中实现了最先进的性能。但是现有翻译模型仍存在知识表示不够精确、负例三元组质量较低等不足,为了克服这些不足本文提出了MvTransE与TransE-SNS模型。本文主要研究内容如下:(1)本文提出了一种多视角学习的嵌入模型MvTransE。该模型先从实体的语义和结构角度生成多个平行子图。然后将原始的知识图谱和子图分别嵌入到全局视角空间和局部视角空间。最后利用多视角融合策略整合关系事实的多视角表示。MvTransE解决了现有模型的两个不足之处。第一,TransE、TransH等模型侧重于从全局出发,学习关系事实的全局表示,这样不能区别地学习各种类型的事实。特别是,它造成实体和关系在向量空间中的拥塞,从而降低了实体和关系向量的表示精度。第二,puTransE采用多个平行空间来学习局部事实,它损害了原始知识图谱的全局事实,从而降低了简单关系事实的学习能力。大量实验结果表明,MvTransE取得了最先进的性能。(2)本文提出了一种相似性负采样策略用于生成高质量的负例三元组。该策略先通过K-Means聚类算法将所有实体划分为多个簇。然后从正例三元组中头实体所在的簇中选择一个实体替换头实体,并以类似的方法替换尾实体。我们将相似性负采样策略与TransE相结合得到TransE-SNS。由于相似性负采样策略解决了TransE在训练中会生成大量的低质量负例三元组问题,提高了负例三元组的质量。大量实验结果表明,TransE-SNS的性能相较于TransE具有显著地提升。
其他文献
水墨语境给艺术思维带来极大灵活性,强有法度,但不困于法度,以其本身的思维去获取更大的创造力,仍然是现代水墨的创新观念。只有重新认识文人画的美学思想与水墨审美价值的局
目的了解医院行政管理人员职业倦怠状况,对其原因进行思考,探讨调动管理人员工作积极性的办法。方法运用中文版的职业倦怠量表和工作满意度调查问卷,对医院45名专职行政管理
边疆地区的发展问题被逐渐纳入国家的话语系统中,因此,探讨边疆地区新的发展路径就成为一种迫切的实践诉求。乡村旅游不仅可以打破“中心-边缘”二元结构,还能促进边疆地区综合
山西晋南剪纸历史悠久,艺术价值丰富,是山西非物质文化遗产中的宝贵财富,一把小小的剪刀上下飞舞就能传递出人类美好的情思、才华和心愿。在民间剪纸艺术形式中,动物形象被广
当未来污水处理厂遇到美国宇航局,大名鼎鼎的NASA,会发生什么?下面带领大家领略一下来自NASA污水处理黑科技OMEGA。OMEGA全称Offshore Membrane Enclosures for Growing Algae,中
给出了振动搅拌的概念及其作用,介绍了近年来研制的连续式振动搅拌机、旋转振动搅拌机、立轴周期式振动搅拌机、双卧轴振动搅拌机.研究证明,采用振动搅拌与强制搅拌相结合的
德国早在数百多年前就已开始发展污水处理技术。随着政治制度变革,污水处理目的和目标的重要性及关联性也在不断变化。本文从污水处理技术、产业发展和工业园区治理模式角度,梳
多值函数在复变函数论中是一个极其重要的概念,对这一概念的处理在众多函数论教科书中各有不同,甚至出现了某些混乱现象,作者对多值函数各种不同的定义方式进行了分析对比,并在教
高冀生,1955年考入清华大学建筑系,师从著名建筑历史学家、建筑教育家梁思成先生,1961年获优秀毕业生金质奖章,留校任教至今。曾任清华大学设计院院长、清华大学基建处处长、
张弦梁结构是由弦、撑杆和抗弯受压构件组成的新型结构,是通过在弦中施加预应力来改善抗弯受压构件的受力性能的自平衡体系,具有受力合理、制造施工简单和运输方便等优点,具