知识图谱融合构建与补全方法研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:xiaoniaohk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络互联的发展,互联网上的数据呈指数型增长,大多数信息被存储成二维表格的形式。知识图谱可以有效的对这些二维表数据实行组织、存储和表示。知识图谱由大量的实体和关系组成,具有很强的语义表达、数据建模能力,被广泛的应用在自动问答、搜索引擎、个性化推荐等各个领域。然而,当前基于二维表格数据的知识图谱构建和融合仍存在一些问题。通常情况下,只有具有相似属性的数据集才能被融合。此外,在构建知识图谱时,可能会出现重复节点,从而导致存储冗余等问题。同时,现有知识图谱大多是通过手工或半自动构建的,导致知识图谱中大量实体和关系缺失,致使知识图谱数据不完整、较稀疏。因此,迫切需要利用知识图谱补全的方法,即链接预测任务把知识图谱中缺失的知识补全。为了解决上述问题,本文展开了以下研究:提出一种基于二维表数据的知识图谱融合及构建方法。针对二维表生成知识图谱时带来的节点冗余问题,以及单表知识不足和多源数据库表在没有关系约束的前提下难以形成表间的映射问题,本文提出基于二维表数据的知识图谱融合构建方法。该方法首先利用本文提出的TKGC方法自行选出核心属性与其他属性之间构成的<属性值,属性名,属性值>三元组生成单表知识图谱,然后利用SNF融合方法或者SRF融合方法对不同类型的二维表知识图谱进行融合,最后实现基于Neo4j的可视化存储。本文利用了四个真实数据集进行仿真实验,可视化结果证明构建的图谱真实有效,通过本文融合方法融合后知识图谱中整体关系节点比增加了22.3%,关系数量增加了10.5%,证明本章方法增强了图谱联合查询和知识挖掘能力。提出一种基于邻域信息和注意力机制的链接预测方法(NALP)。在进行链接预测的时候,大多数现有的知识补全模型都是独立的处理知识图谱中的三元组,缺少应用实体的邻域信息,本文考虑到邻域信息对中心实体表达的作用,在编码器阶段引入注意力机制。在聚合邻域实体前,为了减少海量的邻域带来的计算量负担,首先抽取出k个一阶邻居实体;然后把实体及其k个邻居的向量表示送入解码器,聚合邻域信息进而获得更新的实体表示;最后把新的向量表示输入到解码器模型进行链接预测。NALP算法已经在FB15K-237、WINE、WN18RR三个数据集上完成了链接检测工作,实验结果显示,本文方法与基线模型相比,获得了更高的准确性,证明了该方法的有效性。
其他文献
学位
学位
学位
学位
学位
学位
学位
伯克级驱逐舰作为美国主力舰艇,主要承担防空反导任务。基于伯克级FlightⅡA型驱逐舰的防空反导系统的构成,对各装备的性能和特点进行分析,发现伯克级驱逐舰的弱点;并针对其弱点,研究了反舰导弹突防的技术和战术方面的对策,为战时对抗提供了更优方案,也对实战中提升战斗力具有借鉴意义。
期刊
学位
军事术语是军事领域的专业用语,是军人的规范化、标准化语言,规范和统一使用军事术语,是统一军队认知的基本要求、协调部队行动的基本保证。随着军事技术及其理论的不断发展,新军事概念及其指称形式层出不穷,对这些新概念新指称的术语化、规范化工作亟待更新,对创新型军语管理技术与方法的需求十分迫切。由于军事领域术语词汇更新不及时、规范化程度不够高、技术方法落后等原因,导致军事术语应用中语义指代不一致、军事相关文
学位