面向开放世界的知识图谱补全研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:liongliong422
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是一种典型的多关系结构,由许多实体和关系组成。现有的知识图谱大多都非常稀疏,还不够完整。因此知识图谱补全任务应运而生,旨在通过原有知识图谱中的事实对那些可能存在的隐藏关系进行预测。常见的知识图谱补全方法,采用嵌入表示学习的模型借助三元组中实体、关系嵌入表示向量的近距离假设对隐藏关系进行预测。这类方法针对封闭世界知识图谱补全能发挥出较好的效用,但是针对开放世界知识图谱中的新实体类型与相关关系的预测效果较差。为此针对上述开放世界知识图谱补全中的问题,本文提出了一种面向开放世界知识图谱的胶囊网络模型Caps-OWKG。模型对原有知识图谱进行编码获得实体的结构性向量,又对实体的描述信息进行编码获得实体的描述性向量,将两种向量融合后得到新的表示向量,并经过胶囊网络处理后,获得三元组真实性的概率。Caps-OWKG通过新实体的描述信息作为桥梁与原始知识图谱建立联系,这种方法有效但还略显单一,没有更好的挖掘新实体与原始知识图谱的潜在关系。为此,本文构建了一个包括开放世界知识图谱中所有实体、关系和描述的异构信息网络,并提出了一种基于异构信息网络的知识图谱表示学习模型,利用图卷积神经网络对异构信息网中的节点进行编码,再利用两个不同的解码层完成新实体的分类和预测两个任务,实现对知识图谱的补全。
其他文献
多标签图像分类(MLIC)广泛应用于场景理解、多目标识别、视觉问答等领域。虽然基于深度卷积神经网络(CNN)在图像分类中表现出了能够媲美人眼识别率的精度和性能,但基于CNN的分类模型已经被证明非常容易受到对抗样本的攻击。因此,对于MLIC系统的安全性研究成为一个亟待解决的问题。本文结合现实场景中多标签图像分类器的应用情况,对多标签图像攻击算法开展了研究。其主要内容包括:1、本文提出在多标签图像对抗
学位
随着智能监控设备的普及,从视频中获取和分析行人数据变得十分便捷,人群行为分析和建模引起了越来越多研究人员的关注。一方面,通过计算机视觉和物理方法研究人群行为特征;另一方面,通过对人群行为进行建模,验证和改进人类行为动力学模型。本论文以视频行人轨迹提取为主线,对多视角行人目标检测进行深入研究,结合相似性度量发展了基于轨迹相似度的时空聚类方法,并对行人运动时空特性进行了挖掘分析。论文的主要工作和成果如
学位
任务型对话系统是人工智能领域的研究热点,其实用价值也颇受业界重视。流水线型对话系统是目前采用的主流架构,它将整个对话过程划分为自然语言理解、对话策略、对话生成等多个模块,其中用于识别语句中关键词的槽填充和用于语句中预测情感的对话的情感分析是自然语言理解模块的重要子任务,因此受到学术界和工业界的重点关注,而用深度学习建模槽填充和对话的情感分析是当前的主流方法。然而目前槽填充和对话的情感分析模型存在着
学位
复杂系统云仿真是利用云计算资源共享等优势为复杂系统仿真提供支持的新模式,具有实体规模大,交互复杂,依赖库多样等特点。应用封装可以降低应用部署的复杂度。准确的资源预测可以实现复杂系统云仿真应用最优性能。然而,目前的云环境下主流的封装技术依靠手动编写Dockerfile文件,导致封装效率低下,目前的资源预测技术没有考虑复杂系统仿真应用实体规模,时间同步等特征,难以准确预测应用所需资源,导致资源利用不充
学位
三维超声计算机断层扫描(Three dimensional ultrasonic computed tomography,简称3D USCT)在乳腺癌早期检测筛查及诊断等方面有很好的效果,有助于乳腺癌的及早发现与治疗,提高治愈机率。但在3D USCT系统中,换能器的延迟、位置偏差和温度误差等系统误差会影响到重建图像的质量,其中换能器延迟和位置偏差影响最大,故而需进行换能器的校正。论文基于与浙江衡玖
学位
流数据变化速度快,价值密度稀疏且只能单次访问的特性,导致难以对其价值进行有效评估。采样作为数据价值评估的重要手段,现有在全量流数据上采样会产生过多存储计算资源浪费,访问部分流数据的采样评估方法易丢失蕴含大量离散值的流数据的价值和信息。基于上述问题,如何高效精准的对流数据进行采样使得能够准确的评估其价值成为一个尚待解决的问题。本文针对此问题展开研究,主要贡献如下:首先,针对全量流数据采样产生资源浪费
学位
云计算由于其海量存储和计算而快速发展起来,为个人和组织提供了存储和计算服务。为了保护存储在云中的数据隐私,内容提供商通常会对其数据进行加密。然而云中存在许多数据共享场景,这种存储模式相应的增加了用户之间共享数据的困难。代理重加密是解决数据共享的重要技术手段,让云服务提供商充当代理方来转换密文。但当用户退出时,现有的撤销方案忽视了撤销的用户可能会解密撤销前访问的数据,这会导致内容提供商存储在云服务提
学位
近年来,三维网格模型分割成为计算机图形、图像学的研究热点,越来越多的研究者深入网格分割领域,促使分割技术不断发展,但现有的网格分割方法大多不能完全适用于不同种类的模型,这些三维分割算法或多、或少存在各自的分割缺陷。仅仅利用传统形状直径函数的三维分割算法,存在计算量大、无法较好的适应复杂模型等缺点。为了使三维分割能够较好的适用于不同类别的模型,提高分割速度、增强分割鲁棒性和提高模型分割准确度等,本文
学位
可达性查询是图上的基本操作之一,用于判断图中两结点之间是否存在可达路径。现有的可达性查询算法可分为两类,第一类是直接在原图G上构建索引来回答查询,但其查询性能会受图规模的影响。第二类是首先将原图G进行规约,得到规模较小的规约图Gr,然后在Gr上构建索引来回答查询。现有的图规约算法可以显著减小原图G的规模,但是无法保证规约图上的查询性能。本文针对现有方法存在的问题展开研究,具体研究内容如下。首先,提
学位
随着超级计算机的迅速发展和E级计算时代的到来,计算科学开始发挥越来越重要的作用。计算流体力学(Computational Fluid Dynamics,CFD)作为计算科学的一个重要分支,如今在航空航天航海等领域的应用也愈加广泛,其中包括国产大客机研制、载人航天与深空探测等国家重大工程。基于CFD开展相关设计与研发工作,首先需要对计算域进行空间离散,即网格划分。相比于结构网格和笛卡尔网格,非结构网
学位