基于表示学习的包含公理学习

来源 :天津大学 | 被引量 : 0次 | 上传用户:snowlhj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体公理学习,是本体工程中重要的任务,主要是从知识图谱中构建逻辑包含关系。近来,如何利用表示学习来从大规模知识图谱中学习本体包含公理是一个很大的挑战。一方面是知识图谱的规模越来越大,传统的本体公理构建方法无法应对如此大的规模;另一方面现有的知识图谱表示学习无法刻画谓词间的逻辑关系。因此研究能够表示谓词间逻辑包含关系的表示学习模型是此问题的关键。本文尝试学习保留谓词包含关系的表示和线性规划来解决这一问题。首先,本文设计了一个新的表示学习模型Set E,给知识图谱中的一元谓词类型和二元谓词关系一个统一的连续的低维稠密向量表示。具体地说作为一元谓词的类型被编码成一个实体的集合,类型表示成这个实体集合的边界;作为二元谓词的关系被编码成一个实体对的集合,关系表示成这个实体对集合的边界。这种表示保留了谓词间的包含关系,进而可以用来学习本体包含公理。其次,本文提出了一个基于线性规划的方法,利用Set E训练出的谓词间表示来学习谓词间的包含关系。即把子谓词的得分函数约束当成可行域来求父谓词得分函数的最小值,然后根据最值和阈值来筛选得到公理。最后,设计了大量实验对基于Set E模型的方法和传统方法的性能进行对比。实验表明,本文提出的方法能在真实数据集DBpedia上获取高质量的包含公理,在知识图谱不完整的情况下也能学习到相当的包含公理。其原因主要在于本文设计的表示学习模型Set E能够保留包含关系和将包含公理学习归约成线性规划求解。本文学习包含公理的整个过程具有一定的可解释性,包括训练得到的表示及问题归约过程。并为大规模本体自动化构建提供了一种可行的方法。
其他文献
畜禽废水已成为农村一个主要的面源污染来源,针对这种污染现状,近年来出现了许多废水处理方法。在概括分析了畜禽废水的研究现状后,提出了人工湿地处理技术。通过对人工湿地研究现状的综述,阐述了人工湿地在净化污染物方面的研究进展。并通过对人工湿地在畜禽养殖废水处理中应用的介绍,分析了人工湿地存在的优势和问题,提出了人工湿地在畜禽养殖废水处理中具有广阔的应用前景。
在计算机视觉领域,语义分割是一项十分基本和重要的任务。随着计算机硬件性能,尤其是GPU用于数值计算技术的不断进步,深度学习得以不断发展。全卷积神经网络的出现,使得基于深度学习的语义分割方法取得快速地发展,然而基于视频数据的分割方法获得了较少的关注。视频数据相比于图片数据,多了一维时间序列信息,如何更有效地利用该信息对科研人员提出了挑战。另外,对于智能决策系统来讲,预测未来的能力对于决策来讲具有现实
多层次时间序列指的是由加和关系限制的一组时间序列。多层次预测被广泛应用在电力需求预测、旅游业数量预测以及商业税收预测等统计学、经济学领域。现有的多层次预测方法通常基于一种“两步法”策略。首先,对层次结构中所有的时间序列单独进行预测,然后,采用不同的调和预测算法使其满足加和一致性的限制条件。然而,“两步法”不仅计算复杂度高,而且无法确保所有时间序列的预测是整体最优的。为了解决上述问题,本文从多任务学
随着深度学习技术的不断发展,计算机视觉领域与自然语言处理领域相结合的相关任务研究逐渐成为计算机领域中的一个研究热点。虽然之前已经有相关的研究,如图像语义描述生成以及视觉问答任务,但是这两个任务都只能通过单次交互帮助人类对图像中的信息有基础的了解,而现实生活中对图像中内容的理解是一个循序渐进的过程,即需要通过多次交互对图像中部分内容进行理解,进而通过不断累积最后实现对图像中全部内容的理解。因此,为了
视频问答是多媒体领域和计算机视觉领域中的热门研究课题。该任务要求模型能够根据视频内容和自然语言问题生成答案。这是一个多模态任务,需要问答模型同时对视觉信息和语义信息进行认知和理解,并且融合两个模态的信息进行推断。近年来一些学者开始关注更为复杂的视频问答任务及方法。其一是视频问答中的多步推理,即问答模型能够对包含多重逻辑运算操作如数学运算和属性比较的问题进行解答。其二是将视频问答与视觉定位两个多模态
随着商品物流的增加,特别是对外贸易的加大,在物流和仓储过程中,物体由于倒置或倾斜而引起的严重损坏增多。一些敏感的物体包装上特别标有物品需向上放置的标识,一旦运输过程中发生倾斜,轻则导致经济损失,重则发生危险。如家用电器,医疗设施,化学试剂等。此外,在图书馆中,书籍也会被垂直放置以便查阅。RFID(Radio Frequency Identification,射频识别技术)的兴起和不断完善给进一步提
稀疏数据是在数据集中绝大多数数值缺失或者为零的数据,如何挖掘稀疏数据特征之间的隐含关系从而对其进行预测分析是本文的主要研究问题。目前,主流的挖掘特征间隐含关系的方法无法较全面地抽取特征间隐含关系进行更深层次的学习。通过在特征学习过程中对特征和特征之间的隐含关系进行丰富和扩充,从而提高对特征间隐含关系的学习能力。本文提出一种基于特征之间隐含关系的稀疏预测方法,结合丰富的特征信息参与特征间隐含关系的自
知识图谱近年来得到了广泛应用和扩展,其标准数据模型RDF图数据表现出的复杂性、稀疏性和多样性,造成了RDF处理引擎在存储和查询过程的复杂性,进而导致查询响应的低效性。目前大部分引擎对常见RDF数据特征进行固定模式的处理,无法体现出灵活性。因此研究自适应的RDF处理方法对知识图谱数据处理具有重要意义。本文设计并实现了自适应的RDF处理方法,从存储和SPARQL查询两个方面来提升RDF数据处理的性能。
软件安全知识包括异质软件安全概念(例如,软件缺陷和攻击模式)和软件安全实例(例如,某个特定软件产品的安全漏洞),它们都可以被视为软件安全实体。软件安全实体间具有许多类型内以及跨类型关系。软件安全实体间的关系推理有助于丰富现有的软件安全知识,并对紧急出现的软件安全实体作出解释。然而遗憾的是,软件安全实体目前被记录在不同数据库的超文档中,这种超文档的表示方式不支持软件实体间关系的有效推理。此外,现有的
随着信息技术的发展,真实数据往往具有多视角的特性,即同一对象数据由多个模态或多个数据源构成。例如,对同一物体可以由其图片展示其特征,也可由语言描述其属性信息;一张自然图像可从颜色、形状、纹理等不同角度分别提取信息,由其共同表示。由于机器学习任务很大程度上依赖于数据的特征表示,而表示学习方法可以减少人工设计的难度和随意性,自动地从数据中学习出高效的表征。无论是监督还是无监督的任务,借助多视角数据丰富