【摘 要】
:
知识图谱的表示学习旨在将实体和关系投影到低维连续的向量空间中,从而使知识图谱与机器学习模型兼容。知识图谱补全是预测实体之间缺失关系的任务,知识库中有大量的关于实体描述的重要文本信息,而现有的基于卷积网络结构的知识图补全模型只仅仅考虑表明实体之间关系的知识三元组,而没有考虑到实体的文本描述。为此,论文提出了基于门控卷积神经网络的文本增强嵌入模型(GConvTA),将三元组的结构向量与实体描述编码得到
论文部分内容阅读
知识图谱的表示学习旨在将实体和关系投影到低维连续的向量空间中,从而使知识图谱与机器学习模型兼容。知识图谱补全是预测实体之间缺失关系的任务,知识库中有大量的关于实体描述的重要文本信息,而现有的基于卷积网络结构的知识图补全模型只仅仅考虑表明实体之间关系的知识三元组,而没有考虑到实体的文本描述。为此,论文提出了基于门控卷积神经网络的文本增强嵌入模型(GConvTA),将三元组的结构向量与实体描述编码得到文本向量加以融合,能从符号三元组和文本描述中共同学习,能够建立事实三元组和文本描述之间的联合和交互。将所有三元组(头实体、关系、尾实体)通过预训练表示为3列结构嵌入矩阵和由带有注意力机制的双向长短记忆网络编码实体描述得到3列文本嵌入矩阵。在门控卷积神经网络中,一方面,将文本表示和结构表示在输入层进行融合,得到融合后的特征图。另一方面,也可以在门控卷积层进行特征交互,即结构嵌入和文本嵌入分别输入到卷积中,在门控单元中通过点乘操作,将两个表示得到的特征图进行交互。最后将两个阶段得到的特征图进行再次融合,得到代表三元组的特征向量,这个特征向量通过点乘操作得到最终的评分,来判断三元组是否有效。论文在FB15k-237,WN18RR等基准数据集上进行了链接预测实验,结果表明,GConvTA模型在链接预测实验中优于之前的基线模型如ConvKB、ConvE等模型。将GConvTA模型应用于零次学习场景中,各项指标均高于DKRL模型,进一步说明,论文模型在文本增强知识表示模型中的优越性。
其他文献
随着信息技术的发展,真实数据往往具有多视角的特性,即同一对象数据由多个模态或多个数据源构成。例如,对同一物体可以由其图片展示其特征,也可由语言描述其属性信息;一张自然图像可从颜色、形状、纹理等不同角度分别提取信息,由其共同表示。由于机器学习任务很大程度上依赖于数据的特征表示,而表示学习方法可以减少人工设计的难度和随意性,自动地从数据中学习出高效的表征。无论是监督还是无监督的任务,借助多视角数据丰富
本体公理学习,是本体工程中重要的任务,主要是从知识图谱中构建逻辑包含关系。近来,如何利用表示学习来从大规模知识图谱中学习本体包含公理是一个很大的挑战。一方面是知识图谱的规模越来越大,传统的本体公理构建方法无法应对如此大的规模;另一方面现有的知识图谱表示学习无法刻画谓词间的逻辑关系。因此研究能够表示谓词间逻辑包含关系的表示学习模型是此问题的关键。本文尝试学习保留谓词包含关系的表示和线性规划来解决这一
当深海环境涉及到一定深度时,常常会因充满未知和危险等恐怖因素而引起人们的恐惧情绪,对于患有深海恐惧症的人来说更是如此。而当今时代,随着海洋领域的发展出现了越来越多需要进入深海开展的工作。许多深海工作者必须经常潜入深海中直面恐惧并进行与认知有关的作业,而关于深海恐惧对认知的影响却不甚清晰。本研究探讨了沉浸式虚拟现实诱发的深海恐惧情绪对工作记忆(一种容量有限的认知系统)的影响。要求参与者在通过虚拟现实
随着人工智能的发展,以人为中心的面部表情识别已逐渐受到业界和学术界的普遍关注。面部表情动作单元(Facial Action Units,AUs)是面部表情的重要客观描述,并且AU的检测与分析对于理解和描述人脸表情有着重要的意义。然而,由于AU标注的复杂性以及现有的AU表情数据集的相对较小等问题,如何对现有的AU数据集的扩充,以解决AU数据集标签不均衡问题,已经成为本领域亟需解决的一个问题。本文旨在
作为一种流行的人体生物识别技术,步态身份识别因其在安防监控和人机交互等领域中广阔的应用前景和经济价值,引起了研究人员的广泛关注。现有的步态身份识别技术大多依赖于专用的设备,由于受设备自身条件和使用环境的限制,无法全面满足不同应用场景的识别需求。利用Wi-Fi信号进行人体行为感知具有成本低、非入侵、普适性好等优势,可以用来弥补专用设备的不足。本文研究基于Wi-Fi信道状态信息(Channel Sta
计算机视觉作为目前深度学习应用最为热门的研究方向之一,主要包含图像分类,目标检测,语义分割等子问题。近年来,由于卷积神经网络的发展,图像分析相关模型的性能得到了突飞猛进的提升。同时由于网络结构的不断进化,模型所需要的计算开销也呈现爆炸式增长。在保证模型性能的基础上降低模型所需参数、提高模型运行速度具有重要的研究意义和应用价值。蒸馏学习是近年来提出的模型轻量化方法,该方法通常将庞大臃肿的模型中的知识
在解决复杂的大规模图处理任务时,需要频繁交替使用图查询与图分析,然而目前在理论上图查询与图分析尚未统一,造成查询与分析结果的可靠性无法保证,进而导致查询与分析的优化方法有限。所以如何统一图查询与图分析,设计包含图查询与图分析的统一理论框架对于高效解决大规模图处理任务十分重要。本文基于SPARQL图查询语言,建立统一的图查询与图分析理论基础,包括其语法及语义,并研究讨论其基础理论性质,即表达性与复杂
随着科技发展,诸如全球定位系统之类的位置获取设备的部署迅速增长,目前已经产生了庞大的轨迹数据,其中包含许多有价值的信息,并且已经被用于许多实际应用中,比如城市计算和智能交通系统。对这些轨迹数据的分析处理成为关键,本文提出了一种基于轨迹分段的新颖轨迹总结方法。它是一种综合了轨迹异常检测、轨迹聚类和轨迹分段的多角度分析方式。本文的基于分段的轨迹总结框架包括五个阶段。首先,执行基于搜索窗和相对距离比的异
车载自组织网络(VANETs)是移动自组织网络中的一种,它支持车对车(V2V)和车对基础设施(V2I)通信。自组织性、分布式网络和高度动态的拓扑是VANETs的三个重要特征。VANETs的特点及其在道路安全中的应用引起了工业界和学术界的浓厚兴趣,它在改善交通管理系统,控制交通流量以及改善用户驾驶体验方面有着重要研究意义。然而在这些应用部署前必须先解决网络中信息安全和用户隐私保护问题。聚合签名认证协
如今,越来越多的应用和系统都由神经网络(深度学习)所驱动,影响着或者将影响人类日常生活中的许多方面,比如推荐系统、人机交互甚至是安全防护等领域,具体场景包括信用账户评估、垃圾邮件过滤、车牌识别等等。但是神经网络本身也有缺陷,即便是基于深度神经网络的图像分类器也容易受到微小的、难以察觉扰动的影响。恶意生成的对抗样本,虽然不会对人类肉眼的识别过程造成较大的影响,但它却会利用神经网络的不稳定性,误导模型