【摘 要】
:
知识图谱表示学习旨在将知识图谱中的实体和关系编码到一个低维、连续的向量空间之中,以此来支撑不同领域的应用,如知识图谱补全、问答、推荐系统等。在现实应用中,知识图谱总是动态变化的,既会有新知识的加入,也会有旧知识的删除。大多数现有知识图谱表示学习模型都注重于对静态环境下的知识图谱进行编码,却忽略了其动态性。为了应对知识图谱产生的变化,这些模型需要花费很高的时间代价去重新训练整个图谱,而无法以一种更高
论文部分内容阅读
知识图谱表示学习旨在将知识图谱中的实体和关系编码到一个低维、连续的向量空间之中,以此来支撑不同领域的应用,如知识图谱补全、问答、推荐系统等。在现实应用中,知识图谱总是动态变化的,既会有新知识的加入,也会有旧知识的删除。大多数现有知识图谱表示学习模型都注重于对静态环境下的知识图谱进行编码,却忽略了其动态性。为了应对知识图谱产生的变化,这些模型需要花费很高的时间代价去重新训练整个图谱,而无法以一种更高效的方式去更新图谱的向量表示。为了解决以上问题,本文提出了一个新的基于上下文的动态知识图谱表示学习方法(Dynamic Knowledge Graph Embedding,简称DKGE)。该方法不仅支持对知识图谱进行表示学习训练,还支持在图谱发生更新时,以一种高效的方式去更新图谱新的向量表示。DKGE为每个实体和关系引入两种向量表示,即知识向量表示和上下文角色向量表示。通过两个基于注意力机制的图卷积神经网络和门策略,对实体、关系自身与其上下文进行联合建模。这样的建模方式既有效提升了表示学习的效果,又有效地将图谱更新带来的影响限制在一定范围内,而非整个图谱。得益于此,DKGE可以通过本文设计的在线表示学习算法来高效地更新图谱的向量表示。本文的主要贡献如下:1)提出一个基于上下文信息的知识图谱表示学习模型:通过对实体和关系的上下文信息进行编码,并和实体和关系自身的向量表示进行联合训练,得到实体和关系的高质量向量表示。2)提出一个动态环境下的知识图谱向量表示的在线表示学习算法:在上述基于上下文信息的表示学习模型的基础上,设计了一个在线表示学习算法,能够在图谱更新后高效获得新的高质量向量表示。3)在真实世界的数据集上进行实验,并利用常用的评估标准对实验结果进行评估:实验结果表明本文提出的基于上下文信息的知识图谱表示学习模型相比于其他表示学习模型表现更佳,本文的在线表示学习算法不论是效果还是效率都表现优异(尤其是效率)。研究动态环境下的知识图谱表示学习方法,能够有效提升知识图谱表示学习技术在动态环境下的应用能力,将众多现有基于知识图谱与知识图谱表示学习的应用扩展到动态场景之下。这不论是对于知识图谱本身还是基于知识图谱与知识图谱表示学习的应用的发展都具有重要意义。
其他文献
随着导航定位和无线通信技术的发展,超宽带定位技术在管廊中的应用受到了更加广泛的关注。针对管廊内部复杂环境带来的定位精度降低,以及管廊实时监控、人员管理、安全保障等定位服务软件需求,开展了超宽带定位技术研究和软件设计。本文首先分析了管廊定位系统的技术需求和指标。基于到达时间差(time difference of arrival,TDOA)的极大似然估计定位算法在管廊环境的实际测试中,由于锚点数量少
人耳识别技术是利用人耳的纹理特征或结构特征进行身份识别的技术,是生物特征识别领域的新兴研究方向。由于人耳相比人脸的某些独特优势,使其在近几年发展迅速,受到许多研究者的关注。而三维人耳利用了三维处理技术,突破了二维人耳识别技术的瓶颈,对姿态、光照等外部干扰因素具有较强的鲁棒性,成为国内外的研究热点。虽然三维人耳不受化妆、表情、光照等因素的影响,但如何对具有高相似度的人耳进行区分依然是一个难题。本文在
随着计算机视觉技术的发展,三维人脸重建技术在许多领域内都具有很大的潜力,基于双目立体视觉的三维重建技术由于成本低廉、操作简便而受到了广泛关注,经过几十年的发展,已经取得了非常不错的成绩,然而仍难以重建精度较高的三维人脸模型。针对传统立体匹配算法对低纹理人脸图像的匹配精度较低的问题,本文展开了深入研究并提出了相应的解决办法。基于本文搭建的实拍图像采集系统以及FRGC v2.0人脸数据库,对本文所提的
随着控制技术朝着复杂计算机网络控制方向发展,控制设计人员不能只解决底层的实时控制问题,还要解决上层辅助制造所带来的综合自动化问题。本文对某订单型制衣企业服装缝制流水线的编排优化问题进行了研究,针对目前普遍没有研究到的多缝制流水线工序工位编排优化问题和多缝制流水线工人编排优化问题,进行了建模与求解。在此基础上,开发了一套具有决策支持功能的服装缝制流水线编排系统,以加快缝制流水线的组织速度、提高多条缝
远程监督关系抽取通过对齐知识图谱中的三元组和大规模文本语料来生成大量用于关系抽取的数据。尽管远程监督的方法可以避免人工标注数据,但不可避免地引入了噪声问题。最新的一些方法通过引入实体相关的背景知识来解决噪声问题,如知识图谱中实体的类别信息等。然而这些方法仍然面临一些挑战。一方面,这些方法只引入了单一源的背景知识,需要定制特殊的模型且信息的覆盖率不高。另一方面,这些方法没有考虑引入背景知识中的噪声对
知识库问答是自然语言处理领域中的一项重要任务,其目的是根据自然语言描述的问题,从知识库中查找或推断出问题的答案,具有重要的研究价值和意义。如何跨越自然语言与知识库查询语言之间的差异是知识库问答的难点。语义解析方法将自然语言问题转化成对应的形式化查询,是目前得到广泛研究的一个方向。然而,在面对日益复杂的自然语言问题时,现有的语义解析方法暴露出关系检测准确较低,形式化查询构建噪声过大等缺点。本文的研究
通过对生物医学文献的信息抽取,可以提高生物医学领域知识库构建的自动化程度,以进一步支撑计算机在该领域的文献检索、诊断决策、学术查新、预测分析等方面的应用。医学专利作为一种医学科技文献,其内容创新性、时效性强,并且有完善的实验验证,在学术上和商业上均具有很高的利用价值。抗肿瘤药物是近年来备受关注的一个研究热点,该领域专利公开量也较多,但目前针对抗肿瘤药物专利的分析工作主要靠人工完成,代价较高。研究从
随着我国经济的不断发展壮大,人民群众的消费水平和消费观点逐步升级提高,房地产行业迎来了黄金时期,家装市场上的客户需求也与日俱增。然而家装设计的繁琐和低效无法满足当今市场对数量和质量的需求,家装行业对自动化提出了更高的要求。目前,家装设计的过程需要设计师手动临摹和标注户型图信息,生成三维模型,然后根据专业化知识,通过多次调整和设计来完成家具的布局,往往需要花费大量的时间,只能提供少量的方案供用户选择
API推荐技术面向程序开发人员推荐符合当下编程场景的API方法,在现代软件开发过程中扮演着越来越重要的角色。在急剧增长的开发需求推动下,API推荐技术得到了快速发展,但对API推荐技术的评估却关注的很少。目前研究人员普遍采取的评估方法是从信息检索领域或者其他推荐领域借鉴而来,其中正确性的评估是研究人员和用户最关心的评估结果。但是本文通过实证研究发现,目前API推荐系统的正确性评估存在着以下问题:正
学习分布式且解耦的有效表示是无监督学习的一个重要研究方向,而由多个有效表示混合生成的场景在进行解绑识别时存在歧义问题,即绑定问题(Binding Problem),其广泛存在于视觉和语音等领域的现实应用中,如自动驾驶及虚拟现实中的场景分割和多演讲者语音分割等。感知成组(Perceptual Grouping,PG)是解决绑定问题的重要机制,其具备从复杂结构化输入场景中识别出各实体对象完整有效表征的