面向知识图谱的关系抽取算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:yueyue7373
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱作为目前高效的信息管理技术,能够提高搜索引擎和问答系统的性能,具有广泛的研究前景。知识图谱的构建是应用的基础,关系抽取作为信息抽取的主要任务之一,能够为知识图谱构建提供实体关系三元组,是知识图谱构建的关键技术。远程监督关系抽取方法通过数据自动对齐远程知识库来解决有监督需要大量标注数据的问题,适合应用到知识图谱构建领域,但是远程监督获取的标注语料中存在大量的噪声数据,会影响模型的性能。知识图谱的构建是不断更新完善的过程,利用知识图谱自身的语义信息能够改善关系抽取的性能,提供更高质量的实体关系三元组。本文根据关系抽取和知识图谱的相关知识,结合知识图谱的需求及相关技术,研究了面向知识图谱的关系抽取。本文的主要研究工作如下所述:1)提出采用实体注意力机制(Entity Attention)的关系抽取模型(EA+PCNN+ATT),基于实体注意力机制捕捉不同单词对语句关系表达的影响,联合PCNN(分段卷积神经网络)抽取语句的文本特征,使得模型能够抽取全面的语义特征,此外增加句子层面的注意力机制,减少错误标签对关系表达的影响。与已有的方法相比,能够注意到不同单词对关系表达的影响,提高关系抽取模型的性能。2)提出基于强化学习(Reinforcement learning)的关系抽取模型(PCNN+RL),由于远程监督的数据对齐过程会产生噪声数据,远程监督关系抽取模型一般采用bag(包)级别的训练数据,使用粗粒度的监督信号,这样会降低模型的性能。基于强化学习的实例选择器选取最能表达包关系标签的语句,作为关系分类器的训练数据。与已有的方法相比,解决了远程监督关系抽取的噪声和粗粒度问题,为知识图谱构建提供高质量的实体关系三元组。3)提出结合知识图谱嵌入的关系抽取模型(KG+PCNN),知识图谱的构建是不断完善更新的过程,知识图谱本身蕴含着丰富的语义信息,利用这些信息能够抽取句子中隐含的关系。KG+PCNN首先使用PCNN抽取语义特征,同时利用知识图谱嵌入模型获得知识表示,将两个模型进行联合学习,有效的利用知识图谱的先验信息,改善关系抽取模型的性能。与已有的方法相比,利用全局损失函数联合训练两个模型,能够使两个模型互相促进,提高模型的性能。本文在远程监督基准数据集上进行实验证明了上述方法的有效性。
其他文献
学位
随着通信技术的发展,对于远距离通信的需求越来越高,功率放大器作为发射机的最重要组成部分,客观上推动了功率放大器的发展。固态功率放大器经过几代技术的更新与积累,在大功率小体积的优势条件下受到越来越多研究者的关注。特别是第三代GaN高电子迁移率晶体管,耐压值较前两代技术有较高的提升,且热传导高,有利于大功率器件的散热。本文针对第三代GaN高电子迁移率晶体管设计了一款工作在2-6GHz的宽带平衡式内匹配
学位
为了进一步提升对置活塞式自由活塞发动机(Free-piston Engine,FPE)的燃料利用效率与排放性能,本文以课题组研制的第四代对置活塞式FPE作为研究对象,采用三维计算流体力学的方法对发动机的缸内燃烧过程进行了参数化仿真研究。研究内容主要包括以下几个方面:(1)基于对置活塞式FPE的具体结构,设计了喷雾导向型燃烧组织方式。分析了发动机混合气形成过程和燃烧过程的评价指标。(2)建立了对置活
被动导引头是反辐射导弹(Anti Radar Missile,ARM)的重要组成部分,其需要在复杂的电磁环境中对雷达信号进行实时准确地搜索和跟踪,并能在诱骗条件下引导ARM最终成功打击目标。被动导引头接收到多部雷达交织在一起的脉冲序列,通过雷达信号分选技术将交叠的雷达信号分选出来,当成功锁定目标后,进行诱饵识别,从而准确打击目标。本文针对ARM导引头上的关键技术雷达信号分选和抗诱骗技术进行了研究,
C-N轴手性化合物是多种高效配体和催化剂的核心骨架,广泛存在于天然药物和生物活性分子。烯酰胺类轴手性化合物是C-N轴手性化合物的表现形式之一,备受研究人员的广泛关注。本论文的研究内容主要是通过不对称烯丙基化-异构化反应体系合成烯酰胺类轴手性化合物。目前,烯酰胺类轴手性化合物的获得主要依赖于手性制备液相,其高效的立体选择性合成方法尚无报道。本论文通过不对称烯丙基化-异构化串联反应首次合成了烯酰胺类轴
针对钝感剂在发射药贮存期间的扩散迁移影响发射药服役寿命的问题,采用分子动力学模拟(Molecular Dynamics Simulation,MD Simulation)比较邻苯二甲酸二丁酯(DBP)、丁基硝氧已基硝铵(Bu-NENA)、硝化三乙二醇(TEGDN)与聚新戊二醇己二酸酯(NA)四种典型钝感剂在发射药体系中的扩散性能。同时,探究温度、硝化棉(NC)含氮量、钝感剂浓度和硝化甘油(NG)含
学位
学位
双频探测一般采用多种吸光材料复合的方式,以特殊的复合结构实现单一材料不能实现的波段选择探测,比如拓宽探测波长,划分探测范围,以实现特殊的波段探测需求。目前主要有紫外-可见双频探测、可见近红外双频探测、紫外-红外双频探测、以及近红外中红外双频探测等等。有机无机杂化钙钛矿由于其高的光吸收效率,高的载流子传输效率以及长的载流子扩散长度的独特优势,在LED、太阳能电池、探测器和激光器中有着广泛应用。光学带