基于循环卷积神经网络的实体关系抽取方法研究

来源 :北京化工大学 | 被引量 : 5次 | 上传用户：huxiaoshenshan2010

【摘要】

：

实体关系抽取作为自然语言处理领域的重要任务之一,近些年来一直是学术界和工业界的研究热点。实体间语义关系的抽取,对于信息检索、自动问答、智能推荐等前沿领域都具有重要

【作者】

：

严欢春

【出处】

：

北京化工大学

【发表日期】

：

2018年01期

【关键词】

：

关系抽取远程监督 GRU 卷积神经网络注意力机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

实体关系抽取作为自然语言处理领域的重要任务之一,近些年来一直是学术界和工业界的研究热点。实体间语义关系的抽取,对于信息检索、自动问答、智能推荐等前沿领域都具有重要的意义。传统的实体关系抽取方法需要人工设计特征,耗费大量时间及人力,且容易导致错误传播问题。基于神经网络的方法可以自动进行特征学习,避免了大量人工标注工作。其中,卷积神经网络因其优秀的特征提取能力已逐渐被用于实体关系抽取任务中。然而,对于文本语料中较长的实体共现句,往往只能获取到局部的特征,并不能学习到长距离依赖信息。本文研究结合使用循环神经网络和卷积神经网络的实体关系抽取方法,主要工作如下:(1)针对简单卷积神经网络不能学习长距离依赖信息的问题,本文提出将擅长处理远距离依赖关系的循环神经网络GRU加入到卷积神经网络的向量表示阶段,通过双向GRU学习得到词语的上下文信息向量,为后续的关系模型训练提供更加丰富的特征。(2)针对卷积神经网络中普通最大池化无法捕获两个实体间结构信息的问题,本文提出在卷积神经网络的池化层采取分段最大池化方法,在获取实体对结构信息的同时,提取更细粒度的特征信息。(3)针对远程监督方法自动构建标注语料带来的错误标注问题,本文提出在关系抽取模型中加入基于句子级别的注意力机制,使正确表达对应关系的语句得到较高的注意力权重,同时降低错误标注语句的注意力权重,以此弱化错误标注语料对模型的干扰,提高实体关系抽取的准确率。本文分别设计了英文和中文语料上的实验验证,实验结果表明本文方法能有效提高实体关系抽取的准确率与召回率。

其他文献

晚期胃癌患者采用替吉奥胶囊单药和常规药物的疗效对比

背景；晚期胃癌传统常规药物治疗方式虽然能够起到控制病情的作用，但对患者症状改善的效果并不明显，而且还会给患者带来较大的痛苦。目的：对比研究替吉奥胶囊单药和常规药物在晚期

期刊

替吉奥胶囊单药常规药物晚期胃癌组织工程

世界级气相法白炭黑项目落户江西

期刊

白炭黑需求量卡博特蓝星化工有限公司美国中国气相法

滨江公园休闲新天地项目的设计探讨

采集了江苏省南通市滨江公园休闲新天地项目的建筑和绿道改造的实例,对其外观、结构和使用效果等进行了分析、评价,并对我国新时期滨江公园休息、娱乐建筑及附属绿道的规划与

期刊

滨江公园休闲建筑绿道Binjiang Parkleisure buildinggreenway