基于神经网络的命名实体识别与实体关系联合抽取

来源 :东北师范大学 | 被引量 : 4次 | 上传用户:xxyty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息化的逐步发展,非结构化的文本信息不断增长,如何对大量产生的非结构化文本信息进行有效的处理成为研究的热点。信息抽取技术因其能够从非结构化的文本信息中进行结构化抽取,受到学者们的广泛关注。其中,命名实体识别与实体关系抽取作为信息抽取领域的重要课题,目前解决这个问题的方法主要分为两类:串联抽取和联合抽取。串联抽取方法是通过首先进行命名实体识别,再进行实体关系抽取。这种抽取方式将命名实体识别与实体关系抽取定义为两个相互独立的子任务,它的优点是各个模块之间相互独立、灵活度较高且易于实现。但是,它忽略了两个任务之间的内在联系,而且通过串联抽取方法进行命名实体识别的结果会直接影响到后续进行的实体关系抽取,极易产生误差累积。联合抽取方法旨在构建联合抽取模型,当命名实体识别与实体关系抽取之间存在较强内在联系或依赖关系时,联合抽取模型能够更好的整合两者之间的信息,降低各个中间步骤产生的错误,进而提升抽取模型的性能。本文通过充分分析命名实体识别与实体关系联合抽取方法的研究现状,对目前在命名实体识别与实体关系联合抽取领域效果显著的几种方法进行分析与实验,依据传统联合抽取模型存在的不足,本文提出以下工作:1.为解决串联抽取方法带来的一系列问题,并且避免复杂的人工特征工程,本文通过构建基于神经网络的联合抽取模型进行命名实体识别与实体关系联合抽取任务,基于神经网络的联合抽取模型将命名实体识别与实体关系抽取整合到一个模型中,能够在充分考虑两者内在联系的同时减少人工抽取特征工作。2.针对典型联合抽取模型在训练时需要先进行NER,再根据NER的预测信息进行两两匹配来进行关系分类,易于造成信息冗余的问题。本文提出一种标记策略,将联合抽取问题转化为标注问题,在一定程度上避免了信息冗余的产生。3.本文的研究重点是对于命名实体以及实体间的关系组成的三元组进行抽取,这种抽取方法需要对三元组进行建模,所以,本文基于新的标记策略,构建LSTM-LSTM端到端联合抽取模型,端到端联合抽取模型可以直接通过LSTM神经网络进行建模且无需复杂的特征工程。此外,本文在LSTM解码层添加带有偏置的目标函数,使标签与基于LSTM-LSTM的端到端模型更契合。4.在LSTM-LSTM-Bias模型中引入注意力机制,对模型的输入与输出的相关性进行有效分析,从而获得更多的上下文语义信息。实验结果表明,基于LSTM-Att-LSTM-bias的联合抽取模型能够更准确地识别命名实体并预测实体对关系,实验结果验证了本文提出的算法的有效性和准确性。
其他文献
城乡义务教育均衡发展一直是教育界关注的问题,随着“乡村振兴”战略的提出,农村教育问题更加成为教育热点。文中县域内是指与城市相对的农村地区。在我国当前的教育改革中,
无源定位系统由于自身不辐射信号,具有隐蔽性强、探测距离远、抗干扰能力强的优点,在现代信息化战争中扮演着越来越重要的作用。机载单站无源定位技术具有良好的灵活性和机动
<正>国内小汽车的兴起与公共交通的快速发展,逐渐改变了20世纪城市居民以自行车为主的出行方式。伴随着机动车的快速增长,交通拥堵、空气污染等城市问题逐步显现。与此同时,
林阳寺按摩与导引一瞥福州市鹤龄医院(350007)严明森主题词排尿障碍/按摩疗法,头晕/按摩疗法,咳嗽/按摩疗法,高血压/按摩疗法,腹胀/按摩疗法,疼痛/按摩疗法,@,林阳寺1967年笔者曾从师于北峰林阳寺90高龄的
韦纳的动机归因理论以比较完善的体系和较强的实用性,对我国高等教育领域产生了深远的影响。概述了归因理论的发展历程,以及该理论在教育教学中的应用,提倡教师运用归因理论
改革开放30多年来,我国发生了翻天覆地的变化。经济有了持续的发展,财政收入规模有了迅速的扩大,基本公共服务均等化水平有了明显的提高。但也应当清楚地看到,我国正处在由生
随着媒体网络的发展,广告越发流行,广告宣传对公司的发展也越发重要.因此,现代公司需要在广告上投入更多资金,以提高其产品销量.改革开放以来,中国与世界上许多国家都建立了
目的:检测脂联素基因APM1启动子区-11377C>G(rs266729)、第二外显子区+45T>G(rs2241766)、第二内含子区(IVS2)+712A>G(rs3774261)及3’非翻译区+4545G>C(rs1063539)4个候选单
纺织工厂印染过程中需要消耗大量的水资源,为了将当下环保型社会、经济发展口号落实到位,需要将废水零排放作为企业持续发展的终极目标,就必须引进工艺先进的印染废水零排放
在非定常激励下,等离子体DBD诱导涡是影响等离子体流动控制效果的关键因素,研究静止大气下DBD诱导涡结构特性对进一步理解等离子体DBD流动控制机理具有重要意义。采用高频PIV