基于循环卷积神经网络的实体关系抽取方法研究

来源 :北京化工大学 | 被引量 : 5次 | 上传用户:huxiaoshenshan2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系抽取作为自然语言处理领域的重要任务之一,近些年来一直是学术界和工业界的研究热点。实体间语义关系的抽取,对于信息检索、自动问答、智能推荐等前沿领域都具有重要的意义。传统的实体关系抽取方法需要人工设计特征,耗费大量时间及人力,且容易导致错误传播问题。基于神经网络的方法可以自动进行特征学习,避免了大量人工标注工作。其中,卷积神经网络因其优秀的特征提取能力已逐渐被用于实体关系抽取任务中。然而,对于文本语料中较长的实体共现句,往往只能获取到局部的特征,并不能学习到长距离依赖信息。本文研究结合使用循环神经网络和卷积神经网络的实体关系抽取方法,主要工作如下:(1)针对简单卷积神经网络不能学习长距离依赖信息的问题,本文提出将擅长处理远距离依赖关系的循环神经网络GRU加入到卷积神经网络的向量表示阶段,通过双向GRU学习得到词语的上下文信息向量,为后续的关系模型训练提供更加丰富的特征。(2)针对卷积神经网络中普通最大池化无法捕获两个实体间结构信息的问题,本文提出在卷积神经网络的池化层采取分段最大池化方法,在获取实体对结构信息的同时,提取更细粒度的特征信息。(3)针对远程监督方法自动构建标注语料带来的错误标注问题,本文提出在关系抽取模型中加入基于句子级别的注意力机制,使正确表达对应关系的语句得到较高的注意力权重,同时降低错误标注语句的注意力权重,以此弱化错误标注语料对模型的干扰,提高实体关系抽取的准确率。本文分别设计了英文和中文语料上的实验验证,实验结果表明本文方法能有效提高实体关系抽取的准确率与召回率。
其他文献
背景;晚期胃癌传统常规药物治疗方式虽然能够起到控制病情的作用,但对患者症状改善的效果并不明显,而且还会给患者带来较大的痛苦。目的:对比研究替吉奥胶囊单药和常规药物在晚期
采集了江苏省南通市滨江公园休闲新天地项目的建筑和绿道改造的实例,对其外观、结构和使用效果等进行了分析、评价,并对我国新时期滨江公园休息、娱乐建筑及附属绿道的规划与
背景:在多孔材料磷酸钙骨水泥粉末中复合纤维蛋白胶是否能有效改善磷酸钙骨水泥的生物力学性能,同时加速其在体内的降解代谢,促进体内骨再生,目前还未被证实。目的:构建不同配比的
目前,负压吸宫术仍是避孕失败或意外妊娠补救措施的主要方法之一.我国在以往负压吸宫术时,一般不采用麻醉,受术者需要忍受扩宫和吸宫时的痛苦.随着妇女生殖健康越来越受到重
背景:近年来,许多国内外学者采用联合非融合及融合固定治疗多节段脊髓型颈椎病,取得良好临床效果,但相关远期临床疗效及可能出现的并发症还需要长期的随访进行更深入的研究。 目
背景:胸腰椎角状后凸手术的治疗难点在于矫正率低,矢状面重建难,易发生神经并发症,术后失平衡、假关节发生率高及术后矫正度丢失。 目的:探讨改良经后路全脊椎切除截骨端双侧钉棒