结合注意力机制与长短期记忆网络的中文事件抽取方法研究

来源 :北京交通大学 | 被引量 : 10次 | 上传用户:luodf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网如今已经成为人们获取信息的主要途径之一,人们可以轻松快速地从互联网上获取各种各样的信息。但是,伴随着互联网上的信息呈指数式增长,人们置身于一个信息爆炸的环境中,每天面对铺天盖地的各种信息,甚至已经严重超出了人们的承受范围。因此,如何从海量的信息中找到人们真正关心的信息已成为当前亟待解决的一个问题,信息抽取由此而成为大家关注的重点。事件抽取技术研究是信息抽取研究领域中一个极为重要的子任务,也是当前信息抽取研究任务中的难点和热点之一。事件抽取的任务就是从自然语言描述的海量非结构化文本中抽取用户关心和感兴趣的事件(包括事件的类型和子类型以及事件所涉及的实体、时间及数值等元素),然后用结构化的形式保存和呈现,提供给用户浏览。抽取的事件还可以作为输入信息,提供给机器翻译、文本检索、知识图谱、推荐系统等多种应用,具有重要的实际应用价值和学术研究意义。本文主要面对中文事件抽取,研究中文事件的检测与分类以及中文事件的元素角色抽取。事件检测与分类任务其实是识别事件触发词的过程,这个过程分为两步:触发词识别和触发词分类。本文结合注意力机制和长短期记忆神经网络,提出了 ATT-BiLSTM算法,不依赖词性标注和实体识别,不需要人工设置特征,合二为一地进行事件检测与分类。该方法可以捕捉文本的局部信息和全局信息,通过在ACE 2005中文事件语料集上设置对比实验,相对于传统的模式匹配方法、机器学习方法以及一些现有的深度学习方法,ATT-BiLSTM算法在性能方面有了明显提升。事件元素角色抽取任务分为元素识别和元素角色分类两步。结合通过事件检测与分类获得的事件触发词信息,本文提出了一种结合注意力机制和双层BiLSTM的ATT-DBiLSTM算法,用来完成事件元素角色的抽取。通过引入触发词信息,弥补了事件元素角色抽取中结构特征过于松散的缺陷。通过在ACE2005中文事件语料集与其他现有方法进行对比,本文提出的ATT-DBiLSTM算法明显提高了事件元素角色抽取的性能。
其他文献
图象分割是目标识别、图象理解、计算机视觉研究中最基本和最重要的处理步骤和共同、关键的技术。分割结果的好坏直接影响其后续的识别和理解。图象分割虽历来受到国内外研究
本研究基于导师多年临床经验,并结合中医药现代研究,提出瘀阻脑络为血管性痴呆的基本病机,肾阳虚衰为血管性痴呆的重要发病基础。以活血化瘀,温补肾阳为重要治法,旨在以活血化瘀,疏
情感教育是使学生身心感到愉快的教育,它关注教育过程中学生的态度、情绪、情感以及信念,以促进学生的个体发展和整个社会的健康发展。“应试教育”指导下的语文教学,注重从知识
风险投资是当今世界以及中国最具活力、最具开创精神、最富有传奇色彩的投资热点问题。本文立足于笔者的实践及对中外大量的案例调研,在搜集了众多的第一手资料、最新数据的基
为了深入揭示针刺治疗脑梗塞的作用机制,本课题以大脑中动脉阻断(MCAo)造成大鼠局灶性脑梗塞为实验模型,以针刺对脑缺血时软脑膜微循环的影响为主题,采用显微录相装置结合血管内皮
从西周到秦汉是我国历史上一个重要的转型时期,其中最重要的变化就是完成了从世袭的等级社会向流动的等级社会的转变。本文通过分析社会成员身份等级的划分从西周以世袭制为主
DREB转录因子是重要的转录因子之一,在调控与逆境相关基因的表达、提高植物对逆境胁迫适应性中发挥重要作用。文章综述DREB转录因子的克隆、结构特点、表达、与植物逆境胁迫
<正> 《福布斯》世界富豪、日籍韩裔富豪孙正义19岁的时候曾做过一个50年生涯规划:20多岁时,要向所投身的行业,宣布自己的存在;30多岁时,要有1亿美元的
近年来,我国的会计规范和所得税制度进行了一系列循序渐进的改革。2006年2月15日,财政部颁布了包括1项基本准则和38项具体准则在内的企业会计准则体系。2014年7月,财政部又修
随着地震灾害的频频发生,桥梁的抗震研究也越来越受到广泛的关注。其中土基础结构相互作用体系的问题研究一直是抗震研究的一个特殊的问题。在对土基础结构相互作用体系的分析