基于深度学习的英文事件抽取研究

来源 :苏州大学 | 被引量 : 4次 | 上传用户:chengzi1022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件是指在某个特定的时间和环境下发生的,由若干角色参与,表现出若干动作特征的客观事实。事件抽取任务要求从含有事件信息的非结构化自由文本中,自动识别和抽取出包含有事件触发词和事件角色的结构化信息。传统的事件抽取方法过多的依赖人工选取的特征,一方面人工抽取特征需要专家的领域知识,另一方面这样构建的系统适应性差,泛化能力低。近年研究者开始使用深度学习的方法来自动学习特征,本课题针对如何将深度学习应用到事件抽取任务中展开深入研究,主要研究内容包括以下三个方面:利用深层语义特征优化事件抽取目前很多方法使用浅层的词汇层面特征,很难获得文本中更深层的语义信息,训练得到的模型泛化能力较弱。本课题在传统浅层学习特征的基础上,引入深层语义特征,提高模型的泛化能力。基于神经网络的事件抽取研究传统的基于特征工程的事件抽取方法依赖于人工精心设计的特征和复杂的自然语言处理工具。这些方法虽然经过实验证明是有效的,但是花费了大量人工精力而且会有数据稀疏的问题。本课题使用基于神经网络的事件抽取方法,可以不使用大量人工设计的特征而自动学习句子中的特征。此外,本课题提出联合卷积神经网络和双向循环神经网络的事件抽取模型,结合卷积神经网络和循环神经网络二者的优点,进行事件触发词识别和事件类型分类。融合上下文依赖和句子语义的事件抽取现有的方法忽略了待测词与上下文的依赖关系和句子的语义信息,这些信息对事件抽取是很有帮助的。本课题提出一种神经网络方法,利用双向长短时记忆网络抓取待测词在句子中的上下文依赖,同时使用门控循环神经网络学习句子的语义表示,融合这两种信息提高事件触发词的识别能力。较传统方法,该方法不使用任何自然语言处理工具,避免错误传递;与现有的神经网络方法相比,该方法能有效利用上下文依赖和句子的语义信息,提高事件抽取的性能。
其他文献
随着海洋技术的发展,水下通信网络,作为通信网络的一个重要分支,在海洋监测、水下定位、海洋资源勘探等方面发挥了重要的作用。但是,水下通信网络的研究也有一定的困难,有很
人工智能是计算机科学的一个分支,目的是使机器能够像人类智能一样感知环境并最大化达到目标的可能。机器博弈是人工智能极具挑战的分支之一,其研究对人工智能的发展具有积极
人脸识别技术作为最具有发展潜力的生物特征识别技术之一,在最近几年得到了广泛的研究和应用,尤其是基于视频的人脸识别技术。本文重点研究基于视频的近距离人脸识别方法,主
随着电子商务的迅猛发展,用户购买和使用产品之后会在Web上发表对产品的评论,产品评论的自动挖掘对于商家和潜在的消费者有着重要意义。本文以中文产品评论为主要研究对象,从
项目调度问题是一类具有顺序约束和资源约束的组合优化问题,是典型的NP难问题。机器调度是特殊的项目调度问题。   本论文以最小化完工时间为优化目标,研究两类典型的机器
离群点检测作为知识发现的重要部分,被广泛的应用于欺诈识别、入侵检测、故障诊断及恶劣天气预报等领域。近年来,随着人们对离群数据挖掘重要性认识的不断加深,以及其越来越
多视角视频拼接被广泛应用于视频监控、视频会议、卫星遥感等领域,它可以在保证高分辨率的情况下扩大视频视角,一直是计算机视觉领域的研究热点。多视角视频拼接的关键是视频
现实社会中存在着各种具有特定功能的系统,例如电子商务系统、科学著作系统、在线社交系统等,这些系统可被抽象为具有复杂内部结构的网络,称为复杂网络。很多研究表明,复杂网
在我国,化肥的施用存在利用率低、环境污染严重等问题。为了解决这些问题,必须进行精准变量施肥。国内外在变量施肥控制系统的研究方面有很多成果和进展。国外的成型系统尽管
学位