基于表示学习的事件抽取方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:susame1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取任务旨在从给定的自然语言文本中抽取出指定类型的事件信息,并形成结构化表达,有助于自动文摘、自然语言生成等任务。由于在复杂的自然文本中获取事件语义信息困难,事件抽取是一个具有挑战的任务。本文主要从表示学习层面对事件抽取任务展开深入研究,主要研究内容包括以下三个方面:(1)目前,大多数事件触发词抽取方法专注于捕获序列中的长距离和局部信息,忽略了论元对触发词抽取的影响。针对这个问题,本文提出了一种基于论元序列表示的事件触发词抽取方法。首先,根据事件类型的分布概率筛选出候选论元,并利用基于注意力机制的循环神经网络能捕获序列中重要线索的特点,提取序列中对触发词抽取贡献最大的候选论元;其次,结合该候选论元和利用双向长短时记忆网络模型获得触发词的上下文表示来抽取触发词。在ACE2005上的实验结果表明,该方法降低了噪声实体对事件触发词抽取的干扰,取得了与目前最优触发词抽取系统相当的性能。(2)针对基于标注实体信息的事件触发词抽取方法缺乏实用性的问题,本文提出了一种基于混合神经网络、面向生语料的事件触发词抽取方法。首先,采用双向循环神经网络层对输入进行编码;其次,通过共享信息将获得的实体上下文表示进一步传递到结合了自注意力和门控卷积的神经网络来抽取事件触发词。在ACE2005上的实验结果表明,该方法能捕获实体和触发词之间的依赖关系,有效地提高了事件触发词的抽取性能。(3)针对目前事件抽取方法中忽略了实体、触发词和论元三者之间的依赖关系问题,本文提出一种基于图卷积网络的实体、事件触发词和事件论元联合抽取方法。本文通过引入句法短弧表示增强事件间的信息流动;其次,利用图卷积网络学习图节点的上下文表示,从而捕获事件间的依赖关系。最后,结合句子级别的门控注意力机制对序列和句法上下文表示进行融合,捕获触发词和论元以及论元之间的内部交互关系。在ACE 2005上的实验结果表明,本文提出的方法能够提高事件抽取的性能。本文针对事件抽取问题提出了三个有效的解决方法,取得了良好的性能,将为事件抽取的进一步研究提供借鉴。
其他文献
脂肪醇常指C6-C22的直链且只含有一个醇羟基的精细化学品,被当作表面活性剂广泛应用于日用、食品、农业等领域。脂肪醇分为两大类:合成和天然脂肪醇。合成醇的原料石油,属于
猪链球菌(Strepptococcussuis,S suis)是猪链球菌病主要病原菌,能够引起猪的脑膜炎、肺炎、败血症、多发性关节炎和皮肤化脓性感染,造成了世界养猪业的经济出现严重的损失,也是一种重要的人畜共患病原菌,对人畜公共卫生安全造成了严重的威胁,且如何进行该病的防控受到了越来越多人员的关注。本研究针对2017~2018年从安徽地区屠宰场表观健康猪只中采集的病料(肺脏)中分离得到的猪链球菌的
事件时序关系识别是对具有时序关联的事件对进行识别,并对它们之间的时序关系进行分类的一项任务。它对任何试图深入理解自然语言的系统来说都至关重要,如自动问答、信息抽取
资产证券化作为20世纪60年代末的金融创新工具,最早起源于美国,目前已成为欧美国家和地区最重要的融资工具之一。中国早在2005年试点资产证券化工作,其间受金融危机的影响一
近年来,为了通过加快发展都市近郊的乡村旅游项目来提高农村发展水平,各种农业和旅游业融合发展的活动相继展开,但这些项目在发展过程中出现了同质化的现象,千篇一律,缺乏吸
目前基于有监督方法的命名实体识别技术都需要大规模的标注语料。然而在很多新领域中命名实体定义模糊,标注语料匮乏,而且构建高质量的人工标注数据费时费力。本文任务是中文
中国的邮递系统源远流长,当周之时,即有官邮,号为“邮置”,步传、马传递送简书。此后历代封建王朝为加强统治起见,对于邮驿通信都十分重视。在明清时期还出现了专门服务于民
进入到二十一世纪以来,在社会主义市场经济体制日益完善的今天,会计师事务所对企业出具的审计报告所传递出来的信息越来越能影响到投资者的投资决策。因此,市场监管部门也在
我国农产品电子商务经过二十多年的成长,已形成了多层次、体系化的农产品交易网络体系。十八大以来,党中央、国务院和地方政府出台一系列政策文件,对我国农村和农产品电子商
关联交易作为一种经济行为,本身具有中立性质。但是由于关联方的存在,再加上我国经济法律允许交易双方对自身关联交易定价,关联交易可能被上市公司高管滥用。同时,上市公司中