论文部分内容阅读
事件是指在某个特定的时间和环境下发生的,由若干角色参与,表现出若干动作特征的客观事实。事件抽取任务要求从含有事件信息的非结构化自由文本中,自动识别和抽取出包含有事件触发词和事件角色的结构化信息。传统的事件抽取方法过多的依赖人工选取的特征,一方面人工抽取特征需要专家的领域知识,另一方面这样构建的系统适应性差,泛化能力低。近年研究者开始使用深度学习的方法来自动学习特征,本课题针对如何将深度学习应用到事件抽取任务中展开深入研究,主要研究内容包括以下三个方面:利用深层语义特征优化事件抽取目前很多方法使用浅层的词汇层面特征,很难获得文本中更深层的语义信息,训练得到的模型泛化能力较弱。本课题在传统浅层学习特征的基础上,引入深层语义特征,提高模型的泛化能力。基于神经网络的事件抽取研究传统的基于特征工程的事件抽取方法依赖于人工精心设计的特征和复杂的自然语言处理工具。这些方法虽然经过实验证明是有效的,但是花费了大量人工精力而且会有数据稀疏的问题。本课题使用基于神经网络的事件抽取方法,可以不使用大量人工设计的特征而自动学习句子中的特征。此外,本课题提出联合卷积神经网络和双向循环神经网络的事件抽取模型,结合卷积神经网络和循环神经网络二者的优点,进行事件触发词识别和事件类型分类。融合上下文依赖和句子语义的事件抽取现有的方法忽略了待测词与上下文的依赖关系和句子的语义信息,这些信息对事件抽取是很有帮助的。本课题提出一种神经网络方法,利用双向长短时记忆网络抓取待测词在句子中的上下文依赖,同时使用门控循环神经网络学习句子的语义表示,融合这两种信息提高事件触发词的识别能力。较传统方法,该方法不使用任何自然语言处理工具,避免错误传递;与现有的神经网络方法相比,该方法能有效利用上下文依赖和句子的语义信息,提高事件抽取的性能。