论文部分内容阅读
事件检测针对自由文本实现事件表述语言的提取和结构化数据的组织(如提取触发词并进行类型标记)。在事件检测过程中,同一个单词(触发词候选)在不同上下文环境中可能触发不同的事件类型,而神经网络方法依赖的词向量只有一种形式,从而无法表征不同的上下文信息。此外,在模型训练过程中,上下文中的虚假特征使得触发词识别会出现偏差。同时,通过观察ACE2005语料(国际权威事件抽取评测数据)发现,该语料的事件类别和正负样例分布欠缺平衡性,导致模型对测试集进行事件检测时,如果表征该事件类型的触发词在训练集中出现次数较少,则该类触发词往往不能被赋予真正的事件类型。为此,本研究通过以下方法解决上述问题:(1)一种基于语言学特征和卷积神经网络模型的事件检测方法本研究提出一种新的基于语言学特征和卷积神经网络模型的事件检测方法。类比词嵌入方法,本研究将特征信息转化为实数向量形式,并作为神经网络的输入,本研究把这种形式称为“特征嵌入”。这种方式一定程度上缓解了语言特征离散化表示在自然语言处理任务中带来的“语义鸿沟”问题。此外,在训练过程中,该方法利用目标函数减弱错误特征对模型的影响,进而削弱错误传递带来的负面作用。实验证明该方法可以达到与当下国际前沿系统进行可比的性能。(2)一种基于生成对抗网络的事件检测方法本研究提出一种基于生成对抗网络的事件检测方法。神经网络具有对语义信息编码并将其映射到高维潜在特征空间的能力。一定程度上,其能提高事件检测的性能。然而,这种高维潜在特征空间很容易被“虚假特征”所污染。针对上述问题,本研究提出了一种自调节的学习方法,该方法包括分类网络、生成对抗网络和记忆抑制调节单元三个模块。其中,生成对抗网络生成上述的“虚假特征”,在此基础上,记忆抑制调节单元用于消除分类网络中的虚假特征,从而提升分类网络的事件检测性能。本研究在ACE2005和TAC-KBP2015语料上进行了详细的实验,结果表明:基于生成对抗网络的方法具有很高的有效性和适应性。(3)一种基于负样本采样的事件检测优化方法此外,本研究提出一种基于负样本采样的事件检测优化方法。基于句子级别的事件检测模型把不含有触发词的句子视为负例样本,在模型训练过程中负例样本对模型起着重要的作用,因此,本研究针对如何选择合适的负例样本这一问题,提出了一种基于强化学习方法的负样本采样方法,以此调优事件检测模型的训练过程。实验结果表明,本研究方法能够有效提升事件检测性能,其在触发词识别和触发词类型分类任务上F1值分别可以达到77.0%和74.8%。通过以上方法,本研究在一定程度上优化了神经网络方法对特征信息的使用以及对训练集样例的合理使用,并提高了事件检测的性能,其中,触发词识别的F1值性能可以达到77.0%,事件类型分类的F1值性能可以达到74.8%。