论文部分内容阅读
事件关系反映的是事件间的一种语义关系,在文本表示中既常见又非常重要。目前存在的大多数关于事件及其事件关系的研究工作主要集中在汉语、英语。针对这一问题,本文将进行维吾尔语事件伴随关系以及时序关系的研究。主要工作如下:(1)事件伴随关系,从事件发生的时间上来看,两个事件的发生存在很强的紧密性,一个事件通常伴随另一个事件的出现而出现。针对维吾尔语事件伴随关系,提出基于深度信念网络(Deep Belief Network,DBN)的识别方法,抽取12项基于伴随关系特点的事件结构特征,同时结合事件触发词的词向量信息,计算两个事件触发词的语义相似度,得到触发词语义特征。将事件结构特征和触发词语义特征作为最终的事件表示。该方法用于维吾尔语事件伴随关系的识别,F值为82.48%。为了避免复杂的特征工程的约束,针对该任务,本文提出了结合主题的长短时记忆网络(Long short term memory,LSTM)的识别方法,仅将事件句的词向量表示作为模型输入,该方法不仅能够避免复杂的特征工程,而且在识别效果上也有很大的提升,F值达到96.72%,表明该方法在维吾尔语事件伴随关系识别的有效性。(2)针对维吾尔语事件时序关系识别问题,提出一种结合注意力机制的双向长短期记忆模型(Bi-directional long short term memory,Bi-LSTM)进行维吾尔语事件时序关系的识别。首先结合维吾尔语事件时序特点,抽取13项手工特征,称之为事件内部结构特征。将事件句词向量表示作为Bi-LSTM的输入,得到含有上下文语义信息的事件表示。基于事件触发词建立事件注意力机制,获取事件句最终的事件语义特征。将事件内部结构特征和事件语义特征相融合,作为Softmax层的输入,进而完成事件时序关系的识别.实验结果表明,该方法在获取事件句隐含语义信息的同时也能获取对应的事件语义特征.融合事件内部结构特征后,F值达到88.03%,从而证明了该方法在维吾尔语事件时序关系识别任务上的有效性。