论文部分内容阅读
属性级情感分析旨在从非结构化的文本中分析出人们对属性术语的情感倾向。目前该任务主要有三个研究问题:属性术语抽取、属性级情感分类和属性情感联合抽取。本文主要研究后两个问题。属性级情感分类的目的是确定上下文语境中某些属性术语所表达的情感。已有的方法利用多注意力机制缓解注意力分散问题,改善模型性能。然而这些模型没有深度融合属性术语和上下文的语义,并且忽略先前的注意力信息。针对这些问题,本文提出一种基于动态注意力DAGRU的属性术语情感分类模型。模型通过动态注意力机制考虑先前的注意力信息,改善注意力的准确性。模型的编码层采用联合编码方案进行语义编码,然后结合动态注意力对属性术语和上下文语义进行深度融合。最后在SemEval 2014的Laptop、Restaurant数据集上的实验结果显示:提出的模型准确率比目前最好的多注意力机制高1.73%,证明了动态注意力机制是有效的。属性情感联合抽取旨在通过一个端到端的方法同时抽取句中的属性术语及其情感。目前的研究主要采用基于Collapsed方法的模型,然而Collapsed方法无法建模属性术语与句子之间的交互,并且忽视不同属性术语之间的关联。针对这些问题,本文设计一种属性术语及其情感极性联合生成方案,并提出一个基于Encoder-Decoder结构的端到端模型抽取属性术语及其情感。该生成方案能够使Encoder-Decoder结构适应该任务,并保证预测的完整性。另一方面,Decoder通过信息传递考虑属性术语之间的关系,并且结合注意力模块实现属性术语与句子间的交互。实验在三个基准数据集进行,结果显示:模型在各个数据集的F1值分别能达到64.28%、74.76%、54.52%,超过目前最优结果,证明了基于Encoder-Decoder结构的模型是有效的。综上所述,对于属性级情感分类,本文针对属性术语和上下文的语义融合问题以及忽视先前注意力信息问题,提出基于动态注意力GRU的情感分类模型;对于属性情感联合抽取,针对属性术语与上下文交互问题以及属性术语间关联问题,提出一种基于Encoder-Decoder结构端到端模型,并且针对领域适应问题及预测完整性问题,设计了一种新的生成方案。最后的实验证明了提出的这些方法是有效的。