论文部分内容阅读
随着计算机和网络技术的不断深入发展,如今的互联网已经迈进了社交媒体时代。以微博为代表的新型网络媒体包含了大量关于新闻时事、政策法规、消费产品等话题的情感文本,反映了用户个体的观点、情感、态度与倾向性。关于情感本身以及情感与其他认知过程间相互作用的研究引起了学者们的广泛关注,情感计算也成为一个新兴研究领域。情绪分析是情感计算的一项基本任务,旨在自动识别出文本中包含的情绪,例如喜好、惊讶、愤怒等。本文主要对社交媒体情绪分析任务中的多标记情绪分类以及情绪原因识别进行研究。本文前两章对目前该类问题的研究现状和基本技术进行了详细的介绍,然后针对现有研究的不足之处,在第三章和第四章中分别面向社交媒体的多标记情绪分类和情绪原因识别任务提出了解决方法:(1)面向社交媒体的多标记情绪分类任务,提出了联合二分类神经网络算法。在我们的算法中,经过神经网络得到的文本表示不再被送到一个softmax函数中,而是被送到一组逻辑回归函数中。因此,多个二分类任务可以在同一个神经网络中同步完成。此外,我们设计了一个联合二分类交叉熵损失函数,用于捕获不同标签之间的关系。考虑到多标记情绪分类任务的特点,我们进一步提出将先验的情绪信息融入到损失函数中。实验表明,我们提出的算法在分类性能上超过了现有的多标记情绪分类算法。(2)面向社交媒体的情绪原因识别任务,提出了融合相对位置信息以及全局标签信息的神经网络模型。我们引入了一个相对位置增强的词嵌入学习算法,并且将情绪原因识别任务由独立预测问题转换成重新排序预测问题。我们在神经网络的隐藏层拼接了动态全局标签信息,用于约束同一个句子中不同子句的预测。实验结果表明,我们提出的算法在标准数据集上取得了目前最好的结果。进一步的实验分析表明,我们的相对位置增强的词嵌入学习算法以及融合了动态全局标签信息的重新排序预测机制具有显著的有效性。