论文部分内容阅读
WEB2.0时代,互联网赋予了网民更多的主动权,推动了社交媒体的快速发展。每天都有大量的社交媒体用户活跃在各种各样的社交媒体平台上,例如微博、微信等APP,以及论坛和具有社交功能的购物网站等,产生了大量用户参与的针对人物、组织、事件、产品或服务等发表的评论文本。这些评论文本往往包含着用户自身所表达的情感倾向性,且这些大量的包含用户主观情绪的文本已经成为决策支持的一个有价资源。小到普通用户,大到企业、政府,都可以通过挖掘这些主观性文本来满足自身的需求。针对日益提高的文本分析需求和日益复杂化的社交媒体文本资源,本文关注于面向社交媒体文本的细粒度情感分析问题,研究面向多语义对象的社交媒体文本情感分析,从大量的社交媒体文本中挖掘出用户所针对的评价对象并进行自动化的情感分析,解决社交媒体文本中不同情感词所针对的多个不同语义对象的情感倾向识别问题,明确社交媒体文本中情感的语义指向性。目前已有研究将深度学习方法应用到细粒度情感分析任务中来,并且取得了很多重要理论和应用成果。但由于社交媒体文本的复杂性,深度学习方法在细粒度情感分析任务中仍存在难以有效识别社交媒体文本中所包含的多个不同语义对象和评价词语、难以充分挖掘社交媒体文本中的情感特征信息以有效识别针对多个不同语义对象的情感极性等问题。因此本文从模型架构和技术结合两方面对深度神经网络模型进行改进和技术融合,以提升模型在细粒度情感分析任务中性能。本文的主要研究内容包括:(1)针对如何准确且高效地从社交媒体文本中抽取出具体的语义对象以及相关情感内容等关键信息的问题,本文研究了如何从社交媒体评论文本中抽取出不同的评价对象和评价词语,提出了基于自注意力机制的评价对象和评价词语抽取算法。该方法充分考虑了评论句子序列的全局依赖关系,通过自注意力机制有效地建模评论句子序列的全局依赖,学习句子的内部结构。最后通过对句子序列进行标签预测,实现自动地从社交媒体评论文本中抽取出评价对象和评价词语。(2)针对如何明确社交媒体文本中情感的语义指向性问题,提升判断社交媒体文本中针对多个不同语义对象的情感倾向性的准确率,本文提出了基于联合注意力LSTM网络的方面级情感分析模型。该模型充分考虑了文本的上下文信息、文本中不同语义对象的特征信息以及文本中所包含的情感词信息,结合注意力机制构造了联合注意力LSTM网络并应用到方面级情感分析任务中,以提高方面级情感分类准确率。上述两方面的研究内容,本文均通过分析和实验来验证模型的有效性。