网络文本词语级和篇章级的情感分析

来源 :北京大学 | 被引量 : 0次 | 上传用户:awind54335
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析的主要任务为对文本中的观点进行分析,并判断其情感倾向。网络文本的情感分析任务近年来得到了学者、企业甚至政府的极大关注。本文从词汇和篇章两个角度切入,研究了网络文本中情感词表的自动构建方法以及句际关系在情感分析中的应用。  从词汇角度而言,情感词表是情感分析的基础。在新词频发的网络环境下,完备的情感词表对网络文本的情感分析具有非常大的作用。第2章提出了情感词抽取器和极性预测器,无监督地从未分词未标注的微博语料中抽取情感词并判断其极性。其中,情感词抽取器采用基于模式的抽取方法,充分利用了汉语中的语法规则和语言现象;极性预测器采用基于表情符号和隐层极性信息的方法,为LDA模型赋予了新的语义。实验证明,情感词抽取器和极性分析器能够有效地进行情感词的抽取和极性预测;且实验证明,自动构建的网络情感词表能够有效地提升句子级别的情感分析。  从篇章角度而言,文档所表达的情感与文本的句际关系结构密切相关。第3章和第4章探索了句际关系在情感分析中的应用。  第3章利用句际关系,使用基于加权的方法,提升情感分析的性能。本章将文档切分成具有不同句际关系的文本语段,使用显式关联词来预测扁平结构的句际关系,自动训练并获得表征不同句际关系重要性的权重,进而提升情感分析的性能。本章还发现,转折、因果、条件、总括是对情感分析最有促进作用的句际关系,“不过”、“虽然”、“但”、“同时”、“总的来说”、“但是”是对情感分析最有促进作用的关联词。  第4章利用句际关系,使用基于加权和基于约束的方法提升情感分析器的性能。与第3章不同,本章使用的是层级句际结构,它是由人工进行标注的,准确的、完整的层级句际结构。实验证明,层级句际关系结构对文本情感分析具有促进作用。此外,需要重视引导关系所引导的话题转换对情感分析的影响。  本文的主要贡献有如下两点:(1)我们以完全无监督的方法构建了网络情感词典,该词典中包含了大量的新词新义,对网络文本的情感分析有促进作用。(2)我们构建了相对完善的中文句际关系体系,初步证明了句际关系对中文情感分析的促进作用。  
其他文献
经济全球化削弱了传统地域垄断经济的优势,使全球竞争越来越激烈。激烈的竞争迫使制造企业采用更先进的信息技术和管理技术对生产线的制造过程进行精确的规划、设计和控制,不断
随着汽车数量的快速增长,拥堵成为城市交通中需要解决的一个十分紧要的问题。交通拥堵不仅浪费了驾驶时间,还增加了尾气排放与能源消耗,影响着人们的日常生活。一些研究者利用VA
对于超大规模集成芯片,过高的瞬时功率可能会导致运行时错误,降低其可靠性;同时,高功率带来的诸如散热的问题,也会影响芯片的性能。于是,要设计高性能,高可靠性的芯片,就一定要获得
该文在介绍了数据库系统的一般理论以及引入多数据库系统理论必要性与现实性的基础上,从对多数据库系统的理论研究开始出发,较为详细的讨论了在多数据库系统下如何保持数据的
随着互联网的发展,信息交换在今天变得越来越方便。在带来便利的同时,新技术也产生了诸多的社会问题。软件作为一种特殊的智慧财产,与人们的日常生活联系得越来越紧密。相应
随着互联网技术的普及和多媒体技术的发展,在传统基于扫描文档的OCR技术广泛应用的同时,针对更具一般性的图像文本检测识别技术的需求正在不断凸显。图像中的文字包含着与图像
该文主要从以下四个方面研究了TMN的基本原理及其在LITMN系统中的具体应用和实现.(1)从理论上介绍了电信管理网的基本概念和原理,提出了TMN的功能模型、体系结构以及标准接口
人体行为分析是计算机视觉领域的关键问题,其具备良好的研究价值和广阔的应用前景。人体行为分析常常可以分为人体行为的模式提取、针对行为模式进行分类或者检测两个环节。其
随着航天技术的发展,我国空间探测任务不断增多,航天器、有效载荷等设备的种类和数量越来越多,对地面系统的要求越来越高,尤其在支持多星、多任务运行方面对系统间数据传输效率及
随着遥感图像分辨率不断提高和数据量不断增大,高分辨率遥感图像的云检测对于有效提取和利用数据具有十分重要的意义。传统的云检测方法往往依赖于阈值法和灰度共生矩阵为代表