中文文本情感分析研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:itshuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的迅速发展,网络不仅是人们获取信息的重要来源,也逐渐成为人们表达个人观点和分享自身体验的最佳平台,“阅读式的网络”逐步转变成“交互式的网络”。网络中充斥着海量的、由用户自主发布的文本信息,这些文本或是用户对某个产品或服务的自主评价,或是公众对某个新闻事件、国家政策的个人观点等。如果能够充分利用这些数据,可以为政府舆情监测、企业市场分析等多个应用领域提供帮助。然而,这些数据每天以指数级的速度增长,仅仅依靠人工的方式对其进行挖掘和分析需要消耗大量的人力和时间,如何通过有效的手段从海量的网络资源中获取我们所需要的信息?文本情感分析技术应运而生。文本情感分析是目前计算机领域研究的热点之一,旨在通过计算机技术自动地分析出文本中的态度信息,对文本的情感倾向性做出分类判断。本文调查分析了中文文本情感分析领域的研究现状,针对该研究领域中存在的问题和不足展开研究,主要研究内容和创新点包括:(1)针对网络词语的流行和使用给情感分析带来的困难,提出了一种基于词向量的词语情感倾向性判断方法。借助语言模型的训练,采用词向量表示词语,从语料本身挖掘词语之间的相似性,根据词向量的相似度来判断未知词的情感倾向性,有效解决了传统情感词典的不完善和难扩充的问题。(2)结合第一部分的基于词向量的词语情感分析方法,提出了一种融合句法树和语义规则的中文句子情感倾向性分析方法。一方面充分考虑了句子的句法信息,在句子的句法树结构上实现对句子的分析,另一方面针对句子情感极性转移现象,结合否定词、程度词、转折词等影响句子情感极性的特征,定义了相应的语义规则,有效提高了句子情感倾向分析的正确率。(3)针对微博语句情感多元化以及微博文本涉及领域广泛的特点,采用基于递归神经网络的方法对微博话题评论语句进行情感多分类分析,通过Softmax分类器识别微博文本中所反映出的言论表达者的喜、怒、哀、惧、恶、惊的情绪。在此基础上,根据句子中的程度副词对句子进行情感加权,实现对微博话题的情感倾向分析,从而预测微博话题的发展趋势。
其他文献
蛋白质是人类生命活动息息相关的生物大分子,本文从计算科学的角度研究分析蛋白质。本文主要分为两个部分:第一部分通过分析提取蛋白质的特征然后应用SVM的方法从蛋白质的一
当前,逻辑程序设计已经成为人工智能领域知识表示和推理的一种重要工具。其中回答集编程是一种描述性的问题解决框架,是国际上一个非常活跃的研究方向。加权约束逻辑程序是回答
学位
下一代万维网——语义Web自Tim Berners-Lee提出以来就得到了极大的重视。它是对万维网本质的变革,它的主要任务是使数据能被计算机自动地处理和理解。语义Web的核心——本体
质量管理、进度管理和投资管理是工程项目管理的主要工作内容,它们的目标既对立又统一。在进度管理的过程中,需要利用“甘特图”、“网络图”、“柱形图”、“折线图”等进度
随着互联网的快速发展,网络上的信息呈爆炸式增长,其中主观性文本占有的比例大大增加。如何从这些主观性文本中分析挖掘出作者的观点是一个迫切需要解决的问题。情感分类就是
随着计算机软件应用领域的扩大,越来越多的系统成为了遗留系统。如何更好地利用遗留系统来开发新的系统,正在成为当前软件工程研究的一个重要方向。软件再工程正是在这种情况下
学位
文化遗址是研究古代历史、艺术和科学技术发展的极其重要的实物资料。一方面,这些年代久远的历史文化遗产随着时间的流逝正经受着相当程度的损害,亟需数字化保护。另一方面,要在
随着信息技术的迅速发展以及互联网的广泛深入,信息系统在人类社会中扮演着越来越重要的角色,而处于信息系统最底层的操作系统,是计算机资源的直接管理者,其安全问题是信息系
近年来,我国煤矿安全生产形势趋于好转,但安全事故时有发生,其中瓦斯事故是当前煤矿生产的主要灾害之一,已成为制约煤矿安全生产的重要因素,如何有效的监控煤矿井下瓦斯环境
独立分量分析(ICA)是一种非常有效的盲信号处理技术,其基本原理是通过分析多维观测数据间的高阶统计相关性,找出相互独立的隐含信息成分,完成分量间高阶冗余的去除及独立信源