基于情感词典与规则综合的微博情感分析模型研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:allen_liliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪以来,中国互联网行业得到了蓬勃的发展,网民规模也逐年攀升。微博是近年来互联网上越来越流行的消遣方式,上到政商名流,下至普通百姓,皆乐在其中,微博已逐渐变成了许多人生活中不可缺少的元素。新浪微博平台每天都产生了数以亿计的微博来分享内容、传播信息,这庞大的用户量和数据量背后伴随而来的则是潜藏的商业、社会等多方面价值。  对微博进行情感分析的研究,就是发掘微博潜藏的商业、社会等多方面价值的过程,研究微博情感分析能应用于舆情发现及监控、信息预测、产品评价及改进等领域。深入研究微博内容、获取微博情感倾向是非常有必要的。  目前的微博情感极性分类方法存在着准确率较低、依赖领域知识、较少考虑句内句间关系等缺点,我们的研究希望找到一种方法使分类准确率能得到提高,方法的普适性能得到加强。基于此出发点,本文对结合情感词典与规则的微博情感分析方法进行了研究,主要内容包括以下两个部分:  (一)本文通过构建情感词典,获取语义规则,以情感词为中心,归纳了6种情感词组合,兼顾情感词、否定词、程度副词之间的相互作用,结合情感词典与规则,运用微博子句情感值、整句情感值计算方法,最终实现了微博情感极性分类。实验表明,本文提出的方法比表情符号判别法、情感词典判别法、SVM判别法等方法的微博情感极性分类效果都好。  (二)本文在(一)的基础上,研究转折连词对微博情感表达的影响,从转折连词的4种一般使用情形,考虑微博的句内关系、句间关系,引入转折连词权重系数来改进(一)的微博子句情感值、整句情感值计算方法,提升微博情感极性分类效果。实验表明,考虑转折连词的方法比之前方法分类效果得到了提升。整体实验对比验证了本文所提出的方法不依赖领域知识,普适性较强,准确率较高。
其他文献
随着我国证券市场的不断发展和完善,股票市场作为我国经济“晴雨表”的功能也越来越突出,无论是个人投资者还是国家都十分关注股票市场的走势。若能较为准确的预测股票市场的涨跌趋势,不仅可以为广大投资者提供投资决策的依据,也能够为国家制定相关经济政策提供参考。股票市场具有非线性、高噪声、数据量大等特征,相关的股票分析方法,如基本面分析法、技术面分析法、时间序列分析法等,各有特色,但难以适应日趋复杂的股市。研
随着互联网的迅猛发展以及电子商务的快速流行,海量信息充斥在人们的生活中。信息超载问题也越来越严重。为了解决该问题,推荐系统就此诞生。它通过分析用户的历史行为记录,得出
MQX是一款主要面向工业控制、汽车电子及消费电子等领域实时多任务应用的嵌入式实时操作系统。2009年,飞思卡尔公司半导体公司开始免费开放MQX3.0.1版源代码,同年,苏州大学飞思
随着Web技术的不断发展进步,J2EE已成为Web开发的应用技术的最流行的架构规范。这个平台已经拥有很好的技术支持和服务,它的多层架构受到大型Web开发者的青睐,是解决企业应用
随着人们出行需求的大幅增加和各类交通工具数量的迅速增长,对轨迹数据进行分析和挖掘开始受到广泛的关注和重视。得益于智能交通系统在各大城市的普及应用,大量的车辆轨迹数
随着大数据时代的到来,数据开始呈爆炸式的增长,互联网用户越来越被淹没在数据的海洋之中。因此,如何帮助用户从海量的信息中找到真正感兴趣的资源成为一个亟待解决的问题。商品
自然语言中的实体是指语句中出现的客观世界中存在的,并可相互区别的对象或概念。推断实体所属的语义类型是自然语言处理中的一项有着重要意义的任务,也是一项很有挑战性的任务
随着智能手机等移动终端的兴起,移动互联网正在慢慢地改变人们的生活和习惯。基于位置服务(LBS)的应用作为移动互联网的一个重要组成部分,是每一个移动终端上必备的应用程序。
云计算作为一种新的信息技术,为海量数据的分析和处理带来了全新的视野。它是一种商业计算模型,将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算能力、存
轨迹可以看作是移动对象随着时间的变化在空间中留下的印迹。近年来,随着民用GPS(全球定位系统,Global Positioning System)等定位设备在移动终端上的广泛使用以及基于位置服务