语义规则与表情加权融合的微博情感分析方法

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:asa333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自温州动车事故后登上公众生活舞台以来,微博渐渐成为了百姓生活中不可或缺的社交媒介。通过对用户微博的情感进行分析,可以充分挖掘在产品评价、社会舆论等诸多方面的用户信息,在商业产品的改进维护、保持社会稳定等方面发挥重要作用。在当前中文微博情感分析领域,研究者倾向于对微博的情感极性进行定性划分,其中主要应用两种方法:其一是基于情感知识,包括情感词典、语义规则等;其二是基于特征分类,包括机器学习等。不管是哪一种方法,尽可能多的考虑影响微博情感的因素都是提高算法准确率的关键。本文从提高情感分析准确率的目的出发,较为全面地选取影响微博情感的因素。首先在考虑微博中情感词语情感值的基础上,加入了微博表情这一重要元素,将表情情感值与文本情感值加权参与微博情感计算,使得对包含表情的微博情感判定结果有了一定程度的提高;其次,在语义规则部分,基本涵盖了汉语中最常用的几种句型规则和句间关系规则,如感叹句、反问句、转折关系、递进关系等,并通过实验的方式对两种规则下的参数给出最佳数值,使得算法对复杂语句的情感分析更加准确。另外,通过词语相似度计算,将微博中不包含情感词的非情感句情感纳入考虑范围,并最终对每条微博的情感给出定量数值。在正确率、召回率、F值的基础上,提出合格率这一指标对微博情感判别方法得到的定量数值准确性进行评价。最后,使用Java作为主要开发语言对测试集的1万条数据进行测试,验证了算法的有效性。
其他文献
为了保护环境和节约成本,需要对汽车空调中的R134a制冷剂再回收,但在回收之前要鉴别R134a气体的浓度是否达到回收标准。本文基于红外气体检测技术的原理,得出制冷剂浓度鉴别
根据中原经济区主体城市群节点城市的发展状况,按照聚类分析原理,运用聚类分析法、相关系数法、极大不相关法和征询专家意见法,选取自然生态相与人文生态相中的27个因子,构建生态
采用ADuC842单片机作为核心控制器件,对环境温度和湿度进行测量。当参数出现异常时,通过GSM模块发送相关短消息,自动拨打预设电话并播放录音内容实现远程报警。
梅塞尔中国网站2015年6月9日消息,梅塞尔集团近日宣布在四川省攀枝花市投资建设的稀有气体——氪气和氙气工厂正式投产。这是梅塞尔在中国投资的第二家稀有气体工厂,位于湖南
期刊
教育是对本国传统文化精髓继承、发展和创新的过程。中国传统文化为大学生成长成才提供了厚重的人文底蕴。但大学生所体现的中国传统文化素养却不足。因此,挖掘本民族传统文
酒文化与旅游文化有着相融的关系,并在旅游文化中扮演着重要的角色。从旅游者的需求出发,通过实证分析得出目前旅游者对于黄酒文化旅游产品的消费情况和意愿,从而更好地促进
本文通过对Kate Chopin的The Story of an Hour中模糊修辞的构成手段及其修辞效果进行分析,使我们了解到模糊语言大量存在于文学作品中以构成模糊修辞,并对文学作品起着精确
近几年来,我国广播电视事业在不断的发展,但是在发展的过程中,广播电视台在财务管理方面出现了许多问题,这将阻碍广播电视事业的发展,因此,如何在新形势下面对广播电视台内部财务管
“我们走在大路上,意气风发斗志昂扬,共产党领导革命队伍,披荆斩棘奔向前方……”在中国共产党成立90周年前夕,许多人都在唱红歌、歌颂党活动中,选择了演唱《我们走在大路上
采用Eclise XDB-C18色谱柱建立以乙腈-水为流动相的高效液相色谱条件,测定了吡虫啉在白菜及土壤中的残留动态。结果表明,吡虫啉在白菜和土壤中消解较快,其半衰期分别为2.02 d