论文部分内容阅读
随着互联网的发展,以及移动互联网的快速进步,如今,网络已经成为人们表达观点、发表意见的重要舞台。加之各种互联网产品的诞生和发展,使得网络舆情在舆情中占据了重要的地位,对舆情的研究与讨论也越来越受到关注。而对网络舆情的研究中,重要的一点就是情感分析。对舆情进行情感分析,能够快速的发现和挖掘出网民对待某个时间的态度,更进一步可以对事件的发展做出可靠的预测,还能从一定程度上过滤掉“水军”言论带来的舆情影响。情感分析主要是判断所取文本的情感倾向性,即属于正面、中性、负面。根据本文实际应用的特点,在传统文本情感计算的已有基础上,对不同长度文本采用不同的情感分析方法。对长文本分类提出了一种构建主题词典辅助分类的方法,利用新词发现加以人工辅助构建主题词典。对长文本情感分析时,先分类再使用主题词典辅助分析情感。对于短文本直接采用相关情感词典极性权值计算的方法得到情感倾向。通过情感词典的构建及极性权值的微调,使结果更准确可靠。对于长文本,采用实际使用的三峡工程新闻文本进行情感分析,对于短文本,采用新浪微博数据进行情感计算,都取得了较理想的结果。