基于多策略的微博情感极性分析研究

来源 :中原工学院 | 被引量 : 0次 | 上传用户:hhbsoftware
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博是具有很强时效性和随意性的网络社交平台,自2007年在国内出现以来经历了飞速发展。微博中包含了涉及各个领域的海量信息。通过对微博进行情感分析研究,可以挖掘出很多有价值的信息如用户对某件商品的评价、网民对某件社会事件的看法、对政府制定某项政策的意见等。对微博进行情感分析研究具有非常现实而深远的意义。基于此,本文针对微博进行情感极性分类研究,提出多策略的微博情感判断方法,主要研究内容包括以下几点:(1)针对微博情感分类问题研究微博的语言特征,采用基于微博表情符号、基于情感词典及改进后的SVM的微博情感分类三种方法进行微博情感极性判断。(2)对实验需用到的基础情感词典进行扩展和完善,整理常用的微博表情符号和网络情感词与基础情感词典一起合并形成新的微博情感词典。将完善后的情感词典和否定词词典及程度词词典等合并构建微博文本词库。(3)研究并改进基于SVM的微博情感分类方法,最终选择基础情感词、网络情感词、微博表情符号、否定词等作为微博极性分类特征。进行多组实验选择合适的SVM核函数因子值提高微博观点句和极性分类器性能。(4)通过实验研究训练集及核函数因子c和g值对微博分类结果的影响。实验结果显示改进后的基于SVM的微博情感分类方法的实验结果准确率为83.1%,优于改进前的基于SVM、基于情感词典及基于微博表情符号的方法结果,效果可观。
其他文献
专家系统是一种模拟专家决策能力的计算机系统。论文以机车故障诊断为应用背景,利用人工智能、故障诊断的理论和方法,研究并开发了一个机车故障诊断专家系统原型,以实现对机车故
自从数字水印技术从信息隐藏学科衍生出来后,数字水印技术应用领域不断扩大,现在已应用到了数字版权保护、秘密通信、票据防伪等领域。数字水印技术的核心问题是水印的鲁棒性和
随着互联网技术和数字信号处理技术的快速发展,数字化产品也得到广泛的普及,如何有效地保护数字化产品成为了当今时代信息安全保护亟需解决的问题。自上世纪九十年代起,数字
网格作为一个集成的计算与资源环境,或者说是一个计算资源池,它能够充分吸纳各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的同时还是经济的计算能力。除了各种类型
随着计算机网络应用的普及和网上商务活动的日益频繁,计算机系统和网络的安全问题越来越突出。攻击事件发生的数量逐年增加,近几年的上升幅度更为明显。同时这些安全事故给社
面向对象的技术的出现可以追溯到上世纪六十年代,面向对象的方法更关注于数据而非过程,而在面向对象方法前的软件开发方法更关注于过程,以函数的角度来提供代码的复用。到了
随着语义Web的发展,基于本体的开发和应用越来越多。本体是共享概念模型的形式化规范说明。由于本体开发本身具有分布式的特点,不同组织开发的本体可能覆盖相同或者相交的领
关联规则挖掘是数据挖掘中的一个重要研究分支。传统关联规则挖掘算法使用单一最小支持度阈值进行挖掘,但在实际使用中由于各项目发生频率的不同,需要使用不同的最小支持度阈
聚类是数据挖掘中一种重要的挖掘方法,它从数据库中计算对象间的相似性,并依此对对象进行分类,使得不同类中的对象尽可能相异,而同一类中的对象尽可能相似,即“物以类聚”,发现数据
虚拟植物生长研究如何利用计算机模拟植物的生长发育过程,随着计算机软硬件技术的飞速发展,它已成为计算机领域的一个研究热点,且在农业、教育、园艺、商业和娱乐等领域得到