基于树核函数的句子级别情感分类研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:weiqiangting
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络上的信息呈爆炸式增长,其中主观性文本占有的比例大大增加。如何从这些主观性文本中分析挖掘出作者的观点是一个迫切需要解决的问题。情感分类就是解决这个问题的一种自然语言处理技术,它对文本的主观性信息进行分析,从而得出观点持有者的情感倾向性。本文主要研究句子级别情感分类问题。在详细分析了句子情感分类问题的重要性和难点的基础上,本文提出了一种基于树核函数的句子级别情感分类方法。该方法使用基于SVM(Support Vector Machine)的卷积树核函数自动获取句法结构信息,分别将句法树和依存树作为特征,和其它平面特征相结合,对句子进行情感分类。首先,本文探索基于句法树的结构化特征在句子级别情感分类中的应用,提出了一种在SVM分类器中使用树核和复合核函数来进行句子级别情感分类的方法。实验结果表明在情感分类中树核和复合核的方法比线性核具有更佳的性能。其次,本文提出了基于形容词和基于情感词的句法树裁剪策略。对于前者,提出了一种动态窗口算法来优化一个句子含有多个形容词的情况;对于后者,研究了添加领域相关的情感词对分类性能的影响。实验显示基于情感词的裁剪方法要好于前者。另外,实验证明在隐性情感的分类中本方法也比基于平面特征的方法好。最后,本文研究了基于依存关系理论的依存树裁剪策略,把它和树核函数相结合,提出了基于依存树的句子情感分类方法。实验结果显示本文提出的依存树裁剪策略是有效的。
其他文献
随着网络的普及和信息技术的日新月异,信息膨胀与冗余给人们的社会活动和商务活动带来了信息选择的困惑,因此为每个用户提供快捷准确,满足个人实际需要的个性化信息服务成为
数字家庭是个与时俱进的概念,具有保持在线、智能控制、服务交付等特征。随着信息技术的不断发展,数字家庭所涵盖的内容也在不断变化。研究数字家庭实现过程中的关键技术具有
学位
随着嵌入式系统和网络技术的不断发展,嵌入式Internet技术以其易于集成、开销低以及应用广泛等特点成为现代社会各个领域的热门技术,在远程控制领域也发挥了其强大的优势。无
本文首先对移动Agent技术和NS2(Network Simulator Version 2)网络仿真器结构和功能的研究现状进行了分析,了解到虽然移动Agent技术具有很多传统分布式计算模型所没有的优势,
伴随着互联网技术的迅速发展,网格计算技术也日益发展壮大,它是专门针对复杂科学计算领域的新型分布式计算方法。简单地讲,网格是把整个因特网整合成一台巨大的“超级虚拟计
蛋白质是人类生命活动息息相关的生物大分子,本文从计算科学的角度研究分析蛋白质。本文主要分为两个部分:第一部分通过分析提取蛋白质的特征然后应用SVM的方法从蛋白质的一
当前,逻辑程序设计已经成为人工智能领域知识表示和推理的一种重要工具。其中回答集编程是一种描述性的问题解决框架,是国际上一个非常活跃的研究方向。加权约束逻辑程序是回答
学位
下一代万维网——语义Web自Tim Berners-Lee提出以来就得到了极大的重视。它是对万维网本质的变革,它的主要任务是使数据能被计算机自动地处理和理解。语义Web的核心——本体
质量管理、进度管理和投资管理是工程项目管理的主要工作内容,它们的目标既对立又统一。在进度管理的过程中,需要利用“甘特图”、“网络图”、“柱形图”、“折线图”等进度