文本情感分类中的极性转移问题研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:ran871229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词袋模型是基于机器学习的情感分类任务最为常用的文本表示方法,然而传统的基于词袋模型的文本表示方法存在着一些基础性的问题,尚未得到有效的解决。情感文本中的极性转移现象是其中一个极为重要的问题,很大程度上限制了情感分类的性能。本文针对情感分类中的极性转移问题,开展了以下几方面研究工作:首先,本文总结归纳了极性转移产生的原因与类型,统计了极性转移样本在实际语料中以及在错分样本中的分布情况,并通过实例分析验证情感文本中的极性转移问题对情感分类性能的影响。然后,论文提出了一种混合极性转移检测和反义替换算法。本文先结合规则方法和统计学习方法的优点,提出了混合极性转移检测算法:利用规则方法检测显式极性转移,利用统计学习方法检测隐式极性转移。然后针对算法检测出的否定极性转移子集,提出了反义替换算法,进一步消除否定极性转移。最后,一篇文档将被划分成反义替换子集、句间极性转移子集和无极性转移子集,我们利用子集文档基分类器集成算法,得到文档的最终情感极性。最后,论文提出了一种基于反义样本的对偶情感分类方法。该方法先利用语义知识和反义字典,自动生成与原始样本极性相反并且消除了否定极性转移的反义样本。然后提出了对偶训练和对偶预测算法,利用反义样本参与到模型的训练和分类预测。该方法的一个核心问题是如何构建反义字典,论文还提出的两种情感反义字典构建方法:基于字典资源方法和基于语料的方法。论文在中英文标准数据集上进行了实验,实验证实与相关工作的算法相比,本文提出的算法取得了情感分类性能的显著的提升。
其他文献
随着计算机科学技术的不断发展,尤其是视频编解码技术的不断进步,立体视频的应用场景越来越广泛,加上人们对3D视频也越来越感兴趣,立体视频的编解技术得到空前发展。但是现阶
移动自组织网络(Mobile Ad Hoc Network, MANET)是由在一定范围内的一些无线移动设备(也称为节点)的集合组成的复杂的分布式网络系统,并且不需要依靠任何固定的基础设施,就可
无线传感器网络(WSN)是由大量无线传感器节点构成的、自组织的网络系统。它的特点有大规模部署、低功耗、动态自组织等,近年来在各个领域都获得了广泛的应用。在无线传感器网
云迁移是指将应用程序从企业内部数据中心迁移到云环境的整个过程,该过程涉及到选择云服务,确定迁移方式,重构应用程序,配置云资源等一系列分析、设计、重建的活动。  云计
随着信息时代的发展,计算机﹑科技﹑手机﹑互联网﹑社交网络等关键名词已成为人们日常生活中接触度较广的几个信息时代相关的专有代名词。与此同时,这些信息时代的产物,它们所带来的
数字水印技术是网络环境下知识产权保护和认证的手段之一,是目前信息安全技术领域的一个重要研究方向,本文在对已有的基于小波变换的数字水印技术分析的基础上,利用轮廓变换不仅
随着微机电系统、片上系统、通信技术和低能耗嵌入式技术的快速发展,无线传感器网络(WSN)应运而生,已经成为计算机科学与技术的一个新兴领域。它有十分广阔的使用前景,目前已经应
强化学习是一种用于求解可以建模为马尔科夫决策过程问题的机器学习方法,其通过Agent与环境交互以获得最大累计奖赏的方式进行学习。当前强化学习面临的主要挑战和机遇是如何
计算机网络的发展,使得信息的交流和资源的共享更加便捷。为了教师教学和学生学习的方便,校园网带宽逐年扩大,访问的速度也得到了很大的提高。但是,目前校园网带宽的有效利用率并
目前云计算相关研究领域普遍关注的两个问题是如何保证用户的服务等级协议(SLA)和提高数据中心的资源利用效率。虚拟化技术是云计算资源管理的关键技术,而虚拟机动态放置策略