文本情感分类的研究

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:lancer523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分类是指通过挖掘和分析文本中的立场、观点、情绪等主观信息,对文本的情感倾向做出类别判断。随着人们在web中表达自己观点越来越普遍,针对文本情感分类的研究也变得越来越重要。本文提出了一种文本情感分类算法,分为主观性分类和极性分类两个部分。主观性分类部分分为训练和分类两个过程,训练过程接受已标记的训练文本集,经过文本预处理、文本表示和特征选择得到语句特征表示;利用主观性分类模型训练算法对这些语句特征表示进行处理,得到文本主观性分类模型。分类过程接受语句集,经过文本预处理、文本表示和特征选择以后得到各输入语句的特征表示,接下来利用文本主观性分类算法结合分类模型进行主客观初分类,最后利用动态规划对分类结果进行修正,得到主观性文本子集。极性分类的训练过程接受源领域标记文本集合和目标领域未标记文本集合,经过文本预处理、文本表示、特征选择和基于支点SCL的特征选择得到各文本的训练语句特征表示,利用极性分类模型训练算法对语句特征表示进行处理,得到文本极性分类模型。分类过程接受文本主观句集,经过文本预处理、文本表示、特征选择和基于支点SCL的特征选择得到各输入语句的特征表示,文本极性分类算法利用这些特征表示和极性分类模型得出肯定句子集和否定句子集。实验表明:主观性初步分类准确率为94.7%;基于动态规划修正的贝叶斯分类器的准确率为95.8%;基于支点特征选择的SCL算法的极性分类逻辑平均误分率为0.16,低于普通的SCL算法。
其他文献
Web服务是一种运行在Web上的自包含、模块化的应用程序,它可以在网络中被描述、发布、查找以及调用,从而扩展了应用程序的功能,实现了软件的动态提供。随着电子商务的不断发
为了解决面向服务的体系架构存在的一些问题,例如服务提供者部分失败、服务注册中心部分失败、特定于位置的查询以及服务使用者与服务提供者位置紧耦合,现有的技术和思想均做了
人脸表情识别(Facial Expression Recognition,FER)技术作为计算机科学与人机交互领域一个重要组成部分,受到了众多学者的重视。人脸表情识别技术实际是一门综合性学科,开始
“僵尸网络”是受攻击者控制的危害网络安全的计算机网络。攻击者可以利用僵尸网络实施多种多样的恶意活动,例如垃圾邮件、分布式拒绝服务(DDOS)攻击、网络钓鱼、口令破译、
人类的视觉系统是这个世界上发展最为完善、机制最为复杂的感知系统之一。多年来赋予计算机人类视觉的功能一直都是所有人的梦想。计算机视觉的主要目的就是使计算机系统具有
学位
随着计算机软硬件技术的不断发展和突破,基于图像处理的视觉测距已经成为研究的热点。视觉测量改变传统的测量方式,其可用于无人驾驶、三维重建、智能控制等众多领域。视觉传
参考文献信息是科技文献中的一部分主要内容,用来反映作者所做工作的主要理论基础,同时也提供了一些与该文献相关的其他科技文献的信息。传统的信息检索系统只是把文档的内容
近年来,随着三维数字扫描设备和技术的不断发展,点云模型作为曲面的一种新的表示方式获得了工业界和学术界的大量关注,点云模型在医学辅助诊断、数字娱乐、工业设计、航天模
随着互联网信息的爆炸性增长,搜索引擎已成为人们从海量数据中获取信息的一个重要途径。目前搜索引擎主要还停留在关键词匹配的基础上进行信息的刷选,因此用户输入的查询短语准
随着语义web的发展以及web3.0时代的即将到来,基于web服务的应用也就越来越倍受关注。如何从众多的web服务中准确地找到符合需求的服务就成为研究的难点和应用的关键。语义we