基于OCC模型的文本情感识别方法的研究

来源 :太原理工大学 | 被引量 : 21次 | 上传用户:WSLBCW
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是计算机进行情感识别的一种重要形态。今天计算机使用者所面对的主要是以文字形式表示的信息。传统上的文本分类往往关注于把文本映射到给定的主题,如体育、经济、政治等。然而,近年来对文本非主题分析的兴趣不断增加,其中就包括文本的情感分类。文本的情感分类即情感识别(textual emotion recognition)是指识别文本中隐藏的情感信息。它已成为人机对话和人机互动的关键部分。常用的文本情感识别方法主要包括以下几种:关键词识别(keywordspotting)、词汇关联(lexical affinity)、基于统计的自然语言处理方法(statistical natural language processing)以及使用常识库(commonsenseknowledge base)识别的方法等等。关键词识别和词汇关联的方法主要是根据句中不带歧义的关键词与情感词典中词汇的匹配结果来识别情感。基于统计的自然语言处理方法适合处理较大篇幅的文本,而且还要依赖于大量的训练数据。使用常识库的识别方法是根据大规模常识库中的知识来识别句子的情感。这些模型在一定程度上可以较准确地分析出文本中的情感,但仍存在一定的局限性,因为人类的情感呈现出特有的复杂性和多变性特征,现有文本情感的研究都只建立在心理学的基础上,没有完整的数学理论基础。且大多数模型利用情感关键词识别方法,既没有考虑当事人的性格对情感的影响,也没有考虑句子所表达事件之间的关系。本文构建了一个基于OCC情感认知识别模型的文本情感识别模型,该模型考虑了性格对情感的影响,同时,又很好的定义了事件之间的关系。在OCC模型定义的情感规则基础上,结合文本和常识库的特征定义了一系列文本情感产生规则,并针对性格模型对文本情感产生规则进行更新,得到符合不同用户性格特征的文本情感产生规则。为使所定义的情感产生规则易于由文本特征实现,本文结合自然语言处理(NLP,Natural LanguageProcessing)和常识库的特点对OCC模型的情感规则进行简化和修正。为将性格模型融入文本情感识别过程中,本文通过对大五人格模型的每一维进行分析针对其特点对基本情感产生规则进行修改,建立针对不同性格用户的情感产生规则。为进一步提高模型识别情感的准确率,减少误判,使用用增量学习(incremental learning)方法收集并训练用户的反馈信息。根据反馈信息,动态的对常识库和情感公式中的阈值进行不断的更新,得到了更完善的常识库和更合适的心情、情感阈值。为了验证模型的文本情感识别准确率,根据此模型实现了一个情感聊天程序,通过对比实验发现,该模型由于考虑了人的情感认知识别过程,对文本情感的识别效果要优于其他模型的识别效果。并且在融入性格因素后情感识别的准确率有很大的提高,加入自学习方式后通过不断的更新常识库和心情、情感激活阈值使得文本情感识别的准确率得到了进一步的提高。
其他文献
随着计算机科学技术的发展,计算机得到越来越广泛的应用,越来越多的科研单位和院所都使用自己的科研管理系统来进行日常的业务管理工作。但目前使用的这些科研管理系统大多是早
1991年物联网概念的提出掀起了互联网的一场革命,伴随而来的智能家居将人们日常生活息息相关的设备接入互联网;智能交通、智能电网、工业4.0等新技术,更是将国家关键基础设施和
随着大数据时代的到来,飞速增长的数据量给存储系统带来了巨大的挑战。同时,以闪存Flash为代表的新型存储介质迅猛发展,给存储系统注入了新的活力。闪存固态盘SSD有独特的性
金属制品表面缺陷的检测有着重要的现实意义,因而对于金属图像的处理显得尤为重要。本文从分析标准图像的降噪算法出发,设计更优的降噪算法,并最终应用于金属图像。小波分析
网络层组播可以比单播更高效地实现一对多或多对多的数据分发,能显著提高网络资源的利用效率。然而,传统的网络层组播技术存在着路由器转发状态数膨胀、部署成本高等问题,阻
CNGI应急联动内部管理系统是在CNGI应急联动系统中实现各类数据管理、查询和维护的平台。系统基于Client/Server模式,是多用户、多角色应用系统。不同角色的工作人员能够通过
随着互联网的飞速发展,信息的分享、获取和发布进入了一个新时代。Web服务解决了传统网络应用程序的分布式对象、中间件技术的相互独立性和紧耦合性,其诸多优点使得不同分布
随着下一代全球互联网络的研究和发展,IPv6势必将取代IPv4,被广泛运用到各种有线和无线网络中。而作为一种自组织、自管理和不需要基础设施的网络,Ad Hoc网络以其自身的特性
由于深空网络相较于地面网络具有高误码、超长时延和突发丢包的特点,现有的传输机制难以满足其高效传输的要求。为了解决深空网络的文件传输方面的困难,本文通过在深空网络传
近年来,随着计算机技术的不断提高,以高性能计算机为基础的数值天气预报也有了飞速发展。垂直坐标系作为数值模式垂直离散的基础,对于模式预报性能具有重要影响,混合?-p坐标