基于语义资源的文本情感计算

被引量 : 0次 | 上传用户:gsice0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感计算是人工智能的一个热门研究领域,它的目标是使计算机拥有情感,能够像人一样自然亲切的交流。随着Internet的发展,以文本形式出现的信息越来越多,逐渐成为我们最容易获取也是最为丰富的一种交互资源,然而在国内文本情感分析方面的研究较少。所以本文首先构建情感识别所需的语义资源,情感词汇本体和情感语料库,在此基础上采用了基于语义特征和基于认知-评价理论的两种方法识别文本中每句的情感类别。在语义资源的建设中,首先根据目前情感分类发展的现状,确定情感分类体系。然后通过手工分类和自动获取相结合的方法填充词汇本体的描述框架。情感语料库构建中讨论了制定标注规范、选择标注集、设计标注工具以及标注过程中的质量监控等问题。目前已经标注完成近四万句,一百万字的语料。在完成这些已标注语料的基础上,进一步给出了语料库的情感分布,情感迁移规律等统计数据,分析了情感语料库的特点及应用。基于语义特征的情感识别方法是将句子中词汇的情感信息和语义特征加入条件随机域(CRFs)中,生成文章的情感链。而基于认知-评价理论的情感识别是以拉扎勒斯的认知-评价理论和认知语用学中的认知语境为理论背景,从情感的发生机制出发,以多种情感图式为基础的一个文本情感认知模型。最后本文采用单句评估法和多句联合评估法两种不同的方法,分别评测两种识别方法的正确率和情感的连贯性。实验证明基于语义特征的方法在情感的连贯性上效果较好,而基于认知的方法总体准确率较高。两种方法分别从不同的角度对文本情感识别做了初步探索,具有进一步研究的价值。
其他文献
20000kN静压机属静态超高压装置,是最常用的金刚石合成设备,其以操作简便、生产成本相对较低等优点占据了国内市场的较大份额,在我国超硬材料行业中也占有举足轻重的位置。它
刑事证明标准是刑事证据领域的一个非常重要却又非常复杂的问题。我国当前对于刑事证明标准的研究还主要停留在哲学层面上,远远不能满足司法实践的需要。因此,加强此问题的研究
2016年4月27日,作为美国共和党候选人的特朗普在华盛顿五月花酒店发表了以"美国第一"为中心思想的外交政策演讲。这一演说清晰地提出了特朗普当选后的外交政策方向,是美国现
为研究海砂混凝土的碳化性能,对强度等级分别为C30、C40、C50、C60的海砂混凝土和淡化海砂混凝土进行了加速碳化试验,并测定碳化后碳化深度及混凝土中CaCO3含量,并与同等强度
草莓成活后重管理非常重要,但在实际生产中很多农户对草莓定植期的栽培管理技术了解匮乏,种植水平参差不齐,导致草莓的品质不高,本文就草莓定植后土肥水管理,修剪、病虫害防治等管
嵌入式通信接口设备作为某型号武器系统的重要组成部分,主要负责完成网络通信、并口通信,传输武器系统的状态信息、火控台和光电跟踪仪对武器系统的控制信息以及自检诊断等任务
阿瑟·韦利(Arthur Waley,1889—1966)是英国二十世纪最杰出的汉学家之一,被誉为现代英国介绍中国和日本文学最有成就者。他使中国古诗进入了西方普通读者的视野,并对西方汉学界
分析了激光三角法在3D曲面测量系统中的非线性误差,及影响测量精度的各方面因素。提出了采用双摄像头的光学系统,利用基于神经网络的多维拟和标定的方法,较好地消除各种非线性系
固定资产管理在任何一个企业单位的生产经营过程中都占据着重要地位。对固定资产的有效管理,能够保证资产的质量,提高使用效率,更好地适应经营管理新形式的需要。本文对固定
动脉粥样硬化是一种慢性炎症性疾病,大量炎症细胞、炎症因子和血管生长因子都参与了动脉粥样硬化的形成。新近研究表明,核因子-κB(nuclear factor kappaB,NF-κB)是炎症反应