中文情感词汇本体的构建及其应用

被引量 : 0次 | 上传用户:sksliuxin6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感计算是人工智能的一个热门的研究领域,它的目标是使计算机拥有情感,能够像人一样自然亲切的交流。随着Internet的发展,以文本形式出现的信息越来越多,逐渐成为我们最容易获取也是最为丰富的一种交互资源,然而国内文本情感分析方面的研究较少。本文首先构建情感识别所需的语义资源,情感词汇本体库。根据目前情感分类发展的现状,确定情感分类体系,在此基础上综合现有的各种情感词汇资源构造情感词汇本体。在本体的知识获取过程中采用手工分类和自动获取相结合的方法填充词汇本体的框架,详细描述了词汇的情感类别、强度和极性等,并进一步统计了情感词汇的分布情况。在资源建设的基础上,为了减轻资源建设的人工劳动量,本文提出了基于CRF的情感词汇自动获取方法。将情感词汇的词汇自身规律,上下文规律,以及这些规律之间的搭配与机器学习方法相结合,实现情感词汇的自动获取。并且根据实验结果,分析各种规律对于情感词汇自动获取的作用,从而寻找出最佳的特征集用于情感词汇的自动获取。实验最后对结果进行了进一步的错误分析,找出了导致错误发生的主要原因。在情感词汇中,存在词汇的多情感现象。我们把在不同的上下文中,表达不同情感的词汇称为多情感词汇。多情感词汇的获取采用了自动获取和人工确认相结合的方法。在自动获取部分,使用了《同义词词林》确定多义词,并提出了大多数多情感词汇是多义词的假设。多情感词汇的获取及描述还参考了情感词汇本体库中的相关信息。在人工确认部分,指出了多情感词汇和含有多个情感的词汇之间的区别,为词汇的情感消歧指明了目标。由于多情感词汇的存在,那么就需要对多情感词汇,在特定的上下文中,进行词汇的情感消歧。根据词汇的情感消歧和词义消歧的相似性以及差异性,在现有的各种词义消歧的方法中,选用贝叶斯模型,用于词汇的情感消歧。同时还做了3个实验——基于常用情感的词汇情感消歧、基于词性的词汇情感消歧,基于词性及情感频率的词汇情感消歧。对这4个实验的消歧结果的比较分析,表明了基于贝叶斯模型的词汇情感消歧的有效性。
其他文献
现行规范没有给出振动舒适度的具体评价标准及相应的设计参数。以青岛体育中心综合训练馆大跨度楼盖为背景,提出以3.3Hz为下限控制频率作为方案选择依据。采用MIDAS/Gen对9种
课堂注意力,顾名思义指的是人的心理活动指向和集中于课堂教学。由于注意,人们才能集中精力去清晰地感知一定的事物,深入地思考一定的问题,而不被其他事物所干扰;提高幼儿课堂注意
报纸
煤炭是我国的主要能源,是关系到国家经济发展和社会稳定的重要物资,众多原因决定着我国这种以煤为主的能源消费结构在未来很长一段时期内不会有太大的改变。我国煤炭资源十分
"中小微"企业在我国突飞猛进的发展,繁荣了我国的国民经济,为我国的经济发展做出了巨大贡献。与此同时,"中小微"企业也存在内部会计制度不规范的严重问题,这一问题不解决,将
近年来,异形柱框架结构在我国多层住宅结构中的应用越来越广泛。钢筋混凝土异形柱框架结构柱肢厚度与墙厚一致,避免了普通矩形柱在房间内棱角凸出的缺点,具有较好的建筑美观
知识经济时代的来临与科技进步的影响,对文科大学生综合素质的要求必将日益提高。科技素质是综合素质的重要组成,它是文科大学生未来生存、发展、提高的内在条件和实现人生价
本博士论文除了前言和结语外,正文共有六章组成。第一章为公正审判权概述。公正审判权是指由一系列与公正审判有关的、具体的权利组合而成的权利群或权利集合。公正审判权在
“城中村”是我国城市城市化发展过程中出现的特有的城市社会经济现象,是我国长期二元经济结构的特殊产物。“城中村”的存在,给城市经济、环境、景观、文化等方面带来一系列
自2008年开始的新一轮集体林权制度改革将集体林地的承包经营权和林木所有权以家庭承包的方式落实到本集体经济组织的农户,确立了农民对集体林地的承包经营主体地位。集体林
<正>高考试题是一座富矿,各类各层次研究者从未间断对它的深度挖掘。在知识本位驱动下,高考历史试题的研究主要集中于从浅层次知识结构、中层次历史思维方法、深层次历史素养