基于PAD模型的中文微博情感分析研究

被引量 : 0次 | 上传用户:gonyen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,微博已经成为全球最受欢迎的网络应用之一,微博的快速发展使其显示出了巨大的社会价值和商业价值,人们逐渐习惯在以微博为代表的社交网络上获取、交流信息与表达情感。文本情感倾向性分析主要关注以文本方式存在的信息中的情感倾向,当庞大的数据量使得它无法手动对它们进行分析时,情感分析就开始发挥作用了。情感分析在英文世界一直是一个被广泛研究的领域,而中文情感分析的研究仍处于起步阶段,大部分工作已通过尝试被证明是适用于英文的。首先,本文总结分析了文本倾向性分析的基本概念与算法模型,在此基础上,将心理学中的PAD情感模型引入,结合知网提供的语义相似度计算方法,提出了一种使用给定基础情感词汇与其对应PAD值计算词汇的PAD值的方法,并以此构建了一个基于PAD情感模型的情感词典。其次,本文将问题扩展到中文的文本倾向性分析研究中,提出了一种结合统计信息与语义信息的权重计算方法,通过该方法,在一定程度上消除特征歧义对于分类器的影响,使得特征的权重更贴合文本的语义,分类的效果更好。最后,本文综合中文微博文本分析研究现状,分析了现有的文本表示模型,结合机器学习中的支持向量机算法,提出了基于PAD情感语义特征的支持向量机分类方法。实验结果表明,基于支持向量机的分类算法的效果好于k最近邻节点算法的效果。同时,本文提出的基于PAD情感语义特征的支持向量机分类方法都能够取得比较实用的效果,并对普通的支持向量机方法效果有着显著的改进。
其他文献
自二十世纪八十代以来中国会计电算化迅速发展,会计软件与企业管理软件也从无到有、从小到大迅速发展起来。从我国会计软件的发展历程来看,虽然取得了巨大的成绩,但也存在着
<正> 五爱市场是一个享誉海内外的大型日用工业品批发市场,座落于沈阳市沈河区热闹路与风雨坛街路口交汇处。五爱市场始建于1983年6月,因当时地处五爱街而得名。1989年10月,
<正>中日甲午那场带有民族屈辱的战争硝烟已褪去了120周年,国人对它的惨痛记忆却永远挥之难去。但这场战争对邵阳人来说却值得骄傲,因为有两个邵阳人在这场战争中逆袭清军一
期刊
在党的十八届四中全会强调推动司法队伍专业化的背景下,人民陪审制的存废又引起争议。笔者从制度设立的特殊意义入手,分析其存在的必要性,并且根据目前立法和司法实践的不足,
意识形态话语权本质上是思想统治权,本体论维度的话语权体现为一种具有历史、社会和制度独特性的语言和文本,知识论维度的话语权体现为具有独特性的陈述、术语、范畴和信仰之
经济全球化的深入、竞争程度的加剧、科学技术的迅猛发展等一系列环境的变化,迫使企业不得不开创新的更加适应经济和社会发展需求的营销模式,合作营销正是在这样的时代背景下
儿童权利保护是世界许多国家的政府和人们共同关注的重要问题。1959年联合国《儿童权利宣言》就提出要保护儿童的最大利益。1989年联合国《儿童权利公约》明确地倡导各国立法
近年来随着我国教育改革发展的深入,教育领域的道德滑坡引起了社会各界的高度关注,如何使教育走出伦理困境,提升教育的道德水准,是学界关注的重要课题。教育伦理学作为一门从
经过十多年的发展,中国房地产业已成为拉动中国经济增长的支柱产业,同时又是经济社会问题的焦点,甚至形成了"一调控就减少供给,导致下一阶段更大的调控压力"的怪圈。中国房地
轧钢加热炉作为轧钢工序的重要加热设备,不仅影响轧钢生产的生产成本,也影响轧钢生产的产品质量。加热工艺的优化与否,关键取决于加热炉的燃料种类和燃烧系统、加热炉炉型、