网络文本情感分析的研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:qinchuanhedian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,整个社会已经全面进入了信息时代。越来越多的人加入到了网民的队伍,也越来越多的人愿意在网络中表达自己的真实情感,发表自己的个人看法。产品评价、实时热点新闻评论、商家服务评价这些都准确的反映了网民对评价主题肯定或否定的情感态度。识别和提取这些情感倾向信息,非常有助于商家产品回馈改进和政府的舆情监管等工作。而随着大数据时代的到来,信息量剧增,使得这些评论信息已经不能再使用传统人工的方法进行提取和分析。因此,针对网络文本的情感倾向性分析具有重大的研究价值。文本情感分析的主要目的是为了挖掘文本的情感信息,判断文本表达的情感极性。文章主要的研究内容如下:(1)提出了一种新的词性情感特征提取方法。首先对带有情感极性的语料句按词法规则找出所有带有情感倾向的词性特征,然后通过词性最大匹配算法依据情感识别准确率和占有率提取词性情感特征,最后使用提取的词性情感特征与现有的词性特征提取方法进行对比实验。实验表明,新的词性情感特征提取方法有效的提升了基于情感词典分析文本情感的准确性。(2)提出了一种基于词典语义和SVM结合的分类算法。首先使用高准确度的词典分析算法得到部分准确的分类结果;然后把得到的分类结果用于SVM分类训练,并通过训练的分类器对剩下的文本进行情感分类;最后将词典语义分析和SVM分类结合得到最终的文本情感分析结果。文章将该方法和现有的几种分类方法对产品服务、实时热点新闻和影视著作三个领域的评论语料进行实验对比分析。实验表明,基于词典语义和SVM结合的分类算法比基于情感词典的分析方法和基于支持向量机的分类学习方法都有更好的情感识别判定效果,而相比已提出的基于情感词典和机器学习相结合的方法在情感识别准确度上也有一定提升。(3)实现了一个网络文本情感分析系统。通过现有的分析算法和本文提出的文本情感分类算法,设计和实现了一个集网络文本数据获取、数据处理和数据分析为一体的网络文本情感分析系统。该系统能够快速实时地对在线网络评论文本进行情感分析,具有很大推广应用价值。
其他文献
论民族文化交融及其社会功能○姜明雷家军我国是一个统一的多民族国家,共有56个兄弟民族生息、繁衍在这块美丽、富饶的国土之上,各民族人民用他们的勤劳和智慧,创造了光辉灿烂的民
目的应用Meta分析来探讨干扰素α治疗慢性乙型肝炎患者后T细胞亚群的变化。方法计算机检索Cochrane图书馆、EMbase、Pubmed、万方数字化期刊全文数据库、中国期刊全文数据库
目的:了解重庆地区近年来丙型肝炎病毒(Hepatitis C virus,HCV)基因型分布情况、基因型演变和可能的临床意义,为临床上更好防治丙型肝炎提供依据。方法:回顾性研究2010年1月~
拉卜楞因寺而兴,夏河围寺而城。夏河镇兴起与变迁肇始于民国早期,从方志资料中梳理夏河的城镇兴起及城镇化变迁,其经历了一个围寺而城的演进历程,表明民族地区城镇化进程有其
旅行社的应收账款是旅游市场竞争的产物,是供大于求的买方市场竞争压力所致。旅行社应从应收账款的信用标准、信用条件、收帐政策、账龄分析、坏账准备等方面着手,强化应收账
<正>一、OEM基本概念1.OEM定义OEM(Original Equipment Manufacturer)的直译是"原始设备制造商",OEM俗称为"贴牌生产"或"代工生产",在我国也因理解不同、地域文化差异等因素,
小学英语作业是英语课堂教学内容在课外的延伸与拓展,传统小学英语教学模式使得作业的设计与布置过于追逐数量而忽视了质量,单一、枯燥的作业形式也不能够有效调动学生们的学
目的:本研究应用MRS观察脑泡型包虫病和脑结核瘤的代谢变化特点,并初步探讨MRS对脑泡型包虫病和脑结核瘤诊断及鉴别诊断的价值。方法:收集2013年1月至2016年1月在本院经手术
以泛漓江流域乡村旅游可持续发展能力为研究目标,从乡村旅游开发条件、旅游经济效益、旅游社会文化影响和旅游环境效益4个方面设置了道路通畅度、旅游资源品位、旅游行业监管