基于情感词词典的中文句子情感倾向分析

被引量 : 21次 | 上传用户:aulxbdmmydb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感倾向分析是指通过计算语言学的相关方法,抽取和分析文本的主观倾向性信息,包括判断情感极性,以及从中抽取出于情感,倾向性论述相关的各要素,这些要素包括文本的评价对象,文本的倾向性(包括褒义,贬义,中立等),以及文本在该情感极性上的强度等。随着互联网的普及,网络上的评论性文本越来越多,人们急需将这些文本进行自动的分析,因此对文本倾向性分析的研究成为互联网领域的研究热点。句子级的中文文本情感倾向性分析是其中的一个非常基础并且重要研究课题。本文在认真分析研究有关资料,并对一些具有代表性的情感倾向性分析算法研究的基础上,探讨了一般情感倾向性分析常用方法的原理和不足之处,以及在情感倾向性分析过程中遇到的一些问题,针对这些问题提出了相应的解决办法并通过实验与其它算法进行了比较。本文的内容涉及下面4个方面:1、提出了训练语料规模失衡的情况下的如何保证算法对语料平衡要求的处理方法;从而解决了训练语料规模失衡对分类效果带来的负面影响。2、通过对情感词置信度的评价算法研究,提出了对大规模情感词词典的拆分方法,降低了置信度较低的情感词对情感倾向性分析带来的负面影响,并通过实验验证了该方法的有效性。3、通过对训练语料的深入研究,提出了建立规则集的具体算法,从而解决了如何正确分析部分不含有情感词或者情感词强度较弱语料的情感倾向性问题。4、提出了多层次分类算法,解决了单一算法在准确率和召回率上不能兼顾的问题。在多层次分类算法中,首先对主观句进行中性和极性的二分类,然后对极性文本进行褒贬二分类。在褒贬二分类过程中使用不同的分类策略,分层处理,逐层推进,实验表明该算法在召回率和准确率上都有所提高。
其他文献
学困生的转化问题是各国教育实践中普遍遇到的“老大难”问题,也是教育实践中不可避免的问题。我国实行九年义务教育,小学生升入初中不是择优录取,而是按“自然数额”直接升
本文是一篇研究刑事诉讼视野下知识产权保护问题的论文。由于知识产权的易受侵害性及侵犯知识产权的巨大收益,侵犯知识产权的犯罪现象逐渐蔓延,对市场经济秩序的造成了严重的
微信等新兴交流工具为英语学习构建了一个独立于课堂学习之外的教学平台,成为加强课堂学习效果、组织课后学习与讨论、维系师生关系促进教学相长的重要工具,在新形势下高职院
背景:我国的特殊用途化妆品包括九大类,即育发、染发、烫发、脱毛、美乳、健美、除臭、祛斑、防晒。当前,我国特殊用途化妆品市场的增长率逐年增高,产品的数量也逐年增加,产品
社区矫正,又名社区处遇、社区矫治,是一种与监狱矫正相对的非监禁刑罚执行方式。它通过保持罪犯与社会的联系并利用社区的资源来改造矫治罪犯,是所有在社区环境中管理教育罪
期刊
面子观是礼貌原则中的重要理论之一,在人际交往中起着非常重要的作用。对“面子”文化的认识和理解,西方人表现更多的是“消极面子”,他们不希望把别人的言行强加于自己,自己
为了探讨初中生心理压力、学业成绩与应对方式之间的关系,采用“中学生应对方式问卷”、“中学生应激源量表”对576名初中生进行了问卷调查,并且收集了他们期中考试中的语文
"十五"期间,卫星遥感和地面监测结果显示,全区草原退化、沙化、盐渍化严重,草原生态受到很大破坏.笔者对现在的草原"三化"面积和草原产草量、植被覆盖率与80年代的情况进行了
如何延缓运动性疲劳的产生是半个多世纪中运动医学领域的前沿课题,此项研究已经有很多年历史了。中医中药在运动医学上的应用是中国运动医学中的优势和特色。近二三十年来,中