基于依存句法的句子级细粒度情感计算

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:yanxt99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,舆情分析作为一个热点研究课题被很多学者关注,作为其中的一个重要问题:文本情感分析,自然也成为研究的重点,被很多专家学者不断挖掘。随着人们参与互联网的热情不断高涨,特别是微博、微信等新媒体的快速发展及广泛普及,广大网民从被动的信息接受者变成了信息的产生者,同时随着自然语言分析技术的不断创新及发展,对微博文本这类主观性文本的情感分析也得到了普遍的应用。传统的情感分析主要是基于文章或者句子级,完成相应的情感分析,目前在舆情监控、股评分析领域得到部分应用,并且体现出了一定的实用价值,但是随着互联网的发展,用户表达的口语化,文本不规范化的日趋明显,传统的情感计算方法已经无法胜任现在的任务,因此,本文给出了基于依存句法的细粒度情感计算方法来解决这一难题,通过新的方法和思路,将句子级情感计算的准确率提升一步。本文对基于依存句法的细粒度情感计算任务进行了深入而细致的研究,首先构建了大规模的细粒度情感词典,包含23128个情感词及对应的情感值;同时对语句中的修饰、反转结构构建了修饰情感词典,以及构建了包含591个表情符号的微博表情词典。结合How Net,使用基于同义词林的PMI算法,给出语义角度的词语极性计算方法,然后对句子进行依存句法分析,结合词语间语义依存关系,设计了24种情感短语匹配规则,最后通过细粒度情感计算得到句子的情感值。通过与两种基于句法分析的情感算法实验结果对比,本文算法在召回率和正确率两项关键指标上,均达到了90%以上,优于另两种算法。最后本文设计了一个基于依存句法的细粒度情感计算原型系统。本论文重点研究了以下几部分:1、构建大规模的细粒度情感词典。首先构建了基础情感词典,经过多轮误差校对,人工标注了23128个情感词,并按照极性强弱给出相应的情感标度,为了处理句子中反转、修饰结构等对句子情感极性的影响,构建了相应的修饰词库,同时给出了微博表情词典,最后针对情感词典不能识别的情感词,结合How Net知识库,通过基于同义词林的PMI算法得到情感词极性,且补充到情感词典中。2、句子情感短语抽取。通过依存句法分析,找到句子的句法结构,分析词语间的依存关系,对程度修饰、否定修饰、动态修饰、反转结构等情感短语结构进行讨论和分析,从而归纳出24种情感短语抽取模板,并给出了各个抽取模板的详细说明。3、句子级细粒度情感计算。通过设定的情感短语模板,对句子进行模板匹配,结合大规模的词典资源,分别给出不同模板计算规则,完成情感短语的情感分析,最后考虑到特定句型对情感分析的影响,设定不同的权值,从而得到句子的细粒度计算结果。4、构建了细粒度情感计算原型系统。系统包括文本预处理、情感短语抽取、情感计算、界面展示四个模块,系统提供第三方调用接口,可以满足微博文本的细粒度情感计算需求。
其他文献
企业要想在激烈的市场竞争中取得一席之位,必须具备自己企业的特色,而企业文化是一个企业价值的重要指标,它能够在各方面改善企业的状况,包括成本控制方面。但是现阶段中小企
<正>共情(empathy)作为一种亲社会现象,引起了心理学、社会学、认知科学以及神经生物学等各个领域研究者的兴趣。由于共情现象错综复杂,这些学科的研究内容相互交叉、各有侧
<正>企业要生存和发展,必须创造利润,而企业的利润来自顾客的消费。企业的利润客户来源主要有两部分:一类是新客户,即利用传统的市场营销组合4P策略,进行大量的广告宣传和促
<正>丢勒的《忧郁I》是西方美术史上的名作,潘诺夫斯基在讨论它时提出过三个问题,其中第一问是"丢勒有何权利以一出精神悲剧取代原本是一种低劣气质的慵懒和愚钝"?在欧洲中世
通过对美国职业篮球联赛(NBA)数据的起因、发展和最新应用情况的分析,探讨在大数据时代的背景下,篮球运动引入统计学、现代管理学后所引发的球队组织结构变异,以及对于中国男
社交网站为公众提供一个多元开放的舆论环境,其中的用户可以充分表达自己的观点意见。针对文本内容的情感分析在社交网络日渐复杂化,社交网络信息海量化的趋势之下更显得尤为
<正>梁朝伟就坐在你的膝盖上,刘玉玲也能坐在你的腿上,这种绝妙的体验你连想都不敢想,这就是我们从英特尔迅驰广告看到的真实一幕。广告中,六位普通人与明星零距离接触,六位
随着网络技术的飞速发展,微博作为一种新兴的社交平台,其应用已经逐步渗透到人们生活的各个方面。微博中包含着人们对产品、娱乐、社会热门事件等的观点和看法,蕴含了丰富的
<正>近期编辑部接到作者举报,有个人或组织冒用《中国体育科技》编辑部的名义向作者收取各种费用,此行为严重影响我刊名誉和广大作者的利益。为防止此类诈骗行为的发生,《中
应急演练可以提高组织机构应对突发事件的能力。针对目前应急演练无统一规范的现状,参照PDCA循环法,提出了"四阶段"应急演练标准,将应急演练分为策划、实施、评估与总结、持