中文微博情感倾向性分析与情感要素抽取方法

来源 :北京工业大学 | 被引量 : 7次 | 上传用户:xiaolan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博情感分析可以广泛应用于舆情监控、用户体验收集等领域,同时微博具有短文本、社交化等特殊的文本特性,因此基于中文微博的情感分析与情感要素抽取,成为中文自然语言处理领域中的一个重要研究方法。传统的基于词典或机器学习理论的文本情感分析方法缺乏对微博短文本等特征的适应性,本文引入基于中文微博的情感分析词典,研究了基于微博情感分析词典与特征组合的改进的支持向量机情感分类方法,并将条件随机场理论和句法依存关系分析相结合,从而达到精确抽取微博情感要素的目的。本文提出的基于微博情感分析词典与特征组合的情感倾向性判断方法充分结合了依赖词典和依赖机器学习理论的两种情感倾向性判别算法,而将条件随机场理论应用于传统的基于句法依存分析的情感要素抽取方法,在一定程度上减少了微博的短文本和口语化特征对句法依存分析带来的干扰。本文主要研究工作如下所示:(1)首先,介绍了中文微博的文本特征与社交网络应用环境,在此基础上总结了目前为适应中文微博文本特性对传统文本情感分析的改进方法。(2)其次,引入了基于微博的情感分析词典,提出了对其中情感词极性值的计算方法。综合使用情感分析词典中的情感词典、影响因子词典,计算整篇微博的情感得分,并获得其最终的倾向性。(3)使用已知情感词和句法依存关系分析来抽取微博评价对象和微博新情感词两项情感要素,并且将条件随机场原理引入句法依存关系分析,设计并实现了两者相结合的情感要素抽取系统,能够有效地检测评价对象和新情感词。(4)在上述(2),(3)两部分的基础上,将微博的各类语言特征的组合引入到传统的基于支持向量机的情感分类算法中,并结合第二部分对整篇微博情感值的计算过程,尝试使用不同的方式构建情感特征,使情感分类结果更精确。该算法同时考虑了以不同情感分类策略和特征选择算法进一步改善分类性能。
其他文献
<正>9月26日上午,中共中央总书记习近平在人民大会堂会见台湾和平统一团体联合参访团。习近平首先高度肯定参访团各位成员为推动两岸关系发展、推进国家和平统一进程作出的积
本研究以中国期刊网2001—2007年发表的国家精品课程评价方面的期刊论文为研究对象,采用内容分析法对这些论文数量、地域分布、研究机构类型、研究者角色、研究主题和研究方
服务企业培育和强化自身的核心竞争力,应充分体现服务的特点和要求。要以优化服务环境和塑造品牌形象为基础,以重视和满足用户需求为导向,以开发人力资源和提高员工素质为关
<正>在反腐大潮中,国企改革也走到了一个新的十字路口。改革攻坚依然是2015年"两会"的主题,作为今年中国全面深化改革的重头戏之一,国企改革备受瞩目。中央全面深化改革领导
<正>实现中华民族伟大复兴,实现国家富强、民族振兴、人民幸福,是孙中山先生的夙愿,是中国共产党人的夙愿,也是近代以来中国人的夙愿。我们说的中国梦,就是这个民族夙愿的生
国有企业领导人员的作风建设,既是一个老话题,又是一个新课题,在体制改革不断深入的今天,更是对国有企业的发展稳定起着至关重要的作用,必须长抓不懈,抓紧抓实。
利用智能手机传感器可感知时间、空间、时空和用户等多维情境的特征,可识别用户活动,但原框架模型中仅利用了单一分类器中的朴素贝叶斯算法,存在分类精度效果受限的问题。本
本文以一个生产安全信息化集成项目为例,讨论SOA在企业集成架构设计中的应用。首先阐述了SOA架构的内容、特点,以及在项目中使用的SOA工具和环境,系统使用J2EE平台,Web Servi
目的:探讨恩替卡韦联合安络化纤丸治疗慢性乙型肝炎肝纤维化的临床效果。方法:收集江津区中心医院2012年7月-2014年6月收治的74例慢性乙型肝炎肝纤维化患者,随机将其分为对照
本文针对有关公示制度和学者对公示所用公文文种的观点进行了分析探讨 ,指出公示使用“公告”和“通知”的不恰当性 ,通过对公示制度和“公示”文种的研究 ,提出了应当将“公