基于CNN和BLSTM特征融合的情感分析研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:liqixuexue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展方便了人们的沟通交流,众多的网民通过微博,微信等公开平台发表自己的言论,由此产生大量具有主观情绪的社交网络数据。情感分析技术通过分析、研究大量社交网络数据,挖掘出其潜在的信息,以此来分析网民对社会热点话题的关注度和情感倾向情况,从而为相关部门的政策制定提供支持及正确引导网民的情绪传播。早期情感分析领域研究的文本主要集中在新闻,博客等长文本数据,随着新浪微博,微信等社交网络的迅速发展,基于产品评论、电影评论、社会热点事件评论等短文本情感分析逐渐成为情感分析领域的研究热点之一。伴随着研究的不断深入,针对短文本的粗粒度情感分析现已较为完善,但细粒度的情感分析还有很大的发展空间。然而,针对细粒度的中文评论情感分析数据集还很缺乏。基于这一问题,本文以新浪微博平台中的社会热点话题的微博评论为研究对象,分别爬取了不同话题的评论数据,包括计划生育二胎政策、扶贫政策、环保事件以及雾霾事件,并依据一定的数据处理准则和标注标准对数据集进行了预处理和细粒度的情感标注,从而得到了面向不同话题的情感分析数据集。在此基础上,本文构建了基于卷积神经网络(CNN)和双向长短期记忆网络(BLSTM)特征融合的情感分析模型CNN-BLSTM,该模型基于现有模型中将卷积神经网络建模和循环神经网络(RNN)建模分离的状况,提出将CNN提取的短语特征和BLSTM提取的序列特征结合,用于有效地增强对文本信息的提取能力。鉴于文本中特定情感词对文本情感分析具有更重要的影响,本文在CNN-BLSTM模型的基础上,进一步提出CNN-BLSTMATT模型,该模型通过引入注意力(attention)机制,将CNN提取的局部特征表示引入到BLSTM模块的情感特征表示上,有效增强了BLSTM对情感语义信息的捕获能力,从而达到文本情感特征增强效果。最后,在构建的数据集和公开的英文数据集Stanford Sentiment Treebank(SST)[1]上的实验结果表明,本文提出的CNN-BLSTM模型比使用单一的CNN或者BLSTM模型能取得更好的实验效果。此外,本文提出的(CNN-BLSTMATT模型相较于CNN-BLSTM模型,在显式情感表达的文本中具有更好的情感分类精度。
其他文献
针对大庆石化分公司炼油厂260 kt/a加氢裂化装置高压换热器频繁内漏的状况,深入分析造成内漏的原因,主要有:(1)螺栓预紧力不够;(2)温度变化;(3)压力升降。提出了解决措施:(1)
介绍了电液比例负载敏感负载口独立控制系统组成结构和工作原理,建立了该系统的数学仿真模型;针对执行元件的不同工况,分别设计了基于计算流量反馈的速度控制器和基于压力闭
目的:观察维生素C片研磨后局部涂抹治疗口腔溃疡的临床疗效及安全性。方法:选取2014年2月-2016年2月我院口腔溃疡患者286例,按随机数字表法分为对照组和治疗组,各143例。对照
近年来,中国与菲律宾之间南海争端不断升温,在南海争端的众参与国之中矛盾相对突出,已成为国际关注的焦点。国内学界对于中菲南海争端问题的论著屡见不鲜,本文试归纳梳理近几
《联合国海洋法公约》第十五部分关于强制争端解决机制的规定实质上就是一个普通的仲裁条款,它在处理南海问题时面临着诸多局限。首先,《公约》争端解决机制的强制性是有限度
一、知识产权法保护范围不断扩大、内容不断拓展、水平不断提高知识产权保护范围的扩大化表现为以TRIPS协议等国际条约为主干构成的当代国际知识产权制度不但深入和扩大保护
水是万物之母、生存之本、发展之要,水资源是重要的基础性自然资源和战略性经济资源,对支撑山东省经济社会协调稳定发展,具有不可替代的作用。建设新旧动能转换综合试验区、
随着我国现代化建设的不断推进,现代工业文化也在我国各个地区蔓延开来,使得传统文化在传播与传承方面受到了较多的冲击,传统音乐文化方面体现得极其突出。新时代背景下,探讨