基于深度学习和多特征融合的文本情感分析研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xfzhang901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展,使得微博、Facebook等为代表的自媒体逐渐流行起来,成为用户抒发情感和表达个人观点的热门社交平台。这使得大量包含情感倾向的文本在网络中不断积累,分析这些文本背后隐藏的情感信息,可以掌握人们对热点话题的情感变化,为相关部门在监控舆情时提供参考。在自然语言处理中,文本情感分析是重要分支之一。它是指利用文本挖掘等技术,从含有情感信息的文本中提取态度、观点等信息进行分析。传统的情感分析方法可大致分为两类,一类是基于词典的方法,另一类是基于机器学习的方法。前者依赖情感词典的质量,后者则依靠大量的优质数据,所以两者都存在一定的局限性。深度学习的崛起,正好为文本情感分析提供了新的方法和思路。本文以微博短文本为情感分析对象进行研究,主要研究工作如下:微博文本内容丰富多样,但在现有的微博文本情感分析方法中,文字之外的特征却较少受到注意,导致情感分析效果不尽如人意。为此,本文提出了融合多特征的文本情感分析方法,构建了三种特征,分别是基于词典的情感值特征、表情特征以及改进的语义特征,将其融合搭建了文本情感分类模型。通过爬虫爬取微博文本,对获取的文本进行清洗标注等处理,将其作为自建数据集,用于实验对比。实验结果表明多特征融合对情感具有更好的指示作用,相较于传统文本卷积神经网络模型等,本文提出模型的情感分类能力得到了有效提升。此外,本文还提出基于词频-逆文档频率算法加权的Word2vec模型用于文本词向量化,与传统Word2vec模型进行对比,证明其具有一定的优势。本文结合卷积神经网络(Convolutional Neural Network,CNN)与双向长短期记忆神经网络(Bi-directional Long Short-Term Memory,Bi LSTM)构建了文本情感分类模型(KCNN-Bi LSTM)。卷积神经网络可以提取文本的局部语义信息,而双向长短期记忆神经网络可以提取文本的上下文信息,本文结合两种网络的优点并进行改进,在卷积神经网络的池化层,采用K-Max池化代替最大池化,一定程度上保留了特征的频率和部分位置信息。此外,为使模型更加完善,引入自注意力机制来增加文本中重要词语所占权重。将本文提出的模型与其他传统深度学习网络模型分别在二分类数据集和三分类数据集上进行实验对比,结果表明KCNNBi LSTM模型提高了文本情感分类的准确率,且引入自注意力机制后,模型效果得到了进一步提升。最后,本文基于Flask框架搭建系统,实现情感分析的可视化,具有单句文本预测、批量数据预测、数据占比展示和下载的功能。
其他文献
学位
随着中国发展的进程越来越快,政府的权力愈发扩大,虽然满足了日益增长的公共需求,但是不当的权力行使比例也在大大提高。“懒政、乱政”等现象频发,行政不作为、行政乱作为等严重损害了行政相对人的合法权益,也给社会公共利益带来了许多损失。行政诉讼是规制行政行为的重要手段之一,民众运用司法武器促使行政行为合法化、合理化,正确履行公共服务职能。举报是中国制度的一个创新性突破,早在20世纪90年代,中国举报制度已
目的和意义:本课题通过观察转化生长因子-β1(transforming growth factor-β1,TGF-β1)/Smads信号通路关键信号分子及炎性因子水平的变化,探讨补肾通络法改善特发性肺纤维化(Idiopathic pulmonary fibrosis,IPF)作用机制,以期为临床治疗IPF提供新的思路和方法。研究方法:40只SPF雄性SD大鼠(150±30)g随机分为正常组、模型组
近年来,太阳能产业发展迅速,对高素质人才的需求日趋增长。为加快培养“专业基础实、实践能力强、综合素质高、职业适应快”的应用型本科人才,在大量科研和实践的基础上,围绕“理论、操作、仪器”三方面培养目标,通过合并、简化实验环节,提取、切分核心内容,将原本过程复杂、流程烦琐、研究方法多样的钛矿太阳能电池研究设计为适于为本科生开展的实验教学项目,使其涵盖材料制备、器件组装、材料表征与性能测试等多种主要的训
龙江剧是在周恩来总理“东北要有自己的地方戏”的倡导下诞生的,是黑龙江省唯一的戏曲剧种。它是以母体二人转为基础,借鉴其他剧种优长发展起来的有浓郁地方特色的戏曲形式,凝聚着黑土文化的精华,承载着弘扬黑土文化的使命。龙江剧诞生之初主要是为了解决黑龙江省没有地方戏曲剧种的问题,但是它的创建满足了人民对传统舞台艺术的期待,也适应了时代发展的要求。近年来,已有多部剧目获得戏曲届顶级奖项,成为了东北地区最有代表
BOT总承包模式项目参与方较为复杂、各参与方的风险偏好存在差异,有必要研究BOT总承包模式下高速公路参与方的风险分担,从而提高高速公路建设管理、保证项目建设保质保量完成,实现项目参与各方利益最大化。为了更好的探讨BOT总承包模式下高速公路参与方的风险分担,本文在研读已有参考文献的基础上,对BOT总承包这种新兴模式进行界定,并分析了模式的特点。在此基础上,利用WBS-RBS方法,从工作分解结构与风险
随着体验经济时代的到来,感官交互的重要性日益体现,手感体验作为一种集合了感官、情感及交互体验的综合性体验,可以有效激发产品的感性价值。产品表皮纹理是交互过程中人体获得物体表面微观信息的关键因素,与手感体验关系密切。本研究期望从表皮纹理的角度切入,为产品的手感体验提升开拓一条创新之路。本文首先对手感体验进行了文献研究综述,结合产品触觉体验研究,总结手感体验发生过程;并且基于对手感文化调研以及对传统手
“还行”在日常交际互动中经常出现,使用频率非常高。但是,学界对“还行”的研究尚未深入,现有研究成果较少。尤其是从互动语言学视角下对“还行”的研究不够充分,从互动语言学视角出发,将“还行”与对外汉语教学方面的结合研究较为缺乏。因此,笔者选择“还行”作为研究对象,从互动语言学的角度出发,对“还行”的会话功能进行分析研究,同时,结合“还行”在汉语课堂上的实际教学情况进行分析,并根据分析结果提出教学建议。
电视剧歌曲作为声乐作品的一部分,不同于一般歌曲,其通常与电视剧相伴而生,无论从词曲的创作方面还是从演唱要素的把握方面,都需要与电视剧整体做到协调统一。随着社会的不断发展和电视剧文化的进步,经过越来越多优秀词作家的创作,电视剧歌曲也呈现出愈发繁荣之景象,为大众所熟知。赵季平作为音乐领域当中里程碑式的人物,在电视剧歌曲创作中的作品数量之多、质量之精是为众人所有目共睹的,其创作风格自成一派且在取材方面灵
钢琴不仅是独奏乐器,它在重奏中也担任了重要角色,有钢琴参加的室内乐也称作钢琴室内乐。钢琴室内乐是钢琴与其他乐器合奏的一种音乐形式,在演奏中形成一个由不同音色组成的立体空间,音响效果更加丰富。钢琴室内乐的创作及研究虽然相对较少,但从整个钢琴发展的历史来看,它还是具有一定重要地位的。因此,笔者从钢琴室内乐研究的角度出发,针对钢琴在室内乐演奏中的重要性及其合作问题进行深入探究。本文主要以肖斯塔科维奇的《