基于深度学习算法的微博文本数据情感分类研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:sunboy92121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析技术是自然语言处理领域最火爆的方向之一,其功能就是利用一定的规则对文本上下文信息进行特征提取,并按照预设的算法对文本所蕴含的作者情感倾向进行判定。微博社交平台是时下最热门的中文社交平台之一,若能对微博评论文本进行及时准确的情感倾向判断,其中的商业价值是巨大的。但是如此数量的文本仅靠人工去分辨是不可能的。随着情感分析技术的不断发展,使得利用机器来帮助组织分析用户情感成为可能,从最早的情感字典方法发展到利用机器学习算法来识别情感倾向,再到深度学习技术的出现将情感分析技术推向新的高潮。深度学习是一系列神经网络算法的统称,包括卷积神经网络(CNN)、循环神经网络(RNN)等。其不同于以往的情感分析技术,可以在不依赖人工选择的情况下自主学习文本信息,在情感分类任务上取得了非常瞩目的成就。但是目前国内对于微博情感分类的研究比较稀缺,过往研究多数利用情感字典方法和机器学习算法,运用深度学习算法研究微博文本的文献较少,而且所使用的算法较为简单。本文通过深入研究深度学习算法两种代表结构,发现两种算法互有优劣,若能将两者的优势提取出来共同发挥功效,那么,面对分类任务极有可能产生更好的分类结果,LSTM-CNN算法和CNN-LSTM算法正是基于这一思路构建。基于此,本文以微博用户“头条新闻”为研究对象,爬取了其10039条用户评论,经过数据清洗后,使用Python的Jieba库和Word2vec模型分别作文本分词化和向量化处理,最后构建了一个可以判断微博评论文本情感倾向的模型。这一模型使用了包括卷积神经网络(CNN)、长短期记忆网络(LSTM)、双向长短期记忆网络(Bi LSTM)以及融合算法LSTM-CNN和CNN-LSTM在内的五种深度学习算法。通过实验表明,新提出的LSTM-CNN算法的最终情感分类效果最佳。这说明本文构建融合算法的思路是切实可行的。本文的研究拓展了使用深度学习算法研究微博文本的思路,新算法的提出也对深度学习算法的发展提供借鉴意义。
其他文献
随着全球化趋势的不断加剧,国家之间的竞争开始越来越激烈,为了能够保证我国在国际化竞争的过程之中获得更多的优势,我国领导人之中国家战略经济发展的角度积极推动战略性新
综合能源系统(Integrated Energy System,IES)接入以微型燃气轮机(Micro-Turbines Generator,MTG)为主的可控出力分布式电源,为用户降低用能成本的需求提供了多样化的解决方案。对于具有网络结构的,含多种形式能源的区域式网络侧IES,各种能源之间不能完全透明地共享信息,难以应用集中式计算方法统一求解,因而需要在系统内部进行分布式计算。如何进行单元划分并
目的对糖尿病口腔溃疡患者采取重组人表皮生长因子凝胶治疗的护理效果分析。方法随机抽取2017年12月—2019年12月期间在该院治疗的72例糖尿病口腔溃疡患者,均应用重组人表皮
十八大报告中将党的纯洁性建设纳入党的建设的主线,十八届三中全会再次提出了廉洁政治的目标,可见廉政建设再一次成为党建当中的关键问题。本文对十八大报告中提出的增强执政党
古诗文作为传承中华优秀传统文化的重要载体,在语文教科书的编选中具有举足轻重的意义。因此,我们选取人教版、翰林版两版语文教材作为调查对象,全面考察两版语文教材的古诗
世界经济全球化的深入以及科技、通讯的迅速发展,使得国与国、地区与地区之间的交往更加密切,进而促进了不同文化之间的碰撞和交流,形成了多元文化共生共存的格局。在这种多
文章根据一起10kV备用自投异常动作的情况,具体分析了该备用自投的工作原理及异常动作的原因,并提出了运行人员在对该备用自投装置日常巡视过程中的注意事项。
葛洲坝1号船闸输水系统共进行了4个方案的模型试验研究。最后确定,4区段8根纵支廊道顶孔出水盖板消能的方案作为设计方案。本文简要介绍输水系统方案的选择情况。对试验确定
用强夯换石碴桩及加筋土的施工方法,对宁波北仑港20万吨级矿石码头堆场地基进行加固。试验现场模拟使用荷载最不利组合,经直接加载验证,能提高加固后的地基承载力,并获得了加载过程
目的对比伤口患者清洗与不清洗皮肤对伤口感染的影响,旨在促进伤口愈合,改善伤口患者的生活质量。方法采用病例对照研究方法,纳入2019年1月—2020年7月伤口护理中心就诊的术