基于深度学习的微博评论情感倾向性分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zg29
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的迅猛发展,网民参与社会热点讨论的热情不断高涨,新浪微博成为网民发表观点抒发情感的重要平台,基于新浪微博的社交网络很大程度上反应了中国人的社交行为和情感倾向。如何快速挖掘出新浪微博中隐藏的情感信息,为政府和企业的决策提供有效的辅助信息,正成为自然语言处理领域的研究热点。传统的情感分析需要花费大量的时间提取数据中的特征,并且往往需要与语法规则相结合才能取得比较好的结果,但是在大数据时代,数据量越来越大,人工提取特征的难度不断加大。本文提出使用词向量加深度学习组合的方式去学习数据中的情感信息,其中,使用无监督的Word2vec和Glove模型将数据训练成词向量,词向量将取代人工提取的特征,这种方法节省了人力,并且使用深度学习模型自动学习词向量中的情感信息,最后,通过对比实验验证深度学习模型能够在语句级情感分析任务中取得较好的效果。本文通过Word2vec和Glove语言模型将微博评论数据训练生成两种词向量并分别输入到浅层学习模型SVM、Logistic Regression、Naive Bayesian和深度学习模型LSTM、CNN、LSTM+CNN中,浅层学习模型和深度学习模型通过学习得到词向量中隐藏的情感信息并给出情感分类的结果,根据实验结果统计模型的准确率、召回率等模型性能评估指标,其中,浅层学习模型最高的准确率接近78.1%,深度学习模型最高的准确率接近84.5%。通过对比实验结果本文发现,与浅层学习模型相比,深度学习模型中的LSTM能够存储远距离的信息,CNN能够提取不同维度的特征,这些功能能够更好地挖掘出词向量中隐藏的情感信息,而浅层学习模型在挖掘词向量中隐藏的情感信息时损失了词与词之间的语义信息,这是浅层学习模型性能下降的一个主要原因。与Word2vec词向量相比,Glove词向量能够利用全局统计信息,将更多的情感信息存储到词向量中,而Word2vec只能利用局部信息,因此Glove词向量情感分类的效果要好于Word2vec词向量。
其他文献
采用具有不同形状特征的Al2O3磨料对CdZnTe晶片进行机械研磨,研究了磨粒形状、粒径对晶片的去除速率、研磨后晶片表面形貌的影响,并讨论了其影响机理。研究表明,多角形不规则
本试验以环磷酰胺为阳性药,以嗜多染红细胞微核率为指标探索板兰根、鱼腥草、女贞子和枸杞子保护正常分裂细胞染色体,降低化疗中毒副作用骨髓抑制的作用机理,揭示此4种药均有抗环
<正>"我要开农家旅馆,让来看枫林、游格所河的游客住下来。"在盘州市保基苗族彝族乡雨那洼村,村民姜芳莉开心地说。雨那洼村位于正在开发的格所河峡谷景区旁。2016年,政府帮
目的 观察牛磺酸 (Tau)对幼鼠脑神经的保护作用 ,并对其可能机制进行探讨。方法 用 0 .1 μmol/L亚硒酸钠与不同浓度的 Tau共同加入到原代培养 2 d的新生小鼠大脑皮质神经
<正>读完《追忆似水年华》竟然有种长吁一气的感觉,就像经过一场长途跋涉,沿途风景固然醉人,却还是希望早日到达终点。从15年前拥有这套书,到如今读完它,这么漫长的时光过去
随着社交媒体的普及,微博情感分析受到了广大研究者的关注。为解决情感分析中词间语义关系缺失和词汇重要程度被忽略的问题,提出了一种基于加权词向量和支持向量机的情感分析
二战以后,日本在美国主导下,经过“第二次开国”的战后改革,从战争的废墟中迅速实现复兴。尤其是在经历长达十余年的经济高速增长后,到1968年一跃而为仅次于美国的世界第二大经济
报纸
导出格林乃森参量随温度的变化规律以及热压强的表示式 ,建立了强激光辐照下金属材料表面附近的温度和应力所满足的数学方程 ,以 Cu例 ,对激光辐照下材料表面的热力学效应作
针对目前舞台灯的光束角可变范围小、照度均匀性差等缺点,在全反射式透镜结构的基础上,基于变焦透镜组原理,设计出一种采用单颗透镜的变焦透镜系统。该系统包括准直透镜和可
本文利用有限元的理论,对连续激光对金属材料的热传导过程进行了数值模拟,得到了金属材料的温度场分布和热耦合系数等结果。根据经典热传导的基本原理,描述了激光对金属的加