基于深度学习的疫情期间微博文本情感分析

来源 :吉林大学 | 被引量 : 0次 | 上传用户:studyrec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的不断发展和社会生产力的提高,网络进入到家家户户,在人们生活中的比重越来越大,各种网络平台已经成为获取和传播信息的重要媒介,与此同时,微博凭借其社交性、易用性、灵活性等突出优势,逐渐成为目前中国最受欢迎的网络社交平台。2020年初,新冠肺炎疫情的爆发极大影响了全球大部分地区民众的生活状态,此次公共卫生事件成为全社会关注的重点,国民线下沟通交流更加困难,更依赖互联网平台发表评论以表达自己的态度和情绪。从朋友圈、微博等公共网络平台传递出的信息中我们能发现民众对此次新冠疫情蔓延的担忧和对防疫工作的信心兼而有之的状态。近十几年来,情感分析任务是国内外研究人员关注的重点,同时也是一个挑战。在新冠疫情这一特殊时期,相关的文本数据不断增长,本论文的研究希望对疫情期间的微博文本数据进行情感分析工作,以了解人们的情感状态和需求。本文将词嵌入、卷积神经网络CNN、长短期记忆网络LSTM等深度学习技术同时加入框架,提出了情感分析模型CNN-LSTM-Enhanced,在两个数据集上经过多个对比实验证明了CNN-LSTM-Enhanced模型的有效性。实验首先利用开源的预训练Word2vec词向量文件构建了静态嵌入层,并使用随机初始化且随着训练过程动态调整参数的方式建立了非静态嵌入层,然后在两个嵌入层后面分别接卷积神经网络和长短期记忆网络,最后将得到的特征向量融合后通过全连接层及输出层获得情感分类结果。CNN-LSTM-Enhanced模型在数据集1上准确率和加权平均1分数数值分别达到73.64%和73.13%,在数据集2上准确率和加权平均1分数数值分别达到75.09%和73.70%,优于其它几个对比模型。另外,在CNN-LSTM-Enhanced模型的基础上,结合自注意力(Self-Attention)机制,提出了CNN-LSTM-SA-Enhanced模型,并在两个数据集上进行实验,CNN-LSTM-SA-Enhanced模型在数据集1上准确率和加权平均1分数数值分别达到73.78%和73.30%,在数据集2上准确率和加权平均1分数数值分别达到75.76%和74.34%,实验结果表明,融入自注意力机制的CNN-LSTM-SA-Enhanced模型比CNN-LSTM-Enhanced模型的预测效果有了更进一步的提升。
其他文献
随着5G通信技术的飞速发展,多标准、多模式系统对功率放大器提出了进一步的需求,而传统的功放系统由于功能单一、体积较大等劣势,已逐渐不能满足现代军用通信的需求。可重构技术及可重构功放的优势是各个频段之间的信号互不干扰,能够实现高集成度与智能化,且在每个频段内的性能都能达到最佳,因此在当今的军用通信系统中得到广泛的应用。在军用通信系统中,LDMOS器件以其增益高、频率稳定性强的优势已经成为射频领域的主
学位
煤与瓦斯突出是煤矿生产过程中的一种猛烈急剧的动力灾害,形成机理复杂,影响因素众多。随着近年来各类智能算法的快速发展,结合多种影响因素指标,将煤与瓦斯突出预测转化为非线性的分类问题,构建煤与瓦斯突出风险预测模型,使煤与瓦斯突出灾害的隐患实现早发现早解决,保障井下煤矿的安全开采。分析现有对煤与瓦斯突出发生机理的研究,结合地应力、瓦斯、煤体物理学性质三类因素,确定了预测指标体系,对灰色关联分析加以改进,
学位
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)由于具有效率高,功率密度高,结构简单等优点,已成为航空航天、电动汽车等领域驱动电机的重点发展对象。随着工业伺服控制中PMSM的使用越来越普遍,对系统高性能控制的需求也越来越高。由于运行中的PMSM参数具有不确定性,且温度、磁饱和程度也都在不断变化,传统矢量控制中的PI调节器易受电机参数和负载扰动的影响,导
学位
目的:探讨剖宫产术后切口感染的风险因素,以此制定针对性护理对策。方法:选取2019年5月-2021年12月我院收治的20例剖宫产术后未切口感染患者与20例切口感染患者作为研究对象,收集患者的临床资料分析导致切口感染的危险因素,并进行Logistic多因素回归分析。结果:年龄、妊娠合并症、BMI指数、术中出血量、手术时长、侵入性操作是导致剖宫产术后发生切口感染的危险因素(P <0.05)。经Lgis
期刊
农村消费是新消费的重要组成部分,是我国消费升级的重要领域之一。农村电商的规模增长,为国家精准扶贫工作提供了有力支持。在线购买行为促进了农村消费者群际分类,同时农村消费者对自我分类认知存在显著性差异。农村消费者对社会认同的认知差异又对其在线购买行为产生重要影响,立足农村线上消费市场研究现状,确定本文选题,从营销视角出发,将社会认同引入农村消费者线上购买领域研究。针对社会认同研究多聚焦在社会心理学领域
学位
近年来,由惯性导航系统(INS)与全球卫星导航系统(GNSS)相结合的组合导航系统广泛用于增强无人驾驶车辆的位置、速度和姿态信息。然而,GNSS信号易受复杂的外界环境影响,在遮挡严重的城市峡谷、隧道等地信号会发生中断,无法完成定位服务。因此,研究GNSS/INS组合导航系统在特殊环境下GNSS信号丢失时,如何能够提供可靠的导航服务具有重要意义。解决GNSS/INS组合导航系统中GNSS信号丢失问题
学位
在射频微波器件的设计中,需要在保证器件工作性能的前提下减少设计时间和成本,通常用CAD(Computer Aided Design)软件来建立射频微波器件模型。但在传统射频微波器件的设计中,需要不断优化各参数以满足设计指标,整个过程是耗时费力的。深层神经网络具有高维数据处理能力和复杂非线性关系的近似能力,因此将深层神经网络建模方法应用到天线等射频模块设计中。本文主要的研究工作概括如下:首先,针对基
学位
知识图谱是一种用图来描述知识的技术方法,在表示从不同领域收集的知识方面起着至关重要的作用。然而,不同的知识图谱通常由不同的技术或不同的语言构造,这些单独构建的知识图谱之间包含异构但互补的内容,因此将不同来源或不同语言的知识图谱整合为统一的知识图谱很有意义,一种有效的对齐知识图谱的方法是把多个不同来源但代表相同对象的实体进行对齐。在大数据时代的背景下,为了实现知识的全球共享,跨语言实体对齐作用愈加明
学位
无线通信技术的飞速发展,以及各类新型通信业务场景的不断涌现,正在促使着人-机-物-空间的全面互联。伴随着网络终端数目的持续增长,无线频谱资源稀缺与频谱利用率之间的矛盾日益显现,加重了整个网络的负担。终端直连通信(Device-to-Device,D2D)和非正交多址接入(Non-Orthogonal Multiple Access,NOMA)等下一代无线通信关键技术,可以有效缓解无线频谱资源压力。
学位
随着移动设备需求的增长,价格低廉的单频接收机占据了主要的GNSS市场。因此,基于单频接收机的PPP技术逐渐受到关注。本文在C++平台实现了GNSS单频PPP算法,结合MGEX跟踪站和实测数据,比较GPS、Galileo、BDS各频点的数据质量、单频PPP定位精度和收敛速度,分析了不同条件下的单频PPP应用效果。本文研究内容和结果如下:(1)选取全球范围内分布均匀的29个MGEX站,进行各频点的数据
学位