基于深度学习的微博新冠肺炎话题的文本情感分析研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ythaohaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的不断发展,互联网在人类生活中的比重越来越大,已经成为生活必需品。与此同时,伴随着微博、抖音等软件的崛起,互联网已经开始迈入自媒体时代,这种进步的同时也促使网民自由的对事物发表大量的看法和观点,舆情分析因此应运而生。舆情分析可以快速判断国民对某些重大突发事件的情感倾向,客观的反应社会的舆论导向,有利于国家和相关部门快速了解舆情,从而实现监督,并精准引导,进而维护社会的稳定。农历鼠年以来全社会的关注重点非新冠肺炎莫属,面对来势汹汹的疫情,国民无法在线下沟通交流,因此更依赖通过互联网发表言论以表达自己对疫情现状的担忧或对疫情向好的感叹,特别是微博上的评论传播更快,一旦疫情稍有反复势必会引起社会巨大的关注甚至恐慌。因此如何及时准确的把握社会舆论,如何正确的引导舆论避免恐慌都成为了在新冠肺炎疫情大背景下的一个至关重要的议题和新的考验。基于以上问题,本文针对新冠肺炎相关的微博网络舆情进行研究,通过逐步优化,最终得到三个不同的模型,主要研究工作包括如下几个部分:1.微博中新冠肺炎相关评论文本的预处理。文本采用网络爬虫技术在新浪微博爬取2020年8-9月的新冠肺炎相关评论信息10万条,通过主题模型、相似度算法以及搜索关键词等方法过滤去除与新冠肺炎相关性较低或者不相关的噪声数据;经过人工标注后,采用分词技术和统计方法完成对数据的预处理。2.根据CNN和BiLSTM在进行文本处理时的特点,将二者结合构建模型用于文本情感分析。CNN的优势在于对复杂特征进行提取,BiLSTM模型的优势在于通过保留历史信息从而对整体语句有更好的把控。本文进行多次参数对比实验以确定最优参数下的新模型,相比传统模型在分类性能上均有所提高。3.根据CNN和BiGRU在进行文本处理时的特点,将二者结合构建新模型。GRU模型的基本结构是只含有两个门控设置,LSTM模型则含有三个门控设置,相比之下GRU少了一个门控设置,因此模型结构更加简单。故当分类性能相同时GRU模型更优。通过多次参数对比实验以确定最优参数下的新模型,对比传统模型在分类性能有所提高,同时与C-BiLSTM模型对比后发现分类性能相似但结构更加简单,且运用时间更短。4.针对C-BiLSTM模型的不足进行改进,其不足主要体现在不能有效的解决特征向量分配权重的问题,单纯改变参数已经无法再继续优化,故引入自注意力机制,并构建一种C-BiLSTM-SA模型用于文本情感分析,该模型会关注到句子中各词语相对整个句子而言重要程度的区别并对不同的词语赋予不同权值。最后通过本文自建的数据集进行验证,证明改进后的C-BiLSTM-SA模型分类效果更佳。进一步与其他代表性论文工作进行实验对比,结果表明该模型性能略好。
其他文献
我国是世界上鸡蛋产量和消费量最大的国家,鲜鸡蛋易受到大肠杆菌、沙门氏菌等致病微生物的污染,从而影响其食用安全性,因此开展鸡蛋杀菌技术研究具有重要意义。针对液态蛋、带壳蛋的杀菌需求,详细介绍了热杀菌技术、紫外杀菌技术、高静压技术和高压脉冲电场技术在鸡蛋杀菌中的应用,包括杀菌原理、杀菌工艺、设备研发、应用现状等,对比分析了各技术的优缺点,并对鸡蛋杀菌技术的发展进行了展望,以期为鸡蛋杀菌技术的改善和设备
新一轮的初中音乐教育改革,会将学生音乐核心素养培育作为焦点,继而要求初中音乐教育教学要懂得合理地进行教学理念和教学模式的优化,继而打造更加高质量的初中音乐学习格局。本文从这个角度入手,对于初中音乐教育改革与音乐教师知识素养发展之间的关系进行探讨,并且以扬州清曲知识素养为基本视角,对于初中音乐教师此方面的知识素养情况进行归结,指出其中存在的问题,在此基础上提出音乐教师知识素养发展路径,希望可以更好的
本文的选题首先紧扣当前国内外微分几何研究的大趋势、大潮流,并考虑了当前微分几何理论研究的几个具体方面: 1.黎曼流形,包括紧致与非紧致黎曼流形上几何性质与拓扑结构的研究;齐性空间与对称空间的几何性质及其与李群之间的关系;三维欧氏空间曲面的整体性质;子流形特别是极小流形的研究等。 2.流形上各种算子(如偏微分算子)的研究。 3.纤维丛几何,包括纤维丛上的联络论、示性类的研究及其应用
学位
音乐课程在整个初中教育体系中处于重要的辅助地位,其对学生的全面发展以及综合素养的提升有重要的意义。但是在传统教学体系下展开的音乐教学,往往很难取得理想的效果。随着素质教育的全面推进,初中音乐教学展开改革势在必行。初中生已经有了一定的学习技巧与知识储备,但是也处在对世界保持较高好奇心的阶段。在素质教育的要求下,学生应德智体美劳全面发展,因此音乐、美术、体育等学科也得到了越来越多的关注。初中音乐
期刊
为深入学习贯彻习近平总书记关于防灾减灾救灾重要论述,中共中央党校(国家行政学院)邀请中国地震局地球物理研究所原副所长、特聘专家高孟潭研究员于2021年10月15日作题为“大国竞争时代的防灾减灾救灾能力建设”专题讲座,中央党校的700余名学员参加。讲座紧密围绕深入学习贯彻习近平总书记关于防灾减灾救灾重要论述,通过震例客观分析我国面临的自然灾害形势,深入剖析在实现“两个一百年”奋斗目标进程中防灾
期刊
目的:建立中国新疆哈萨克族青少年正常(牙合)冠宽及牙量分析指数的均值及标准差,并与其他地区民族资料进行对比研究,填补中国不同民族、地区的正常牙合资料,为(牙合)畸形的分析诊断提供依据。方法:选取符合纳入标准的新疆地区100名正常(牙合)哈萨克族青少年,年龄在13-18岁之间,平均年龄在16岁,分别制取牙颌模型,用游标卡尺(精确度到0. 02mm)由作者在一段连续的时间对每一付模型进行测量,测量数据
目的:研究新疆维吾尔族长寿家族与非长寿家族的DNA断裂水平及相关影响因素。方法:采用流行病学方法进行现场问卷调查,内容包括许多选择性条目,例如:生活方式、饮食习惯、吸烟饮酒史、遗传史、生育史、既往病史等等,同时对每一个调查对象进行体格检查,包括:身高、体重、血压、脉搏等,并且在征得本人同意后采集血液样本,通过彗星实验方法检测其血淋巴细胞DNA断裂水平。统计学分析采用t检验、秩和检验、相关分析、回归
目的:通过中性粒细胞抗原(NA)等位基因的频率调查,了解乌鲁木齐地区维吾尔族、汉族、哈萨克族人群NA基因频率,并为NA相关的输血性疾病建立可靠的基因诊断技术。 方法:优化并建立了多重PCR-SSP(plymerase chain reaction with sequence-specific primers)法,对健康,无血缘关系的乌鲁木齐地区维吾尔族120名,汉族118名,哈萨克族102名
《陌上桑》是汉乐府中的一首立意严肃但又笔调诙谐的乐府叙事诗,文章主要讲述了一位名为罗敷的年轻美丽的女子在采桑路上遇到太守,太守被罗敷的美色所吸引想要进一步占为己有,但罗敷以家中夫君为理由巧妙地回绝了太守,刻画了一个美丽坚贞又充满智慧的采桑女性形象。本文在充分理解女性主义批评理论的基础上,利用该批评理论对《陌上桑》进行多角度分析,主要通过解读"罗敷"形象还有"罗敷"与文中太守、丈夫等人之间的关系来看
自主神经介导性晕厥是儿童常见疾病,严重影响患儿的身心健康,给予及时有效的治疗尤为重要。儿童自主神经介导性晕厥的治疗在国内外学者的共同努力下取得了巨大的进展,特别是个体化治疗策略的提出,显著提高了治疗的疗效。今后仍需探索干预及预防新策略,不断优化个体化治疗的预测技术,为不断提高儿童身心健康水平付出不懈的努力。