基于ARIMA与LSTM混合模型的微博网民负面情感预测研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:ffg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国突发事件频频发生。在突发事件中,网民通过微博发表自己的观点和见解,产生了大量具有情感的信息。其中,负面情感的蔓延极易引起民众的过激行为,若不加以正确引导,任其发展,极有可能造成严重的网络舆情危机,负面情感的预测显得尤其重要。因此,本文以微博负面情感数据为研究对象,结合情感分析和时间序列建模方法,在博文情感值计算的基础上筛选出负面情感,并建立ARIMA-LSTM混合模型进行预测。主要研究内容如下:(1)提出基于情感词典与规则结合的微博情感分析方法。首先结合基础情感词典、网络情感词典、微博表情符号词典、“突发传染病”领域词典、修饰词词典5大词典构建一个面向微博的情感词典,然后以微博情感词为中心,从词语级、句子级、文档级3个层面分析微博情感语义规则,并根据语义规则定义了微博文本情感计算表达式,最后结合微博文本与表情加权规则计算微博最终情感值,得到负面情感数据集。(2)提出了一种基于差分自回归移动平均(ARIMA)与长短期记忆神经网络(LSTM)混合模型的负面情感预测方法。针对负面情感数据同时包含了线性特征和非线性特征,首先利用具有良好线性逼近能力的ARIMA模型得到初步的拟合结果和残差,然后利用具有良好非线性拟合能力的LSTM神经网络模型得到残差的预测值,最后将二者的预测值进行组合得到最终的负面情感预测结果。(3)通过实验验证本文提出的混合模型的优劣性。设置了三组实验并选取平均绝对误差(MAE)和平均绝对百分比误差(MAPE)这两种评价指标,利用“埃博拉病毒疫情”事件的负面情感数据集,对比论证本文提出的混合模型的优越性,实验结果表明该混合模型对负面情感的预测精度高于其他两个模型。
其他文献
信息偶遇是一种被动获取信息的方式,随着互联网网络技术的发展,新闻媒体的融合发展,人们以沉浸于新闻的海洋之中,面对海量的新闻内容,人们对新闻的获取已不再像传统纸质媒体那样是一种主动搜寻的方式,获取新闻的方式已逐渐转变成为一种被动获取的偶遇的方式。已有的信息偶遇研究主要聚焦于信息偶遇的概念、偶遇的过程模型、以及偶遇的形象因素研究,为偶遇微过程的研究较为缺乏。此外,在现在新媒体环境下,根据调查报告显示,
学位
当前,南海地区存在着复杂的岛礁主权、岛礁法律地位和海域划界争议,形成了诸多争议海域,且南海争议海域的传统和非传统安全问题此起彼伏,各国在南海争议海域既面临着日益严峻的执法需求,也因南海争议海域执法存在法律规范不统一、不确定,执法主体、执法手段乱象纷生等多种问题,造成了混乱的局面,甚至多次因执法争端导致区域国家间关系的紧张。我国海洋权益以及海洋战略面临着诸多风险与挑战,既需加强对争议海域违法行为的执
学位
近年来,随着信息技术的发展,互联网作为信息科技的产物,改变了经济和商业的运作方式。作为一种商业模式的颠覆性创新,共享经济打破了已成熟建立的传统商业模式,创造了巨大的社会和环境效益,在全球范围内的业务量呈现爆发式增长态势。共享经济也将同样改变酒店和旅游行业未来的发展动态。作为共享经济的一个重要子领域,在线短租的出现打破了消费者对传统酒店标准化住宿的单一选择壁垒,为住宿市场提供了多样化的房源,填补了市
学位
移动阅读时代,新闻客户端是人们获取新闻资讯的重要工具之一,融入了音频、短视频、直播等多样内容表达形式的新闻客户端带给人们一种全新的阅读体验。然而在新闻客户端飞速发展的同时,亦存在着设计同质化、内容质量不高、“信息茧房”导致用户阅读视野受限等问题,不利于其健康长远地发展。用户体验是衡量一个客户端成功与否的重要依据和评判标准。对新闻客户端的用户体验进行度量可以让经营者了解自身的运营状况,也可用作对其竞
学位
随着网购环境的日益完善、移动支付的广泛推行以及网民数量的日益增加,网购成为了人们生活中不可缺少的一部分,与此同时,互联网上关于商品的在线评论的数量也呈爆发式增长并反过来对商品的后续销量产生影响,在线评论已经成为了消费者在线搜寻可能的目标商品并下定决心购买该商品时的关键参考依据之一。因此分析在线评论数据对商品销量的预测研究具有重要意义,成为相关研究的重要方向之一。关于基于评论的销量预测研究,多是基于
学位
在线旅游企业通过深度加工用户数据可以以更低成本为用户提供更精准的位置服务,用户也可高效便捷地获取高质量位置服务来辅助旅行决策。但若企业过度收集用户数据和滥用用户数据则会伤害用户利益,触发用户的自我保护行为,并最终制约在线旅游行业的持续稳定发展。因此,探究触发用户隐私保护行为的机制对于平衡用户隐私和个性化服务之间的关系具有积极意义。本文聚焦于在线旅游用户位置隐私保护行为,探究了触发用户位置隐私保护的
学位
随着大数据时代背景下网络数字资源的爆发式增长,数字图书馆机遇与挑战并存,数字图书馆的学术资源不应局限于图书和期刊论文等传统的文本资源,互联网上的文本数据同样被认为极具学术价值的资源。因此,数字图书馆在保持原有的传统馆藏资源的优势上,需要将新闻网页等被认为同样具有学术研究价值的网络文本资源纳入其中。但是,一方面,互联网上的新闻网页等文本资源增长迅猛且更新频繁,如果将其纳入到数字图书馆中,不能使用传统
学位
随着我国居民消费水平的提升和移动互联网技术的升级,知识付费行业取得了较好的发展,移动知识付费平台的数量不断增多。移动知识付费平台一方面可以激励更优质内容的产生,另一方面可以帮助用户更高效的筛选信息。随着消费水平的提高和消费观念的变化,人们对于精神文化的需求日益增加,为知识付费的意愿也会有所增强,因而知识付费行业拥有着巨大的市场潜力。因此,探究影响用户对知识付费类APP满意度的因素具有一定的实践意义
学位
随着知识图谱技术的不断发展,其应用迅速向各个垂直领域渗透。在金融领域中,企业知识图谱构建受到了工业界与学术界的广泛关注。使用知识图谱技术从来源广泛、类型复杂的企业数据中获取关联信息,并为用户提供面向金融的分析服务是当前的研究热点。企业知识图谱将来自不同数据源的企业信息进行统一的表示与融合,最终形成一个大的企业关联图谱。在企业关联图谱上,利用已有的图查询与挖掘技术能够构建丰富的知识发现应用。本文从知
学位
伴随中国经济的快速发展和人民生活水平的显著提高,对健康和更高质量生活的追求促使医疗服务需求快速增长。而传统医疗因资源紧张、地域分布不均衡、分级诊疗不完善等问题,无法应对这种快速增长的医疗服务需求。互联网技术的迅速发展以及Web 2.0技术的出现,以在线医疗社区为代表的新型“互联网+”医疗模式在打破传统医疗模式的时间和空间限制、高效整合利用医疗资源、提高医疗服务水平上发挥着重要的作用。它摒弃了传统的
学位