融合表情符号特征的自然灾害事件微博舆情研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:wys9802110814
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网推动了信息全连接生态的形成进程。信息的数量与种类飞速增长,信息交互形式趋于多样化,信息获取与分发成本骤然降低,人与人之间的连接也在持续稳定的信息交互中不断加强与扩张。承载着用户客观观点与主观情感的数据成为互联网时代的新型资产。挖掘数据背后的模式是数据持有者及其他相关部门或机构的工作重点所在,且高效精准的数据挖掘离不开有效的方法和理论支持。在公共安全领域中,公众在线数据及设备监测物理数据等是开展灾害事件管控、安全生产管控、智慧医疗部署等研究的重要基础。由于灾害事件的强大破坏力,如何探究数据中隐含的价值信息从而为灾害事件预警及管控提供有效参考十分重要。当前,社交平台的迅速发展为公众创造了即时多样的在线交流环境,而微博凭借其流畅的交互体验、即时的信息收发和深厚的用户基础在中文在线社区中发挥着举足轻重的作用。探究灾害事件中的用户的行为模式及情感波动能够多角度感知受灾群众及其他地区群众的潜在动向,为灾前预警、灾中应急和灾后修复各阶段的策略制定及方案实施提供一定的借鉴,实现更高效的舆情管控。本文以“山竹”台风为例,分别从用户行为模式分析和微博文本情感识别两方面展开研究。在用户行为模式研究中,本文结合灾害风险感知中心理距离理论构建用户行为模式分析框架,并详细分析了台风事件中微博用户行为,研究发现台风事件中女性用户相比男性用户发布更多的灾害相关微博,且包含图片或视频的微博会获得更多的用户评论。与此同时,在灾前预警阶段,北京地区用户消极情绪高于广东地区,存在“台风眼”效应。为构建更高效准确的微博情感识别模型,本文综合考虑表情符号、微博文本内容和文本标点符号特征,并根据不同特征组合模型的性能对比结果构建了基于Fast Text和Random Forest微博情感识别模型。为验证情感识别模型的有效性,本文分别采用LR(逻辑斯特回归)、NB(朴素贝叶斯)、SVM(支持向量机)三类基分类器进行对比,实验表明融合Fast Text文本分类结果及表情符号特征的随机森林情感分类模型表现最佳。
其他文献
当前,南海地区存在着复杂的岛礁主权、岛礁法律地位和海域划界争议,形成了诸多争议海域,且南海争议海域的传统和非传统安全问题此起彼伏,各国在南海争议海域既面临着日益严峻的执法需求,也因南海争议海域执法存在法律规范不统一、不确定,执法主体、执法手段乱象纷生等多种问题,造成了混乱的局面,甚至多次因执法争端导致区域国家间关系的紧张。我国海洋权益以及海洋战略面临着诸多风险与挑战,既需加强对争议海域违法行为的执
学位
近年来,随着信息技术的发展,互联网作为信息科技的产物,改变了经济和商业的运作方式。作为一种商业模式的颠覆性创新,共享经济打破了已成熟建立的传统商业模式,创造了巨大的社会和环境效益,在全球范围内的业务量呈现爆发式增长态势。共享经济也将同样改变酒店和旅游行业未来的发展动态。作为共享经济的一个重要子领域,在线短租的出现打破了消费者对传统酒店标准化住宿的单一选择壁垒,为住宿市场提供了多样化的房源,填补了市
学位
移动阅读时代,新闻客户端是人们获取新闻资讯的重要工具之一,融入了音频、短视频、直播等多样内容表达形式的新闻客户端带给人们一种全新的阅读体验。然而在新闻客户端飞速发展的同时,亦存在着设计同质化、内容质量不高、“信息茧房”导致用户阅读视野受限等问题,不利于其健康长远地发展。用户体验是衡量一个客户端成功与否的重要依据和评判标准。对新闻客户端的用户体验进行度量可以让经营者了解自身的运营状况,也可用作对其竞
学位
随着网购环境的日益完善、移动支付的广泛推行以及网民数量的日益增加,网购成为了人们生活中不可缺少的一部分,与此同时,互联网上关于商品的在线评论的数量也呈爆发式增长并反过来对商品的后续销量产生影响,在线评论已经成为了消费者在线搜寻可能的目标商品并下定决心购买该商品时的关键参考依据之一。因此分析在线评论数据对商品销量的预测研究具有重要意义,成为相关研究的重要方向之一。关于基于评论的销量预测研究,多是基于
学位
在线旅游企业通过深度加工用户数据可以以更低成本为用户提供更精准的位置服务,用户也可高效便捷地获取高质量位置服务来辅助旅行决策。但若企业过度收集用户数据和滥用用户数据则会伤害用户利益,触发用户的自我保护行为,并最终制约在线旅游行业的持续稳定发展。因此,探究触发用户隐私保护行为的机制对于平衡用户隐私和个性化服务之间的关系具有积极意义。本文聚焦于在线旅游用户位置隐私保护行为,探究了触发用户位置隐私保护的
学位
随着大数据时代背景下网络数字资源的爆发式增长,数字图书馆机遇与挑战并存,数字图书馆的学术资源不应局限于图书和期刊论文等传统的文本资源,互联网上的文本数据同样被认为极具学术价值的资源。因此,数字图书馆在保持原有的传统馆藏资源的优势上,需要将新闻网页等被认为同样具有学术研究价值的网络文本资源纳入其中。但是,一方面,互联网上的新闻网页等文本资源增长迅猛且更新频繁,如果将其纳入到数字图书馆中,不能使用传统
学位
随着我国居民消费水平的提升和移动互联网技术的升级,知识付费行业取得了较好的发展,移动知识付费平台的数量不断增多。移动知识付费平台一方面可以激励更优质内容的产生,另一方面可以帮助用户更高效的筛选信息。随着消费水平的提高和消费观念的变化,人们对于精神文化的需求日益增加,为知识付费的意愿也会有所增强,因而知识付费行业拥有着巨大的市场潜力。因此,探究影响用户对知识付费类APP满意度的因素具有一定的实践意义
学位
随着知识图谱技术的不断发展,其应用迅速向各个垂直领域渗透。在金融领域中,企业知识图谱构建受到了工业界与学术界的广泛关注。使用知识图谱技术从来源广泛、类型复杂的企业数据中获取关联信息,并为用户提供面向金融的分析服务是当前的研究热点。企业知识图谱将来自不同数据源的企业信息进行统一的表示与融合,最终形成一个大的企业关联图谱。在企业关联图谱上,利用已有的图查询与挖掘技术能够构建丰富的知识发现应用。本文从知
学位
伴随中国经济的快速发展和人民生活水平的显著提高,对健康和更高质量生活的追求促使医疗服务需求快速增长。而传统医疗因资源紧张、地域分布不均衡、分级诊疗不完善等问题,无法应对这种快速增长的医疗服务需求。互联网技术的迅速发展以及Web 2.0技术的出现,以在线医疗社区为代表的新型“互联网+”医疗模式在打破传统医疗模式的时间和空间限制、高效整合利用医疗资源、提高医疗服务水平上发挥着重要的作用。它摒弃了传统的
学位
近年来,我国突发事件频频发生。在突发事件中,网民通过微博发表自己的观点和见解,产生了大量具有情感的信息。其中,负面情感的蔓延极易引起民众的过激行为,若不加以正确引导,任其发展,极有可能造成严重的网络舆情危机,负面情感的预测显得尤其重要。因此,本文以微博负面情感数据为研究对象,结合情感分析和时间序列建模方法,在博文情感值计算的基础上筛选出负面情感,并建立ARIMA-LSTM混合模型进行预测。主要研究
学位