社交媒体数据对灾害预警的研究——基于主动学习思想的语料库搭建

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:anglelc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国自然灾害频发,给人民的生命财产安全带来了巨大损失与隐患,如何加强抢险救灾工作的效率成为了一个迫在眉睫的问题。开展抢险救灾工作高度依赖灾损数据的搜集速度和搜集精度,而传统灾损估计模型与信息搜集方法由于存在时间滞后性等客观缺陷,并不是一种能够实时提供灾损相关信息的方法,不利于抢险救灾工作效率的提升。社交媒体作为实时信息传递的媒介,可以将用户对于灾损事件的实时情绪反馈及时记录,这种情绪反馈中包含了用户主观意识上对于灾损严重程度的衡量,即,当用户面对一个具体的灾损情景时,会针对此情景产生一个即时的情绪反应。在该情绪反应中既包含了灾损严重程度的信息,也同时包含了用户对当前程度的灾损的主观评价反映。大数据分析技术将个人的主观性通过上升到群体层面来予以减弱,能够有效消除由于个体对待灾损信息反应特异性带来的反应不足和反应过度,使得研究人员能够更客观地通过社交媒体对灾损的群体评价来研究灾损信息。因此,本研究将社交媒体数据引入灾损信息相关领域,以提升信息搜集效率与预估准确性,辅助灾损信息监控工作,提升抢险救援的工作质量,并且为稳定社会公众情绪提供帮助。本次研究首先对“利奇马”台风事件中社交媒体用户在微博平台发布的语料进行情绪分析,以抽取出微博群体对灾损事件的情绪反应,在此过程中针对研究目的通过对比筛选等步骤,选取了适宜的情绪分类模型——极端随机树模型,并且采用主动学习的思想搭建了针对极端天气条件下社交媒体文本情绪分析的语料库,使得整体分类结果准确性上升至83.10%。随后,本研究将时空信息、灾损信息与情绪分类结果相结合,分析“利奇马”台风事件中社交媒体用户显示出的情绪特征,以此构建通过情绪曲线进行灾损信息分析的灾损预警方案。预警方案的测试工作通过对“河南水灾”事件中产生的微博语料的分析来展开,验证前述语料库的普适性、语料库更新方法的适用性、情绪曲线对于灾损信息的反应程度等。同时,对河南水灾事件中表现出的情绪特征进行分析。由于语料库质量对于文本情绪分类结果的准确性至关重要,但现有公开语料库无法满足本研究对于极端天气条件下社交媒体文本细颗粒度情绪分析的要求,因此通过给予情绪类别明确定义、构建情绪判定规则并且构建针对性语料库,来提升分类结果的可靠性。语料库搭建选取人机结合标注的方法,采用主动学习的思想进行更新;研究证实,此方法能够提升人工标注效率,并提升语料库整体质量。本研究构建的语料库在“利奇马”台风事件与“河南水灾”事件中展示出了较为优越的性能。研究表明,同台风眼距受灾地距离、台风风力等变量相比,社交媒体用户情绪波动与人身伤亡和财产损失事件相关性更大,并且对于前者的反应程度明显高于后者。在同一类事件中,用户“灾前”祈福性质发言欲望显著强烈于“灾后”悲伤性质的发言欲望。就细颗粒度情绪进行分析,本研究发现极端天气条件下社交媒体情绪基调为“惧”;“悲”通常为次要情绪;“好”情绪的波动一般来自于“灾前”的祈福、祝愿平安等心理活动;而“乐”、“恶”、“怒”、“惊”四类情绪占比较小,通常与自然灾害导致的其他事件相关。各情绪曲线的波动对于抢险救灾工作的指示意义不同:“好”情绪曲线的波动预示着灾损事件即将发生,此时应注意灾前人员避离;如果“悲”、“恶”等情绪曲线出现异常波动,一般为“灾后”悲痛情绪的表达,因此应注意灾后物资调配、救援工作的展开等;而“惧”情绪曲线相较于其他曲线的波动也值得关注,如果“惧”情绪曲线与其他情绪曲线波动幅度相近,则可能发生了引起人们关注但未导致实际损失的事件,若其波动异于其他曲线,则极有可能代表着灾损事件已经爆发。根据上述发现,本研究所述“灾损预警”工作包括两个方面:一方面在灾损事件发生之前,通过特定手段预期到灾损的发生,并据此进行防范性工作;另一方面,对于正在发生或者已经发生的灾损事件,通过特定方法预估人身伤亡或财产损失的量值,为抢险救灾、灾后重建等工作提供信息支撑。由此,本研究构建的预警方案大体逻辑包含三点:其一,以历史灾害事件中构建的语料库为基础,在预期自然灾害发生时搜集社交媒体信息并进行情绪分析,与人工标注结果进行比对,对准确性未达标的语料库依据主动学习的方法进行更新;其二,在情绪监测过程中注意随机抽取时点进行语料库的检验,保证情绪分类模型结果的可靠性;其三,在灾难事件全过程中持续进行社交媒体实时数据的搜集,监测情绪波动状况,遇情绪曲线异常波动时留意是否存在较大灾损事件的发生,并考虑救援物资是否准备充分等问题。此预警方案在对“河南水灾”事件的演示中效果理想。本次研究尚且存在如下四点不足:一是研究条件不支持使用过于复杂的模型;二是目前所公布的灾损数据不足以支撑定量分析;三是情绪类别可进一步优化;四是灾难事件数量较少使得结果可能具有偶然性。此四者不足期待后续研究进行解决。
其他文献
在传统的中国社会,人口以家庭为聚落,老年人口的居住安排也以子女为主体,家中的子女及其配偶承担照料老年人的职责。而这样的传统的养老方式正在随着时代变迁出现脱节,一方面是老年人口,尤其是是失能老人的健康状况恶化,使得传统的养老方式无法满足多样化和繁重的护理需求,另一方面生育观念的转变和异地工作造成的代际地理距离增加使得人口结构正在转变,子女绕膝的老年家庭居住模式收到了一定的冲击。老年人口能否享受幸福的
学位
作为人类历史见证和珍贵遗存,古代绘画具有丰富的科学文化内涵和史料研究价值。但由于自然因素及人为破坏,它们大多遭受着褪色、破损、霉变等病害问题。低品质古代绘画极大降低了鉴赏体验且严重阻碍了文化传承,针对其的修复工作已刻不容缓。传统手工修复不仅耗时费力、面临专业技术人员稀缺等问题,还存在不可逆的二次破坏风险。为了解决这个问题,本文采用深度学习等先进技术,开展古代绘画图像修复研究。考虑到现有的图像修复算
学位
购买保险是居民应对风险的主要措施。随着老龄化大潮和后疫情时代的到来,中国居民风险意识的增强和保险需求的扩大对人身保险配置提出了新要求,因此研究居民在健康风险下的保险决策,对于提高居民的生活质量和促进我国保险行业发展具有重要意义。为了研究居民在重疾风险和死亡风险下的最优人身保险配置,本文建立了生命周期保险决策模型。居民面临的不确定性包括身体状况的不确定性和收入的不确定性,它们会影响到居民的收入、获得
学位
自2014年首只民企公募债违约、2015年首只国企公募债违约以来,刚兑打破后信用债市场不确定性愈演愈烈,爆发了许多令人咋舌的违约事件,2020年的永煤事件更是颠覆了市场认知,信用债市场遭受巨大冲击。加之新冠疫情席卷全球,需求下降,供给收缩,经济下行,信用环境面临前所未有的挑战。信用市场囊括了国民经济全部行业,而行业之前常有多层联系,既有信贷、贸易、股权、供应链等直接关系,也有宏观环境敏感性等带来的
学位
产险业务是我国保险市场的重要组成部分,近年来监管部门关于投资以及偿付能力等方面的相关政策对产险市场产生了深远影响,在此背景下,本文关注产险公司的可持续发展问题。可持续发展即公司仅依靠内部盈利便可满足偿付能力要求,而不需要外部融资。考虑到将产险公司所有业务聚合起来计算偿付能力资本要求以及沉淀资金具有一定的难度,因此本文以车险业务为例研究产险公司的可持续发展问题,本文研究思路对研究公司层面的可持续发展
学位
随着未来移动网络B5G/6G向智能化迈进,不同计算密集型和高能耗应用业务的涌现,使得移动终端将任务迁移到边缘服务器进行处理的边缘计算得到了广泛的应用。但由于物理尺寸的限制,移动设备通常在电池容量和计算能力方面受限,而边缘计算任务迁移过程中,大量的密集型计算任务将加速终端的能耗,缩短移动设备电池的使用周期。因此如何高能效地迁移任务、降低移动终端能耗,一直是边缘计算中的开放问题。在当前高能效边缘计算任
学位
视频超分辨率是图像处理领域中一个经典且具有挑战性的视觉任务,其目标在于根据序列低分辨率视频恢复相应的高分辨率视频。视频超分辨率重建旨在利用相邻视频帧之间的时序和空间信息生成时空一致的高分辨率视频。本文重点围绕基于深度学习的视频时序特征学习,以及时空特征融合的视频超分辨率方法展开研究。在学习并研究了目前先进的深度学习视频超分辨率重建方法的基础上,提出了结合高分辨率光流估计补偿的高分辨率特征投影网络H
学位
权益指数年金保险,是一种与股市指数或债市指数相关联,同时具有最低收益保证的年金产品。在欧美成熟的保险市场上销售火爆,保费收入约占整个年金市场的三分之一。虽然目前我国的保险市场上还没有出现权益指数年金产品,但已经具备相应条件:一是人口老龄化的加剧将会催生巨大的养老保障需求,在我国养老金制度体系中,需要创新发展多样化的商业养老年金产品。二是近年来,保险公司保费增长乏力,普遍面临着较大的经营压力。而养老
学位
公允价值在金融行业的广泛应用,为保险公司负债评估带来了新的挑战。我国保险会计准则对公允价值的进一步应用,以及IFRS17的发布对全球保险公司会计准则带来的冲击,也向保险公司准确拆分业务组成、合理评估负债提出了更高的要求。在这种背景之下,寿险公司需要通过合理的风险对冲安排进一步优化风险管理措施、释放准备金,实现对负债的准确评估并改善财务结构。二十余年以来,我国新型寿险产品的不断发展也使得保险业更加重
学位
验证码是一种区分某次操作的主体是计算机程序还是正常用户的安全机制。文本验证码因其轻量、灵活易部署,被广泛应用于注册、登录、发帖、投票等场景。近年来,基于深度学习的攻击破解技术不断发展,使得文本验证码的安全性岌岌可危。对于安全人员而言,如何设计既能满足轻量级应用需求,又能提升抵御攻击能力的文本验证码是目前面临的难点和困惑。为了解决上述挑战,提升文本验证码的安全性和对抗能力,本文从广泛分布的文本验证码
学位