基于社交媒体的地震灾情数据挖掘与烈度快速评估应用

来源 :中国地震局工程力学研究所 | 被引量 : 4次 | 上传用户:zhoudddmmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地震灾害被称为群灾之首,而我国又是全球范围内地震灾害最为严重的国家之一。地震灾害分布区域广、发生频率高、造成损失严重是我国的基本国情,减轻地震灾害损失成为我国经济建设面临和必须重点关注的现实。破坏性地震发生后,如何高效、迅速地获取灾情信息并进行与地震损失相关的烈度评估,是地震应急救援和管理面临的关键问题,对这一问题的探索一直以来都是学术界瞄准的重要研究课题,也是灾区各级政府最为关注的问题之一。近年来,伴随着移动互联网技术的快速发展,蕴含海量数据的社交媒体平台为开展地震灾情获取和地震烈度快速评估提供了全新的视角和重要的途径。由于社交媒体数据具有海量性、时空性、交互性、强扩散性、融合性等特点,公众通过社交媒体可以自由表达自己的所见、观点与情感,无形中加速了灾情信息的共享与传播。挖掘震后用户自发贡献的社交媒体海量数据,使“众包”和“群智”思想在地震应急中发挥其应有作用,是有效提升地震灾情获取能力的重要途径与手段。鉴于此,本文在吸收信息科学、工程地震学、管理科学与工程以及统计学等学科的思想和方法的基础上,对社交媒体中震后灾情数据的抓取、甄别、存储以及其时空特征与主题分布特征等若干问题进行了深入研究,在此基础上结合机器学习中的人工神经网络算法,提出了一种基于社交媒体数据的地震烈度快速评估方法。研究的主要目标是统计并分析近年来我国大陆地区在社交媒体平台产生的地震灾情数据所呈现出的特点和规律,以此来推动社交媒体地震灾情数据挖掘这一新兴研究领域的发展,并探索一种新的基于社交媒体数据的烈度快速评估方法,以期提升地震应急救援工作的效率,为地震应急指挥决策提供参考依据。在充分吸收总结前人已有成果的基础上,本文以新浪微博移动端破坏性地震灾情数据为研究对象,致力于探索、解决地震应急和震害评估中的关键性科学问题,完成的主要研究工作及取得的创新成果如下:1.提出了一种多策略的社交媒体地震灾情数据获取方案,以新浪微博移动端为数据源,建立了我国大陆地区首个社交媒体地震灾情数据库及管理平台,为开展这一领域的研究工作奠定了重要基础。以我国现有的规模最大、用户最多的社交媒体平台新浪微博为例,总结分析了现有微博数据获取方法。在此基础上,提出了新浪微博商业API、网络爬虫、烈度衰减关系以及历史震例烈度分布矢量图相结合的多策略社交媒体地震灾情数据获取方案。基于新浪微博移动端,抓取了我国自2010年以来共206次破坏性地震震后72小时内与地震相关的微博数据,建立了我国大陆地区首个社交媒体地震灾情数据库及管理平台,并实现了数据可视化。同时,收集整理了我国大陆地区26次破坏性地震的烈度分布矢量图,在此基础上完成了位置微博的提取与地图匹配。本文所建立的数据库包含文本内容数据与用户关系数据,内容丰富、资料详实,便于下载使用,该数据库的建立为今后开展地震灾情获取和数据挖掘工作提供了宝贵的基础资料。2.基于社交媒体数据,分析了2010年以来我国大陆地区破坏性地震所呈现的灾情时间特征、空间分布特征、时空变化特征以及主题特征,挖掘得出了地震灾情的统计特征和分布规律。基于第三章获取的震后72小时微博数据进行了描述性挖掘,对于总体数据开展了时间分析和空间分析,对于位置微博数据基于热力图进行了时空特征变化的分析,并应用K-means方法做了主题聚类分析,掌握了不同的灾情主题分布情况和规律,较为全面地挖掘得出了近年来我国破坏性地震社交媒体端灾情数据的统计特征和规律。3.基于社交媒体数据,以机器学习中的人工神经网络算法为基础,建立了烈度快速评估模型,提出了一种数据驱动型的地震烈度快速评估方法。将机器学习中的多分类问题思想和文本挖掘方法引入到地震烈度快速评估中,提出了基于震后社交媒体数据的地震烈度快速评估方法的总体框架和流程。采用2010年至2018年的20次破坏性地震新浪微博数据为样本,构建微博文本数据的特征向量矩阵,建立数据与烈度分区之间的对应关系,将碎片化、半结构化的微博文本数据转化为可以作为分类问题输入的空间向量形式,形成机器学习所需的结构化的数据集,在人工神经网络算法的基础上训练出地震烈度快速评估模型。这一模型经测试集性能测试评估准确率可达81%,经实例分析评估准确率超过67%。本文所提出的这种数据驱动型的地震烈度快速评估方法,从时效性和精度上均可相对较好地满足地震应急救援的实际需求。本文的学术贡献和应用价值主要在于:在大数据时代开辟了地震灾情信息获取的一条新途径,为地震应急中的灾情快速获取与烈度快速评估提供了新的技术思路,提出了一种新的地震烈度快速评估方法,在地震应急救援和政府抗震救灾中将具有重要的应用价值。
其他文献
近年来,随着我国旅游业的发展,满足这一需求的经济型酒店如雨后春笋般应运而生并且获得了较大的发展,但是,随着外来酒店业的进入,以其长期的经营过程中积累的管理方法与经验,
下肢深静脉血栓形成是外科手术后严重的并发症之一。以往外科医师常注意手术操作本身的并发症及对心、肺等重要器官的影响,而忽略手术对血管的损伤、血液淤滞和凝血功能的影响
2009年5月14-15日,“2009高尔夫国际论坛·球场评选”论坛在海南博鳌举办,来自全国各地的250多位专家学者、业界嘉宾及大专院校师生参加了论坛。“高尔夫国际论坛”创办的目
目的探索观察胱抑素C、同型半胱氨酸和糖化血红蛋白联合检测在诊治糖尿病早期肾脏损害中的临床意义。方法选择2011年1月-2012年12月治疗的60例糖尿病早期肾脏损害患者作为研
如今我国经济发展迅速,科技越来越发达,基础建设也越来越完善,随之我国城市轨道交通线规划的施工技术也逐渐成熟,为我国一些大型城市的城市轨道交通建设提供了技术支持。我国
开放式教学模式是依托网络教学环境,基于任务引领的学生自主探究、合作竞争式的教学模式。其特征是教学情境开放、教学任务开放、学习方式开放、解题方案开放、评价机制开放
天人合一是儒家乐理极力追求的一种哲学境界,王邦直的《律吕正声》在对律学的研究中,承继中国传统文化,把对律学的研究与崇尚“自然之理”联系起来,这也是王邦直《律吕正声》重要
本文回顾了功能翻译理论的发展及其在旅游资料中的指导意义,然后结合一些实例,以功能翻译理论为依据,从文本功能、审美意识和文化差异三个角度探讨了旅游资料的翻译策略。
对湘钢宽厚板厂加热炉进行了热平衡测试,其热效率为60.09%,可比单耗37.35 kg/t,在国内同类型加热炉能耗比较中处于中上水平。分析了订单化生产对加热炉经济指标造成的影响,湘
采用常规低温高磁感取向硅钢钢种,开展脱碳退火速度工艺试验,研究了不同脱碳退火速度及炉内气氛对脱碳板参数和成品磁性能及表面质量的影响。结果表明,随着工艺速度的提升会导致