论文部分内容阅读
我国的地震活动不仅频率高、强度大而且分布十分广泛,由其造成的社会经济损失居于自然灾害首位,因此如何有效的减轻和降低地震造成的社会经济损失,成为地震应急领域探讨和研究工作的重点。与发达国家相比,我国地震应急信息的管理主要存在着以下三个方面的差异:(1)信息采集手段较单一;(2)信息传送不够及时、准确,甚至存在死角、失真现象;(3)信息获取速度较慢,产出与存储源多样。因此针对目前我国地震应急基础信息多渠道上传模式以及震后大量灾情等信息的纷纭复杂,基于信息检索在智能化领域的快速发展,本文收集了四川省2013年4月20日芦山7.0级地震、2014年11月22日康定6.3级地震、2017年8月8日九寨沟7.0级地震、2017年9月30日广元青川5.4级地震的四次地震应急资料,就我国的地震应急工作以及应急信息的检索分类做了以下分析与研究:(1)详细介绍了我国地震应急的工作体系、工作内容;分析了地震应急信息多渠道源的特点,按照信息产出的空间属性,将信息源划分为地震发生现场信息源和非现场信息源,结合应急信息的服务对象,以地震系统工作内部和工作外部环境来对信息的渠道和用户进行细分。(2)基于近年来专家学者在地震应急信息分类方面的研究成果,以信息服务的高效便捷为目的,按照地震事件的震前、震时、震后时间主线,将地震应急信息分为震前基础背景信息(震区自然灾害以及社会基础背景信息)、地震震情灾情信息(地震本身属性以及其造成的直接、间接损失信息)、震后应急救援信息(应急救援动态行动信息)三类。(3)通过对文本信息检索方法的学习,考虑到目前地震应急信息手动归类存在的现实困难,基于地震应急信息分类的需求,构建了一种高效便捷的信息分类处理方法。对比分析了信息检索的三种基本检索模型,采用TF-IDF为权值公式,选取传统的布尔模型(关键词分类法),展开了地震应急信息自动分类的研究。(4)采用“关键词分类法”,对多渠道地震应急信息的自动分类进行研究。主要工作有:1)信息的分类。对收集的应急资料,按建立的分类标准进行分类;2)文本的结构化处理。首先将各类信息集成于一个文本文档(.txt文档),再按动词、名词进行分词、词频统计处理;3)筛选关键词,得到关键词库。选取词频统计top20的词、计算每个词对应的TF-IDF值,按规则手动选取得到关键词库;4)在计算机语言的支持下,按词频所占比例将关键词库划分五个区间,采用布尔模型最大匹配的方式,设计地震应急信息自动分类的实现方法。信息经过结构化规范处理后,选取的震前基础背景信息关键词主要有人口、降水量、GDP等;地震震情灾情信息关键词主要有灾区、震情、余震等;震后应急救援信息关键词主要有绑带、搜救、医疗器材等。由筛选结果来看,各类信息的关键词之间具有一定的辨识度,处理后的信息使得传输的条理性更强,更便于进一步的信息加工与处理。实现地震应急信息的自动分类,能大大的提高信息的利用率,在一定程度上缩短应急信息加工处理与服务的时间,快速高效地为应急指挥提供信息服务。