论文部分内容阅读
地震是威胁人类生命财产安全的重大自然灾害之一,地震应急是在震后应急期内人们所采取的减少人员伤亡及经济损失的紧急应对措施。决策者如何根据地震应急知识快速做出有效决策,将民众的生命财产损失降至最低是地震应急的关键。地震应急的知识发现模型的构建是地震应急知识领域的核心科学问题之一,如何在种类繁多、内容繁杂的数据中,研究减少先验知识的依赖和支持下的地震应急的知识发现至关重要。目前地震应急知识领域主要聚焦于知识获取与知识处理,涉及数据多为文本数据,仅关注领域内部分专业点分析,缺少对整个地震应急领域的梳理分析且可视化表达效果较差。已有知识发现方法中统计学习的方法主要依靠有限的历史案例知识,而基于机器学习与神经计算的方法则需要专家先验知识作为支撑,可视化分析方法更多的是辅助知识表现,直接作为知识发现的手段则略显单一。因此,本文提出一种基于文本大数据的地震应急的知识发现模型。首先收集与地震应急相关的学术文献数据集和社交媒体数据集,然后利用CiteSpace分析工具及形式概念分析方法提取高频关键词及其关联关系,以词频联系作为它们之间关系的强度,构建地震应急知识的复杂网络,以对网络进行社区划分研究,并通过搜索指数分析,得到公众关注的地震应急知识的时空分布特征,最终实现地震应急的知识发现与验证。本文研究内容主要包括以下两方面:(1)提出了一种基于文本大数据的地震应急的知识发现模型。首先介绍文本大数据的获取来源,获取了中英文学术文献数据集与社交媒体数据集作为模型实验数据;其次以文本处理的关键词提取技术提取不同数据集关键词,依靠夹角余弦距离和形式概念分析建立对应数据集关键词的关联关系;之后在复杂网络理论的支持下构建关键词复杂网络,并应用最适合该网络的Louvain算法进行社区划分,利用模块度Q提取出可靠社区进行对应知识发现分析;最后将部分关键词导入百度指数与谷歌指数,分析公众对应地震应急知识的关注特征,完成整个地震应急知识发现模型的构建与应用。(2)根据模型分析了地震应急知识发现结果。分别对学术文献、社交媒体、搜索指数知识发现结果进行对应分析及交叉对比,理清了不同数据来源下的地震应急知识组织,发现了知识的隐含关联关系,找出了知识跨学科专业的组合,综合为地震应急决策者提供知识决策支持。