基于文本大数据的地震应急的知识发现

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:afdwer213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地震是威胁人类生命财产安全的重大自然灾害之一,地震应急是在震后应急期内人们所采取的减少人员伤亡及经济损失的紧急应对措施。决策者如何根据地震应急知识快速做出有效决策,将民众的生命财产损失降至最低是地震应急的关键。地震应急的知识发现模型的构建是地震应急知识领域的核心科学问题之一,如何在种类繁多、内容繁杂的数据中,研究减少先验知识的依赖和支持下的地震应急的知识发现至关重要。目前地震应急知识领域主要聚焦于知识获取与知识处理,涉及数据多为文本数据,仅关注领域内部分专业点分析,缺少对整个地震应急领域的梳理分析且可视化表达效果较差。已有知识发现方法中统计学习的方法主要依靠有限的历史案例知识,而基于机器学习与神经计算的方法则需要专家先验知识作为支撑,可视化分析方法更多的是辅助知识表现,直接作为知识发现的手段则略显单一。因此,本文提出一种基于文本大数据的地震应急的知识发现模型。首先收集与地震应急相关的学术文献数据集和社交媒体数据集,然后利用CiteSpace分析工具及形式概念分析方法提取高频关键词及其关联关系,以词频联系作为它们之间关系的强度,构建地震应急知识的复杂网络,以对网络进行社区划分研究,并通过搜索指数分析,得到公众关注的地震应急知识的时空分布特征,最终实现地震应急的知识发现与验证。本文研究内容主要包括以下两方面:(1)提出了一种基于文本大数据的地震应急的知识发现模型。首先介绍文本大数据的获取来源,获取了中英文学术文献数据集与社交媒体数据集作为模型实验数据;其次以文本处理的关键词提取技术提取不同数据集关键词,依靠夹角余弦距离和形式概念分析建立对应数据集关键词的关联关系;之后在复杂网络理论的支持下构建关键词复杂网络,并应用最适合该网络的Louvain算法进行社区划分,利用模块度Q提取出可靠社区进行对应知识发现分析;最后将部分关键词导入百度指数与谷歌指数,分析公众对应地震应急知识的关注特征,完成整个地震应急知识发现模型的构建与应用。(2)根据模型分析了地震应急知识发现结果。分别对学术文献、社交媒体、搜索指数知识发现结果进行对应分析及交叉对比,理清了不同数据来源下的地震应急知识组织,发现了知识的隐含关联关系,找出了知识跨学科专业的组合,综合为地震应急决策者提供知识决策支持。
其他文献
癌症、环境污染、人口老龄化和食品安全等严重威胁人类健康,其中癌症是医学领域尚未攻克的难题。迄今为止,包括手术、化疗、放疗、光疗、基因治疗、免疫治疗、靶向治疗、和微
本文研究了条件(SP)的性质,给出了条件(SP)关于任意系,循环S-系,Rees商系的同调分类问题.本篇论文分为两章.第一章定义了条件(SP),研究了条件(SP)与强平坦,条件(P),条件(E)以
带浮力块立管这样的变截面结构在复杂海流作用下的受力及振动响应非常复杂,而相关研究较少。这使得带浮力块的海洋立管设计过于保守,浪费极大。因此,本文应用基于迭代的高精
量子通信,具有极高的安全性,是未来通信网络的关键要素。目前,基于宏观光学器件构建的光量子系统无法进行有效扩展,而光量子集成芯片在操纵量子系统的尺度和复杂度等方面展现
随着国内海上风能资源开发力度加大,风电场规划和建设工作相继展开,筒型基础在风电场中应用可大大降低建设成本。四筒基础在抵抗超大水平荷载方面更具有优势,四筒基础沉贯安
本论文包含以下四部分的内容:1.介绍了手性分离的背景及意义,手性药物的获取方法;重点介绍了高效液相色谱手性固定相对手性化合物的拆分;简介了膜分离技术,尤其是手性高分子
水合盐相变储能材料(Phase change material,PCM)具有储热密度高、导热系数大、相变温度范围适中、低成本且容易获取等优点,可用于调节能量供给与需求在时间和空间上的不平衡,
盐岩由于其损伤恢复、蠕变性能较好以及低渗透率等优点,是理想的地下储能介质。由于盐岩溶腔蠕变收缩并沿上覆岩层传递造成的盐岩储气库上方地表沉降会对环境和经济造成严重
太阳活动区是太阳爆发性活动如太阳耀斑、暗条爆发、日冕物质抛射等现象发生的主要区域,这些爆发性活动是影响日地空间环境,造成灾害性空间天气的主要因素。磁浮现——即太阳
1,8-萘啶衍生物具有荧光量子产率高、摩尔消光系数大的优点和优秀的光化学、光物理性质以及良好的配位能力。在引入BF2配位形成1,8-萘啶氟硼类化合物之后,其优秀的荧光性能可