基于文本挖掘的灾害多级联动分析与预测研究

来源 :中国地质大学 | 被引量 : 0次 | 上传用户:guobihuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
气候变化加剧、城市化进程加快,以及人类社会活动的影响,灾害的联动发生日益表现为一种常态。而城市化进程的不断加快,使得灾害系统变得更加复杂。传统的灾害管理和防灾减灾模式面临严峻挑战。因此,基于我国各类灾害的时空分布规律,分析灾害的多级联动模式,预测灾害多级联动发生的概率,已成为防灾减灾中提供应急决策支持的有效方法之一。而依赖国家官方数据获取灾害信息的方式存在数据收集困难、数据滞后等问题。随着互联网和信息技术的迅速发展,网络信息传播更加便捷和高效。网络文本逐渐成为大数据背景下一种重要信息资源,为灾害领域相关研究提供了前所未有的机遇。网络新闻、百度百科等网络文本数据中隐藏着很多有价值的灾害信息,如何基于文本挖掘的方法识别和提取出这些潜在的有价值的灾害信息,并基于此构建灾害多级联动分析模型是需要解决的关键科学问题。本文以国家自然科学基金项目“灾害多级联动模式下城市群综合承灾能力的评价与仿真研究”为依托,以网络文本数据为研究视角,围绕灾害关联关系分析与挖掘这一核心主题,综合运用文本挖掘、机器学习、自然语言处理、贝叶斯网络、复杂网络等方法和技术,在分析我国自然灾害时空特征的基础上,以暴雨灾害为灾害多级联动的研究对象,进一步探索其领域特征和文本识别方法,抽取事件因果关系,构建贝叶斯网络模型,实现对其次生灾害节点的推理与预测,为防灾减灾和断链减灾提供科学的决策支持。主要的研究工作和结论如下:(1)基于网络新闻数据的我国自然灾害时空特征分析。采用信息抽取方法对中国新闻网2008-2017年的灾害报道进行了信息抽取和分析,得到我国主要自然灾害类型,并通过与官方信息的对比验证了网络新闻数据用于灾害研究的合理性和有效性,结果表明我国气象灾害主要分布在每年的4月到9月,高峰期在7月和8月;灾害主要发生在云南、四川、贵州、湖南等地,而这些地区的主要灾害类型为暴雨、洪涝和地质灾害;暴雨和洪涝灾害很有可能存在空间关联性。(2)灾害多级联动新闻文本识别研究。网络新闻涉及到方方面面的信息,需要进一步识别和筛选灾害多级联动相关的文本数据。针对领域敏感性,采用基于标签传播的领域词典构建方法,融合领域主题特征和Word2vec词向量,结合基于集成思想的XGBoost方法,研究灾害多级联动新闻文本的识别问题,实验结果表明本研究提出的方法在准确率和召回率方面相比单独使用Word2vec有了一定的提高。(3)灾害多级联动事理图谱构建与分析。基于单一案例手工构建的灾害链模型不仅费时费力,还容易产生冗余和遗漏。研究从灾害新闻文本中抽取灾害事件因果关系,获取灾害因果知识和经验,并将灾害事件的多级联动模式刻画成一个有向的事理知识库,进而引入复杂网络方法,对灾害多级联动事理知识图谱中的关键节点进行分析,为防灾减灾决策提供科学的参考依据。(4)基于贝叶斯网络的灾害多级联动分析与预测。基于灾害多级联动事理知识图谱,以相关文献中的灾害节点影响因素作为补充,构建一个比较全面的、客观的灾害多级联动贝叶斯网络模型。以暴雨灾害为例,通过构建暴雨-地质和暴雨-洪涝的贝叶斯网络模型,并基于历史案例数据进行参数学习,预测多级联动事件发生的概率和后果的严重程度,据此提出暴雨灾害的断链减灾措施。本文的主要创新点体现在以下三个方面:(1)针对依赖专家知识构建贝叶斯网络的局限性,提出了一种基于事理图谱的贝叶斯网络建模方法,推理预测灾害多级联动。(2)针对特征词领域敏感问题,提出了一种融合领域主题特征和全局文本特征的灾害多级联动文本识别方法。(3)针对当前因果关系抽取方法未考虑文本中的灾害多级联动问题,提出了一种基于因果提示词扩展词典构建的多层灾害因果链抽取方法。
其他文献
苏东坡作为我国古代伟大的文坛领袖,在诗、词、书、画等方面都有着很高的成就,是我国豪放派诗词的代表人物。但是苏东坡的人生却非常坎坷,数次遭贬。约在元丰二年,苏东坡因为乌台诗案被贬黄州,在黄州留下了很多诗词歌赋。其中前后《赤壁赋》就是代表作,但是这两篇作品也体现了不同的感情。本文将对苏东坡前后《赤壁赋》进行解读与探究。
在国民经济水平不断提高、人们物质生活不断丰富并且精神生活需求愈发旺盛的当下,我国旅游服务业迎来了重要发展机遇。不过,传统旅游发展模式存在一定局限性,与日益多元的旅游需求不相适应,基于此,2017年3月,强调资源整合与满足多元需求的全域旅游被写入政府报告中并上升为国家战略,成为推动旅游业转型发展的重要模式。在全域旅游背景下,酒店餐饮企业作为旅游服务业的重要参与者,根据
律师民事责任制度是律师制度中的基本制度之一.在以委托人与律师的关系为中心建立起来的律师制度中,律师民事责任制度直接调整着不断变化的双方关系,对当事人权利的保障、律师职能的体现、法律精神的彰显均有确保功能.建立完善的律师民事责任制度对正逐渐走出法治之路的中国来讲,其意义尤为重要.该文对律师民事责任制度的研讨共分四部分:第一部分是律师民事责任的含义和法律基础.第二部分是律师民事责任制度的比较考察.第三
时代观即对时代内涵、时代特征、时代主题的认识、判断,是最高层次的战略问题,直接决定着一个国家内外政策制定的正确与否。从马克思、恩格斯到毛泽东,是传统的马克思主义时代观发展时期。其中,马克思、恩格斯是奠基人,列宁是继往开来的重要发展者,斯大林肯定和否定方面参半,以毛泽东为核心的第一代中央领导集体,自1940年代到1960年代中期,认为战争与和平两种可能同时并存,但此后直到改革开放前,认为战争与革命仍
学位
TOD(Transit-OrientedDevelopment)主张以“公共交通引导开发”的理念,致力于对城市的土地进行综合合理的开发建设。本文通过TOD模式下城市轨道交通项目政府收益的评价研究,尝试发现问题、并去分析问题,再提出解决问题的相关建议。本论文先分析了当今世界国内外的TOD的研究现状,以及当今社会城市轨道交通投资的,然后作了以下几个方面的分析和研究:1、
目的:探讨基于CT肠道成像(CTE)利用机器学习方法提取的影像特征在评估活动期溃疡性结肠炎(UC)病变程度中的价值。方法:将2017年9月-2020年9月在本院首诊为UC的157例患者患者纳入研究。根据Mayo临床评分方法,将所有患者分为轻度组(3~5分)40例、中度组(6~10分)52例、重度组(11~12分)65例。所有患者行肠镜及CTE检查。基于CTE图像记录
中国特色法治反腐,就是在中国特色社会主义理论指导下,党带领全国人民,在治理腐败、实现政治清明目标的过程中,摒弃“人治”,实施“法治”,反腐败法治化的基本路径或方式。纵观人类历史,反对腐败制约权力滥用,从总体上看,不外乎两条基本路径:人治反腐和法治反腐。历史和当代国际社会反腐败的实践证明,法治反腐已超越人治反腐成为当代社会反腐败的基本方式。中国特色法治反腐,立足国情,借鉴国际社会法治反腐经验,体现了
学位
北魏文人群体北魏史,严格说始于拓跋珪登国元年(386)。这一年正月,拓跋珪即代王位,作《即位告祭天地祝文》,改元登国。四月,改称魏王,徙居盛乐。北魏孝武帝(出帝)元脩永熙三年(534),北魏分裂为东魏、西魏。东魏都邺城,西魏都长安。北魏历史前后一百四十九年。
生物土壤结皮是干旱沙区地表景观的重要组成部分,对维持荒漠生态系统稳定具有重要意义。微生物是生物土壤结皮的重要组分,在维持生物土壤结皮结构和功能、促进生态系统物质循环等方面发挥着重要作用。我国北方沙区面积大,自然条件复杂多样,生物土壤结皮分布广泛,类型多样,形成了特色鲜明的生态梯度。本文采用扩增子测序和宏基因组测序技术,分析了我国北方3个典型沙区(毛乌素沙地、共和盆地
随着现代科技的快速发展,社会各个领域都在广泛地运用大数据,税务机关面临着涉税数量增加、税源更加隐蔽等问题。但同时,税务机关可以利用大数据等现代化技术手段,对税收数据进行筛选、分析,防控税收风险和减少税款流失。基于此,本文将大数据与税收风险管理有机结合在一起,首先阐述了研究的背景和意义,确定本文的研究方法和内容,并在梳理国内外文献和进行评述的基础上,从大数据、税收风险等概念的界定入手,论述了信息不对