基于应急案例本体的信息抽取的研究及应用

被引量 : 8次 | 上传用户:luckkycaroll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有价值的应急案例信息对应急决策支持系统中新危机情形下的应急预案的构建具有很重要的借鉴意义。而Web上的信息正经历从无序到有序,从非结构化和半结构化,到结构化,再到具有语义结构的变化轨迹。为实现从过渡时期混乱的Web页面格式中提取、集成信息,利用语义网和本体的对知识的表示,搜索程序可以进行基于概念的精确搜索而不是简单而模糊的关键词匹配方法。这样通过精确搜索可以整合应急决策所需的案例库的资源。通过对案例的分析和匹配,供应急决策系统中的决策者和领域专家制定相应的决策机制。本文在研究各种信息抽取模式的基础上,提出基于本体知识表示的应急案例的信息抽取的方法。在本方法中,我们先利用Ontology对概念、关系、关键字等定义并表示应急案例领域知识。并且根据本体表示,生成相应词表,用于规则定义的匹配字典。由于案例具有一定的复杂性,把案例分为基本事件和完整事件。对事件分别定义用于信息抽取的规则。然后对句子进行语法、词法分析预处理,分析后的结果与先前生成的抽取规则进行匹配。匹配又分两步,先是对定义的基本事件进行匹配,如果符合基本事件的包含要素,将标注并抽取结果存入案例库。并继续按照完整事件模式继续匹配,抽取完成后更新案例库。利用本文描述的方法并结合应急案例为应用,实现了信息抽取在本体知识描述下的案例抽取系统。实现中利用了JAPE语言完成对信息抽取规则的定义,并调用中科院计算所开源软件ICTCLAS完成对中文资源的词法、语法分析。本文中描述了信息抽取系统的系统框架、实现结构、流程图。开发平台为Eclipse+JAVA,并用Protégé定义了应急事件的本体描述,实现了基于应急案例本体的信息抽取。最后通过实验结果表明,以本体定义得出的抽取规则对信息抽取是可行,而且有价值的。并且分析了有待继续深入研究的问题和进一步拓展的方向。
其他文献
<正> (一)春季土元恢复活动时,筛出旧土换新土。新土配方是:锯末60%,灶灰20%,鹧鸪粪20%,掺匀堆沤,粉碎成疏松颗粒状。
期刊
知识产权文化包括观念形态和制度形态两个层面的意义。近代知识产权制度诞生的历史告诉我们,知识产权法律制度的生根发芽必须有其适宜的文化土壤。当代中国知识产权文化的构
秸秆覆盖技术是当前世界旱农地区广泛推广的一项耕作技术。在我国,秸秆覆盖在传统农业中早有利用,近些年来在北方旱农地区迅速发展,成为少耕、免耕法的一个重要组成部分。作
泥页岩井壁失稳问题一直是钻井工程中一个复杂且带有世界性的难题,针对这一问题的研究工作从20世纪40年代起就开始进行,至20世纪90年代,进入了泥页岩井壁稳定的多场耦合研究
国外有人把道教称为“汉学中的汉学”形成了日本、法国、美国三个主要的研究中心,国内对道教的研究相对于其他学科起步比较晚。在中国的哲学史上,在所有的哲学家中,身后遭遇最离
辛亥革命、国民革命、共产革命是中国革命过程中相互衔接、演进的三个阶段,前一次革命为后一次革命"预留"了空间,后一次革命在前一次革命的基础上推进。正是这三次革命的相互
<正>随着我国"走出去""战略的深化与"一带一路"战略的实施,海外电站项目发展迅猛。据统计采用EPC模式进行项目建设,已成为当下海外火电站建设最主要的业务模式。该模式下设计
本文认为,保理的本质是以债权转让为基础的贸易融资,文章围绕保理的服务内容和法律基础这两条主线,从不同角度论证了保理在我国的法律机制和存在的风险,其具体包括各国立法的
GPS技术作为近年来新兴的高精度、高技术含量、高效率、低成本的导航定位技术,其高精度工程测量的突出能力越来越广泛地应用在对高层建筑的变形监测上。本文主要根据高层建筑
本文从CRM产生与发展的基础上,研究了智能化客户关系管理体系的内涵和管理思想,分析了智能化客户关系管理体系的类型和结构,辨析了CRM在以往行业应用中高失败率的原因,最后讨