论文部分内容阅读
有价值的应急案例信息对应急决策支持系统中新危机情形下的应急预案的构建具有很重要的借鉴意义。而Web上的信息正经历从无序到有序,从非结构化和半结构化,到结构化,再到具有语义结构的变化轨迹。为实现从过渡时期混乱的Web页面格式中提取、集成信息,利用语义网和本体的对知识的表示,搜索程序可以进行基于概念的精确搜索而不是简单而模糊的关键词匹配方法。这样通过精确搜索可以整合应急决策所需的案例库的资源。通过对案例的分析和匹配,供应急决策系统中的决策者和领域专家制定相应的决策机制。本文在研究各种信息抽取模式的基础上,提出基于本体知识表示的应急案例的信息抽取的方法。在本方法中,我们先利用Ontology对概念、关系、关键字等定义并表示应急案例领域知识。并且根据本体表示,生成相应词表,用于规则定义的匹配字典。由于案例具有一定的复杂性,把案例分为基本事件和完整事件。对事件分别定义用于信息抽取的规则。然后对句子进行语法、词法分析预处理,分析后的结果与先前生成的抽取规则进行匹配。匹配又分两步,先是对定义的基本事件进行匹配,如果符合基本事件的包含要素,将标注并抽取结果存入案例库。并继续按照完整事件模式继续匹配,抽取完成后更新案例库。利用本文描述的方法并结合应急案例为应用,实现了信息抽取在本体知识描述下的案例抽取系统。实现中利用了JAPE语言完成对信息抽取规则的定义,并调用中科院计算所开源软件ICTCLAS完成对中文资源的词法、语法分析。本文中描述了信息抽取系统的系统框架、实现结构、流程图。开发平台为Eclipse+JAVA,并用Protégé定义了应急事件的本体描述,实现了基于应急案例本体的信息抽取。最后通过实验结果表明,以本体定义得出的抽取规则对信息抽取是可行,而且有价值的。并且分析了有待继续深入研究的问题和进一步拓展的方向。