论文部分内容阅读
非常规突发事件有别于其他对公共安全带来危害的事件,主要具有四种特点:突发性、难以预测性、不可控性、演化多变性等,因此非常规突发事件的发生往往会对人员和社会财产带来巨大的损失,严重影响人们的生活秩序,也会给公共安全带了一定的危害。危险品是非常规突发事件的一个重要来源,危险品存储、运输等各环节经常因知识缺乏、处置不善而酿成事故甚至灾难,若能有一种快速获取相关知识的工具,将对管理处置培训周期大大降低,很大程度上较少事故发生的概率。本文针对这一现实需求,提出利用知识图谱技术构建危险品领域的专用知识图谱,经调研目前尚未发现有中文的危险品知识图谱,因此本文拟以此为目标,重点梳理了危险品知识图谱的构建框架,采用了两大类方法构建知识图谱,通过人工构建的图谱与各方法结果进行比较,结果发现,两类方法在实体抽取中均表现出较好的效果,但两类方法在相应最佳参数下基于深度神经网络的词向量相似在实体关系抽取上表现优异。验证了本文提出的构建方法是有效可行的,并通过比较分析提出来效果更好的方法及对应的模型参数。具体包括以下工作:(1)建立了危险品知识图谱构建技术框架危险品物质性质十分复杂,物质间关系繁多,构建过程中用到多种相关的技术,本文对涉及的技术进行了整体的框架描述,满足整个危险品知识图谱的构建。(2)建立了两大类危险品实体关系抽取模型在实体抽取的基础上,重点研究了实体关系抽取。采用了基于共现的实体关系抽取和基于词向量相似的实体关系抽取。建立了基于共现情况下八种共现划分实体关系抽取模型,同时运用深度神经网络对危险品语料进行训练获得词向量表示,建立了基于词向量相似实体关系抽取模型。(3)危险品知识图谱构建方法比较评估针对研究中的两种危险品实体关系抽取模型,基于词共现抽取模型和词向量相似抽取模型。采用了基于以专家知识判断实体关系抽取为标准的矩阵形式模型评估。将它们构建的知识图谱与专家构建的图谱从共现不同划分、不同阈值、不同对比指标三个维度进行详细的对比分析,评估两类方法效果,确定最佳构建方法及模型参数。