论文部分内容阅读
民航突发事件应急管理的核心是对民航突发事件进行快速与有效的决策,使得决策者适时地、创造性地化解危机。随着民航业与互联网信息技术的迅速发展,对新常态下民航突发事件应急管理的能力提出了更高的标准与需求。知识图谱是一种可以有效的实现领域知识的表达、检索与推理的新型知识表示工具。研究民航突发事件知识图谱构建的关键问题对于进一步提升民航突发事件应急管理能力具有重要意义。民航突发事件知识图谱构建的核心内容包括实体识别和关系抽取等,其中民航突发事件实体识别和关系抽取是构建民航突发事件知识图谱的关键任务。因此,本文以航空安全事故调查跟踪报告、微博、微信和抖音等与民航突发事件相关的文本信息为基础,深入研究民航突发事件实体识别和关系抽取的问题。针对民航突发事件实体自动获取的问题,本文提出了一种将双向长短期记忆网络(BiLSTM)与条件随机场(CRF)结合的民航突发事件实体识别方法,该方法首先利用领域词典对民航突发事件实体进行自动标注,并将已标注的数据转化为分布式字符向量,其次采用BiLSTM模型获取序列文本的上下文特征,最后通过CRF模型获得序列标注结果。实验结果表明,与传统的CRF方法比较该方法的F值提高了约6.6%,有效解决了传统方法在识别民航突发事件文本信息中包含复合实体或混合实体方面效率低且大量使用人工定义特征模板的问题。针对民航突发事件关系抽取准确率低的问题,本文提出了一种基于多层注意力机制与双层Bi LSTM结合的民航突发事件关系抽取模型Datt-BiLSTMs。首先将文本信息的每个词语向量化并融合词性、实体位置等特征向量,将所有特征向量进行拼接后输入双层BiLSTM模型中,捕获更高级的上下文表示;然后引入词语级和句子级注意力机制来获取每个词语的重要性,同时有效地利用语义信息,减少噪声的影响;最后通过softmax分类输出关系抽取结果。在民航突发事件关系抽取的数据集表明,该方法F值为79.3%,较传统神经网络模型方法有进一步提高,为民航突发事件知识图谱的自动构建提供了更好的方法支撑。