论文部分内容阅读
随着全球航空维修行业(Maintenance,Repair&Operations,MRO)市场份额不断增加,我国民用航空维修产业充分发挥技术优势,依托大数据研究民用飞机维修方案,寻求更加合理的、增强航空器性能的、减少维修成本的方案。以知识图谱为代表的处理关联数据的大数据应用技术是更好解决飞机维修方案的路径之一。但在飞机维修领域,知识图谱研究工作较为缺乏,缺少相关数据集。因此,本文以国内大型航空公司的飞机维修日志文本信息为基础,分析实体命名和关系抽取经典算法并进行优化改进,得到了飞机维修领域知识图谱;为解决抽取出来的飞机维修领域知识图谱完整度较低,且具有较大稀疏度的问题,运用知识推理算法对其进行补全。本文主要工作如下:1.针对本领域实体边界模糊、实体长度较长、实体数量多且复杂以及样本量小等问题,本文基于标注维修数据,深入研究对抗训练和现有实体命名BERTBi LSTM-CRF算法。本文第三章对BERT嵌入层自带Tokenizier分词进行改进,再利用对抗训练在嵌入层加入扰动样本,最后再进入Bi LSTM-CRF,最终实现飞机维修领域实体识别;利用句子级和词语级双层Bi LSTM-Att算法开展了关系抽取任务的相关研究,并生成了飞机维修领域知识图谱。相关实验表明,改进的方法能够在飞机维修领域数据集上取得良好的效果。2.为了解决强化学习的奖励函数需要手动调整才能获得良好效果,以及游走路径为找到可靠的证据路径需要消耗大量计算资源,本文第四章引入生成式对抗模仿学习,使用模仿学习的概念,结合生成对抗网络模仿从知识图谱中自动采样的示例样本来自适应地学习推理策略和奖励函数,而无需手动进行奖励工程,这样就利于生成式对抗模仿学习解决了人工调整奖励函数的问题,以及无需专家经验也无需耗费大量计算资源,仍然能很好地自适应学习推理策略。相关实验表明,本文的知识推理方法在补全飞机维修知识图谱方面取得良好效果。3.在实际应用方面,本文运用相关算法,从大量非结构化文本数据中抽取了飞机维修领域实体和关系,成了飞机维修领域知识图谱。并基于图谱数据,结合本文提出的知识图谱推理算法,开展了飞机维修领域自适应维修方案、维修手册应用指南、高故障率机载传感器的鉴别与指导、机载传感器潜在耦合故障发现等应用。实践表明,相关应用能够在日常维修过程中发挥积极的作用。