论文部分内容阅读
安全是铁路运输生产的生命线,是推动铁路智能化发展的前提。在蓬勃发展的大数据和人工智能等技术驱动下,铁路智能化发展已成为当前铁路行业重点推进的方向和目标。高速铁路开通运营已超过十年,正从大规模建设向以全面安全运营维护为主的阶段转换。高速铁路的规模和体量快速扩充,业务信息系统变得愈加复杂,各种安全问题呈多元化、复杂化趋势演变。随着高铁各项设备服役年限的增长,基础设施逐步进入维修周期,动车组大量实施高级修使得高速铁路安全保障和运营维护压力日益增大。近年来,高速铁路的智能化发展非常重视其安全保障能力的建设,逐渐搭建了综合检测车、工务、电务、供电等多个安全监测检测系统,积累了海量的结构化、半结构化及非结构化监测数据。各业务部门基于监测检测数据相继开展了安全设备相关的数据分析,尽管依靠传统基于数据驱动的知识工程与专家系统解决了诸多关键问题,但其应用限制于规则明确、边界清晰、封闭性的应用场景,强依赖于专家经验,难以应对大数据时代开放应用到规模化应用的需求。当前针对非结构化复杂数据的处理能力欠缺,制约了智能高铁安全领域的知识沉淀、应用和共享。知识图谱技术凭借语义丰富、质量精良与结构友好等技术优势在各垂直领域纷纷布局应用,其富含实体、概念、属性和关系的三元组语义知识能够将多模态复杂数据表达成更接近人类认知世界的形式,这给智能高铁朝向更加安全、可靠的发展目标提供了新的解决思路。因此,本文基于当前智能高铁安全运营现状及存在问题,借助知识图谱技术优势,以智能高铁安全领域实际业务需求为导向,以铁路安全风险、安全隐患、事故故障等安全数据为驱动,借鉴知识图谱在金融、医疗、电商等垂直领域落地应用经验,深入开展面向智能高铁安全保障的知识图谱智能化服务应用研究。本文主要工作和贡献如下:(1)提出了面向智能高铁安全保障的知识图谱构建及应用方法,设计了面向智能高铁安全保障的知识图谱顶层架构。通过开展面向铁路安全保障的知识抽取、知识可视化等关键技术研究,提出了面向铁路安全领域知识图谱构建与应用的方法和算法链,为构建铁路全域知识图谱提供了理论和技术支持。(2)提出了面向智能高铁安全保障的安全“知识图谱+事件图谱”双谱融合方法。以安全领域实体图谱为基础,基于安全数据自身较强的动态变化特征,构建了一种揭示安全事件间演变规律和逻辑的安全事件图谱。通过铁路安全事件图谱聚焦安全事件的因果、顺承和时序关系,开展事故故障演变规律、模式及脉络分析,精准切合面向智能高铁安全保障的智能化服务应用,为有效预防和避免安全事件发生提供了决策辅助作用。(3)提出了基于ELMO-Bi-LSTM+CRF的铁路安全实体识别模型。通过ELMO模型进行语料数据向量化处理,并将预处理后的结果输入到Bi-LSTM模型。同时,利用CRF条件随机场进行数据样本的全局特征学习。针对铁路安全数据对上下文信息具有强依赖性特征,该实体抽取方法弥补了字向量特异性缺失问题,实现了安全事故故障自身特征的提取,提高了铁路安全领域复杂多词义识别水平。并以某路局电务领域的安全事故故障数据进行实验,其准确率P、召回率C和F-Score均在80%以上,验证了该方法的有效性。(4)提出融合Transformer多头自注意力机制的实体关系抽取方法。在实体关系抽取任务上引入注意力机制(Attention)对目标样本数据进行倾向性特征标注,以突出训练集语料中的关键语义信息特征,并对其充分理解识别。该方法通过注意力机制特征筛选,减少了上下文特征中存在的无关信息,实现铁路安全事故故障样本实体关系的准确识别。(5)提出了基于叠层CNN-BiGRU-CRF组合模型的故障事件因果关系抽取方法。将铁路安全因果关系按显式和隐式进行抽取任务划分,通过利用CNN卷积神经网络和Bi-LSTM双向门控循环单元提取训练样本数据的全局及局部特征,利用CRF随机向量场模型完成序列标注任务。通过某路局电务故障数据进行模型验证,验证了方法的有效性。