论文部分内容阅读
随着我国高速铁路的不断发展,高质量的动车组需求量也在不断增加,为了采用更加先进的手段保障动车组的安全运行,分析动车组的全生命周期数据成为了重要的手段之一。然而,以目前的情况而言,动车组全生命周期数据分布于各个单位的多个业务系统之中,存在数据结构不同、模式不统一、标准不一致等诸多问题,因此本论文针对我国高速铁路动车组全生命周期多源异构数据难以进行统一管理的现状,研究如何将数据融合技术与动车组全生命周期数据管理需求相结合,将分布于不同业务系统中的数据转化为格式统一、准确、面向部件的数据,从而有利于于动车组全生命周期数据的集成管理。本论文主要工作包括以下几点:(1)详细分析动车组全生命周期多源异构数据的存储现状,概括出了对其进行数据融合时需要解决的问题,并采用数据抽取和数据清洗技术,对动车组全生命周期多源异构数据进行预处理,使之成为结构统一,便于数据融合的数据;(2)在分析了数据融合的相关算法、本体论和数据抽取及清洗等理论技术的基础上,提出了一种动车组全生命周期多源异构数据融合体系,针对其中两项关键技术——模式匹配和数据冲突解决进行了重点研究,提出了基于动车组本体知识库和组合相似度的模式匹配方法与基于马尔可夫逻辑网络和组合规则的数据冲突解决方法,并使用实际的动车组全生命周期数据对其进行了验证。实验表明,上述两种方法能够有效的解决动车组全生命周期数据融合过程中的模式匹配和数据冲突解决问题;(3)将提出的数据融合体系应用于真实的动车组全生命周期数据管理场景,实现了数据从面向车组级到向面向部件级的转换、融合和统一,并以转向架为例展示部分数据组织视图。