论文部分内容阅读
高速列车速度快,传感器采集的频率高,数据更新速度快,因此采集到的数据量大,对故障诊断系统的数据存储、管理和分析能力提出了巨大的挑战.针对目前的高速列车故障诊断系统难以有效处理海量数据的情况,设计了一种基于大数据的高速列车海量数据故障分析系统.采用当前流行的大数据处理工具构建了能够处理海量高铁数据的大数据基础支撑平台,能够高效的存储、管理高铁的海量传感器数据.并且针对传统故障诊断方法在海量数据的时候建模速度很慢甚至无法建模求解的问题,在大数据基础支撑平台的基础上研究了能够对海量高铁数据进行建模的分布式算法,提高了海量高铁数据故障建模的效率.最后通过Speedup、Sizeup、Scaleup这3个性能指标对系统集成的PCA故障建模算法(以分布式PCA故障建模算法为例)的效率进行验证,验证结果表明系统中的分布式算法在3个性能指标上都有良好的表现,能够有效进行大数据量的故障分析,为高速列车的故障诊断提供可靠的保证.