论文部分内容阅读
随着我国高速列车的进一步提速和铁路信息系统的不断完善,如今已经具备采集更多的列车运行信息的条件。目前,运行的高速铁路列车上通过部署大量传感器采集了多种数据,列车振动数据就是其中之一。振动数据不仅影响乘客的旅行感受,而且也反映列车部件的运行情况。因此分析处理高铁振动数据对提升列车服务能力,保障列车安全运行具有重要意义。然而传统的高铁振动数据特征提取与分析技术是运行在单个机器上的,这类技术在大量传感器采集的海量振动数据面前,暴露出处理时间长、人工干预多、处理大数据文件能力不足等缺点。云计算技术的出现为解决上述问题提供了思路。MapReduce是一种有效的处理大数据的并行计算框架,是云计算主要模型之一,可以自动分配任务且实现任务均衡。因此利用MapReduce来分析处理高铁振动数据,以应对高铁振动大数据的挑战,提升高铁振动数据处理能力有重要的实际应用价值。本文旨在研究基于MapReduce技术的高铁振动数据预处理与特征提取方法。本文的主要工作包括:作为准备工作完成了Hadoop并行计算实验平台的搭建。在研究振动数据预处理方法的基础上,设计了基于MapReduce的高铁振动数据预处理算法——并行异常数据处理和并行线性趋势项消除。异常数据处理算法用于发现异常点,对异常点进行处理。线性趋势项算法用于消除振动数据中的线性漂移。在预处理结果的基础上,设计和实现了一种基于MapReduce的振动数据通道分离算法。该算法将数据文件中不同通道采集的数据分离到独立的数据文件中,并保持原有数据的时序顺序不变。通道分离完成后,设计和实现了基于MapReduce的高铁振动数据特征提取方法。最后,一方面研究了高铁振动数据不同方向数据分布情况,指出不同部件故障会改变数据分布参数,因而可通过数据分布情况判断列车部件故障的类型。另一方面,使用线性回归分析得到列车速度与高铁振动数据标准差的线性关系,并以此将振动数据分成“可忽略”、“需观察”、“必须处理”三类。这部分工作使得振动数据处理更加具有针对性,进观步提升了处理效率。本文实现的所有基于MapRedece的振动数据分析处理方法都在Hadoop云计算平台上进行了算法并行效率验证实验,实验结果表明,本文设计的算法并行性好,能胜任大量振动数据分析处理任务。