论文部分内容阅读
近年来铁路总公司积极推进货物运输改革,努力提高铁路货运服务水平,加强铁路物流化建设,力求扩大铁路运输在货物运输市场中的份额。但是目前铁路货运中最突出的问题是货物运输的时间具有很大的不确定性,大大制约了铁路运输的竞争力。虽然铁路部门制定了铁路货物运到期限,但是货物运输时间仍会受到车流集结、车流改编等运输作业的影响,因此铁路部门需要加强对车流的有效掌控,提升运输组织效率。而准确的车流预测可以实现对车流分布的有效掌控,可以及时避免车流拥堵的发生,保证路网的运输效率。车流预测的基础是车流径路,确定合理的车流径路,对于准确地进行车流预测、高效地进行运输组织具有重要作用。本文以确定合理的车流径路为研究目标,借助铁路运输信息集成平台提供的各业务系统整合的数据,构建车流运行径路获取模型来获取车流运行过程中的真实走行径路,并利用Hadoop平台处理车流运行径路大数据集,对车流经由的每个车站构建针对不同货种的车流运行径路模式和概率后缀树,并在车流预测系统中进行验证。具体工作如下:(1)对反映车流实际走行情况的车流运行径路进行研究,借助铁路运输信息集成平台获取经过整合和共享的铁路业务数据,建立径路节点映射模型、车辆报文匹配模型、径路序列拼接模型来获取完整的车流运行径路。(2)考虑到铁路车流运行径路的数据量会随着时间的累积不断增大,传统数据分析方法不能实现对不断增加的海量数据的有效分析,本文设计大数据分析方法利用Hadoop平台来处理车流运行径路数据,利用Sqoop工具实现传统关系型数据库与分布式文件系统HDFS之间的数据传输,利用MapReduce编程模型高效处理车流运行径路大数据集,利用变阶马尔科夫模型对车流运行径路的径路序列进行处理,建立运行径路模式并构建概率后缀树,用以预测车流运行径路。(3)利用Java编程实现基于运输信息集成平台的车流运行径路获取过程,搭建Hadoop平台进行MapReduce编程开发来处理车流径路大数据,并实现车流运行径路模式提取和概率后缀树的构建,以不同货种、不同径路模式预测车流运行径路,并在车流预测系统中进行验证。