论文部分内容阅读
本文为了进一步满足处理海量GPS数据的精度与速率的要求,主要完成了地图匹配算法在精度上的改进和改进后地图匹配算法在MapReduce并行计算框架上的并行化设计与实现。针对海量GPS数据分析的精度问题,主要是分析一些现有地图匹配算法在现实生活中运用场景的优缺点,结合部分地图匹配算法的优点与本人的一些研究成果,提出一种结合部分交通规则的地图匹配算法。该算法主要借用隐马尔可夫模型(Hidden Markov Model,HMM)对地图匹配过程进行建模,充分考虑了前后GPS信息和电子地图中的路网拓扑关系,提高了地图匹配算法的精度,以进一步满足海量GPS数据的挖掘需求。本文完成了包括噪声数据过滤、冗余数据去除、缺失数据补充和漂移数据修正的GPS数据预处理过程,改进的地图匹配算法的设计与实现以及与之对比的一种拓扑信息的地图匹配算法的设计与实现等工作,通过与基于拓扑信息的地图匹配算法在精度和处理速度上进行对比,得出在处理文章中所给的采样频率的GPS数据上,改进后的地图匹配算法匹配结果的精度更高。针对海量GPS数据处理速度的问题,本文主要对地图匹配算法的并行化进行了研究。该问题的研究意义在于更快的处理大量时空数据的地图匹配问题,提高处理的速率,节约时间成本。本文完成了包括噪声数据去除并行化、冗余数据去除并行化、缺失数据补充并行化和漂移数据修正并行化的GPS数据预处理过程的并行化,改进的地图匹配算法并行化的设计与实现以及与之对比的改进的地图匹配算法单机版本的设计与实现等工作,通过对比地图匹配算法的单机版本和并行化版本的结果和执行时间,得出了基于MapReduce计算框架设计的地图匹配算法设计的正确性,同时也得出了该并行版本所耗时间最短,而且在数据量逐渐增大时,这种实现方法相比其他两种在速率上的优势更大,进而得出这种并行化算法在处理大量数据的优越性。