论文部分内容阅读
大数据时代的到来为城市智能交通水平的提升提供了更大的潜能。如何应对城市交通大数据快速分析的要求,深入挖掘其内涵规律,建立历史经验知识库,实现城市交通大数据内在价值,成为交通智能化发展的迫切需求。当前浮动车作为智能交通分析主流数据,仍无法满足城市交通精细化时空分析粒度与对整个城市路网全息感知的要求,如何解决这一矛盾成为交通大数据分析的核心问题。 本文将基于稀疏浮动车数据交通分析分为两个基础问题:一是在数据处理方面,如何对原始的数据进行高效的预处理与地图匹配从而提高原始数据的质量;二是在数据分析方面,如何针对数据的稀疏性进行有效的插值从而充分挖掘历史数据的内涵价值。本文主要研究工作与创新点如下: (1)针对浮动车数据稀疏,数据异常,数据时序性缺失问题,提出一种非参数粒子滤波算法Particle_S_A_F,将速度、角度加入粒子滤波算法构建,解决了浮动车数据常见的“漂移”与“回弹”处理。与Mean、Median、Kalman、Particle相比,Particle_S_A_F的数据清洗效果要明显优于对比算法。 (2)针对HMM“标注偏移”问题,提出一种适用于稀疏浮动车数据地图匹配算法ST-CRF,以GPS空间定位精度、浮动车空间可达性、时间可达性、浮动车相邻GPS数据点的中心距离临近性,以及行驶方向的一致性建模,基于北京市浮动车数据与上海市高频浮动车数据,在不同采样间隔对四种地图匹配算法(P-L、ST-Matching、IVMM、ST-CRF)进行了测试,证明了ST-CRF算法的有效性以及鲁棒性。 (3)针对城市交通状态估计的实际需求,提出HS主曲线算法。结合稀疏浮动车数据分析的具体任务,将HS主曲线模型用于到城市路网交叉口通行耗时估计与城市路网路段平均行程时间的插值,并同其他插值算法(Mean、Median)进行对比,验证了HS主曲线的有效性与鲁棒性。基于Spearman秩相关分析,测试了HS主曲线的时空依赖性。本文还将HS主曲线插值结果用于具体城市交通分析,论证了本研究的应用价值。 (4)针对城市交通时序数据预测,提出一个普适性层叠泛化集成学习开放框架Stacking,并基于error-ambiguity decomposition证明了有效性。为验证层叠泛化模型的效果,采用六种常用的时序预测算法(MEAN、LLSR、ARMA、ANN、RBFNN、SVM)与四种常见的模型混合策略(EW,OW,MV,ME)对交叉口通行耗时集成建模,验证了Stacking的优越性。