论文部分内容阅读
目前,严重的交通拥堵已成为大中型城市面临的突出问题,阻碍着新型城镇化建设的有序发展。随着城市交通拥堵形势的日益严峻,如何有效地识别区域内的交通状态成为智能交通研究中的一个热点。传统的识别方案基本是依靠感应线圈、摄像头等固定传感器组建交通状态检测网络,此类方法由于存在建设和维护成本高的局限,对整个城市路网达不到完全覆盖。而浮动车数据凭借其采集成本低、覆盖面广的优势逐渐成为最重要的交通数据来源。通过对浮动车轨迹数据的分析可以挖掘出交通流状态信息,从而实现对拥堵道路的准确识别。浮动车的数量在不断地增长,每天产生的定位信息数以亿计。海量的数据为传统的数据处理技术带来了挑战,如何提高系统的吞吐量和性能成为首要解决的问题,分布式计算的出现为大数据处理提供了新的解决方案。本文围绕如何利用出租车GPS数据进行交通拥堵识别的问题展开研究,所完成的主要工作如下:(1)将原始的出租车GPS数据进行预处理,包括数据清洗和地图匹配。介绍了数据的来源和格式,分析了影响GPS数据质量的无效数据和噪声数据的特征及清洗流程。在研究了现有的几种地图匹配算法基础上,采用隐马尔科夫模型(HMM)进行地图匹配,以修正偏离路段的轨迹点位置信息。(2)采用SAGA-FCM算法进行路段拥堵状态的识别。选取路段平均速度作为主要的拥堵识别指标,通过单辆车的平均速度估计出路段的平均速度。针对交通状态的模糊性,采用模糊C均值聚类算法(FCM)进行交通状态的模糊划分。由于FCM算法对初始值敏感且容易陷入局部最优,结合模拟退火遗传算法(SAGA)改进其不足。实验表明,在拥堵状态识别上SAGA-FCM算法比FCM算法准确度更高。(3)设计了一个基于Storm平台的拥堵识别系统。针对大规模GPS数据实时处理的问题,探讨了分布式流处理系统的架构。基于Storm平台,结合消息中间件和空间数据库,对SAGA-FCM拥堵识别算法进行实现。最后采用WebGIS相关技术,将城市路网和拥堵路段在网页上进行可视化展现。