论文部分内容阅读
随着汽车保有量的迅速增加,有限的道路资源和不断增长的汽车保有量之间的供需矛盾越来越尖锐,交通拥堵问题日益严峻。交通控制与诱导是应对城市交通问题的重要手段,实现交通控制与诱导的关键基础之一是实时准确的交通量预测,如何准确高效地估计和预测交通量,一直是智能交通研究领域的重点。传统方法通过固定检测器获取交通量信息,但存在维护成本高、准确性差的缺陷。卡口过车数据能够精确识别每一辆通过卡口的机动车信息,具有对卡口的交通量进行精准获取的能力,且具有易维护,适用性强的特点。同时,通过号牌信息提取机动车在城市多个路段中的出行路径,能够获取不同路段的交通流量时空关系,使交通量预测更精准。利用含有轨迹特征的历史和实时的海量卡口过车数据,对实时交通流状态进行分析评价,对未来短时间内的交通流状况进行预测,能够动态地掌握城市交通实时变化特征,提前预知道路交通运行特点,对道路资源动态优化调度,为提高交通研究水平、交通管理科学决策服务提供有效数据支撑。本文基于海量过车数据的挖掘分析,对交通量进行有效表征。首先本文提出了卡口路径的概念,通过Apriori关联规则,将海量的过车轨迹进行卡口层面上的统计分析,表征路段与卡口间的交通量时空关系,将传统单个断面的交通量预测时间序列问题,转变为多个卡口的时间序列的决策树回归问题,提高交通量预测的科学性和准确性。在交通量时间序列预测的问题上,通过数据重构的方式对信息进行识别和提取,本文提出了基于Apriori关联规则的K近邻、基于Apriori关联规则的随机森林和基于Apriori关联规则的梯度提升回归树方法,采用多变量作为模型输入,提高预测精度。论文将交通问题与新型计算机技术结合,利用Spark分布式计算框架效率高、易用性好、通用性强的特点,对海量卡口过车数据进行存储、统计和实时分析,实现了短时交通量预测分布式算法。最后,论文通过对苏州市某区域卡口过车数据的实例分析,验证了基于Apriori关联规则卡口路径随机森林和基于Apriori关联规则的卡口路径梯度提升树回归方法在交通量预测问题上的有效性。