论文部分内容阅读
伴随着中国的现代化进程,中国社会经济飞速发展,截止2017年底,中国机动车保有量已经达到3.1亿辆,但由于人口向城市聚集,城市中的交通路网承受着巨大压力,交通拥堵问题成为城市交通路网中的普遍问题。在目前的智能交通信息系统中,交通流量预测是重要的一环,也是解决交通拥堵问题的关键所在。在采集大量交通信息的基础上,精准的交通流量预测有助于智能交通信息系统高效的分析路网状况,及时的向管理者和出行者反馈交通信息,从而对路网进行更好的规划,提高路网利用率。传统的交通流量预测方法一般基于单条道路的历史数据进行非线性拟合,用到的数据量小,模型简单,过拟合严重,一些学者考虑了道路的时空特征,针对性的提出了路网压缩的思想,但由于大多是手工分析特征,路网压缩算法泛化性能差,无法支持大规模高维度的城市路网数据。为了弥补以上传统交通流量预测方法的不足,更好的对大规模城市路网整体进行预测,本文提出一种基于深度学习的城市路网交通流预测框架。首先引入机器学习中的特征工程方法,对大规模交通路网数据进行特征处理,使用基于SVDD和孤立森林的异常检测方法剔除数据中的异常节点,通过基于差分的平稳性检验获得最优参数,通过基于CH指标优化的谱聚类路网压缩方法对路网数据进行压缩;然后,设计并实现了基于LSTM和SAEs的路网交通流量预测融合模型,可以直接输入特征工程和路网压缩处理后的数据,利用平稳性分析提供的参数,使用堆叠的LSTM模型提取数据浅层的序列特征,使用SAEs模型对数据进行自编码,提取深层次的隐藏特征,并使用动态权值融合方法对二者进行融合,兼顾了数据的浅层特征和深层次特征,提高了模型的预测精度和泛化能力。最后,本文利用美国明尼苏达大学交通数据研究实验室的双子城交通数据对该框架进行了实验分析,实验表明:(1)基于SVDD和孤立森林的融合模型可以有效的识别并且剔除大规模路网中数据量不足的坏点,提高数据质量;(2)基于CH指标的谱聚类路网压缩方法可以有效地对城市路网数据进行压缩,在保证预测精度的前提下,压缩率达到20%;(3)本文提出的基于深度学习的融合模型预测模型在预测精确度和性能上明显优于其他模型,在整个路网中的预测平均精度达到了 97.7%。