论文部分内容阅读
我国经济的快速发展和城市化进程的加快增加了城市的就业需求,更多的人选择聚集在城市工作和生活。城市人口增长在推动城市发展方面做出了巨大的贡献,另一方面也给城市带来了一些负面影响,最显而易见的问题就是交通拥堵和空气污染。解决交通拥堵问题被许多城市当作工作重点之一,也成为了学术界一个热门的研究课题。交通拥堵受交通基础设施、人口密度等因素影响,还受学校所在地、企业密集地、公众活动场所、气候、气象条件等多种因素影响。因而预测和解决交通拥堵问题是一个巨大的挑战。本文探讨关于时空相关性的城市区域交通流量预测问题,提出基于神经网络及聚类的城市区域交通流量预测方法,主要的研究内容包括:(1)提出基于周期性特征的中长期交通流量预测方法。这种方法的主要思想是利用交通流量时间序列数据的周期性特征(如对于某个特定区域,工作日各时间点的交通流量有很大的相似性等)来建立数据之间的相关性,从而构建针对性的预测模型。本文从建立基于长短期记忆人工神经网络(Long-Short Term Memory,LSTM)的交通流量预测模型入手,根据区域交通流量的变化范围选择聚类粒度,将原始流量数据作聚类,然后再对聚类后的数据进行训练和预测验证,目的是忽略区域交通流量数据微小变化带来的波动,更多地关注数据的趋势性变化,以便更好地匹配区域流量周期性特征。从而提高预测的准确率,尤其是对中长期时间交通流量预测的效果更好。(2)提出基于临近性特征的短期交通流量预测方法。这种方法的主要思想是利用交通流量时间序列数据的临近性特征(如对于某个特定区域,过去几小时交通流量变化对未来短期交通流量的变化有较大影响)建立数据之间的相关性,从而构建针对性的预测模型。本文首先构建基于临近性特征及LSTM的预测模型;其次对原始数据进行聚类,建立基于动态聚类临近性特征及LSTM的预测模型,对聚类后的数据进行训练和预测验证;然后将两种模型的预测结果进行整合,根据均方根误差(Root Mean Squared Error,RMSE)情况给两种模型的预测值分配适当的权值,对预测偏差做适当修正,即RMSE小的模型分配更大的权值,RMSE大的分配小一些的权值。多模型整合实现了对各模型取长补短,可提高预测的准确率。(3)提出基于相关区域聚类及CNN的交通流量预测方法。这种方法的主要思想是利用交通流量数据的空间相关性特征(由于车辆进入目标区域或离开目标区域都经过其某个相临区域,所以目标区域与其周边临近区域有着非常密切的空间相关性)建立数据之间的相关性,从而构建针对性的预测模型。本文通过区域流量相关度量方法选择相关区域,减少模型训练的计算量;然后对目标区域及相关区域的交通流量数据进行聚类,再用基于相关区域聚类及CNN的预测模型对聚类后的相关区域数据进行训练和预测,从而提高了CNN的训练准确度及效率。本文利用微软亚洲研究院提供的数据集对所提出的交通流量预测模型进行了训练和预测验证,并对实验结果进行分析。