论文部分内容阅读
在社会飞速发展、汽车等交通工具大范围普及的时代背景下,城市交通路网变得日益复杂化、多元化,因此对城市交通的承载能力也有了进一步的需求。人们在出行的同时逐渐更为关注通行的时间和效率,精准的旅行时间不仅可以优化居民出行路线,减少不必要的出行拥堵时间,还能够减少繁忙路段的交通流量,避免交通堵塞,缓解交通压力。因而城市短时交通旅行时间预测问题的研究对于改善居民生活和城市交通都具有重要的意义和研究价值。现阶段对于短时交通旅行时间预测问题的研究,主要分为朴素方法,参数方法,非参数方法和混合方法四类。朴素方法如历史平均算法(HA),计算复杂度低,易于部署,然而正是因为缺乏复杂计算,朴素方法通常存在预测结果精度不高的问题;参数方法是指方法模型结构已被预先定义,而模型参数数值需要在实验中计算得到。这类方法主要基于时间序列分析,包括自回归滑动平均(ARMA)模型,差分自回归滑动平均(ARIMA)模型和时空差分自回归滑动平均(STARIMA)模型。这类方法的特点是根据历史通行时间序列,通过滑动平均、自回归等运算来预测下一时间片段中的路段通行时间,并没有考虑到交通数据的空间特征和其他路段对目标路段旅行时间的影响;非参数方法是指模型结构及其参数均需要在训练中确定,又分为基于模型的方法和基于记忆的方法两类。在基于模型的方法中,历史数据被用来构建模型结构,一旦模型结构得以确定将不再需要历史数据。这类方法主要有人工神经网络(ANN),随机森林(RF)和支持向量机(SVM)。而基于记忆的方法则需要维护一个额外的数据库来存储历史数据,因为历史数据不仅被用在构建模型结构的阶段,也需要被用于预测阶段。典型方法有k近邻(kNN)算法。非参数方法更加充分地挖掘了数据特征,预测精度较高,但是同样存在特征单一,未考虑城市交通时空特征和时移特征的缺点。短时旅行时间预测问题是智能交通系统(ITS)的重要研究课题之一,一方面城市交通数据每天在以指数级的速度在增长,为旅行时间预测的深度学习方法提供了数据基础;另一方面,计算机硬件能力也得到了极大的提升,多核处理器逐渐普及,GPU并行计算技术愈发成熟,也为旅行时间预测问题的研究提供了硬件保障。本文介绍了一种基于交通数据时空和时移特征,结合卷积神经网络(CNN)与长短时记忆网络(LSTM)进行旅行时间预测的混合预测模型。本文中,我们将首先介绍我们所提出的时移特征的定义,然后提出根据KL-散度(KL-divergence)和城市路网结构过滤并提取目标路段的相关路段的方法,筛选出当前时间段内对目标路段的旅行时间有影响的上游相关路段。然后根据相关路段构建时空时移特征矩阵。最后通过CNN提取特征并用LSTM进行旅行时间预测。我们的方法在现有方法的基础上作出了很大的进步,一方面针对城市交通数据提出了时移特征,并结合空间特征进行了有效建模,另一方面我们的CNN-LSTM模型能够有效处理输入矩阵,并具有对长期数据的记忆能力。我们的方法通过真实数据集进行了验证,实验结果表明我们的模型效率与现有方法相比有明显提高。本文的贡献主要有以下几点:在短时旅行时间预测问题的研究中,首次提出了结合CNN和LSTM的深度预测架构;通过KL-散度和城市路网结构筛选目标路段的相关路段,在减少冗余数据的同时提高了预测精度;我们首次提出了相关路段间的旅行时间影响随时间空间移动的概念(后文简称为时移信息或时移特征),并将时移特征与时空特征相结合用于预测。我们在真实交通数据集中进行了多次实验,实验结果证明我们的模型在准确率和效率方面均高于目前最新方法,具有在实际中的应用价值,并可以在相关领域内迁移应用。