论文部分内容阅读
人群流量的准确预测对于政府部门有效且合理的管理交通资源、提高群众出行体验、改善道路交通安全环境等来说具有重要意义。然而,由于人群流量数据具有特殊性,它是一种复杂的时空数据,建立人群流量预测模型时必须同时考虑其时间依赖关系和空间依赖关系。此外,人群流量还受事件、天气等外部因素的影响。因此,想要准确的预测人群流量绝非易事。传统人群流量预测方法的研究对象通常是单一区域的人群流动模式,而这些方法只考虑人群流动的部分时空依赖关系,未对整个时空依赖关系做一个全面准确的衡量。因此,本文将会考虑影响人群流量变化的各种因素,并对人群流量进行建模和预测。本文将城市区域划分为一个个的网格区域,利用人群流动的轨迹数据来表示和计算人群流量,以此得到了人群流量在时间轴上的张量表示。针对网格区域之间的人群流量预测问题,本文提出了一种基于深度学习的人群流量预测模型—基于密集连接的卷积神经网络和带注意力机制的门控循环神经网络的时空预测模型(DCAST),该模型对影响人群流量的各种因素进行了合理的统一建模,也更加准确的预测了预测区域的人群流入流量和流出流量。另外,为了更好的捕获区域间的时间依赖关系,本文设计了一个带有注意机制的门控循环单元模块,实验结果表明,带注意力机制的门控循环单元模块在本文提出的DCAST模型中发挥了重要作用。针对城市区域人群流量预测中的时空依赖问题,DCAST模型将时间轴划分为三个部分:Short-Term Dependence、Period Rule、Long-Term Dependence,用这三个模块分别对区域人群流量中的短时依赖关系、周期规律和长期依赖关系进行描述,每个模块均由结合Dense Net和基于注意力机制的GRU的网络结构组成,其中的Dense Net网络用来描述空间依赖关系,而基于注意力机制的GRU用来描述时间依赖关系。然后,对三个部分的输出进行加权融合。针对影响人群流量的外部因素,本文提出的DCAST模型通过一个两层全连接网络来进行外部特征提取。最后,将前三个部分融合的结果与外部模块的输出集成,从而对各区域的人群流量进行预测。另外,本文分别在两个真实数据集,即纽约共享单车轨迹数据集Bike NYC和北京出租车轨迹数据集Taxi BJ上对DCAST模型进行了实验,得到的RMSE分别为5.53和15.70。实验表明,DCAST模型的预测结果比传统的时间序列预测方法以及其他同类基于深度学习的预测方法更加准确和可靠。