论文部分内容阅读
随着城市机动化进程的不断发展,交通拥堵、环境污染等一系列问题日益突出。发展公共交通系统是缓解各种城市交通问题的有效手段,作为一种绿色、便捷的“出行最后一公里”的解决方案,共享单车依托着“互联网+交通”的模式快速的发展。与此同时,公共停放点不足、共享单车车辆损坏、在时间和空间上的调度不均衡性,一定程度降低了共享单车系统的服务质量,制约了公共自行车系统的健康发展。这些问题背后除了资本市场的投资不合理、管理不规范,共享单车企业对具体时间地点的需求预测不精确、资源调度不合理也造成了显著的负面影响。因此,运营者需要精细化的数据分析和运营策略以提高共享单车系统的经济效益和社会效益。
高精度的共享单车需求分布预测有助于运营者预知未来的系统状态以及供需不平衡的局部区域,并及时采取高效的调度策略来保证系统恢复稳定状态,对精细化的单车系统运营具有重要的意义。有别于其他出行方式,共享单车用户对外部因素(天气、建筑环境等)较为敏感;近年来,机器学习和大数据技术的发展为大规模的交通数据存储和分析提供便利,同时为网络层面的高精度的短时需求分布预测提供了新的研究思路。综上,本文旨在利用深度学习方法精准预测时间、空间维度上的共享单车需求预测,以便对共享单车进行更有效的管理。各部分研究工作和结论如下:
首先,本文对共享单车出行特征进行整体分析,并对预测模型的输入数据集进行预处理。根据共享单车的历史骑行数据,分析了共享单车用户的出行时段分布、用户属性等宏观特征,其次,本文综合了城市土地利用分区数据和城市地理信息数据,将其量化处理为居住、工作、消费和交通四种土地利用特征和强度。最后本文将天气数据(包括温度、风速、降水量)按小时划分,以统一不同粒度的输入数据。
其次,本文结合天气数据和骑行数据对站点层面的单个共享单车停车点的需求进行预测。为解决递归神经网络在训练时梯度消失或梯度爆炸的问题,本章选用长短期记忆神经网络(LSTM)作为预测模型,通过对参数的调节以优化预测网络的训练精度,通过不同的输入数据和不同的预测方法与本章提出模型进行对比。
最后,本文结合土地利用数据和骑行数据对网络层面的共享单车停车点的需求进行预测。为了有效的融入土地利用信息,本章选用时空图卷积神经网络(ST-GCN)作为预测模型,在频谱域卷积中使用切比雪夫多项式来降低网络的复杂度,在空间域卷积中以门控图结构作为空间维度的信息传递模型;接着通过对参数的调节以优化预测网络的训练精度;最后通过不同属性的邻接矩阵和不同的预测方法与本章提出模型进行对比。以旧金山市自行车数据为案例进行分析,结合土地利用信息的ST-GCN模型对未来1小时、3小时、6小时客流需求的预测误差(MAPE)分别为4.8%,5.6%,7.3%,结果显示,相比于LSTM以及以物理距离为空间关联的ST-GCN模型,以用地属性为空间关联的ST-GCN模型可以有效的预测区域内停车点的需求量,为共享单车调度、停车点位置优化等其他方面的研究奠定基础。
高精度的共享单车需求分布预测有助于运营者预知未来的系统状态以及供需不平衡的局部区域,并及时采取高效的调度策略来保证系统恢复稳定状态,对精细化的单车系统运营具有重要的意义。有别于其他出行方式,共享单车用户对外部因素(天气、建筑环境等)较为敏感;近年来,机器学习和大数据技术的发展为大规模的交通数据存储和分析提供便利,同时为网络层面的高精度的短时需求分布预测提供了新的研究思路。综上,本文旨在利用深度学习方法精准预测时间、空间维度上的共享单车需求预测,以便对共享单车进行更有效的管理。各部分研究工作和结论如下:
首先,本文对共享单车出行特征进行整体分析,并对预测模型的输入数据集进行预处理。根据共享单车的历史骑行数据,分析了共享单车用户的出行时段分布、用户属性等宏观特征,其次,本文综合了城市土地利用分区数据和城市地理信息数据,将其量化处理为居住、工作、消费和交通四种土地利用特征和强度。最后本文将天气数据(包括温度、风速、降水量)按小时划分,以统一不同粒度的输入数据。
其次,本文结合天气数据和骑行数据对站点层面的单个共享单车停车点的需求进行预测。为解决递归神经网络在训练时梯度消失或梯度爆炸的问题,本章选用长短期记忆神经网络(LSTM)作为预测模型,通过对参数的调节以优化预测网络的训练精度,通过不同的输入数据和不同的预测方法与本章提出模型进行对比。
最后,本文结合土地利用数据和骑行数据对网络层面的共享单车停车点的需求进行预测。为了有效的融入土地利用信息,本章选用时空图卷积神经网络(ST-GCN)作为预测模型,在频谱域卷积中使用切比雪夫多项式来降低网络的复杂度,在空间域卷积中以门控图结构作为空间维度的信息传递模型;接着通过对参数的调节以优化预测网络的训练精度;最后通过不同属性的邻接矩阵和不同的预测方法与本章提出模型进行对比。以旧金山市自行车数据为案例进行分析,结合土地利用信息的ST-GCN模型对未来1小时、3小时、6小时客流需求的预测误差(MAPE)分别为4.8%,5.6%,7.3%,结果显示,相比于LSTM以及以物理距离为空间关联的ST-GCN模型,以用地属性为空间关联的ST-GCN模型可以有效的预测区域内停车点的需求量,为共享单车调度、停车点位置优化等其他方面的研究奠定基础。