论文部分内容阅读
随着城市化的不断加快,人们对于出行的需求与日俱增。网约车通过互联网技术与乘客进行在线即时匹配,解决了传统出租车打车难、司乘信息不对称等问题,有效地满足了乘客的出行需求。本文针对网约车出行需求进行深入研究,利用深度神经网络技术,能够较为准确地预测出城市网约车出行量与出行分布情况。本文首先对网约车数据进行了预处理操作,通过DBSCAN聚类算法对数据进行时空间聚类,采用地图匹配消除GPS数据不在道路中的情况。针对城市GPS轨迹分布范围较广且分布不均的情况,使用泰森多边形算法对预测区域进行了空间划分,通过大数据分析技术深入了解了网约车出行的时间与空间特征。采用深度神经网络模型对网约车出行订单量和网约车出行目的地两项需求进行了预测。本文的主要研究内容如下:(1)首先对网约车数据进行了数据清洗和格式转换,采用DBSCAN聚类算法对网约车OD点数据进行时空间聚类以提高预测的准确度,结合西安市路网信息对聚类后的GPS数据进行地图匹配,采用泰森多边形生成算法对西安市预测区域进行空间划分。(2)采用大数据分析技术,使用时间分片操作将一天24小时划分为等长的时间片段,通过研究网约车出行量随着时间的变化分析网约车出行时间需求。区域空间划分完成后,研究各个子区域中单位时间片段内网约车出行量分析出网约车出行热点分布,完成对网约车出行空间需求的分析。(3)采用卷积神经网络(CNN)和长短期记忆网络(LSTM)组合的深度神经网络模型对网约车出行需求进行预测。通过SPSS等数据分析工具,确定了网约车出行订单量预测模型和网约车出行目的地预测模型的输入,分别实现了对网约车出行订单量和网约车出行目的地的预测。本论文着眼于研究网约车出行需求预测问题,为充分利用数据的时空特性,首先通过CNN网络提取出数据的空间特征;然后通过LSTM网络提取出数据的时间特征;使用西安市网约车订单数据和GPS轨迹数据对上述算法与模型进行了实验评估。实验结果表明,与传统的预测模型相比,本文采用的深度神经网络模型具有更高的预测准确度(PA)和更低均方根误差(RMSE)。