论文部分内容阅读
随着网络通信技术和全球卫星定位技术发展,“互联网+”潮流的冲击对居民的交通出行带来了巨大改变,尤其是智能手机的普及,给网约车行业飞速发展增添了强劲动力。网约车出行以快速、舒适、便捷的特点近年来占据了大量的传统出租车市场份额。同时,由于城市化进程不断加快,交通拥堵、打车难、寻客难等交通城市病问题依然严重,网约车供给与乘客出行需求不匹配问题仍然困扰着供需双方。针对此一系列现实难题,居民网约车出行具有怎样的时空特征、影响网约车出行的建成环境影响因素是什么、怎样对居民网约车出行需求进行准确预测,是学术界和城市管理人员面临的共同问题。在大数据和人工智能背景下,本文以成都市三环内区域为研究区,融合网约车订单数据及其它相关时空大数据,在小尺度格网下对网约车出行时空特征进行研究,构建丰富有效的解释变量体系,深入分析建成环境对居民网约车出行全局与局部影响因素,揭示解释变量间的空间异质性特征,利用显著影响变量和时序数据搭建并训练网约车出行需求预测模型,并对预测模型性能进行对比验证和评估。本文所开展的研究致力于为缓解城市交通拥堵、减少环境污染、提高网约车管理调度水平、居民便捷出行等方面提供借鉴参考和决策依据。主要研究内容和成果如下:(1)对网约车订单数据进行预处理和空间统计,在200m的小尺度格网下,从时间上和空间上研究网约车的出行分布特征,对网约车一天中出行的早高峰、午高峰、晚高峰和深夜平峰时段进行了精准划分,并结合网约车在工作日和周末的出行特征差异展开了对比分析。在此基础上,本文提出将具有噪声的基于密度的聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)与核密度估计(Kernel Density Estimation,KDE)结合的算法,对网约车在不同日期时段下的出行起终点热区进行了有效识别。(2)为研究建成环境变量对网约车出行的全局影响和局部影响因素,对兴趣点(Point of Interest,POI)数据、人口、道路、建筑物等建成环境变量进行收集和预处理,经相关性分析和共线性检验,构建了包含21类变量的建成环境解释变量体系,通过普通最小二乘法(Ordinary Least Squares,OLS)模型回归得到了工作日、周末在不同时段下起终点模型建成环境解释变量对网约车出行的全局影响程度。结果表明,工作日起点午高峰模型拟合优度最高,调整R~2为0.352,不同变量在不同时间的起终点模型中其影响作用截然不同。接着,在局部影响因素研究中,对OLS模型中表现显著的解释变量代入到地理加权回归(Geographically Weighted Regression,GWR)模型和多尺度地理加权回归(Multi-scale Geographically Weighted Regression,MGWR)模型中进行对比回归验证,MGWR多带宽的特点和对局部区域特征的捕捉能力使得其较GWR和OLS具有更小的模型误差和更高的拟合精度,在平均全天时段起点模型中达到了调整R~2最高0.729。同时,MGWR模型捕捉到了不同时段各变量对网约车出行影响强度在空间上的显著异质性,其中工作日和周末的晚高峰起点时段以及平均全天起点时段中的道路变量、住宿服务变量和金融保险变量空间异质性分布明显。(3)选取在建成环境影响性分析中拟合程度最好的显著解释变量和天气信息、日期类型数据结合,基于多源时空大数据融合搭建了一个多层的卷积神经网络-长短期记忆(Convolutional Neural Network-Long Short-Term Memory,CNN-LSTM)模型,该模型在对网约车出行需求空间特征进行准确捕捉的同时,充分考虑了训练数据集间的时间依赖性问题。经训练和测试,预测模型均方误差(Mean Square Error,MSE)、平均绝对误差(Mean Absolute Error,MAE)和R~2分别为0.00087、0.0167和0.813。为保证模型的有效性和精度,对比传统的主流神经网络模型,验证了CNN-LSTM具有较好的预测效果。接着,对不同时间粒度、不同时间步长、不同空间格网尺度下模型的性能进行了对比实验,以确定模型重要超参数的有效性,在时间粒度为60分钟、时间步长为4、空间格网尺度为700m的设置下,取得了预测模型在精度和运行效率上都是相对最优结果。研究结果表明:在小尺度、多时段视角下利用空间分析和热区组合提取算法能够对居民网约车出行时空特征进行有效捕捉,成都市居民网约车出行在时间上具有明显的不同日期类型、时段特征,空间上网约车出行距离衰减及圈层出行结构特征显著,该方法适合作为对城市交通参与者出行特征分析的研究方法;运用OLS模型和MGWR模型深入探究建成环境变量与居民网约车出行的全局和局部影响因素,在不同时段模型中,充分分析了网约车出行影响因素的时空异质性,有效挖掘了影响网约车出行的显著相关建成环境因素;搭建的CNN-LSTM模型将建成环境变量、时序变量作为训练特征数据,通过多模型、多尺度、多参数的对比实验,验证了模型对居民网约车出行预测的精度和性能,提高了预测能力,为居民打车出行的供需关系改善提供了新的思路和方法支持。