论文部分内容阅读
随着城市轨道交通的快速发展,提升运营质量,改善乘客出行体验至关重要。常规及突发事件引发的客流出行变化对城轨运营造成巨大挑战,挖掘相应的站点短时客流需求特征并预测,能够为运营管控方案制定提供量化支撑,意义重大。目前城轨短时客流预测主要以常态条件为背景,而常态条件与常规、突发事件背景下的客流需求特征差异明显,既有研究成果并不适用于常规及突发事件。因此,本文以常规及突发事件为研究背景,进、出站客流为预测目标,利用自动售检票(Automatic Fare Collection,AFC)系统数据,常规事件公示数据和突发事件记录数据,从客流需求特征挖掘、预测场景及预测难点识别、事件信息提取、突发事件下训练集样本不均衡、预测模型搭建、预测场景不确定下融合机制设计等6个方面展开研究。主要研究要点和成果如下:1.利用AFC数据,构建Ward准则聚合式层次聚类算法,归纳常态条件下站点短时客流需求特征。融合多源数据(AFC数据、常规事件公示数据、突发事件记录数据),挖掘事件下城轨网络短时客流时空传播特征。以此为基础,归纳常规及突发事件下典型预测场景、预测难点并提出解决思路。2.以常态条件为研究背景,解决了预测变量重要度评估及选取问题。考虑客流时空依赖性,分别构建季节性自回归移动平均模型(Seasonal Autoregressive Integrated Moving Average,SARIMA)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)和随机森林(Random Forest,RF)预测模型。结果表明:在单步和两步预测中,GBDT表现最优,SARIMA表现最差,客流序列间存在一定非线性关系;GBDT和RF分别在单步和两步预测中鲁棒性最强,在多步预测中应减少上步预测值干扰;简单叠加预测变量并不能显著提升预测精度,构建预测变量时应先确保关键变量的选取。3.以常规事件对客流产生影响为研究背景,解决了事件信息提取和预测模型搭建两个关键问题:1)分析常规事件下客流时空传播特征,提取事件信息,表征事件引发的客流波动;2)分析输入变量特征及输入、输出变量间因果关系,引入深度学习(Deep Learning,DL)理论,构建基于DL的短时客流预测框架,可拓展性强、可解释性高。结果表明:提取的事件信息使基于DL的模型学习事件下客流需求特征,可进一步提升预测精度,预测精度高于GBDT;在常态条件下的预测场景中,GBDT表现更优,且提取的事件信息使基于DL的模型和GBDT预测精度略有下降。这不仅验证了事件信息提取和基于DL框架搭建的合理性和有效性,同时表明一组预测变量和单一模型难以满足不同预测场景需求,需针对预测场景挖掘输入变量并发挥各模型预测优势。4.以突发事件对客流产生影响为研究背景,解决了事件信息提取和突发事件下有限客流样本导致训练集样本不均衡(与常态条件下客流样本共同输入)两个关键问题:1)分析突发事件下客流传播特征,提取事件信息;2)引入合成少数类过采样技术(Synthetic Minority Over-sampling Technique,SMOTE),边界线合成少数类过采样技术(Borderline SMOTE,BL-SMOTE),自适应综合过采样技术(Adaptive Synthetic Sampling Approach,ADASYN)过采样突发事件下客流样本,平衡训练集同时丰富事件下客流需求特征,强化预测模型学习事件下客流变化规律。结果表明:DL-SMOTE、DL-BL-SMOTE和DL-ADASYN预测误差小于GBDT和DL模型,证明事件信息提取和过采样技术的合理性和有效性,其中DL-BL-SMOTE预测精度最高、鲁棒性最强;在常态条件下的预测场景中,GBDT表现最优,DL-SMOTE、DL-BL-SMOTE及DLADASYN表现最差,即过采样技术和提取的事件信息降低了DL模型预测精度,同样说明需结合预测场景挖掘输入变量并发挥各模型预测优势。5.针对事件未必对预测时段内客流产生影响的实际问题,分别设计基于朴素贝叶斯(Naive Bayesian,NB)分类器、双向动态追踪(Dual Track,DT)、神经网络(Neural Network,NN)融合机制,发挥GBDT及DL模型在事件对客流无影响及有影响预测场景中的优势。结果表明:三种融合机制在大部分场景中可进一步提升子模型预测精度,其中GBDT-DL-DT预测精度最高、鲁棒性最强,GBDT-DL-NB鲁棒性最差,GBDT-DL-NN预测精度最差。三种组合机制设计对解决预测场景不确定下城轨站点短时客流预测问题提供思路和方法。