论文部分内容阅读
随着经济和科学技术的发展,民航运输系统凭借其方便快捷的特性备受旅客青睐。然而快速增长的旅客数目和航空资源无法匹配,导致延误现象愈发严重。当前民航延误预测主要以单个航班延误分类预测为主,关于航班延误具体时间和机场延误多步预测的研究较少。本文基于航班运行数据建立我国民航交通网络模型,基于网络时空相关性提出机场延误的多步预测模型和单个航班延误预测模型,实现机场延误状态变化趋势预测和航班延误时间预测。主要研究工作如下:(1)利用复杂网络理论对民航交通网络进行建模,探究民航交通网络延误状态的时空相关性。首先对航班数据清洗并建立民航交通网络模型,验证了我国民航交通网络具有小世界性和幂律性。随后利用相关性系数和改进的PageRank算法对延误状态的时空相关性进行探究。改进的PageRank算法描绘了单个机场延误对网络内其他机场的影响,解决了传统方法孤立评价延误空间相关性的局限性。最后利用KMeans算法对延误状态向量聚类,获得相似的网络延误状态分布。(2)考虑机场延误状态的时空相关性和其他辅助特征,提出了民航网络内多机场延误状态的多步预测模型。利用PageRank获得的空间特征向量对输入序列进行空间相关性加权处理,将加权序列输入至长短时记忆网络与序列到序列模型中,实现时空相关性的共同挖掘和多步预测。通过引入时间注意力机制和其他辅助特征,提升模型预测精度并获取历史数据中每个时间步长的重要性。最后通过多种对比算法分析验证所提出的模型在机场延误多步预测中的有效性。(3)建立基于深度学习的单个航班延误预测模型,将天气、网络延误状态预测值和时空相关性数据引入模型中以提供更多辅助特征。面对高维稀疏特征数据,提出了基于堆叠稀疏自编码器和XGBoost回归算法结合的单个航班延误预测模型。通过多层自编码器模型实现对高维特征的自动提取后,将降维特征输入回归预测层。实验结果验证了所提出的模型具有更强的特征降维能力和更高的模型预测精度。网络延误状态数据明显提高了模型的精度。最后对造成航班延误的关键特征进行提取,提出单个航班延误归因模型并分析各个特征对延误状态的影响。