论文部分内容阅读
随着航空运输业的迅速发展,国内外形成了诸多机场群,且机场群的发展日益成熟;同时随着大数据及深度学习技术的发展,已经广泛的应用在各个领域之中。因此本文以机场群延误预测为目标,基于大数据及深度学习技术,提出一种基于跳过门的长短时记忆网络(Skip Long Short Term Memory,Skip-LSTM)的机场群延误预测方法。旨在通过深度学习算法挖掘中国京津冀机场群和美国纽约机场群的数据信息对中美机场群的延误状况进行预测,并对比中美机场群数据集的差异。为机场、空管局、航空公司等相关部门的决策提供辅助参考意见,论文的主要研究工作如下:首先,构造机场群数据集并对数据进行预处理:提取目标机场群中各个机场的航班数据及气象数据,并以时间为键值,融合航班数据和气象数据,最后合并机场群中各个机场的数据,完成机场群数据集的构造;然后根据机场群数据中各个特征的特点,对数据进行编码。本文对不同的机场群数据以及不同的数据特征采取了不同的编码方式,以便神经网络能更准确地提取机场群数据中的特征信息,得到更好的预测结果。其次,提出一种基于长短时记忆网络(Long Short Term Memory,LSTM)的机场群延误预测方法。因为机场群的延误状况具有时序性,所以采用具有时序性的循环神经网络(Recurrent Neural Network,RNN)对机场群的延误状况进行预测。然而传统的RNN在训练过程中存在着梯度消失或者梯度爆炸的问题,无法学习长时间的序列,而基于LSTM网络构建的机场群延误预测模型,在RNN的基础上增加了遗忘门,输入门和输出门,在一定程度上避免了梯度消失和爆炸,能够学习到较长的时序信息,获得较高的准确率。最后,由于LSTM在每一个时刻中,所有的神经元状态都需要更新,所以训练时间较长,模型预测精度也无法继续提高。因此本文提出了基于Skip-LSTM的机场群延误预测模型,该模型在LSTM的基础上增加了skip门,通过skip门输出控制神经元状态的更新,充分的提取机场群延误状态的时间相关性,获得更高的准确率和更短的训练时间。模型最后利用softmax分类器对机场群的延误状况进行分类预测,最终模型的预测准确率达到95.35%,优于传统的网络模型,能对机场群未来的延误状况进行有效预测。