面向恶劣天气的机场航班延误集成预测模型研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:jinxiangjinshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航空出行以其快速便捷、轻松舒适等优势,成为人们长途旅行的首选出行方式之一,而航班延误作为航空出行的一大难题,不仅影响机场与航空公司的正常运行,还会造成旅客的不便与损失。由于航班延误的成因复杂多样,难以被人为干预,目前仍未找到彻底处理航班延误问题的有效方法。因此,本文所提方法将事后被动应急转为事前主动干预,对缓解航班延误产生的负面影响有着重要意义。为改善传统航班延误预测模型考虑因素不全、预测精度较低的问题,提出一种基于Light GBM的航班延误多分类预测模型,对航班信息与天气信息进行结合,运用方差过滤与递归特征消除进行特征筛选,采用SMOTE与Tomek Link对数据进行不平衡处理,最后使用Light GBM算法进行建模,并使用贝叶斯调参进行优化,实现对航班延误时长的多等级预测。实验部分对所提模型的各个处理步骤的有效性进行验证,分析了不同因素对航班延误预测的影响重要性,将所提模型与多个机器学习预测模型进行比较,结果显示所提模型的预测性能最优,预测准确率提升至91.05%,同时大幅度降低了训练时间成本。为进一步提升模型的整体预测性能与稳定性,提出一种基于Stacking的航班延误集成预测模型,结合熵E差异度与准确率作为排序指标,运用前序选择方法选出最佳组合方式,以Light GBM、XGBoost、RF、KNN作为基学习器,SVM为元学习器,构建堆叠式的双层集成学习框架,结合多种学习器优势,增强Stacking集成预测模型的稳健性。为评估模型性能,另外构建基于软投票、硬投票、加权计算与不同基模型组合的Stacking集成预测模型用于比较,实验结果证明,基于Stacking的航班延误集成预测模型在整体与各等级类别上的预测性能均为最优,其整体准确率达到95.40%,F1分数达到0.9539,分别比效果最好的单一模型高出4.35与4.40个百分点。
其他文献
研究目的:乳腺癌(Breast Cancer,BC)是全球最常见的癌症,发病率逐年增高,位居女性恶性肿瘤首位,也是癌症相关死亡的病因之一。雄激素受体(Androgen Receptor,AR)在多种乳腺癌分子亚型中广泛表达,大量研究显示,AR与乳腺癌患者预后有一定的相关性,提示其有望成为乳腺癌治疗的新靶点。本研究拟探究新型雄激素受体拮抗剂(AR-10)对不同类型乳腺癌细胞的作用及其机制,并探讨AR
学位
图像语义分割的目的是对图像的每个像素进行分类并将其划分到对应的语义区域。与图像分类和目标检测不同的是,图像语义分割任务中的训练标签为像素级标签而非区域级标签,其获取过程既昂贵又耗时。为了降低语义分割任务对像素级标签的需求,利用少量标记数据训练模型的半监督图像语义分割方法已成为图像领域的研究热点。通过研究分析现有的半监督学习方法和基于深度学习的语义分割模型,本文针对语义分割数据集标注困难和标注成本高
学位
知识图谱以图的方法巧妙地把现实世界的实体与实体之间的关联组织起来,是一个拥有大量语义信息的知识表示工具。民航突发事件知识图谱作为领域知识图谱的一种,其强大的知识表示、推理和检索能力对于民航突发事件的应急管理和决策有着重大意义。知识图谱的最小单位是由实体与关系所组成的三元组,故实体识别和关系抽取成为构建高质量知识图谱的两大关键任务。为了避免将实体和关系的抽取视为串联的两个任务任务所造成的冗余信息、错
学位
目的:探讨60例乳腺癌肝转移患者的临床病理特点并利用GEO数据库探索相关基因。方法:本研究回顾性分析了2000年至2020年浙江大学医学院附属第二医院(浙大二院)乳腺外科收治的60例乳腺癌肝转移患者的资料。应用SPSS 25进行统计学分析。分布情况采用Kolmogorov-Smirnov正态性检验法,生存分析采用Kaplan-Meier法,非参数检验采用Kruskal-Wallis法及Mann-W
学位
区域机场群航班数据中蕴含丰富的机场运营特征,这对于发现机场群航线网络的不足、获取机场容量需求有重要意义,为后期调整短期航班和重新分配机场容量提供参考。目前制定航班时只考虑单个机场的运营状况、单条航线的需求量或某一指标,忽视了区域机场群内枢纽机场与周边机场的协同关系,从而导致航线网络结构缺乏整体性。为解决以上问题,本文进行可视分析方法研究,融合可视化、数据挖掘和交互技术分析区域机场群中隐含的航班运营
学位
背景结直肠癌(Colorectal cancer,CRC)是最常见的消化系统恶性肿瘤之一。在中国,CRC的发病率与死亡率随着人们生活习惯和饮食水平的改变呈现稳步上升的趋势。近年来肿瘤免疫治疗成为肿瘤治疗领域的研究热点,尤其是肿瘤免疫治疗中的免疫检查点抑制剂在恶性肿瘤当中的应用更是备受关注。但整体上,只有一小部分错配修复基因缺陷(d MMR/MSI-H)的CRC患者(12-15%)可以从免疫检查点抑
学位
目的原发性肝细胞癌(Hepatocellular carcinoma,HCC)具有发病率高和死亡率高的特点,手术切除是主要治疗手段,但术后总体复发率高,其中切缘复发率高达30%。目前研究认为手术切缘宽度是影响预后的主要因素之一,本研究目的在于评估手术切缘宽度对HCC复发模式和生存预后的影响,以指导进一步术后辅助治疗。材料与方法本研究回顾性分析2014年至2016年之间在我院行根治性肝切除术的HCC
学位
背景和目的tRFs(t RNA-related fragments)是衍生于t RNA的非编码小分子RNA片段,近年来大量研究表明,这种小分子片段在人体发挥各种生物学功能,而且与各种疾病都有着显著关联。在多种恶性肿瘤中,t RFs的异常表达促进了肿瘤的进展。然而,t RFs与结肠癌进展之间的调节关系在很大程度上仍然未知。本研究旨在探讨低氧条件下结肠癌细胞中关键t RF的功能,并探讨其潜在的分子机制
学位
背景与目的近年来,女性乳腺癌发病率呈年轻化趋势,尤其是中国等发展中国家较发达国家相比乳腺癌发病年龄较轻。目前认为年轻乳腺癌侵袭性强,预后较差,但由于样本量有限,相关临床特征影响其死亡风险的认识并不统一,该研究旨在在一个大型的疾病数据库中进一步分析年轻浸润性导管癌(Infiltrating Duct Carcinoma,IDC)患者的人口社会学特征和临床病理参数并构建列线图以预测其乳腺癌特异性生存率
学位
近年来,复杂网络在网络安全等领域应用广泛,识别复杂网络中的关键节点,对于理解网络的结构和功能,保障整个网络的稳定运行具有重要意义。在实际应用中,将复杂网络中的节点进行重要性排序能够为计算机网络安全风险的综合评估提供一条有效可行的解决途径,能够帮助确定计算机网络的安全风险等级,为下一步安全管理员采取适当的措施维护计算机网络安全奠定理论基础。然而,现有的关键节点识别方法存在准确性不高和计算复杂度高的问
学位