【摘 要】
:
航班延误是民航业的一大难题,提前对航班的延误情况进行预测,以采取合理的应对措施,对缓解航班延误产生的负面影响有着重要意义.为提升预测性能,提出一种基于轻量级梯度提升机(Light gradient boosting machine,LightGBM)的航班延误多分类预测模型.该模型结合航班信息与天气信息,运用方差过滤与递归特征消除进行特征筛选,并采用合成少数过采样技术(Synthetic minority oversampling technique,SMOTE)与Tomek Link对数据进行不平衡处理
【机 构】
:
中国民航大学计算机科学与技术学院,天津 300300
论文部分内容阅读
航班延误是民航业的一大难题,提前对航班的延误情况进行预测,以采取合理的应对措施,对缓解航班延误产生的负面影响有着重要意义.为提升预测性能,提出一种基于轻量级梯度提升机(Light gradient boosting machine,LightGBM)的航班延误多分类预测模型.该模型结合航班信息与天气信息,运用方差过滤与递归特征消除进行特征筛选,并采用合成少数过采样技术(Synthetic minority oversampling technique,SMOTE)与Tomek Link对数据进行不平衡处理,最后使用LightGBM进行建模,实现对航班延误时长的多分类预测.为验证模型的合理性,将所提模型与其他先进算法构建的模型进行对比.实验结果表明,所提模型在各种预测性能指标上结果更优,将预测精度提升至90%以上,同时大幅度降低了训练时间成本.
其他文献
[目的]新能源发电具有间歇性和随机性,其功率为不确定性数据,会造成电网电压和频率的变化,对电力系统安全运行构成威胁.为保证大规模新能源并网后电网电压的安全,考虑新能源发电波动不确定性,提出一种基于区间建模的新能源电网无功优化策略.[方法]该策略采用区间数描述无功优化模型中的不确定参数,进而建立区间无功优化模型,采用基于优化场景的区间潮流算法求解区间潮流方程,获取状态变量区间,确定控制变量的可行性,在此基础上采用改进的粒子群优化算法求解区间无功优化模型,在粒子群算法中加入局部搜索环节和离散变量交叉处理操作以
[目的]面对“互联网+”智慧能源发展的机遇与挑战,众多能源企业都在探索转型,打造繁荣的能源生态圈,其中一项重要手段是运用互联网思维和云大物智移链等技术,构建开放共享、敏捷灵活的能源服务平台.[方法]针对能源服务平台扩展快、业务多变、可靠性要求高等特点,分析了传统单体式架构的不适应性,并提出应用互联网行业流行的微服务技术进行平台构建,阐述了一种基于微服务的“互联网+”智慧能源服务平台设计和实现的技术方法及要点.[结果]作者基于该方法构建了“互联网+”智慧能源服务平台,在此基础上建设了多个面向不同用户的能源互
[目的]目前非开挖水平定向钻广泛应用于电力电缆线路工程穿越天然或人工的障碍物,工程应用中在需要一次成孔后敷设多根电缆保护管,文章定义为群管回拖穿越.群管穿越以其优异的经济及环保优势在工程中大量应用,但目前规范只给出了塑料管单管回拖力的计算方法.文章旨在研究电力电缆线路工程中群管一次回拖的回拖力计算方法.[方法]以珠三角某220 kV电缆线路工程为依托,该工程在同一地点采用非开挖水平定向钻两次穿越国家一级水道,穿越地层大部分为可塑粘土层,工程实施前采用塑料管单管回拖力计算方法进行理论计算,实施过程中现场实测
[目的]由于生态保护和风场边界等条件的限制,有些机位点的主风向方向存在明显山头障碍物遮挡,影响了机组的发电量和安全性能,文章旨在研究减小山头对机组影响的方法.[方法]基于STAR-CCM+软件平台对主风向上有山头遮挡的机位点附近地形进行了数值模拟,分析了扇区管理、提高轮毂高度、地形修整等方法对机组的安全影响.[结果]结果表明:扇区管理、提高轮毂高度和地形修整都能改善风机的安全性.但在该项目中,采用双平台的地形修整的方法对改善风机安全性更加有效.[结论]分析结果可为如何降低来风方向的山头对风机的影响提供方法
[目的]电网工程采用全户内紧凑型布置是当前国内城市电网建设大力发展形势下的必然趋势.如何将室内设备产生的大量热量散发出去,且减少对周围环境产生不利影响,是一项值得深入研究的课题.自然通风作为经济高效、无噪声产生的通风方案应优先考虑采用.为研究不同气楼方案对户内启动回路场自然通风的影响,在其他条件不变的情况下,通过改变气楼位置及形式,对广州市某直换流站工程户内启动回路场的散热效果进行对比分析.[方法]采用CFD数值模拟方法,针对流线型通风器和薄型通风器工况,模拟了厂房内气流的温度场和速度场.[结果]模拟结果
[目的]为了满足近期欧洲电站工程建设需要,亟需了解电站工程中欧洲管道及管件标准的要求.[方法]针对管件,将欧洲管件标准与国内管件标准相应条款逐一对比.[结果]经过对比,获得了欧洲管件标准与国内管件标准的差异:欧标管件在行业使用范围、管材使用范围上更全面;欧标管件的尺寸偏差、焊接端壁厚偏差、形位偏差,总体比国标要求严格;欧洲管件强度计算标准保守一些,更偏于安全;欧洲管件在管件端部坡口、通流面积、弯头弯曲半径等方面相对国标管件有其特点;另外,进入欧洲市场的管件需要遵守欧盟行政指令PED指令.[结论]通过上述标
[目的]针对当前电力监控系统安防要求持续更新的难题和安防整改现场作业效率低下、效果不可控的问题,以及部分二次设备无有效整改方案而大面积脱网运行的现状,研究了二次设备集中安防运维及主动感知和诊断预警关键技术.[方法]变电站内统一部署合规并网装置,利用基于深度信念网络的多类支持向量机入侵检测和基于自适应概率标记的IP反向追踪技术筛选录波数据、主动感知和追溯诊断入侵威胁,采用基于威胁和对抗分析相结合的风险预警和综合评估技术进行影响评估和等级评定,利用现有的录波主站系统拓展安防运维管理业务,形成集中运维管理的模式
[目的]随着我国“碳中和、碳达峰”目标的提出,可再生能源发电企业面临着快速扩大装机规模,大力发展投资并购的诉求,在我国存量补贴资金缺口逐步增大的背景下,如何确定可再生能源项目的补贴收入,并采用合理方法对项目估值,一直是并购决策的难点.[方法]重点关注了2020年发布的补贴新政,测算了可再生能源存量补贴的兑付系数,基于多情景假设补贴现金流入的规模及时间.[结果]通过等比补贴系数测算及投资估值模型,明确了我国补贴缺口的收口时间及各年度的等比补贴系数,并基于可再生能源项目特点,研究选定最佳估值方法.[结论]通过
[目的]为解决高压直流输电工程中接地极在广东地区选址困难问题,研究将现有接地极连接组成广域接地极供未来直流工程接入,减少对极址周围电气设施、地下金属管道设施的影响.[方法]分析了现有接地极作为子接地极组成广域接地极的可行性,提出几种典型的广域接地极应用场景,并进行了各子接地极的自然分流计算、均流计算和多回直流同时运行工况计算.[结果]广域接地极能降低粤东极址的设计要求,缓解鱼龙岭接地极对油气管道和周边电力系统的影响,具有实施的可行性.但在不增加均流电阻的情况下,效益仍不明显.[结论]该研究为通过采用广域接
针对“最后一公里”配送的无人机需求预测问题,考虑无人机性能、空域环境和运输任务等限制条件,分别以最大化快递运输量、最小化运输成本为目标函数,建立多阶段无人机需求预测模型.考虑快递业务历史数据和影响因素,建立组合预测模型预测快递业务量;利用动态分配算法预测无人机快递分担量和无人机需求量.以某区域实际快递数据和低空飞行条件进行算例分析.结果表明,本文提出的预测方法不仅可以根据配送中心业务量、工作时间和成本要求提供灵活的无人机需求方案,还能够使得无人机的工作时间利用率达到95%以上.