论文部分内容阅读
大雾是一种常见的灾害天气,发生时具有低能见度的特点,会对人们的出行产生极大的影响。如果能够提前对大雾天气进行预测,将有效地避免经济损失、降低风险。目前对大雾的研究中主要包括对雾的雷达实时监测以及相关数值分析方法,但上述方法不仅需要借助预报员的经验,而且复杂的计算过程可能会产生一定的时间开销。而随着人工智能的发展,目前已较广泛地应用于航天、生物医疗等领域的预测任务中。另外,现有的研究工作更加关注于当前时刻雾天气的状态,没有对未来时刻雾的状态进行预测。因此对未来时刻雾天气的研究将具有重要的意义。本文借助全国综合气象信息共享平台(CIMISS)的气象要素数据,经过相应的数据处理,利用机器学习方法对未来时刻大雾状况进行研究(短邻雾研究)。其研究内容根据东北区域气象中心需求有如下两个方面:短邻雾分类预测研究、短邻雾能见度预测研究。对短邻雾天气分类预测研究包括主要气象特征分析、建立不同短时邻近雾分类预测模型。其中研究了一种结合支持向量机(Support Vector Machine,SVM)与特征选择Wrapper方法的短邻雾天气分类预测模型。该模型对多维气象数据进行列切分得到关于列的数据子集,将不同的子集数据输入至SVM中进行训练,根据不同子集的训练效果得到最优SVM训练模型及对应最优子集,从而在众多气象要素中提取出该预测时间主要影响雾分类预测的特征属性。并将最优模型作为该时刻的雾分类预测模型。对短邻雾天气能见度预测的研究包括建立不同短时邻近能见度预测的集成学习模型,计算参与预测的气象要素对能见度值影响程度得到影响程度排名。其中研究了一种基于Boosting集成学习策略的梯度提升树(Gradient Boosting Decision Tree,GBDT)算法,并研究其在分布式系统XGBoost下的预测情况。根据能见度值的预测情况计算出影响各短时邻近时刻的气象要素排名。根据上述两个方面研究的结果开发出雾天气预测系统,将其应用于东北气象中心的灾害天气预测系统中实现对未来时刻雾天气的预测,并利用气象学TS标准对模型在CIMISS数据集的预测能力进行评分。结果表明应用于开发系统中的预测模型能够较准确的对大雾发生的时间进行预测。