论文部分内容阅读
气象与人类衣食住行密不可分,观测气象相态有利于促进国民发展。目前气象要素预报算法的主要手段是数值预报。其实质就是通过利用高性能电脑对大气运动的偏微分方程进行计算,根据某一区域的气候背景和天气演变规律,推算该区域几个小时后,几天后,甚至是几周后的环流形势,并进行一个定性或者定量的预报。然而气象要素预报现阶段也存在一定问题。本论文以机器学习作为主要算法,力求在多气象相态判别问题上有所突破。首先根据所获得的气象数据分析其特点,了解气象学知识,结合专业人员知识经验,选取所需要的气象要素数据并处理为有效数据集。然后设计适用于多气象相态分类模型,判别未来某一时间段内某气象要素的预测结果。主要工作如下:1.收集整理了一套适用于机器学习训练的气象相态数据集。首先收集中国区域范围1996年至2015年的地面填图气象要素数据和温度对数压力数据,并进行匹配,接着剔除异常缺失数据以及两份数据集不匹配部分。最后与气象专业人员沟通后舍弃对分类判别结果不起作用的气象要素,降低数据维度,最终得到38种气象要素作为数据源。2.提出了新的气象相态分类模型,此模型结合了支持向量机算法、粒子群优化算法以及梯度均衡机制。支持向量机算法是模型的基分类器,粒子群优化算法的主要作用是对SVM算法内部的参数进行优化选择,提高模型分类的准确率,梯度均衡机制通过重构损失函数,能很好处理类别不平衡问题,使训练更加稳定。针对气象数据集,将单个支持向量机建模进行实验,然后结合粒子群算法同时在6个SVM算法内部进行寻优建模实验。SVM算法结合梯度均衡机制建模实验,接着结合6个经过粒子群算法优化的SVM算法组合成强分类器,对比三种模型的分类准确率,最后验证本文的观点:支持向量机+粒子群优化算法+梯度均衡机制的结合模型分类判别准确率高,评价结果好,各气象相态分类最为理想,说明此模型具有良好的多气象相态分类准确率和较高的分类稳定性,为气象预报提供一定的参考。