论文部分内容阅读
降水是在多种因素共同影响下产生的重要气候现象,是大气循环的重要组成部分,随着全球变暖,各种不合理人类活动的加深,降水突变现象时有发生,其规律性越来越让人难以捉摸。而准确、及时的降水预测为地区水资源的开发管理以及预防洪涝灾害提供参考,对人们的日常活动和生产计划非常重要。但降水数据在不同影响因子共同作用下呈现非线性、非平稳性特性,并且在降水数据采集过程中或多或少的伴随一定的噪声,致使降雨预测困难,传统方法的预测效果难以满足社会大众的期望。随着人类对气象研究的重视,以及数据挖掘、智能计算理论和技术的提出和发展,越来越多的智能计算和数据挖掘技术被用来解决降雨预测问题,并且表现出比传统算法更好的效果。目前,广泛应用在降水建模预测中的神经网络方法和支持向量机算法可以对降水数据各影响要素之间的复杂关系进行有效的描述,但算法本身的结构和参数选定很难进行统一化,需要根据程序员的经验来选择确定,算法计算量又非常大,不利于大容量样本的训练学习;具有强大回归分析能力的基因表达式编程(GEP)算法对降雨量的预测则是直接作用于降雨量序列本身,对降雨量序列复杂的时频成分及不同降雨量的时频差异并没有过多关注,严重降低了降雨预测的效果。现实工程技术领域对于非线性、非平稳数据的处理很多都是采用时频分析方法,经验模态分解(EMD)和小波分析都是当前有效处理非线性和非平稳数据、消除噪声的时频分析方法。本文试图分别用EMD和小波分析与具有极强符号回归分析能力的多细胞基因表达式编程算法(MC_GEP)进行融合建模预测降水数据,提出基于EMD和MC_GEP的降水预测算法EMGEP2RP和基于小波分析和MC_GEP的降水预测算法WTGEPRP,对降水数据先经过时频分析后再进行GEP建模预测,以提高降水预测模型的有效性和精度。本文主要的研究工作:(1)首先提出了基于MC_GEP和EMD的降水建模预测算法EMGEP2RP。用EMD方法,依据数据信号自身的极值特征尺度作为度量,将原本复杂的、难以挖掘规律的数据信号自适应的分解成多个平稳、易于观察的分量之和的形式,再分别通过MC_GEP滑动窗口建模拟合预测,用郑州、南宁、澳大利亚墨尔本三组真实的降水数据进行模拟实验,以RMSE和MAE作为评价指标,结果表明:EMGEP2RP算法拟合和预测的效果比SVM、MC_GEP、BP、GEP都好,算法的预测精度有所提高。(2)其次提出了基于MC_GEP和小波分析结合的降水预测算法WTGEPRP。小波分析是对数据的时间——尺度分析的一种有效方法,其具有窗口面积大小不会改变,时间、频率窗可以改变的特点,能将原始降雨数据分解成更小频率之和的形式,便于更为细微地观察信号。同样以郑州、南宁、澳大利亚墨尔本三组降水数据作为模拟实验的数据,在四组不同小波基的所有分解层数下分别进行实验,结果表明:当WTGEPRP选择恰当的小波基和分解层数时,拟合和预测RMSE和MAE评价指标明显小于EMGEP2RP算法,拟合和预测效果更好、预测精度更高。