论文部分内容阅读
灰霾是一种由大量干燥颗粒、灰尘、烟雾和大小混合均匀的浮尘漂浮在空气中,并且掩盖了清澈的天空的大气现象。灰霾的形成有两方面原因:一是不利的气象条件;二是大气颗粒物(特别是细颗粒物PM2.5)和气体污染物的增加。灰霾影响大气环境质量,影响气候和能见度,影响人体健康,尤其是细颗粒物(PM2.5)会分别沉积于上、下呼吸道和肺泡中,引起鼻炎、支气管炎等病症,长期处于这种环境还会诱发肺癌。 目前还没有一种标准的模型或者方法能够准确预测灰霾,本研究提出了一种新型的异质混合集成学习模型来预测灰霾——DIMMEC(DIversity-MarginMaximization Ensemble Classifier)模型。 论文的主要工作包括:第一,本实验首先对输入的14个因子与灰霾的相关度进行了计算,时间步、风速、CO、PM10、PM2.5、SO2、温度、湿度、能见度这9个因子与灰霾有较大的相关性,其他因子(O3、气压、NOx、NO2、NO)相关性较小。第二,采用随机子空间方法生成了子训练集,每个子训练集包含不同的特征空间。第三,选取容易陷入空间局部最小的决策树和神经网络这两种异质混合模型作为个体学习器,分析不同个数不同类型个体分类器组合,得到差异度最大的异质混合模型。第四,support vector machine在防止过度拟合、运算速度和预测精度方面都表现出明显的优势,因此用它对个体学习器产生的结果进行结论集成。 本研究采用的数据是济南市2011年1月、4月、7月和10月24小时气象和污染物排放数据。通过验证实验:DIMMEC在预测灰霾方面的准确率为88.86%,明显高于其他个体学习器。BP神经网络模型的准确率为83.3%; C4.5的准确率为86.6%;DecisionStump的准确率高为71.3%; REPTree的准确率为84.2%; Random Tree的准确率为81.9%; Random Forest的准确率为87%。通过实验结果,可以证明本研究所提出的DIMMEC异质混合集成学习模型在灰霾预测方面有着良好的稳定性和相当高的准确率,因此DIMMEC模型是一种可靠的模型。