论文部分内容阅读
改革开放以来,国家集中精力进行经济建设,工业化进程急速加快,但是,与此同时带来了十分严重的环境污染。其中空气污染是近些年来人们最为关注的,尤其是近几年的雾霾十分严重。由于雾霾对人们的呼吸系统产生很大伤害,但是以人们现在的科技水平还无法根治空气污染,所以对空气质量进行预测变得非常重要,尤其是对空气质量的细粒度预测。本文首先采用了训练速度快,泛化性能好的ELM(Extreme Learning Machine,极限学习机)作为基础进行研究。但是ELM对于函数的拟合能力比深度学习差很多。所以为了进一步提升预测精度,很多学者使用CNN,RNN等深度学习模型对空气质量进行预测,但是由于这些模型无法将输入和输出同时作为序列处理,所以精度较差。为了充分利用序列信息,本文基于Seq2Seq(Sequence-to-Sequence,序列到序列)模型对空气质量预测进行了研究。(1)为了让ELM进行细粒度的预测,本文在其基础上本文提出了GBELM(Gradient Boosting Extreme Learning Machine,梯度提升极限学习机)。GBELM主要针对其激活函数和随机确定输入层和隐藏层权值所带来的不稳定进行了改进。对于激活函数,采用ReLU(Rectified Linear Unit,修正线性单元)和softplus进行代替,同时还试验了RBF(Radius Basis Function)核函数对其的影响。对于不稳定的问题,采用梯度提升算法对其集成,稳定其输出并提高预测精度。实验表明,softplus和ReLU都可以为ELM带来明显的提升,但是RBF函数无法使得ELM对空气质量的预测精度有很大的提升,同时应用梯度提升算法使得ELM的性能获得了进一步的提升。(2)本文针对Seq2Seq训练速度慢和误差积累的问题提出了n-step AAQP模型。对于训练速度慢的问题,使用全连接层和位置编码代替了RNN作为编码器。原始的解码器采取递归预测的方式获取结果,会导致误差积累较大,为了减少其误差积累,解码过程采用n-step递归预测。实验证明,用全连接层和位置编码代替RNN后,预测精度能够接近甚至超过Seq2Seq。另外,n-step递归预测减少了解码时间步,有效的减弱了误差积累,同时大幅提升了训练速度。最后,通过对两个模型的对比,改进后的Seq2Seq的预测精度更高,而且对于突然的变化,GBELM不能将其很好的拟合出来,但是改进后的Seq2Seq能够更好地拟合出空气质量的突发变化。