论文部分内容阅读
当今社会经济处于高速发展状态,这得益于大量的工业生产带来的经济效应。但工业生产伴随着空气污染物的排放,使得空气质量遭到了严重的破坏,这将会对人们的身心健康造成严重的危害,因此空气质量预测具有重要的现实意义。本文对9个区域城市监测站点在2013年-2018年间的空气质量数据和气象预报数据进行系统的分析,发现多个站点之间污染物PM2.5数值的变化存在着相互影响的关系,污染物浓度的变化受空间特征的影响;另外,PM2.5浓度的变化受其它污染物浓度及气象因素的影响,它们随着时间的推移表现出周期性变化,反映了空气质量数据及气象因素存在着时间序列问题,它们有着长期依赖的特征关系。针对以往特征提取的方法中,采用了卷积神经网络单尺度卷积核的方法或人工选择的方法进行特征提取,这样的策略存在误差大、效率低、精度不高等问题。本文提出了基于卷积神经网络多尺度卷积核(MSCNN)和LSTM网络的PM2.5预测模型(MSCNN-LSTM)。为了得到更精确的预测结果,对MSCNN-LSTM预测模型进一步优化,结合遗传算法(GA)全局寻优精确的特点,提出MSCNN-GALSTM预测模型。具体主要研究内容如下:1)针对传统卷积神经网络(CNN)采用相同尺寸的卷积核进行特征提取时会在一定程度上使网络达到瓶颈状态,使得特征提取结果并不是那么理想。本文采用多尺度卷积核(MSCNN)进行特征提取,将多尺度特征进行拼接融合,进而提取到层次更深及范围更全面的特征,使得网络有更强的泛化能力。另外,在空气质量数据特征提取过程中,将多站点多特征的空气质量数据做简单变化,形成多站点单特征的并列一维特征图。然后,将变化后的并列一维特征图经过多尺度卷积操作得到空气质量数据的时空特征,最后将它们进行拼接融合,得到多站点多特征的时空特征关系。2)结合LSTM网络能有效处理时间序列问题的能力,提出MSCNN-LSTM预测模型。具体地,MSCNN-LSTM预测模型把MSCNN中提取的时空特征输入至LSTM网络,以此来挖掘空气质量数据长期依赖的特征关系。然后,将LSTM网络的输出结果接入全连接神经网络得到目标站点PM2.5浓度的预测结果。3)针对MSCNN-LSTM预测模型中LSTM网络参数难以训练的问题,提出以遗传算法(GA)优化LSTM网络参数的新模型(MSCNN-GALSTM)。准确来说,MSCNN-GALSTM模型能够通过GA寻找到最优参数,将模型的预测准确率进一步提升。实验结果表明,本文提出的MSCNN-LSTM、MSCNN-GALSTM预测模型相比于两个对比预测模型在三种评价指标上取得了更优异的表现,验证了MSCNN-LSTM、MSCNN-GALSTM预测模型在PM2.5浓度预测上有更好的发展潜能。