论文部分内容阅读
太湖蓝藻水华严重影响沿湖居民的生活,对蓝藻密度的提前预测十分重要。虽然目前已经建立了许多基于传统方法的蓝藻密度预测模型,但这些模型的预测精度仍有很大的改进空间。本研究区别于传统的蓝藻密度监测方法,采用深度学习和迁移学习方法,通过太湖水域中的环境变量对蓝藻密度进行建模,实现蓝藻密度的准确预测。本研究工作主要从以下三方面开展:1.基于深度学习的太湖蓝藻密度预测方法研究。该研究主要针对单个太湖蓝藻监测点,提出了一种深度学习模型—1D CNN-SLSTM-ATTE模型来预测蓝藻密度。在该模型建立过程中,进行相关性分析和小波变换的数据预处理,利用传统长短期记忆网络(Long-Short Term Memory,LSTM)模型进行改进,加入一维卷积神经网络(1D Convolutional Neural Networks,1D CNN)和注意力机制(Attention Mechanism,AM)并改进激活函数。通过与传统机器学习和深度学习算法方比较,本文提出的1D CNN-SLSTM-ATTE模型的预测结果更加准确。均方误差(Root Mean Square Error,RMSE)平均下降了272.21cell/ml,平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)平均下降了26.23%,平均绝对误差(Mean Absolute Error,MAE)平均下降了142.29cell/ml,纳什效率系数(Nash-Sutcliffe efficiency coefficient,NSE)平均上升了0.217。2.基于迁移学习的太湖蓝藻密度预测方法研究。该研究针对多个太湖蓝藻监测点,运用深度学习和迁移学习方法,通过建立一个大型可用数据集来预测多个目标的蓝藻密度趋势。基于该数据集,首先建立包含残差网络(Residual Network,Res Net)、门控循环单元(gated recurrent unit,GRU)和多头注意力机制(Multi-Head Attention)等深度学习算法的预训练蓝藻密度预测模型,然后将预训练模型获得和保留的知识转化为可用数据量小得多的目标系统蓝藻密度预测模型。为了体现迁移学习的优势,对比在没有进行迁移学习的情况下,利用目标系统本身的数据建立了相同结构的蓝藻密度预测模型精度。与基于传统的深度学习模型的迁移学习相比,采用本文研究的迁移学习模型后,对蓝藻预测的RMSE、MAPE、MAE分别下降了55.67、12.67%、30.71,NSE提高了0.126。3.基于卷积长短时记忆神经网络的蓝藻水华预测方法研究。该研究针对太湖多个湖湾水域的蓝藻密度监测,基于卷积长短记忆神经网络(Convolutional Long Short-Term Memory,Conv LSTM)与CNN算法,提出了蓝藻密度预测的深度学习模型CNN+Conv LSTM+CNN。遥感提取NDVI,结合监测点的环境变量数据进行训练,并与仅考虑时空特征的深度学习模型Conv LSTM和仅考虑空间特征的深度学习模型CNN以及仅考虑时间特征的深度学习模型LSTM、Bi LSTM和1D CNN+LSTM进行对比。测试结果表明,CNN+Conv LSTM+CNN模型最终使RMSE、MAPE、MAE分别下降了98.56、7.13%、74.59,NSE提高了0.33。