论文部分内容阅读
图像序列数据是现实世界中一类极为重要的数据,而且往往维度较高,数据规模十分庞大。目前图像序列预测被用于自动驾驶领域,取得了不错的进展。在气象预报领域,随着观测设备革新和存储技术的发展,带动了对大量雷达回波图像数据处理需求的增长。传统的雷达回波外推和降雨量预测主要依靠光流外推和统计分析方法,尽管这些方法在大部分天气过程中取得了不错的效果,但都缺少对时间序列的建模能力,并且对快速变化的天气不能很好的反应,建立有效的表征模型用于气象领域的序列预测,成为一个很有挑战性的问题。近年来深度学习在序列建模方面的优势为该问题的解决带来了新思路。本课题针对气象领域的图像预测以及建立在其基础上的降雨量估计,开展了基于深度学习的气象预报模型及应用研究。针对传统光流法无法建模快速变化的非线性运动,以及近段时间提出的ConvLSTM方法对于长序列图像预测模糊,无法建模多峰分布的不足,提出了基于生成对抗GRU的图像序列预测模型。经过对气象领域图像数据背景知识的研究和业务实际需求进行深入调研,设计了解决该问题的模型。模型采用端到端的结构,主要包括两个网络,一个网络采用序列到序列的架构,用于生成序列预测图像,另一个网络根据真实图像对生成图像进行纠正,解决预测图像不够准确的问题,两个网络交替进行训练。最后在业务应用层面上将本文方法和目前业务中采用的方法进行对比,可以实现秒级实时图像序列预测,验证了该模型对大气运动规律的建模和特征的学习是有效的。对图像序列进行预测的最终目的是为了更好的预测强降雨,建立从图像到降雨量的回归模型。目前国内外解决这个问题均依靠统计和统计校正方法,建模能力较弱,对强降雨的预测往往很不理想,因此,本文提出了基于CNN、BiGRU、和C-BiGRU三种降雨回归模型,使用基于深度学习的特征抽取、基于手工抽取的特征和利用卷积神经网络学习到的特征作为循环神经网络的输入,结合两个模型的优点分别进行建模预测。对强降雨影响因素的分析和成因复杂性的考虑,对决定降雨的图像数据进行整理和数据集构建,同时也使用传统的机器学习方法如随机森林和XGBoost进行建模,最后对这些方法进行比较,验证了深度学习模型在非线性复杂系统的建模问题上有良好的表现。