论文部分内容阅读
云是大气中热力过程和动力过程的外部表现,同时也是水汽循环的重要环节。它在天空中表现出来的水汽状况、稳定程度以及高度和厚度,都是实时预测天气的关键性特征。因而对于人类的生产生活来说,云的实时观测有着重要意义。传统的地基云观测主要是依赖气象员的目视观测,这样不仅效率底下,而且严重依赖气象员的经验,很难做到实时性。近年来,随着数字图像采集设备的发展,国内外涌现了许多地基全天空云图像采集设备。越来越多的设备投入使用,数字地基全天空云图的数量和规模日益庞大。由于云图正确分类是一个庞大的工程,需要专业人员花费很多时间来完成,因此,自动高效的图像分类方法有着很强的应用需求。本文借鉴传统的基于内容的图像分类技术,结合词袋模型理论,研究数字地基全天空云图的特征表示以及分类建模方法。本文提出了基于微结构模型的云图分类方法。微结构云图是指对全天空云图像进行过采样取块并抽取其局部图像特征,对特征进行无监督聚类后形成视觉词典,从而映射为基础特征图。该方法将全天空云图像视为从图像块映射的微结构的集合而不再是传统的像素的集合。通过统计微结构的加权直方图作为图像的特征向量,最后使用支持向量机分类器重新识别云图像的类别。针对云图数据集标注样本少、图像分辨率大的特点,本文提出了两种深度网络结构和不同的训练方法。第一,根据深度学习理论及其实验表明,网络的第一层卷积层的滤波器模板主要是提取颜色特征和纹理特征,之后的特征看作是颜色纹理特征的更高级组合,因而通过迁移学习进行深度网络微调,训练出识别全天空云图的深度模型;第二,提出了一种无监督的自我学习与有监督的导向学习相结合的方法来解决标注样本少,图像分辨率大的分类任务。使用大量未标注数据的无监督自我学习过程可以起到数据降维和特征学习的作用,同时把大部分参数学习转移到无监督网络中,最后使用标注数据进行导向学习训练出识别全天空云图的深度模型。对于本文提出的方法,本文使用中国气象科学研究院和北京交通大学共同发布的全天空云图数据集。实验表明,基于微结构模型的分类方法和基于深度学习的分类方法分类准确率分别为90.9%和98.4%,比传统方法提升了 20%以上。