论文部分内容阅读
高分辨率遥感影像的获取随着国内外高分辨率遥感卫星的陆续发射也变得越来越容易。面对海量的高分辨率遥感影像,如何快速、自动识别地物成为了研究热点。由于遥感影像的分辨率不断提高,传统的“基于像素”和“面向对象”的识别方法只能对地物类别进行解译,无法描述高层次的场景语义信息。因此,当前研究的热门问题成为了对遥感影像进行场景层面的理解。基于场景识别任务的目的在于准确地识别出各类地物的语义类别,而这些语义类别是由人工定义好的。基于特征编码的方法通过提取场景的底层特征进行分类,因具有较好的性能和易实现性,已经被大量的应用于场景识别中。如何将底层特征和高层特征相联系来解决“语义鸿沟”问题成了该方法需要解决的一个根本问题。本文沿着视觉词包模型再到主题模型的路线展开相关的研究,将场景的底层特征进行词包表达,再进一步映射到主题表达。本文的主要研究内容和创新点包括以下几点:1.将文本分析中的词包模型引入到遥感影像中,对场景进行特征表达,实现了对“语义鸿沟”的跨越。考虑到遥感影像的空间特性和尺度特征,将基于空间金字塔表示的多尺度词包模型用于场景的特征表达中。通过实验证明,该方法对特征的表达能力优于经典的词包模型和基于空间金字塔的词包模型。2.在多尺度词包模型的基础上,提出了基于多尺度词包表达的hLDA模型。通过对多尺度词包模型中的视觉单词分布进行统计,发现隐藏的主题信息与人的认知结果相同,总是先根据影像的特征属性粗糙的分类,随后再进一步细分。所以本文将多尺度特征引入到hLDA模型中,作为模型层次结构建立的先验知识,利用人工建立主题与类别间的关系进行地物识别。3.利用GF1-PMS影像数据,结合茶园自身的特点,以场景为基本单元提取茶园。为了验证hLDA模型在茶园识别上的有效性,本研究同时比较了基于MS_BOVW模型的茶园识别。通过相关实验验证了将主题模型方法用于茶园识别的效性。由实验结果可知,与只利用底层视觉特征的MS_BOVW模型相比,hLDA模型能够把基于底层视觉特征的分析转化到高层语义信息上,得到更高的分类精度。