论文部分内容阅读
随着国内外技术的发展,人类获取的影像空间分辨率以及数量都有了质的提升,高分影像具有丰富的光谱信息,空间纹理特征明显,同时包含有大量场景语义信息。实现高分影像复杂典型场景的准确高效自动识别,在很多领域上都具有非常重要的意义。场景的地物覆盖类别众多以及构成复杂,所以难以从大量的影像中直接获得感兴趣的场景信息,人工处理图像以获取信息显然是不可能的,目前关于场景分类识别的模型方法还比较少,对高分影像场景分类识别方法的研究更为鲜有。 针对上述问题,本文的工作主要是对影像场景分类与识别算法模型的研究,结合高分影像的新特性提出了基于注意力模型的神经网络影像场景分类与将Canny算子与Ratio算子结合的边缘识别方法,并将之运用到高分辨率遥感影像场景的分类识别实验中。基于注意力模型的神经网络影像场景分类模型包括五种网络,分别为:Glimpse网络,Recurrent网络,Emission网络,Context网络,Classification网络,模型以一个glimpse窗口为输入,利用网络的内部状态来选择下一个要关注的位置,同时在动态环境中产生控制信号。接下来,对在检测过程中会出现恒虚警特性的Ratio算子进行改进,改进后的Ratio算子使得影像更利于归一化处理,再采用Canny算子与改进后的Ratio算子组合进行边缘识别实验。 为了验证本文提出方法的有效性,实验首先对一典型的复杂场景图像UC-Merced数据集进行分类实验,我们的实验显示,RAM(Recurrent Attention Model)在处理对象越多,越杂乱的图像分类任务上,分类效果越能优于具有一定数量参数的卷积结构模型,并使用UC Merced21数据集将之前其他实验的分类精度与我们的方法得到的结果进行比较,方法的分类精度达到了98.23%,超过了已有传统方法和其他神经网络方法,在场景目标边缘检测识别试验中,将Canny算子与改进后的Ratio算子组合成新算子,能够准确描述原影像中的结构,同时在保持边缘连续性以及抑制噪声方面都取得了良好的效果。同时还将模型应用在通过无人机航拍得到的Harbin10类数据集上,分类精度同样达到了91.8%,证明了本模型可适用于不同分辨率不同场景的多种数据集,本文最后,使用哈尔滨无人机航拍影像数据,通过引入注意力模型的递归神经网络分类方法,对正常河流与污染水体场景进行分类,实验结果初步证明模型可以对黑臭水体场景进行准确区分,建立的判别模型具有普遍适用性,研究方案可以进一步应用及推广,模型可有效提升高分辨率影像的场景分类和目标识别任务的性能,并能对高分辨率影像的智能解译和复杂的语义计算提供借鉴和参考。