论文部分内容阅读
高分辨率对地观测遥感影像已经广泛应用于国防、农业、林业、海洋、国土和环境监测等众多方面。与中低分辨率遥感影像相比,高空间分辨率遥感影像具有丰富的形状、结构和纹理信息,基于传统的像素处理方式已经不能满足高空间分辨率遥感影像的处理需求。近十年发展起来的面向对象的图像分析已成为高空间分辨率遥感影像处理的主要方法,但是在面向对象的图像分析中,除了影像分割困难外,还面临如何准确描述与表达影像对象内容这一问题。从高空间分辨率遥感影像对象中提取的纹理和形状等影像特征的维数往往比较高,高维特征将影响分类器性能,因此特征选择是高空间分辨率遥感影像面向对象图像分析的一个重要研究内容。模式识别领域的特征选择方法常常评价特征对类别依赖性、类别之间的可分性以及特征之间相关性,但没有揭示数据特性之间潜在的相互影响。本文立足于特征选择方法中的过滤器模型,针对这一基础性的问题,度量数据特性并揭示数据特性间的相互影响。另外,紧紧围绕“面向高空间分辨率遥感影像对象的特征分析”,通过分析高空间分辨率遥感影像对象集的数据特性以解决面向该样本集监督/半监督分类中的不平衡问题。本文的主要研究内容分为以下两个方面:1.用可分性准则、依赖性准则和特征间相关性准则来度量相应的数据特性,并刻画数据特性间的潜在关系是本文的主要研究内容之一。2.在土地覆被/土地利用分类中,现有的研究利用核技巧处理高空间分辨率遥感影像对象组成的线性不可分的样本集,并忽略类别不平衡问题。这里,不平衡问题是指由偏斜分布引起的有些类别大小过大(称为大类)而有些类别大小过小(称为小类)的现象,它将导致分类器过于倾向大类。当标记样本充足时,从监督学习的角度研究样本集的内在可分性,降低线性不可分问题和类别不平衡问题对分类的影响。而当标记样本不足时,从半监督学习的角度充分利用未标记样本信息,研究样本集在偏斜分布下的内在可分性。本文主要的创新点概括如下:1.定义了不同类型的准则,解析地分析了它们之间的关联,以度量不同的数据特性并揭示其相互影响。首先假定样本及其属于各个类别的条件概率服从多元正态分布,然后给出三个准则:可分性、冗余性和特征对类别的依赖性准则,并利用多元线性回归方法建立不同准则之间的关联以描述数据特性间的相互影响。为了验证准则的有效性,采用朴素的搜索策略—特征排序—进行监督和半监督特征选择。在实际数据集上,原始准则产生了比经典特征选择方法(ReliefF和mRMR)差不多甚至更好的分类性能,表明了准则的应用价值。为了证实准则之间的关联,由一种准则及准则间关联的导出其它类型的准则。在服从正态分布的仿真数据集(artificial dataset)和实际数据集上,比较了原始准则与导出准则性能的一致性,证实了准则之间的关联。通过这些关联,间接地揭示了数据特性之间的相互影响。2.提出了基于图的可分性方法—局部赋权判别投影(locally weighted discriminating projection,简称为LWDP)。该方法基于流形思想从局部分析不平衡数据集,提出了一个泛化的目标函数作为准则,以处理数据集中可能存在的非线性结构;采用相异性而非传统的相似性(如热核)度量样本对之间关系,以更好地保持局部结构并减轻不平衡问题的影响;根据类别大小和局部类别分布,基于一致性假设提出邻域并的约束以限制近邻样本之间的关系,并把该约束引入权重矩阵以克服不平衡问题和潜在噪声的影响。在包含大类、中等类和小类的高分辨率航空遥感影像上,与经典准则和最新准则相比,LWDP提高了所有类别精度,尤其是小类的分类精度,减轻了类别不平衡问题、线性不可分问题和潜在的噪声的影响。3.提出了一种基于图的可分性方法—非对称局部判别选择(Asymmetrically Local Discriminant Selection, ALDS)。在只有少量标记样本时,ALDS引入关于类别大小比例的先验知识,针对性地设计了不对称的误分类代价函数,全面地分析了成对样本之间关系。这些技巧有助于在半监督学习中克服类别不平衡问题,准确评估特征保持几何性质和判别结构的能力,并增强泛化能力。在只包含大类和小类的高分辨率航空遥感影像和QuickBird影像上,通过与经典的和最新的特征选择方法对比,发现ALDS在提高总体精度的同时提高了小类精度,先验知识有助于改善分类结果,而且在偏斜度高样本集上改善得更多。