论文部分内容阅读
高光谱遥感是目前遥感技术的前沿,其纳米级的光谱分辨率能够提供更加丰富的地物信息。随着高光谱遥感的在各个领域的深入研究,其广泛的应用价值备受到国内外的关注。
高光谱遥感数据具有数据量大,波谱覆盖范围广,分辨率高和数据冗余等特点。直接对获取的高光谱数据进行分析处理的效果不佳,Hughes现象表明,大量的高维数据会降低高光谱数据分类的准确性,因此有必要对高光谱遥感数据降维,将高光谱的原始的高维特征空间转化为保持原始特征空间的全局和局部结构的低维特征空间,提取最能反映其类别信息的新的高光谱数据特征。
目前,高光谱降维研究主要集中在监督信息和无监督信息的领域,主要的处理方法有特征选择和特征提取。特征选择是在保留原有光谱信息的情况下尽量减小高光谱的波段数目,通过提取的波段子集来代替原始数据集合。其过程就是利用光谱曲线样本的监督信息或者无监督信息来构造筛选波段的评估准则,结合搜索效率高的搜索算法,找出接近于全局最优的波段组合,特征选择方法一直在遥感的降维研究有着重要地位。特征提取是通过对高光谱原始数据特征进行组合变换产生的新特征,这些新特征保持原始数据的信息,并且其维数要远远小于原始特征。
本论文结合高光谱样本数据特点,将半监督降维方法应用到铀矿床高光谱降维实验中。目前获取的高光谱样本数据中,大部分是未标记类别信息的样本,只有少量的带有类标记的样本。因此考虑半监督降维的思想,将大量未标记的样本与少数未标记样本有效结合,使其提取的新特征更能够提高分类性能。本论文首先介绍了高光谱数据的读取和预处理,然后从特性选择和特征提取的两个方面,结合监督信息和无监督信息的评价准则,构建了高光谱降维的一般模型,在地物高光谱数据和高光谱遥感数据上进行了实验。然后分别实现了基于无类标号信息PCA降维方法和基于带类标号FDA的降维方法。这两种方法主要从类内离散度和类间离散度来度量优化标准。分析FDA的思想,可将PCA转换为仅有一个类别的FDA,那么两者的代价函数可以用同种方式表达,对于带标号和不带标号的数据可以利用加权线性结合,也就是基于半监督思想的SELF算法。SELF算法有效的结合了两类数据的特征,能利用较少的带类标记的商光谱遥感数据样本引导数据的降维。在铀矿床高光谱遥感图像选取了部分样本作为实验数据,与监督和无监督的降维算法做实验对比,贝叶斯分类器做评价标准。基于半监督的SELF算法在拥有30%的带类标记的样本时,就能达到监督算法的分类精度,并且其降维的维度要小于无监督的降维方法。实验研究表明半监督方法在保证精度的情况下,能够充分利用标记的样本信息。如果应用于实际,将大大减少一些人工实地探测开销,节省成本。