论文部分内容阅读
近年来遥感技术发展十分迅速,高光谱图像得到了广泛地研究与应用。图像分类是高光谱数据分析处理的一项基本内容。但是高光谱图像高维的数据特点、有限的带标签样本给数据分析和处理带来很大的困难,在分类过程中容易引起维数灾难。并且,获得有标签样本需要大量人力物力,传统的监督分类方法表现出了很大的局限性。因此,同时利用有标签样本和无标签样本来训练分类器的半监督方法成为高光谱图像分类研究的热点。半监督分类需要充分利用无标签样本所包含的光谱和空间信息来训练推广能力好、分类精度高的分类器。三重训练和自训练是两种常用的半监督分类算法。对于三重训练算法,在初始训练样本很少的情况下,所训练的三个分类器之间没有明显的差异性,这制约着算法分类精度的提高。对于传统自训练算法,在对无标签样本进行标记的过程中容易发生误标现象,导致算法性能下降。基于以上问题,本文在前人研究的基础上对高光谱图像半监督分类做了深入的研究与探索,分别对三重训练和自训练分类算法进行了改进。本文的主要工作如下:1、提出基于主动学习和差分进化算法的三重训练分类。在所提算法框架中首先通过主动学习算法选取一定量的最有价值的无标签样本,然后在训练每个分类器之前通过差分进化算法在所选取的无标签样本的基础上产生新样本。这些新产生的样本将被标记并与原来的有标签样本一起初始化分类器。实验结果表明,该方法可以充分地利用无标签样本,并且在有标签数据很少的情况下能够明显提高分类精度和运行效率。2、提出基于空间-光谱聚类的半监督分类。该方法首先通过Gabor滤波提取空间信息并将其与光谱信息结合,然后利用主动学习算法选取一定数目的最有价值的无标签样本作为可能加入训练集的候选样本。在对无标签样本进行标记的过程中借助了自训练过程,采用基于概率模型的支持向量机与聚类算法相结合的方式,并且在谱聚类中引入了空间几何信息。同时由于支持向量机的概率输出形式可以提供任一像元属于某一类别的概率,算法通过设置一个概率阈值将基于概率模型的支持向量机与聚类算法结合,来标记无标签样本。仿真结果表明,所提出的算法可以对无标签样本进行有效的标记,并且可以获得较高的分类精度和Kappa系数。在所提出的算法中,主动学习的利用有效地降低了对无标签样本的标记成本,提高了算法的运行效率;差分进化算法的利用,不仅丰富了训练集合,也使三重训练中初始化分类器的三个训练样本集有更明显的差异性;引入空间约束的谱聚类算法不再只依赖图像的光谱特征,使聚类结果更加精确;基于概率模型的支持向量机的使用,使得整个标记过程对于混合像元来说更加准确合理。