论文部分内容阅读
单类分类是指在只有一种类别样本的情况下,只通过这一类的样本训练分类器,再用训练出的分类器对未知类别的新样本进行类别的判断。在遥感影像分类问题中,当某种类别样样本无法获取或是相对于其他样本数量很少时,就会产生各类样本数不平衡的现象,传统的两类或多分类方法将不能很好的适应;或者当应用者只需要从图像中提取某种特定的类别时,标定大量非此类别的样本将花费额外的时间,这时就需要用单类分类器来解决分类问题。因此,研究单类分类器在遥感影像分类中的应用有着重大的意义。 本文首先对已有的单类分类方法做了总结和概述,并集中讨论几种典型的单类分类算法,将它们应用于实际的遥感影像进行比较分析实验。证明基于支撑域的单类分类方法OCSVM(one-classSVM)和基于密度的方法GDD均可以完成针对遥感影像的地物分类,而BSVM方法因考虑了更多样本的信息,能够得到更好的分类结果。得出结论,在单类分类问题中,加入未知类别样本的信息,可以提高分类效果。 接着引入利用目标类别样本和未知类别样本完成分类的PUL(positiveandunlabeledleaming)算法,此方法已成功应用于文档分类问题,但是还没有广泛应用于遥感图像的处理。PUL方法有着不需要人为设定参数的优点,文中在PUL算法基础上提出一种改进算法T-PUL,通过实验证明,PUL方法和T-PUL方法可以成功应用于LandsatTM遥感影像分类中,在只有目标类别样本和未标定类别样本的情况下,PUL方法和本文提出的T-PUL方法可以获得优于OC-SVM、BSVM(BiasedSVM)方法的分类效果,T-PUL方法在一定程度上又对PUL算法有所改进。这类算法的优势在于,在节省标定样本付出的时间和精力的同时,保证了分类精度。 鉴于PUL方法和T-PUL方法在遥感影像单类分类应用中的巨大潜力,本文接下来对PUL方法和T-PUL方法做进一步的研究,通过实验探讨训练样本数量、未标定类别样本组成结构、目标类别不同对PUL、T-PUL方法分类效果的影响。总的来说,更多的目标类别样本和包含更多非目标类别样本的未知类别样本更有助于获取高的分类精度,然而在分类过程中,如果想控制这样的样本结构,将需要花费更多时间来标定选择样本,所以实际应用时仍需要在分类精度和花费人力物力之间折衷选择。此外,样本量少时,T-PUL方法相对PUL方法的优势更为明显。可见,PUL方法、T-PUL方法在遥感影像的分类中有着广阔的应用前景。