论文部分内容阅读
海冰是极地和中、高纬度地区经常发生的海洋灾害之一,它的冻结、融化和漂流会对沿海地区、海洋上的生产作业产生重大影响。当某些海域发生大面积海冰灾害时,会对近岸港口、沿岸海产品养殖、航海船只和海上资源开采平台造成巨大的损失。因此,为了快速准确地评估海冰冰情,及时预报海冰灾害,确保人身财产安全,海冰检测研究具有重要的意义。相对于传统的海冰检测方法,遥感海冰检测技术能够提供全天候、大面积、准确的海冰信息,已经被广泛应用到海冰检测和海冰预报的工作中。一般海冰检测的遥感数据主要有:SAR,MODIS,Landsat等遥感数据。SAR影像数据波段相对单一,所含信息量有限;因空间分辨率低,MODIS数据的特性无法细致地反映区域的情况;相比于SAR和MODIS数据,Landsat以及高光谱遥感数据的空间分辨率较高、光谱信息丰富,更适合用来区别不同的海冰类型。用于遥感技术的海冰检测方法可大致分为以下几种:非监督分类,监督分类及半监督分类。非监督分类是一种不需要先验知识的方法,分类精度较低;监督分类操作简单,利用先验知识检测精度较高,在海冰检测中具有一定的优势;不同于监督分类中完全依赖先验知识改进分类模型的特点,在半监督分类的过程中,标签样本和未标签样本共同训练分类模型,虽然未标签样本没有标签信息,但它们的空间分布特性及包含的丰富信息对分类模型的改进具有很大的作用。在实际中,因海冰覆盖区域地理环境复杂特殊,对大范围的海冰遥感图像进行标注是一项耗时费力、十分艰巨的工作。在只有少量标签样本的情况下,分类器会受到标签样本数量和质量的限制,导致分类器性能无法提高。然而,存在大量的未标签样本没有得到充分利用,这些未标签样本包含丰富的信息。针对这种情况,本文提出协同主动学习与半监督学习的方法用于海冰分类,并提出有效的采样策略选择信息含量较大的样本,加入到训练迭代过程,然后通过主动学习和半监督学习的协同验证机制建立一种有效的海冰分类模型。本文的主要研究内容如下:详细阐述了遥感图像的特点及分类原理,对于遥感海冰数据难以获取,数据光谱维度高等特点,介绍了适用于遥感海冰数据分类问题的方法——支持向量机(support vector machine,SVM),并介绍了SVM分类问题中将多类分类转化为二类分类的过程。针对海冰遥感数据标签样本难以获取的问题,分析使用主动学习方法来解决。描述了主动学习的原理和过程,不同的采样策略将会导致分类器不同的分类效果,介绍了基于不确定性准则与差异性准则的采样策略。本文利用BVSB(best versus second-best)、SOM(self-organizing map)神经网络和ECBD(enhanced clustering-based diversity)结合的主动学习采样策略,能够查询处于样本低密度区域具有丰富信息且在核空间中差异性较大的代表性样本,加入训练样本集,有效改善因标签训练样本较少而难以提高分类精度的问题。大量存在的未标签样本中含有丰富的空间信息,可以更好地刻画样本整体范围的空间分布特征。由于主动学习和半监督学习在减少人工标注代价和提高分类精度方面具有内在一致性,本文提出协同主动学习和半监督学习的CATSVM(Cooperative Active Learning and Transductive SVM)分类框架。一方面利用主动学习选择最有价值的样本加入到标签样本集参与训练;另一方面可以有效地利用大量未标签样本中包含的信息,并通过主动学习和半监督学习的协同验证机制对加入分类模型的伪标签进行验证,进一步提高伪标签样本的准确率,实现在较小标注成本的基础上获得较好的分类性能,达到较好的海冰分类效果。巴芬湾、渤海湾、辽东湾数据的实验结果分析表明,本文提出的CATSVM方法在减少标注成本的同时提升了分类模型的精度,该方法适用于多光谱及高光谱图像的海冰分类,验证了该方法的分类性能和鲁棒性。