论文部分内容阅读
棉花是重要的经济作物和全球战略物资,准确、及时地获取棉花种植的空间分布信息对棉花种植管理及棉花产业的可持续发展具有重要意义。遥感技术以其覆盖范围广、动态更新快等优势被广泛应用于作物种植区识别与分类研究。然而,已有的棉花种植区遥感识别研究主要基于监督分类方法,单一分类器的精度因研究区和使用的数据不同而存在差异,没有一种分类器能够在所有情况下都获得最优表现,且监督分类方法对样本数据的依赖性较高,在一定程度上限制了其在大区域棉花分布制图中的应用。鉴于此,本文基于棉花生长季的Sentinel-2多光谱(Multispectral Instrument,MSI)和Sentinel-1合成孔径雷达(Synthetic Aperture Radar,SAR)影像,分别从三个方面开展了棉花种植区识别方法研究:提出基于客观赋权法集成多分类器的集成学习算法以提高棉花与其他作物的分类精度;构建棉花制图指数以降低识别过程对样本数据的依赖;提出基于指数和自动阈值法的棉花种植区识别方法以提高棉花识别的自动化能力。本文为大区域棉花遥感识别提供了方法参考,主要研究内容和结论如下:(1)针对可获取样本数据的情况,提出了基于客观赋权法集成多分类器的集成学习算法对棉花与其他作物进行分类。以K最邻近法、支持向量机、随机森林、BP神经网络和一维卷积神经网络为基分类器,基于Sentinel-2 MSI影像计算时序归一化植被指数作为基分类器的输入特征。对熵值法和变异系数法进行改进,并结合组合赋权法对五个基分类器进行加权集成。结果表明,利用改进的赋权方法确定基分类器的权重获得的分类精度高于利用原始赋权方法,并且基于组合赋权法对改进的熵值法和改进的变异系数法进行组合获得的分类精度略高于基于单一赋权方法获得的分类精度。与基分类器相比,基于F1-score和归一化组合赋权法构建的集成学习算法在美国阿肯色州、佐治亚州和得克萨斯州的三个研究区的分类总体精度分别提高了1.12%~6.45%、0.75%~3.98%和0.45%~2.70%。与传统众数投票、概率融合和精度加权方法相比,本文提出的集成学习算法同时考虑了基分类器的精度差异与稳定性。(2)针对缺乏样本数据的情况,结合光谱和SAR特征构建了棉花制图指数(Cotton Mapping Index,CMI)用于棉花种植区识别。基于Sentinel-2 MSI和Sentinel-1 SAR影像对棉花和非棉花作物的光谱和SAR特征进行分析,发现在NDVI峰值时期,棉花在红边1和红边2波段的反射率高于非棉花作物,在红光波段的光谱角以及VV极化后向散射系数的绝对值低于非棉花作物。考虑到区域作物物候差异的影响,基于上述特征结合多时相遥感影像和自适应窗口构建了CMI,进而结合经验阈值法识别棉花种植区域。结果表明,在美国阿肯色州、密西西比州、佐治亚州和得克萨斯州的四个研究区的总体精度高于81.20%,在我国新疆研究区提取的棉花面积与统计数据的平均相对误差为26.69%。与监督分类方法相比,该指数的优势在于对样本数据的依赖性较低,不需要训练样本即可进行棉花种植区识别。结合光谱和SAR特征构建的CMI在棉花种植区识别中的精度高于仅利用光谱特征构建的指数。此外,CMI在棉花种植区早期识别中也具有一定的潜力,提高了棉花分布制图的时效性。(3)针对基于CMI的制图结果中棉花错分误差较高且错分区域主要为花生种植区的问题,利用Sentinel-2 MSI影像的近红外波段和两个短波红外波段构成的光谱角构建了棉花花生差异指数(Cotton and Peanuts Difference Index,CPDI),进而提出了基于CMI、CPDI和自动阈值法的棉花种植区识别方法。在美国阿肯色州、密西西比州、佐治亚州、得克萨斯州、阿拉巴马州和亚利桑那州的六个研究区的实验结果表明,对于有大量花生种植的区域,与仅利用CMI相比,结合CMI和CPDI识别棉花种植区降低了错分误差,提高了棉花识别的总体精度。空间阈值法通过灰度共生矩阵考虑了数据的空间分布关系,在CMI和CPDI阈值确定中的总体表现优于最大类间方差法、最大熵阈值法和三角形阈值法。与经验阈值法相比,该方法不需要结合参考数据确定阈值,可根据不同区域数据的分布特征进行阈值计算,进一步提高了棉花种植区识别的自动化能力。基于CMI和CPDI结合空间阈值法对我国山东、印度、巴基斯坦和乌兹别克斯坦研究区进行棉花分布制图,提取的棉花面积与统计数据的相关性较高。