论文部分内容阅读
草地作为全球最常见的植被类型之一,在维护全球生态安全、防止沙漠化及涵养水源等方面具有十分重要的作用。准确获取草地空间分布信息不仅具有十分重要的生态环境意义,还有助于相应保护管理政策的制定。传统的草地覆被信息监测方法主要采用野外采样法,该方法耗时,耗力,效能低且成本高,受到许多人为因素的限制,并且不能快速检测大范围的草地覆被信息。遥感监测技术近几十年来发展迅速,在全球植被信息获取方面发挥着重大作用。当前基于遥感影像的大区域土地覆被信息提取研究中,通常存在相同时相的遥感影像获取困难,不同时相的遥感影像因拍摄时的不同角度、照明以及物候时相等因素的影响产生明显的色彩差异,训练样本获取难度大,相邻影像重叠区域冗余信息处理困难等问题。因此,对于覆盖多景遥感影像的大范围区域,如何实现草地覆被信息的高精度提取,仍然有待探索。其一,相邻影像间重叠区域的地理空间具有一致性,地物类型一般不会随着时间推移发生很大改变。将重叠区域影像对象作为附加样本自动选择的有效区域,可有效利用重叠区域冗余信息,并减少样本选取工作量。其二,迁移学习方法中的联合分布自适应(Joint Distribution Adaptation,JDA)和平衡分布自适应(Balanced Distribution Adaptation,BDA)的领域自适应方法可通过数据特征之间的变换,削弱不同数据域间的差异。采用迁移学习方法平衡遥感影像间存在的时相差异,可削弱因时相差异引起的影像数据特征变化程度。其三,借助机器学习分类器算法完成遥感影像信息提取可大大提高其自动化水平,选择分类能力强的分类器算法对信息提取结果影响较大。研究立足以上三点,本文提出了一种基于影像重叠区域特征迁移机器学习的大区域草地信息自动提取算法,实现了甘肃祁连山保护区草地植被分布的高精度提取。本文以甘肃祁连山自然保护区草地植被分布为例,以Sentinel-2影像数据为主,30m数字高程模型数据为辅。通过卫星遥感影像重叠区域选取不同比例标记样本对分类精度影响实验、迁移学习方法对分类精度影响实验、4种分类器算法对比实验、甘肃祁连山自然保护区草地覆被信息提取实验和5种分类策略对比实验进行对比分析,得到如下结论:(1)本文基于影像重叠区域特征迁移机器学习的大区域草地自动提取算法,能够有效、高精度提取甘肃祁连山自然保护区的草地覆被信息,在一定程度上满足了大区域遥感影像的专题信息提取需求。文中以1景影像分类,迁移学习模型平衡影像时相差异,自适应完成重叠区域信息迁移,拓展完成了12景目标影像分类。研究区平均总体分类精度达到92.59%,平均卡帕系数达到0.84。实验结果论证了本文所提方法可有效实现大区域范围少训练样本的甘肃祁连山自然保护区的草地覆被信息提取。(2)通过选取不同比例的重叠区域标记样本与源训练样本混合完成草地覆被信息提取对比实验,发现随着影像重叠区域标记样本量的增加,草地覆被信息的提取精度先迅速提高,再趋于稳定或有略微下降趋势。当重叠区域标记样本所占比例达到10%时,研究区草地信息提取的平均总体精度最高。(3)通过2种迁移学习方法对分类精度的影响实验,可以发现BDA模型对分类精度的有效性要高于JDA模型。本文所使用的BDA迁移学习方法可有效削弱因时相差异引起的影像数据特征分布差异。(4)通过4种分类器算法对比实验,BP神经网络作为源分类器的平均总体精度和卡帕系数最高,泛化能力最强,其总体精度、卡帕系数达到92.59%、0.84。随机森林和支持向量机次之,其总体精度、卡帕系数分别达到91.61%、0.82和90.34%、0.78。决策树的泛化能力最差,其总体精度、卡帕系数达到87.28%、0.74。(5)本文方法既利用影像的重叠区域信息,又采用迁移学习方法。为了验证两者对草地信息提取的有效性,本文采用5种分类策略进行研究区草地信息提取对比试验。试验结果表明,融合影像重叠区域信息和进行迁移学习均能提高草地提取精度,融合重叠区域信息对提取精度的促进作用要高于迁移学习,同时融合影像重叠区域信息和进行迁移学习对草地信息提取精度有效性最高。本文方法取得的分类精度略优于监督分类,且具有显著减少大区域遥感信息提取过程中训练样本选取的潜力,可有效提升遥感专题信息提取的自动化水平。