论文部分内容阅读
自然界中蕴含着丰富的资源,发生着错综复杂的现象,这些现象都和人们的生活息息相关,如气候变化、生物生态、社会人文、经济发展乃至军事设施等都产生了巨大的影响。而这些资源和现象又因地形地貌的不同而存在着明显的差异,只有准确、可靠、系统地获取自然界中的相关数据,才能把神秘的大自然数字化、透明化、信息化,才能制定出科学、合理、准确、因地制宜的经济发展、开发利用、环境保护、灾害预防、农田水利和土木工程等的开发规划。尤其对于复杂地貌区域,由于地表条件本身的复杂性,往往容易导致建模困难,这在很大程度上给许多相关研究增加了难度。因此,研究复杂地形条件下的坡位划分具有十分重要的现实意义。本文围绕着如何快速、高效地对复杂区域地貌类型进行模糊划分这一问题进行了相关的研究。首先分析了坡位划分的相关背景、研究现状、存在的问题以及随机森林算法的研究现状,介绍了坡位划分的相关理论。通过分析发现已有的模糊坡位划分算法存在数据量大,计算过程复杂,时间开销大,或模型设计过程中忽略了不同的地形因子对不同坡位的影响程度不同等问题,针对这些问题提出了总体的解决方案。在具体实现解决方案的过程中,提出了一种带有窗口机制的基于随机森林的模糊坡位划分算法。基于随机森林的模糊坡位划分算法主要基于(1)在进行坡位划分时,不同地形因子对不同坡位的影响程度不同以及(2)地形坡位的类别是一个相对的概念,随着空间中两位置点距离的增加,它们之间坡位类型影响程度反而会下降,甚至在距离足够远的情况下,这种影响度可以忽略不计。基于上述假设,本文首先结合专家知识提取研究区各坡位典型位置点集作为训练和验证数据集,利用随机森林算法分析地形因子与坡位之间的关系,计算不同地形因子对各类坡位的重要程度作为坡位划分的权重因子。其次,设置多个大小不等的窗口,针对每个给定大小的窗口,分别计算待划分位置点和典型位置点的距离,然后针对距离在设定窗口内的典型位置点求取它们之间的模糊地形要素。在综合待分类位置点和典型位置点的模糊地形要素的相似度时,通过加权因子原则计算综合相似度。这种坡位划分算法能够在考虑不同地形因子对坡位划分的影响度不同的基础上,提高分类的准确性并且在很大程度上减少程序的运行时间。最后以重庆市江津区永兴镇的一块区域为例,分别使用基于随机森林的模糊坡位划分算法、基于最小算子和均值的模糊推理模型在研究区进行试验,并在时间花费和分类精度上进行对比分析。实验表明本文提出的基于随机森林的模糊坡位划分算法无论是在运行时间上,还是在坡位划分的准确性上都有一定程度的改善。从而验证了基于随机森林的模糊坡位划分算法的有效性。通过比较分析不同窗口下的分类准确率,可知当窗口大小达到一定的程度后,无论是从Kappa系数值还是准确度上分类效果变化不再明显、趋于稳定,从而验证了本文的初始假设。最后,通过比较不同大小的窗口对分类准确性的影响,选出最佳的分类方案,在更大的研究区域区对算法的有效性进行验证,并通过ArcGIS平台绘制相应的坡位划分效果图。