论文部分内容阅读
随着空间科学技术的发展,空间数据对于社会经济发展的重要性已经逐步得到普遍的认同,这也加快了获取和应用空间数据的步伐,空间数据正在以指数方式急速增加。空间数据包含着海量的信息,从中分析出这些信息所隐含的知识,并将这些知识反作用于现有的数据,可以得到新的信息和知识。可见,空间数据效用的发挥除了数据本身的数量和质量的增长外,更多的有赖于数据分析方法的有效性和实用性。空间统计分析正是处理和分析空间数据信息的有效方式。而本文的创新点在于将空间加权主成分分析方法应用于基于遥感图像的环境快速评价中,是对原有空间统计学研究领域的有益补充。
多元统计分析主要用于数据分类和综合评价。空间信息涉及了大量相互关联的自然和社会要素,空间信息中许多变量通常都是相互关联的,就可以按这些关联关系进行数学处理来统计分析和简化空间信息。主成分分析是多元统计分析方法的一种,它通过数理统计分析,将众多要素的信息压缩表达为若干具有代表性的合成变量,这克服了变量选择时的冗余和相关。主成分分析用于图像处理的基础是样本的协方差和相关系数矩阵,因为它们可以表现出多波段图像之间的内部联系。主成分变换是在空间数据统计特征基础上进行的一种多维正交线性变换,用来处理空间数据中的遥感数据时,主要应用于遥感影像光谱增强,进行数据压缩,以较少的几个相互线性无关的主成分代替多波段遥感信息,减少数据冗余,并降低影像解译的不确定性。
主成分分析方法中建立的相关系数矩阵测算了多波段图像之间的内部关系,但在把该矩阵运用于空间数据处理的过程中时,没有考虑到图元的空间关系以及图像过滤和分类的所需的基本属性信息,因此,可以对相应的相关系数的定义进行改进。成秋明教授提出了用空间加权方法来建立相关系数矩阵。空间加权主成分分析方法根据与每个样品(像素)的位置相关的其他能显示像素的相对重要性的特征确定空间加权相关系数。具体而言,空间加权因子根据像素的空间相对位置或者相对重要程度赋值,即每个像素都可以根据一个变量的值来进行加权。加权的变量可以是邻近程度的估算值,或者是其他可以用来估算加权的因子。在计算相关系数矩阵时,运用空间加权方法可以根据与每个样品的位置相关的其他能显示像素的相对重要性的特征定义一个模糊加权蒙版,用这个空间加权蒙版再与需要处理的空间数据来计算相关系数矩阵。与普通的主成分分析相比,空间加权主成分分析方法考虑到了空间数据的每个样品空间位置特征。类似的加权方案也可以运用于其他的多元统计方法,包括回归、聚类、判别等等。
在本文研究中,Wij是定义模糊加权蒙版的值的模糊隶属函数,取值范围在0≤Wij≤1,当某个空间位置上的空间特征属性信息不重要时,这个位置上的加权值被赋为0,即Wij=0;当某个空间位置上的空间特征属性信息是非常重要的信息时,这个位置上的加权值被赋为1,也就是在这个位置的Wij=1。当0<Wij<1时,Wij的值在0和1之间,此时需要根据空间位置特征来对权值进行赋值,当空间位置的属性特征越次要,W的赋值就越接近0来表示该像素越次要,当空间位置的属性特征越重要,Wij的赋值就越接近1来表示该像素越重要。因此,具有空间特征属性信息的像素可以用空间加权因子W进行量化。
本文中探讨的用基于GIS空间分析模块构建空间加权蒙版图层的方法通过插值方法来生成,插值方法使用的多幂次反距离加权插值法和克里格空间插值法。基于加权因子生成空间加权蒙版图层的流程如下:首先通过样点数据获得样品数据的空间属性和空间位置、以空间位置的属性特征信息作为加权因子用空间加权插值方法进行插值生一个成栅格图像。将该栅格图像以同一种色系显示,图像内某点的空间属性特征信息越重要,其所在点的像素值也越大,当空间属性特征信息越次要时,其所在点的像素值也越小。再将这个栅格图像的像素值进行转换使它的值在0到1之间的范围内,转换过程中保留了栅格图像的高值和低值之间的差别,从而通过这种转换,生成了值范围在0到1之间的空间加权蒙版图层。转换后所生成的空间加权蒙版图层里,当某点的空间属性特征信息越重要,其所在点的像素值就越接近1,当某点的空间位属性特征信息越次要,其所在点的像素值就越接近于0值。因此,空间位置的属性特征信息可以用这个空间加权蒙版图层来进行量化,也就是说,通过这种方法所生成的空间加权蒙版图层可以看作是以空间位置的属性特征信息做为权重的蒙版图层,这个空间加权蒙版图层可以用来对需要处理的空间数据进行加权运算。
本文通过IDL语言编程实现了空间加权主成分分析方法,实现了改造相关系数计算公式的程序,并进一步实现了计算加权相关系数矩阵的程序。并通过北京密云水库北部土壤Cr含量的估测案例分析对程序进行了验证和评述。本文案例的研究区位于北京市东北区域的密云县境内,密云水库的左上方。密云县北部地区的土壤Cr含量普遍比其他地区要高,尤其是在密云水库北部地区Cr异常,其含量达到背景值的2倍以上。由于该地区土壤环境质量对于北京市生活用水的水质有较大关系,因此,本文收集了研究区的样本数据,用来对研究区的土壤Cr含量进行空间统计分析。本文案例的空间数据以遥感Landsat7号卫星拍摄的北京地区ETM数据为基础,首先在数据预处理的过程中将研究区的遥感数据剪切出来,并且以研究区的土壤Cr含量为基础,通过不同幂次的反距离加权插值法和克里格空间插值生成栅格图像。将该栅格图像以同一种色系显示时,图像内某点的土壤重金属Cr含量值越高,其所在点的像素值也越大,当土壤重金属Cr含量值越低时,其所在点的像素值也越小,因此通过这种方法生成的栅格图层可用来生成空间加权蒙版图层。还需要对其进行波段运算,使该栅格图像像素值位于0和1之间的数值。通过波段运算后的空间加权蒙版图层中,当某点的土壤重金属Cr含量值越高,其所在点的像素值就越接近1,当土壤重金属Cr含量值越低时,其所在点的像素值就越接近于0值。因此,土壤重金属Cr含量可以用这个空间加权蒙版图层来进行量化,也就是说,通过这种方法所生成的空间加权蒙版图层可以看作是用土壤重金属Cr含量做为权重的蒙版图层,这个空间z加权蒙版图层可以用来对研究区遥感数据进行加权运算。
在实例研究中同时加载研究区图像和空间加权蒙版图层图像,用土壤Cr含量多幂次反距离加权插值法和克里格方法插值生成的空间加权蒙版层,对研究区的6个波段图像分别进行主成分加权运算。通过比较对研究区遥感图像各波段多幂次反距离加权、克里格方法加权主成分分析和原始相关系数的运算结果得出的结论是,以土壤Cr含量为加权因子分别以多幂次反距离法和克里格方法插值构建空间加权蒙版,对研究区遥感图像分别多种加权方法主成分分析,这6种加权方法都能够改变各遥感波段图像之间的相关系数值,由此可以改变由相关系数得出的特征值和特征向量,进而改变各个主成分的载荷值。对遥感图像进行加权主成分分析与普通的图层叠加是不一样的,将土壤Cr含量8次方反距离加权主成分得分与普通主成分得分相减得到加权主成分得分差异图,通过对第3、1、2加权主成分得分差异图的RGB彩色合成图像进行分析,图中的紫红色图案可以显示出土壤Cr含量加权主成分分析后的变化信息,紫红色图案即研究区域中土壤Cr含量较高区域,从而可以对研究区环境进行快速评价。本文案例中的研究区遥感图像使用多幂次反距离法和克里格方法加权主成分分析的结果相同之处在于,相对于普通主成分分析的加载值,多种加权主成分分析方法的结果中第1主成分对波段2、波段3和波段7的加载值有所增加,第3主成分对第7波段的加载值有所增加,说明用土壤Cr含量进行加权主成分分析后,增加了波段2、波段3对第1主成分的影响力,增加了第7波段对第1主成分和第3主成分的影响,这3个波段的波长范围分别是0.52~0.60μm、0.63~0.69μm和2.08~2.35μm,符合0.5~1.0μm和2.2μm附近波段属于估算土壤重金属元素含量的最佳波段的前人研究结论。随着反距离幂次的增加,加权主成分分析的第3主成分对波段5的加载值的绝对值递减,而对波段7的加载值的绝对值递增,说明反距离幂次越大,加权主成分分析的效果越好。通过本案例研究验证了使用ETM+数据来估测土壤Cr污染的可行性和空间加权方法用作改进传统空间统计分析方法的有效性。从一个更宽广的视角看,通过使用空间加权方法对传统空间统计分析方法加以改进,会使分析结果的主题特征信息得以增强。相对于使用传统空间统计分析方法的产生的结果,通过使用空间加权方法改进传统空间统计分析方法后产生的结果特征更加明显,有利于后续的信息分析提取研究。
因此,用样品的分布位置及其属性信息来构建加权蒙版层,并进行空间加权主成分变换,可以应用于研究区内各类型空间数据的处理,能够增强样品对空间信息获取的影响。这种方法适用于在空间数据的处理过程中,用已知的空间数据特征来构建加权蒙版层,构建蒙版层的方法可以是以某种特征数据(如地形地貌特征,用途特征等)进行不同幂次的反距离插值或者克里格插值等方法。用这种方法构建的加权蒙版层来对需要处理的空间数据进行加权主成分变换,可以拉伸需处理的空间数据的特征区域值,因此可以更好地显示特征区域,以便于对特征信息进行信息提取和数据分析。可见,将空间加权方法应用在GIS和统计学中,可以利用空间加权因子直接考虑样品的空间位置特征,根据空间数据变量的值给每一个样品加权。本文通过集成GIS和空间统计分析技术,将空间加权主成分分析方法应用于基于遥感图像的环境快速评价中,是对原有空间统计学研究领域的有益补充。同时,空间加权方法作为一种相对通用的思路,在对空间统计学其他方法的改进中可以得到更广阔的应用。