论文部分内容阅读
本文的研究内容在于如何利用空间聚类方法,将人口和社会经济数据在属性数据空间和地理空间上的分布特征,利用GIS技术合理、有效、可视化地展现出来。
空间聚类不同于传统聚类方法,其目标是发现“属性相似,空间邻近”的地理实体集合。由于人口与社会经济数据大多来自于行政统计单元,在GIS中表示成面状数据,因此最直接的方法是采用面状数据的聚类方法,其好处是直观意义明显,指标处理简单。但行政统计单元越来越不能满足数据多源化、精度高的知识发现。为此本文引入了格网信息系统(或称格网系统)的思想,主张将GIS二维空间中的面状的行政统计单元用网格划分,将人口和社会经济数据分配到各个网格上,以网格作为存贮、分析统计数据的基本统计单元,并提出一种基于格网系统的聚类算法(DensityInformationGrid,DIG);最后,由于基于网格的聚类算法在参数设置上存在很强的主观性,提出一种对统计单元数据预先聚类的监督方法(SupervisedDIG),通过该方法可避免阈值设定的主观性问题,使得聚类结果能反映属性数据的分布特点。