论文部分内容阅读
本文从地理信息系统(GIS)的角度研究空间聚类挖掘算法,将空间数据两个重要特征(空间拓扑特性、空间多尺度特征)与可视化交互技术融入挖掘过程中,从空间邻接关系、多尺度两个点切入,初步研究空间聚类挖掘原理与方法。主要的研究内容和结果如下:
1)阐述了空间数据结构、空间数据挖掘和空间聚类挖掘的相关理论和概念,并对现有的空间聚类挖掘算法做了系统分析与研究。
2)讨论了空间数据预处理及相关可视化技术,并结合实例给出了建立空间多维立方体与进行在线联机分析处理(OLAP)的方法。
3)研究了基于空间邻接关系的空间聚类挖掘算法VSG-CLUST。该算法是一种基于图分割的可视化空间聚类算法。其基本原理是利用Delaunay三角网与MST(最小生成树)两种图论工具将地理实体的邻接信息(空间相邻关系)加入并参与到空间聚类中,以维护聚类对象的基本空间结构特征,引导聚类过程得到既保证类内对象在属性上的相似性,又保证其在空间上邻接的聚集簇。算法的可行性与有效性得到验证。
4)研究了利用多尺度的空间概念层次关系进行空间聚类挖掘的算法。认为空间层次特征本质上是空间数据多尺度性质的表现,考虑尺度维条件下的空间聚类算法可将尺度因素作为一种约束条件施加于VSG-CLUST算法中MST的分割和修剪策略,即一种基于尺度因素约束的空间层次聚类挖掘算法。
5)最后,在上述理论研究和算法实现的基础上,给出了课题小组成员共同实现的一个基于WebServices技术的数据挖掘系统Hsminer,并给出了一个应用实例。该实例是对福建省环境质量监测数据集利用本人实现并集成到系统中的基于邻接关系的空间聚类挖掘算法进行聚类挖掘。