论文部分内容阅读
GML(Geography Markup Language)是一种用于描述现实世界中地理对象的标识语言。基于World Wide Web Consortium(W3C)提出的更宽泛的。Internet标准,GML以一种可以在互联网上共享的方式表达地理信息。
聚类分析是数据挖掘领域一个非常活跃的研究课题,在国内外得到了广泛关注,被应用到诸多的领域中,如市场研究预测、模式识别、模式分析和异常检测等。目前大多数空间聚类算法主要是针对关系数据,并且没有考虑空间拓扑关系的相似性。为此,本文对基于拓扑关系的GML空间面对象聚类算法作了较深入的研究,取得了如下一些成果:
1.提出了两种基于点面包含关系的GML,空间面对象聚类算法SCGML_IR、SCGML_IR*。两个算法将GML,文档中点面空间对象的包含关系作为空间对象相似性度量准则,用CLOPE算法对空间面对象进行聚类。SCGML,IR*算法在SCGML_IR的基础上,采用空间包含索引机制来提高空间包含关系的求解效率。实验结果表明,算法SCGML_IR和SCGML_IR*能实现GML数据的空间聚类,具有较高的效率。
2.提出了一种基于线面包含关系的GML,空间面对象聚类算法SCGML_LRI。算法将GML文档中线面空间对象的包含关系作为空间对象相似性度量准则,并用CLOPE算法对空间面对象进行聚类。实验结果表明,算法SCGML_LRI能实现GML数据的空间聚类,具有较高的效率。
3.提出了一种基于拓扑关系的GML空间面对象聚类算法SPCTR_GML。与前两种算法相比,该算法考虑了面对象的包含、相交、相邻三种拓扑关系,以面对象为中心,引入网格的思想进行空间对象间拓扑关系的计算,获得各个面对象与点、线、面等空间对象间的包含、相交、相邻关系,以此作为空间对象相似度计算方法,用ROCK算法进行聚类。实验结果表明算法SPCTR_GML是有效可行的。