论文部分内容阅读
空间聚类是空间数据挖掘的一项重要研究课题,空间聚类就是根据相似性对空间对象进行分组,使得每一个簇中的对象有非常高的相似度,而不同簇中的对象尽可能不同。空间聚类在地理信息系统、地理市场、导航、交通控制等方面都有广泛的应用。GML(geography mark-up language)是一种用于描述现实世界中地理对象的标识语言,利用GML,可以存储和发放各种特征的地理信息,控制地理信息在Web浏览器中的显示并且可以在Interact上畅通无阻的传输。目前,面向GML的空间聚类研究比较少,本文主要研究了面向GML空间线对象聚类算法,同时考虑了空间拓扑关系,取得了如下一些成果:
1.研究了GML中空间线对象的相交关系,提出了一种快速判断线对象相交的算法FJSLI,该算法首先求出两个线对象的外接矩形,然后根据两个外接矩形的相对位置,分三种情况来讨论。实验结果表明,快速判断线对象相交算法FJSLI比基本的线对象相交判断算法具有更高的执行效率。
2.提出了基于相交关系的GML空间线对象聚类算法SCIR,该算法首先计算出空间线对象的相交关系,然后针对空间线对象的相交关系和非空间属性,定义了一种相似度度量方法,最后利用ROCK算法的思想进行聚类。实验结果表明,算法SCIR能够实现GML数据中基于相交关系的空间线对象聚类,并具有较高的效率。
3.提出了一种基于相邻关系的GML空间线对象聚类算法SLCAR,该算法首先对GML进行预处理,发现空间线对象周围的相邻对象,定义了一种相似度度量方法来度量空间线对象在相邻关系上的相似度,并使用了层次聚类算法进行聚类。实验结果表明,算法SLCAR能够实现GML数据中基于相邻关系的空间线对象聚类,并具有较高的效率。
4.提出了基于拓扑关系的GML空间线对象聚类算法SLCTR,该算法同时考虑了空间线对象的相交关系和相邻关系,定义了一种相似度度量方法来度量空间线对象在相交关系和相邻关系上的相似度,并利用层次算法的思想进行聚类。实验结果表明,算法SLCTR能够实现GML数据中基于拓扑关系的空间线对象聚类,并具有较高的效率。