论文部分内容阅读
RCP(Rich Client Platform)是Eclipse插件开发的一种应用,改变了Java在桌面应用开发领域中的劣势地位,而uDig是基于Eclipse RCP开发的一款开源桌面GIS软件,可以在其基础上方便的进行GIS系统的二次开发。在开发GIS系统的过程中我们试图把聚类分析技术引入到GIS系统中,因此我们重点对聚类分析技术展开了研究。聚类分析是指将物理或抽象对象的集合,按照某种相似程度的度量,尽可能地使具有相同性质的对象归于同一类中,具有不同性质的对象归于不同的类中,最终把对象集合分组为多个类的分析过程。它是一种重要的人类行为,已广泛应用于数据挖掘、图像处理、计算机视觉、生物信息和文本分析中。本论文首先对RCP技术及当前流行的GIS开发框架uDig进行了简单介绍,然后对聚类技术所使用的算法进行了具体研究。本论文的工作重点是:第一部分是绪论部分,简要介绍了RCP技术的国内外研究现状。并重点综述了现有的聚类技术,分析了具有代表性的聚类算法。第二部分介绍了利用RCP技术及uDig开源框架所开发的GIS系统。第三部分提出了一种特征空间属性加权混合C均值模糊核聚类算法(WKFM)。该方法充分考虑了属性间的不平衡性,通过利用优化选取核参数的核函数把在原始空间中非线性可分的集群转化为高维空间中同质集群。在标准数据集上进行了聚类实验,实验结果证明WKFM算法能更好的发现集群的聚类中心,获得数据集质量更好的划分。第四部分提出了一种关系数据的中心权重模糊聚类算法(WMF)。该算法中给每一个属于这个类的对象赋予一个中心权重以此来表示其作为这个类的代表对象的可能性程度,这种机制使类中的多个对象来代表整个类而不是利用类中的一个对象来代表整个类。通过在标准数据集上进行的聚类实验证明,WMF算法能更好的发现数据集中潜在的内部结构及对象之间的关系,得到每个聚类结果更加准确的描述。第五部分提出了一种成对约束的属性加权半监督模糊核聚类算法(WHFCM)。该方法充分考虑了属性间的不平衡性,在传统模糊聚类算法中融合半监督学习机制并通过Mercer核把原始的观察空间映射到高维特征空间。由于WHFCM算法利用了约束条件,所以其获得了表现更优异的聚类效果。第六部分提出了一种面向GIS系统的高维数据双层聚类方法。在该方法中通过一个示例数据来演示聚类算法在GIS系统中的应用。