论文部分内容阅读
地理信息系统是一个针对解决复杂地理问题而设计并支持空间数据的采集、管理、处理、分析、建模和显示的计算机系统。空间数据挖掘是指从空间数据库中通过数据挖掘算法分析出隐含的、有价值的特征或信息的过程,是数据挖掘的一个重要分支。地理信息系统与空间数据挖掘的结合可以弥补各自的不足,使得双方的功能更加的强大,适用范围更加广泛。随着空间数据属性的不断膨胀,信息间存在大量的冗余,此时属性压缩就显得尤为重要。 本文首先介绍了地理信息系统与空间数据挖掘的概念、特点和功能等,然后具体的介绍了空间数据挖掘中有代表性的降维算法。在此基础上,本文开展了如下的研究工作: (1)提出一种新的基于正交函数系和FCM的时间序列聚类算法,首先通过一个非线性映射,将长度为n的时间序列映射到L2空间,然后通过计算函数之间的距离得到时间序列之间的相似度,最后经过FCM算法实现时间序列的聚类分析。 (2)通过近邻之间的加权处理改进了Isomap算法。改进后的Isomap算法使数据在降维的过程中更好的保持了近邻之间的关系特征。 在上述的理论基础上,通过五种具有代表性的、类型各异的数据集对算法的有效性和可行性进行验证。其中,基于正交函数系和FCM的聚类算法的实验结果表明,该方法在处理高维的时间序列压缩率达到90%的情况下,依然具有良好的聚类效果。改进的Isomap降维算法的实验结果说明,本文提出的算法使数据降维的同时可以更好的保持数据之间的拓扑关系。最后应用本文提出的聚类算法对气象数据进行挖掘,分析出辽宁省的气象要素时空分布规律特征。