论文部分内容阅读
随着现代科技和数据获取设备的迅速发展,空间数据库的数量和大小日益丰富,使得空间数据挖掘和知识发现变得越来越重要。而在数据挖掘过程中,存在大量冗余数据影响我们的决策,Rough集理论在得到决策规则和分类方面是最有利的根据。它不但可以在不影响数据表达信息的前提下使原来的数据量大为减少(数据约简),而且还可以产生决策规则,从而挖掘出数据中的有效模式。其次,Rough集理论不同于其他处理不确定性问题的理论,如概率方法、模糊集方法等,它无需提供任何所需处理数据集合之外的先验信息。然而Rough集理论要求所处理的决策表中的值必须用离散数据表达,因此在使用Rough集理论对数据挖掘前必须先对数据进行离散化处理。本文首先介绍了数据挖掘,空间数据挖掘的意义、使用的主要方法、获得的知识类型和过程,接着又介绍了Rough集的基础知识,为随后的深入研究做铺垫。其次开始深入研究Rough集在数据挖掘过程的核心问题—属性约简,对目前基于Rough集的属性约简算法展开分析,并比较了各种算法的性能。本文提出一种FAE算法,用于在属性约简前进行优化属性的选择,并在此基础上又建立了一个基于Rough集分析的分类器模型—FAERS模型,通过实验证明了这个算法的分类效果很好。而针对Rough集在挖掘一般决策表的最简规则或者所有规则是一个NP-hard问题,本文又引入蚁群算法,提出一种新的属性约间算法—ACR算法,将蚁群算法用于在对寻找约简属性的过程中指导搜索的方向,通过具体的例子证明了这个算法的有效性。随后,本文又介绍了云理论的相关知识,并具体研究一种基于云模型的离散化算法。在前面理论研究的基础上,本文提出一种基于GIS的空间数据挖掘原型系统,并通过具体的例子说明该系统的运行步骤。最后,在总结本文研究成果和不足之处的基础上阐述了空间数据挖掘的前景。