论文部分内容阅读
随着信息技术和数据获取技术的发展,研究人员收集并保存了大量的与空间位置有关的历史数据。针对这些庞大的数据,人们迫切希望找到强有力的数据分析工具来挖掘空间数据中隐含的知识。空间聚类分析是强有力的数据分析工具之一,空间聚类分析可以发现隐藏在数据海洋中的聚类规则,又可与其他类型的数据挖掘问题结合,挖掘出更深层的知识。 本研究主要内容包括:⑴研究了聚类分析的基本理论,传统的和新近提出的空间聚类分析算法。⑵针对队列智能聚类算法的局部收敛和停滞问题,采用层次聚类算法对其解进行聚类,提高种群多样性从而提升聚类的质量。采用UCI机器学习库中的IRIS、CMC和Wine数据集进行测试,改进算法的F值(聚类准确率)优于k-means、k-medoid,表明改进算法聚类效果优良。⑶针对模糊k-modes聚类隶属度测度方法没有考虑对象空间分布的缺陷,将距离和密度双度量的测度方法引入模糊k-modes算法,从而以一种更加合理的方式更新对象的隶属度。采用UCI机器学习库中的vote、mushroom和zoo数据集进行测试,改进后算法的F值优于改进前的,表明改进算法聚类效果优良。最后将改进后的算法用于百度地图中收集来的空间数据进行聚类,得到了较好的聚类结果,表明了算法应用于空间数据的可行性和有效性。⑷采用包含经纬度信息的芬兰两城市移动电话GPS数据和上海公交车和的士的追踪GPS数据,用基于动态聚类的队列智能算法进行聚类分析,芬兰两城市的移动电话GPS数据聚类结果可以帮助当地移动运营商决策移动基站的放置位置;上海公交车的追踪GPS数据聚类结果可以帮助公交公司决策调度站的放置位置;的士GPS数据聚类结果可以帮助出租车公司决策分公司的位置。