论文部分内容阅读
随着空间数据库的快速增长和广泛使用,如何从空间数据中自动地发现空间知识变得越来越重要。空间co-lOCation模式代表了一组空间对象,其空间实例在地理空间中频繁关联。当前挖掘空间co-location模式所遇到的困难在于,空间对象的实例分布在连续的空间中并拥有复杂的空间关系,大部分的计算时间需要用来计算co-location模式中的实例。
本文详细分析了co-location模式挖掘的实质和近年来提出的三种co-location模式挖掘算法,在此基础上提出了一种改进的无连接co-location模式挖掘算法。本改进算法在模式的生成上仍采用由频繁k-1项集生成候选k项集的类apriori算法,但在实例的生成上做了改进。算法采用改进CPI-tree树结构,提出基于映射的团实例生成算法,减少了团实例的生成时间。对改进co-location挖掘算法的时间复杂度和空间复杂度进行了仔细分析,并通过对模拟数据和真实数据的试验,表明新算法能够提高co-location模式挖掘的效率。
基于对各种挖掘算法的研究,开发了一个基于b/s结构的通用c0-location挖掘平台,通过此平台,可以查看原始数据的分布,提供交互的挖掘过程、比较不同算法的挖掘效率、可视化地展示挖掘结果。此平台的研究,将更有利于co-location挖掘算法在实际中的推广和应用。
最后为总结部分,在对本文主要内容作简要回顾的同时,还指出了当前挖掘co-location模式研究的未尽问题,并对未来的研究做出展望。