论文部分内容阅读
伴随着空间位置技术的快速发展和广泛应用,空间数据挖掘也成为数据挖掘领域的热点之一,而对空间频繁co-location模式的挖掘也成为空间数据挖掘中最为重要的研究方向。目前空间co-location模式挖掘已经取得了相当多的研究成果,但是这些研究成果都基于实例平等的思想,并不能解决所有的实际应用问题,同时,由于空间数据的海量性、复杂性,导致人们从空间数据中挖掘出感兴趣的知识的方式越来越少,因此,对空间数据挖掘的深入研究,会给人类的生产、生活带来巨大的益处。在确定数据集和不确定数据集上的数据挖掘研究日趋成熟,但是在空间数据上的研究成果,大多数是基于理想化的空间数据,而忽略了现实生活中存在的各种约束条件,例如:空间中可能会存在障碍区域、可能会存在时间约束等等。本文针对实际应用中频繁出现的两种情况:时间约束和无需用户预先设定阈值,进行了深入的研究,所以本文具有很重要的实际应用价值。第一、本文阐述了co-location模式挖掘的研究现状和取得的相关成果,同时简要的介绍了co-location模式挖掘的相关概念、挖掘方法和目前取得的相关研究成果,并对co-location挖掘的经典算法做了简要的介绍和分析。本文还对带有时间约束的co-location模式挖掘的相关概念和方法做了简要的介绍,并提出了时间约束下co-location模式挖掘面临的问题。第二、本文在时间约束下,对实例之间的邻近关系R进行了重新定义,即将时间约束和欧几里德距离联合起来定义邻近关系R,使其更符合实际意义。第三、本文在定义邻近关系R的基础上,将无阈值的概念引入到其中,使得数据挖掘更符合实际应用,即无需用户预先设定阈值就可以挖掘出自己感兴趣的模式。第四、本文给出了时间约束下无阈值的co-location模式挖掘的基本算法(TW算法),同时还提出了两个改进算法(TW-I算法和TW-V算法),以提高挖掘的效率。第五、本文利用合成数据和实际数据,对提出的基本算法和改进算法进行实验分析,并且在不同的参数下,将基本算法与改进算法进行了比对,发现改进算法更高效。第六、本文最后部分为总结和展望,主要是对全文做一个简要的总结,同时针对论文中存在的研究问题,做了相应的展望,希望在未来的工作中可以加以完善。