论文部分内容阅读
空间co-location模式代表一组空间特征,它们的实例在空间中频繁的关联。空间co-location模式挖掘研究是空间数据挖掘的一个重要方向,目前有大量关于确定数据的co-location模式挖掘的研究,但是针对不确定数据的空间co-location模式挖掘研究工作仍出于起步阶段。不确定数据在现实场景中处处存在,并且确定空间数据的co-location挖掘算法不能适用到不确定数据,因此不确定数据的空间co-location模式挖掘研究意义重大。本文主要研究不确定空间数据下top-k概率频繁co-location模式的挖掘以及数据库实现,内容如下: 首先分析了研究现状,概括了co-location模式挖掘研究的内容及成果,介绍了不确定数据的知识以及空间co-location模式挖掘的相关定义。 其次,介绍了可能世界、top-k概率频繁模式以及矩阵方法,分析了矩阵的特点,并对此方法进行优化,设计了一种索引方式求参与度,改进了矩阵的构造,提出Matrixblock、Matrix两种剪枝方法,达到一次判断,批量剪枝可能世界的效果,同时设计了一种网格圈定求表实例的方法。 第三点:设计了一个关于top-k概率频繁co-location模式挖掘的后台数据库原型系统,详细介绍了表的设计和主要存储过程的实现。 第四点:通过对合成数据和真实数据进行实验,验证了优化算法的高效性,分析了各个参数以及数据集分布对算法性能的影响,同时得出了数据库实现系统的优缺点。 最后对本文工作做了简要总结,指出了不足以及未来的研究方向。