论文部分内容阅读
空间co-location模式挖掘目前面临着许多挑战,主要包括:第一,空间数据中存在大量的不确定性和模糊性,如“商场人很多”,“他很高”等等。第二,空间邻近关系的距离阈值难以准确设定,距离阈值的微小变化对频繁模式的数量和质量都有极大的影响。第三,空间数据的大数据量,使得频繁模式的数量非常庞大。第四,传统的空间co-location模式挖掘算法的大部分时间都用于生成co-location模式的表实例。为了解决以上问题,本文研究了基于云理论的空间极大co-location模式挖掘。 首先,分析了国内外研究现状和空间co-location模式挖掘面临的挑战。 其次,设计了高效的度数法求解最大团,并在合成数据集和DIMACS基准图上通过实验验证了算法的完整性、正确性和高效性。 第三,改进度数法求解空间特征极大团,并引入极大频繁模式代替所有的频繁模式,设计了空间极大co-location模式挖掘算法,并在“云南三江并流自然保护区”数据集上通过实验验证了算法的正确性和高效性。 第四,在空间极大co-location模式挖掘算法的基础上,采用云理论处理空间数据中存在的不确定性和模糊性,并引入新的空间邻近关系概念缩小距离阈值对频繁模式数量和质量的影响,设计了基于云理论的空间极大co-location模式挖掘算法,并在重金属污染浓度数据集上通过实验验证了算法的优势。 最后简要地总结了本文的研究工作及未来可扩展的研究方向。