论文部分内容阅读
空间离群检测能够帮助人们发现潜在的、有趣的空间数据模式,并把它用于未来演变趋势的分析研究。在许多实际情况下,这些不寻常的空间离群事件往往具有出乎意料的研究价值,因此空间离群检测被广泛应用于城市的人口普查研究、气候异常检测、传感器异常检测、卫星图像检测等重要领域。 空间离群对象既可以是离群单点,也可以是离群区域,目前主要的空间离群检测算法将二者孤立出来,区别地对待和研究,然而能够同时检测空间离群单点与空间离群区域的研究成果还相对较少。空间对象受到空间自相关与空间异质性的影响,空间近邻关系的对待在很大程度上决定了算法的准确性。本文在研究分析现有离群检测算法的基础上,针对空间离群检测的关键问题和已有算法的不足,提出了两个基于图的空间离群检测算法。研究工作主要包括: ①研究了离群检测的基础技术框架,系统地分析和对比了传统离群检测算法的基本原理,并介绍了离群检测领域中的研究热点; ②全面分析研究了空间数据所具有的特性,对常见的空间近邻关系表达方法进行了阐述与比较;分别概述了空间单点检测算法与空间区域检测算法; ③利用WDNN(Weighted Delaunay Nearest Neighbor)图的构造原理,提出了一种基于裁边策略的空间离群检测算法,采用基于二部图最短边的空间离群因子,通过反复裁去―最大边‖来实现空间离群单点和离群区域二者之间的并发查找,隔离了―坏邻居‖对正常数据的干扰,有效避免了经典算法中常出现的错误检测问题; ④在裁边算法的基础上,提出了一种基于MST(Minimum Spanning Tree)分割策略的改进算法,利用MST的优良性质,最大程度地简化了WDNN图,减少了原图中等待裁边的数量和相关图搜索次数,降低了检测算法的时间规模,达到对空间离群快速检测的目的; 论文中使用来自于国家统计局的真实数据集和一组人工数据集来进行实验,直观地展示了本文算法的检测过程与检测结果;通过算法实验结果与实际情况的分析对比,验证了本文算法在空间离群单点与离群区域检测上的有效性,并具有稳健性强的优点。