基于图的空间离群检测算法分析与研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:einsun222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间离群检测能够帮助人们发现潜在的、有趣的空间数据模式,并把它用于未来演变趋势的分析研究。在许多实际情况下,这些不寻常的空间离群事件往往具有出乎意料的研究价值,因此空间离群检测被广泛应用于城市的人口普查研究、气候异常检测、传感器异常检测、卫星图像检测等重要领域。  空间离群对象既可以是离群单点,也可以是离群区域,目前主要的空间离群检测算法将二者孤立出来,区别地对待和研究,然而能够同时检测空间离群单点与空间离群区域的研究成果还相对较少。空间对象受到空间自相关与空间异质性的影响,空间近邻关系的对待在很大程度上决定了算法的准确性。本文在研究分析现有离群检测算法的基础上,针对空间离群检测的关键问题和已有算法的不足,提出了两个基于图的空间离群检测算法。研究工作主要包括:  ①研究了离群检测的基础技术框架,系统地分析和对比了传统离群检测算法的基本原理,并介绍了离群检测领域中的研究热点;  ②全面分析研究了空间数据所具有的特性,对常见的空间近邻关系表达方法进行了阐述与比较;分别概述了空间单点检测算法与空间区域检测算法;  ③利用WDNN(Weighted Delaunay Nearest Neighbor)图的构造原理,提出了一种基于裁边策略的空间离群检测算法,采用基于二部图最短边的空间离群因子,通过反复裁去―最大边‖来实现空间离群单点和离群区域二者之间的并发查找,隔离了―坏邻居‖对正常数据的干扰,有效避免了经典算法中常出现的错误检测问题;  ④在裁边算法的基础上,提出了一种基于MST(Minimum Spanning Tree)分割策略的改进算法,利用MST的优良性质,最大程度地简化了WDNN图,减少了原图中等待裁边的数量和相关图搜索次数,降低了检测算法的时间规模,达到对空间离群快速检测的目的;  论文中使用来自于国家统计局的真实数据集和一组人工数据集来进行实验,直观地展示了本文算法的检测过程与检测结果;通过算法实验结果与实际情况的分析对比,验证了本文算法在空间离群单点与离群区域检测上的有效性,并具有稳健性强的优点。
其他文献
无线传感器网络是集多种技术为一体的新型网络,有着广泛的应用和巨大的潜力,近年来也一直是国内外研究的热点。无线传感器网络的节点通常由电池供电,因此网络各层协议在设计时尽
3G移动通信网络作为移动通信技术的代表,能在广域范围内提供较好的漫游服务,但是它提供的数据传输速率以及网络带宽较小,费用较高。WLAN作为另一种常见的无线接入网络,能提供相对
纹理是自然界中物体表面呈现出的主要特征,是人类视觉信息的重要组成部分,对纹理的视觉感知是人类认识世界的重要方式。在研究领域,纹理作为一种图像模式的描述,是计算机视觉和模
虚拟植物是指利用计算机模拟植物在三维空间中的生长发育状况。随着计算机技术与植物学的发展,虚拟植物建模和可视化技术日益成熟,能够逼真地模拟植物生长变化及与环境的交互,并
随着信息化时代的到来,信息技术在人们的日常生活中得到了广泛应用,出现了各种信息系统,记录着用户的日常行为信息。在本文的研究内容中,从用户个人数据分析、用户间关联性度量和
图像数据的剧增是普通个人、家庭以及各组织机构共同面对的现状,对大量图像数据进行有效管理也是人们共同的需求。多数情况下,人们更愿意以语义的形式描述和管理图像数据,因此基
随着互联网的普及与广泛应用,越来越多的人在互联网上发表自己的主观言论,使得带观点的文本呈爆炸式增长。观点信息(也称情感信息)的收集与分析对个人、商业组织、国家政府等都有
目标定位与身份识别技术广泛应用于各个领域,由于目标种类多样,背景复杂多变,需要设计不同的目标定位与身份识别算法以适应不同的应用场合。基于视频流的目标定位与身份识别
无线传感器网络(Wireless Sensor Networks, WSNs)是由大量具有可通信、可传感、可控制、可数据处理的无线传感器节点,以自组织、自装配的方式所构建的网络。WSNs被广泛应用
软件项目估算包括项目工作量、开发时间和成本等内容。在软件项目开发过程中,项目估算一直是一个非常困难却极其重要的问题。一个准确的估算结果,有利于开发团队制定一个合理有