数据挖掘中孤立点检测算法的研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:fjfhmtv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量的数据集中提取隐含的、未知的、潜在有用的知识的过程,是数据库研究最活跃的领域之一。而孤立点检测是数据挖掘中的重要研究分支,其作用就是发现数据集中的“小模式”,即显著不同于其它数据的对象。经过近20年的发展,孤立点检测技术得到了广泛的应用。传统的孤立点检测算法存在一些难以克服的障碍,例如算法的参数难以选择造成检测结果不稳定,算法难以适应高维数据的特性等。本论文主要针对以上问题,对孤立点检测算法进行了研究。本文对当前的孤立点检测算法进行详细地研究比较,指出各自的适用范围和存在的不足,并在此基础上完成主要工作如下:本文在对基于单元的孤立点检测算法的详细研究分析的基础上,针对该算法中边界处孤立点的误判问题,提出用数据集边界阈值动态调整函数的方法来解决此问题,针对距离值D需要手动输入的问题,提出利用抽样平均距离来代替手动输入距离值D。改进后的算法不仅有效地减少了边界处孤立点的误判,还减少了参数的输入,提高了算法的自动化程度。针对传统孤立点检测算法对高维数据的适应性较差的情况,提出基于粗糙集的孤立点挖掘算法,为孤立点的定义和孤立点的挖掘提出一个新的方法,并用实验充分验证粗糙集理论在孤立点检测算法中的有效性。
其他文献
在时态数据库中时态数据的JOIN操作是一种能起到关键作用的操作,一方面是由于该操作本身代价比较高。设想两个大小为n的表进行JOIN操作,如果采用最简单的嵌套循环方式,这个代
近年来,无线传感器网络(Wireless Sensor Networks,WSNs)一直是热门的研究领域之一,相关的技术发展迅速,已经广泛应用于环境检测、智能家居以及安全防护等领域中。在无线传感
目标跟踪是目前的重点研究问题之一。近几年跟踪领域取得了很大的成果,虽然现在已经提出了很多方法,但是由于真实场景的复杂性,目标跟踪仍然是一个挑战。相关滤波模型是一种判别
人脸检测是人脸识别等技术的研究基础,随着计算机技术的发展,人脸检测已经成为一个独立的研究课题,并且已经开始广泛应用到全新人机界面、基于内容的检索、基于目标的视频压
混沌遗传算法是一种基于遗传算法和混沌算法的混合算法,不仅具有遗传算法的并行性、整体优化性的优点,还具有混沌算法的遍历性、初始值敏感性、可预测性、结构内部有序性的优
作为信息中心网络(Information Centric Networking,ICN)的研究热点之一,命名数据网络(Named Data Networking,NDN)的发展受到了越来越多的研究机构以及研究人员的关注。无论
随着P2P网络的发展,它在对等计算、协同工作、内容共享等领域都有非常广泛的应用。但是P2P应用的增加必将产生大量的数据请求和数据传送,而这会造成网络拥塞等一系列问题,进
农业模型是农业数字化建设的核心。农业模型研究与应用的不断深入与发展对农业模型的开发方式、复用质量和效率、模型管理等提出了更高的要求。随着基于组件的软件开发技术的
随着信息化的发展,公安部门积累了大量的历史数据,但对这些数据的分析利用程度较低.数据仓库的目的是建立一种体系化的数据存储环境,应用联机分析处理技术(OLAP)提取用户感兴
随着市场竞争越来越激烈以及计算机技术的发展,信息化已经成为各个产业的必然要求。企业商业活动中对信息的获取、加工、处理的要求越来越高,传统的操作型信息管理系统已经难