基于邻居关系的数据库异常点挖掘方法研究与实现

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:FSACN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据库存储技术、计算机科学技术和数据采集技术高速发展,数据库中都积累了大量的原始数据。所以,如何从大量的数据中快速并且准确的提取出有价值的信息是目前计算机科学领域的一个研究热点。数据挖掘就是提取有效知识的技术。因此,数据库异常点挖掘指的是从含有大量数据的数据库中,通过某些特殊方法来发现具有高价值的知识或信息的过程。主要进行了对数据点邻居关系进行了研究,研究了一种基于邻居关系的数据库异常点挖掘方法NLOF(Neighbor-Local Outlier Factor)。该方法与传统的基于密度的异常点挖掘方法相比,在精度与时间花费都有所改进。该方法主要的改进方面有以下几点:(1)提出一种基于邻居关系的网格山脊点过滤方法对数据进行预处理;(2)采用信息熵对数据进行维度简约和对属性进行权值化;(3)根据网格的邻居关系对数据点邻域查询进行优化,降低数据点找寻邻域的计算量。对方法进行了实验验证。实验采用了人工合成数据、葡萄酒质量数据集和UCI(University of California,Irvine)的成人数据。实验结果表明该方法相对于LOF(Local Outlier Factor)方法,其检验效率和精度都有所提高。
其他文献
撑竿跳高是田径运动中技术相当复杂的田赛项目,有着很强的技术性,良好的技术动作对取得优异的成绩起决定性作用。本文以第13届全运会预选赛和第13届全运会,女子决赛最高成绩,
随着人们对复杂网络研究的进一步深入,社区结构已经成为了研究的热点,人们认识到对社区结构的识别可以帮助我们更好的理解和使用复杂网络。近年来,在社区结构识别方面的研究
植物分类识别是重要的基础研究。它的分类识别有助于人们有效地理解植物。随着人工智能与机器视觉技术的发展,基于图像处理与机器学习的植物分类技术成为当前植物分类学的研
目的:探讨老年患者消化内科护理的安全隐患及其对策。方法:我院消化内科100例老年患者,2018年6月到2019年6月接受治疗,各50例随机选入对照组和试验组。对照组采用常规护理,试
本文从移动互联网迅速发展的背景切入,分析了未来互联网对移动性支持的迫切需求以及当前网络层移动性支持不佳的现状。学界和业界针对当前移动性支持不佳的根本原因,即IP地址
在智能制造为核心的工业4.0背景下,随着中国制造2025战略的深入,工业的自动化程度越来越高。其中手眼系统的普及给自动化生产的高效性提供了保障。双目立体视觉系统是手眼系
无线传感器网络(Wireless Sensor Networks,WSN)已经被广泛地应用到了生产生活之中,它一般由大量的传感器节点组成。传感器节点的能量来源一般是电池,这使得节能对于WSN来说
Android是开源系统,很多手机商对Android系统进行二次开发,Android的市场份额也越来越大,很多不法分子也由此发现可乘之机,开发了恶意的Android应用,获取不法利益。所以,为了
当今经济蓬勃发展,中国正处于难得的战略机遇期,工业企业发展十分迅速,税务部门税款入库的模式日益多样;随着企业税款待报解账户也日益增多,导致对账人员工作量越发繁重,传统
图像分类是计算机视觉里非常活跃并经典的研究领域,传统的图像分类难以适应人们生活日益增长的检索分类需求,细粒度图像分类逐渐获得了越来越多的关注。细粒度分类属于目标识