基于近邻差波动和图标签传播的离群点检测算法

来源 :燕山大学 | 被引量 : 0次 | 上传用户:Lucy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点检测技术是数据挖掘领域的一个重要研究分支,其在入侵检测、欺诈检测和医疗卫生检测等领域发挥着重要的作用。近年来,国内外学者提出了众多离群点检测方法,但是这些方法都存在着各种缺陷,在很多数据集上存在检测精度不佳的问题,因此本文针对现阶段的离群点检测方法存在的问题进行研究,提出了新的离群点检测方法。首先,针对基于近邻关系的离群点检测方法存在边界区域点检测精确度不高和内部点计算耗时的问题,提出了一种基于近邻差波动因子的离群点检测新方法。该方法依据离群点的相互近邻点数远小于k近邻点数这一特点,给出了一种基于近邻关系的剪枝方法;定义近邻差的概念来刻画数据对象与其邻居点的分布特征,在变化的参数k下,离群点和内部点的近邻差的变化不同,采用近邻差波动衡量每个数据点的离群程度,进而检测出离群点;并对所提算法进行正确性和时间复杂度的分析。其次,针对基于图标签传播的离群点检测算法存在只能检测聚类离群点和参数k难以确定等问题,提出了一种基于局部信息图标签传播的离群点检测新方法。算法依据相互近邻关系,设计了一种自适应参数k值的计算方法;利用参数k和近邻关系构建局部近邻图,生成局部相似性矩阵和转移概率矩阵,再循环标记每个数据点,对每个数据点进行有限次的标签传播,离群点和内部点标签传播收敛速度不同,统计每个点的收敛值差;将数据点的收敛值差和相互近邻个数相结合作为离群因子,刻画数据对象的离群程度,进而检测到离群点;并分析了所提算法的正确性和时间复杂度。最后,以精确率、召回率和AUC值为评价指标,在人工数据集和真实数据集上对所提算法和其它几种算法进行实验对比,验证了本文所提算法的有效性。
其他文献
近年来,随着脑肿瘤疾病发病率和死亡人数持续上升,脑肿瘤疾病对人类的生命健康已经造成严重的危害,医生依靠个人经验来对脑肿瘤MRI图像进行诊断和分析,不仅效率较低还会导致人为的主观误判,因此提高计算机辅助手段对脑肿瘤诊断的效率和精确度成为脑肿瘤辅助诊断的研究热点之一。本文通过深度学习方法来进行脑肿瘤分类和分割算法的研究,构建有效的辅助诊断手段。具体工作如下:首先,针对传统方法中脑肿瘤分类效率低且由于数
学位
环境热能是一种自然环境中无处不在的、可再生的绿色能源。水伏效应是通过纳米材料与水作用将水中能量直接转化为电能的现象。近些年,研究发现基于纳米材料制备的水伏发电机可将环境热能转化为电能,特别是由自然水蒸发作为驱动力的水伏纳米发电机已被证明具有巨大的发展潜力。利用纳米材料制备水蒸发驱动的纳米发电机,大多是采用纳米材料直接堆叠构成纳米发电机。这种制备方式使得发电机中的纳米材料之间结合力不强,发电机的机械
学位
<正>近年来,石家庄市以机构改革为契机,选优配强督查队伍,创新创优督查方式,注重运用督查成果,推动督查工作从全覆盖向高质量发展,实现了“1+1>2”的效果。整合机构编制,明确职责分工,实现督查工作全覆盖。为有效解决“重复督查、多头督办、效率低下”等突出问题,石家庄市将原市委督查室与市政府督查室两个部门进行整编合并,成立市委市政府督查室。根据督查工作点多面广的特点,
期刊
图像去模糊是一个经典的计算机视觉问题,其目的是从模糊图像中复原出相应的清晰图像。图像去模糊方法根据模糊核信息是否已知,可以分为图像盲去模糊和图像非盲去模糊,本文针对图像盲去模糊问题并结合深度学习,搭建了三个深度网络进行图像去模糊,具体研究内容如下:首先,设计了一种基于注意力机制的多尺度动态场景盲去模糊方法。由于多尺度信息能有效地提升图像去模糊的性能,因此设计了一个“多输入-多输出”的多尺度网络结构
学位
白光二极管(WLED)具有亮度高,功耗低和无污染等特点,已成为照明和显示等领域的重要光源。因此,如何进一步提高发光效率和改善发光特性,是目前WLED研究的核心问题,吸引了学者和商家的极大关注。本文中,主要设计和制备了分别发射红光和绿光的纳米荧光粉,重点讨论了发光特性和自制WLED发光性能。具体工作包括:首先,采用高温固相法制备了LiY1-xO2:xEu3+和KY1-yO2:yTb3+两个系列的纳米
学位
神经元突触可塑性是神经科学中记忆形成和认知功能的基础,人脑的诸多高级认知功能都和神经元的突触可塑性有关。另外太赫兹波辐射越来越广泛地应用于生物医学领域。因此本文将太赫兹波和神经生物学结合起来,从场电位信号角度入手探讨太赫兹辐射对神经元突触可塑性的调控作用。首先,针对太赫兹调控神经元突触可塑性的可靠性问题,提出了太赫兹调控神经元突触可塑性的研究方案并搭建了太赫兹调控神经元的电生理实验平台。通过对太赫
学位
日新月异的无线通信技术不仅给科技发展带来了无限可能,也为人们的生产生活添姿加彩。多输入多输出(Multiple-Input Multiple-Output,MIMO)技术作为新一代无线通信系统的核心技术之一,它充分利用了空间维度使得系统获得更高的可靠性和频谱利用率;然而,MIMO系统存在系统复杂、实际操作困难等问题。空间调制(Spatial Modulation,SM)技术针对MIMO的缺陷,扬长
学位
近年来,通过数字游戏对空间认知能力进行训练和测试逐渐成为国内外认知科学领域研究的热点。但是目前大多数对于空间认知能力的训练方式较为简单,对于融合了脑机接口交互范式的空间认知训练系统的相关研究较少。为了在已有的空间认知训练系统基础上深层次提升训练效果,本文引入认知负荷的理念,设计了融合脑机接口与虚拟小车的空间认知训练系统,通过深入分析受试者训练前后的脑电信号来评估训练系统的有效性,并在此基础上研究了
学位
冠状动脉疾病是最常见的心血管疾病,并且是世界上最常见的死亡原因之一。X射线冠状动脉血管造影术是用于诊断和治疗冠状动脉疾病的主要成像技术。从冠状动脉造影图像中分割血管和检测狭窄血管可以帮助医生精确的诊断疾病。目前,虽然研究人员已经提出了许多方法,但是准确的冠脉血管分割和狭窄血管检测仍然是一个挑战。在此背景下,本文做出了以下研究。首先,建立了冠脉造影图像数据库。搜集了来自真实病例的冠脉造影数据,脱敏处
学位
本文创新性地提出一种理解传播的新观念——传播的记录观,尝试突出和强调传播的时间维度。记录可理解为信息与信息生产者的剥离,与时间相关,在传播中扮演了更为重要的角色。传播技术的进步,很大程度上是记录技术而不是传递技术的进步。记录是传播的基础,没有记录就没有传播。无论是传播的传递观还是仪式观,人们对传播的记录功能都没有给予足够的重视。从记录视角来理解传播,可以综合体现传播的技术和文化特征,特别是对理解以
期刊