一种基于枢纽现象和加权离群分数的离群数据挖掘算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:jiaonimaqubao110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高维数据集中出现的枢纽现象,本文给出了一种基于枢纽现象和加权离群分数的离群数据挖掘算法.该算法首先根据逆k近邻中出现的枢纽现象,以及与离群数据的关系,利用k近邻中的距离信息作为权值,对逆k近邻的离群分数进行加权;其次随机生成区分度阈值,根据该阈值判断区分度比例满意值,并根据满意值计算数据对象的离群程度,选取离群程度最大的若干数据对象作为离群数据;最后采用人工数据集和UCI标准数据集,实验验证了该算法的有效性.
其他文献
2015年11月21日至2015年12月20日,国家计算机网络入侵防范中心发布漏洞总条目为450条,漏洞总数为上月的67.06% ,有所下降.其中威胁级别为“紧急”的有149条,“高”的有94条,
本文针对移动设备存储空间和计算能力有限的特点,在移动云平台下研发设计的一款基于局部复制的结构性文档协同编辑冲突消解算法,简称MCPS算法,在其基础上进行了冲突消解内容
前段时间顺路到珠海参观新生代虾农刘洋的养殖场,最大的感受并不是他的养殖场规模有多大,而是他的养虾哲学:懂得如何控制产量,懂得如何控制自己的贪欲.回来的路上我想起一句
期刊
Mean Shift算法是一种非参数估计方法,能够快速收敛到概率密度函数的模态,在图像处理领域已得到了广泛的应用。算法的带宽参数的选取会直接影响到收敛速度和收敛结果,而手动调试参数需花费大量的时间和资源。为解决这一问题,提出一种Mean Shift算法优化带宽自动搜索策略,采用Mean Shift算法对图像特征空间内的样本点进行聚类分析,以图像结构特征信息作为分割效果的评判准则,自动寻取优化带宽参
互联网技术飞速发展给人们带来便利的同时,网络上大量色情淫秽等不良信息极大地干扰了正常的网络生活。根据当今网络不良视频的特点,文中提出了一种基于MPEG-7颜色描述子与动态肤色检测技术相结合的视频过滤算法。该算法综合考虑视频的静态信息和动态信息,采用支持向量机(SVM)进行学习分类,综合两类特征得到最终结果。通过实验分析,该算法有效提高了分类准确率,在当今网络环境中有着广泛的应用前景。
星系团作为宇宙中大尺度结构的基本单元,是天文观测中需要提取的重要成分.由于宇宙其他强宇宙前景辐射的混叠,使得提取星系团辐射成为一个难题.文中使用基于FastICA和高斯滤
研究了具有外部扰动空间机器人系统的补偿控制问题。首先,给出了漂浮基空间机器人系统的动力学方程。进而借助于增广变量思想,针对系统存在有未知惯性参数及外部扰动的复杂情况,先后设计了空间机器人系统关节运动、末端爪手运动的增广自适应神经网络补偿控制方案。所提控制方案无需对载体的位置、线性速度和线性加速度进行实时地测量与反馈;且较比传统自适应控制方法,又不要求动力学方程满足关于系统惯性参数的线性函数关系,因
中国民航传统的空管不安全事件调查工作包括责任调查内容,涉及到过错界定及处罚事务,使调查工作在可靠性和准确性上存在明显的不足。为此,作者对空管不安全事件调查工作提出
我国的市政管道工程近几年发展迅速,但也带来了不少的质量通病。为了解决这些质量通病,我们需对管道工程的整个施工组织设计进行总结和归纳。并且严控整个施工管理过程,从而
对消防给水设备设计的主要问题进行了讨论,可为消防给水设备设计提供参考.