离群度相关论文
聚类分析是数据挖掘中的重要研究内容之一,其主要任务是将数据对象根据某种相似准则划分成多个簇,同一个簇中的对象之间具有较高的......
近年来,互联网的高速发展和广泛应用使人类进入了真正的大数据时代,我们每时每刻都在产生海量数据。然而由于数据来源的多样性和复......
论文分为两部分,第一部分讨论了总体峰度的统计意义,给出了样本峰度的最大值;第二部分讨论了不同情况下weibull分布参数的极大似然估......
基于密度的聚类是聚类算法中的一种,其主要优点是可以发现任意形状的簇,对噪声不敏感.而现有的该类算法对于空间数据分布不均匀的......
峰度通常被认为是衡量一个分布尾重的量,一些作者认为峰度是衡量分布在均值附近尖峰度的量。设已有总体样本X1,…,Xa,样本峰度记为Kn......
设X=(x1…,xn)(x1,…,xn不全相等)是来自某总体容量为n的简单样本。本文证明了样本峰度kn(X)的最大值为n-2+1/n-1。该结论支持了作者关于峰......
针对Mohemmed等新近提出的基于粒子群优化(PSO)算法的离群点检测方法(MOHEMMED A,ZHANGM,BROWNE W.Particle swarm optimisation f......
在基于近邻思想的离群点检测算法中,参数k的选择是无法避免的,而k值过大或者过小都会对检测效果产生很大的影响.因此,如何选择k值......
针对电信欠费挖掘主题,结合电信欠费数据非平衡的特点,重点研究了缺失与离群数据对分类结果的影响,从而提出了一个面向电信欠费挖......
近年来,科学技术发展越来越快,信息知识的传播也更加广泛,数据挖掘这门技术在各方面得到了推广。数据挖掘为了在大规模的、不确定......
针对快速超球体聚类的离群点检测算法只能定性地判断数据点是否为离群点,导致离群点的检测精度和召回率较低的问题,提出一种基于采......
近年来,数据挖掘作为海量数据中知识提取的有效手段,已广泛应用于电信领域,如话费欺诈分析、客户细分、客户流失预测、交叉销售等......
文本聚类在很多领域都有广泛应用,而聚类算法作为文本聚类的核心直接决定了聚类的效果和效率。结合基于划分的聚类算法和基于密度......