论文部分内容阅读
密度有偏采样技术是针对不一致数据集提出的一种采样技术,现有密度有偏采样方法在寻找聚类时容易受异常点的影响而产生错误的聚类。基于这一缺陷,提出了一种新的密度有偏采样——DOSP,在寻找聚类时,该算法可以利用密度有偏采样存在的空间划分,在计算子空间密度的同时搜寻异常子空间,并屏蔽对异常子空间的采样,从而有效地消除异常点的影响。实验证明该算法不仅有效地消除了异常点的干扰,而且在高噪声情况下,算法的计算代价明显降低。