论文部分内容阅读
大数据集没有非常有效的简化方法。提出一种基于小波聚类的数据预处理的算法DPWaveCluster,该算法包括量化特征空间、小波变换、聚类、形成查找表、映射数据点到聚类,以及按要求在聚类标识周围选取适当数据点形成简化数据集等操作步骤。利用小波变换的多分辨分析特性获得无监督聚类来帮助简化数据集。通过synthetic_dat和topo标准数据集的仿真实验表明,该算法实现简化大数据集高效而适用。