论文部分内容阅读
hub聚类算法可以解决传统聚类算法无法处理高维数据的问题。然而,由于它未考虑数据中的冗余和噪声特征,从而降低聚类性能。因此,提出PCA-Hubness聚类方法用于提高高维数据的聚类性能。PCA-Hubness聚类方法利用逆近邻数的偏度和本征维度的相互关系,以偏度的变化率为降维依据,保证在对高维数据降维时不会损失过多的有价值信息,有利于提高聚类效果。此算法在UCI数据集上进行实验,相比hub聚类算法,轮廓系数平均提高15%。