论文部分内容阅读
基于高维数据往往属于几个低维子空间的并的事实,子空间聚类就是一种揭示高维数据的潜在低维结构的方法。对于给定的一个来自高维空间的数据集,子空间聚类是指将这组高维数据分割成若干组,其中每一组的数据对应于一个低维的子空间。揭示高维数据的潜在低维结构能够更好的体现数据本身的性质,并在机器学习和计算机视觉等方面有着重要的应用。 基于谱聚类的方法是近几年较为流行的一种子空间聚类方法,该方法往往需要构造一个基于子空间数据表示的相似度矩阵。理想中的相似度矩阵应该是类间稀疏、类内一致的。类间的稀疏性能够将来自不同子空间的数据分离而类内的一致性能够将来自同一类的数据聚集在一起。以往的方法往往只满足相似度矩阵的部分特性而不能得到理想的效果,因此本文提出一种子空间表示的数据相关自适应回归的方法。它实质上能够对相关性较强的数据之间的表示系数用l2范数而对于相关性较弱的数据之间的表示系数用l1范数,l2范数能够使得表示系数之间具有一致性而l1范数能够使得表示系数之间具有稀疏性。因此我们的模型具有自适应性,并且能够保证相似度矩阵类间的稀疏性和类内一致性。它也获得了理想的实验结果。 此外,基于稀疏理论和群组效应,本文还提出两种显示增强相似度矩阵的稀疏性和群组效应的子空间聚类方法。其中一种更能够保证相似度矩阵类间的稀疏性和类内的群组效应。类间稀疏性能够保证类间表示系数为零而类内群组效应能够保证类内表示系数是一致的。并在几个流行的高维数据集和一个标准的图像分割数据集上分别做数据聚类和图像分割实验。取得了比以往方法较优的数据聚类效果和图像分割效果。