论文部分内容阅读
分类问题是数据挖掘中应用领域极其广泛的重要技术之一,这篇文章主要介绍了一种基于矩阵低秩变换的判别分类方法。因为许多高维数据,都是近似存在于一些低维子空间中的,所以我们的想法就是把这些高维数据依据它们所在的潜在低维子空间进行分类。具体做法就是先利用有类标的数据集学习一个全局的线性变换,然后将数据变换到一个类别更加明显、更易进行分类的投影空间中去,再对数据进行分类。此外,这种方法也可以作为一种有效的特征提取方法,它能够保证样本在投影后的空间中有最佳的分离性。 文章先介绍了一个低秩变换的分类模型,这个模型将核范数作为建模和优化的准则,在子空间上学习一个投影矩阵。这个学习到的投影矩阵保留了来自同一子空间的数据的低秩结构,同时使来自不同子空间的那些数据得到最大分离。然后,我们对这个方法进行了改进,加入了一个判别项。这个判别项的作用是在原模型增大不同类别数据类间距的基础之上,使得同类数据类内距更小,从而获得更好的分类效果。这个判别分类模型充分利用了已知类别的多方位信息,比原模型鲁棒性更强。本文分别通过理论分析和数据实验,阐释了模型的合理性并且验证了实验的效果。文中采用一个基于次梯度的方法对模型进行了求解并对算法收敛性进行了分析。最后对模拟数据和实际数据进行实验的结果均表明我们的方法取得了比原模型更优的分类效果。