论文部分内容阅读
图像分类是跨越多学科的重要应用技术,实现图像分类首先要通过特征提取方法获取图像特征。随着图像获取设备的不断发展,目前的图像分辨率不断提高,相应的数据维度随之急剧增加。另外,由于采集环境和采集设备本身的问题,导致大部分图像中都含有噪声或数据异常值,针对现实中的这种问题,本论文集中于研究具有噪声或异常值的图像数据降维问题。LPP是一种具有很小的局部误差并且保持降维特性的著名降维度量方法,在实际应用中已证明其在数学上具有很好的降维度量性能。但它采用平方L2范数作为误差的度量,这种度量对具有高斯分布噪声的数据具有很好的表达效果。然而许多实际问题的图像数据都包含非高斯噪声或异常值,对非高斯噪声,应用LPP模型数据会影响降维数据的表示效果,同时采用L2范数作为距离度量也会放大数据中异常值的影响。为了解决上述问题,本文对带有噪声的图像数据的降维问题研究,主要从以下几个方面对现有方法进行了改进:(1)针对图像数据包含噪声或异常值,提出了低秩局部保持投影的降维模型(Low-Rank Locality Preserving Projection,LR-LPP)。LR-LPP是一种具有低秩局部保持特性的非线性降维方法,它基于鲁棒的PCA,首先将原始数据分解为低秩本征分量和稀疏的非高斯噪声分量,然后在低秩本征分量上实施传统LPP过程,因此LR-LPP对非高斯噪声具有较强的鲁棒性。论文采用交替方向乘子算法(ADMMs)进行模型求解,并对求解算法进行了收敛性分析。在多个公共数据库上实验表明,在降维后的不同维度下,LR-LPP模型对人脸和物体图像的分类都取得了令人满意的结果。(2)针对平方F范数会扩大噪声负面作用的问题,提出了基于F范数的低秩局部保持投影降维(Low-Rank Locality Preserving Projection based on F-Norm,LR-FLPP),该模型使用F范数作为原始数据投影到低维空间后的距离测度,进而削弱了噪声和异常值导致的累积误差。由于F范数的引入,也给LR-FLPP模型的求解带来了一定难度,本文采用交替方向乘子算法求解其变量与参数,并在多个公共数据集上进行了收敛性验证实验。在真实公共数据集上进行的分类实验和鲁棒性实验表明,LR-FLPP的实验结果优于所有对比算法,相比于LR-LPP也有明显的提升,因此具有更强的鲁棒性。(3)针对图正则化非负矩阵分解降维方法(Graph Regularized Nonnegative Matrix Factorization,GNMF),为了改进预定义的相似度矩阵的度量效果,提出了基于双流形正则化的非负矩阵分解模型(Double Manifolds Regularized Non-negative Matrix Factorization,DMR-NMF),该模型在GNMF模型基础上增加了自表达约束,并与自适应关联矩阵学习框架联合学习有效系数矩阵。模型采用交替方向乘子算法(ADMMs)进行求解,给出了求解算法的收敛性的理论证明,并且给出了四个公共数据集上目标函数值收敛性实验。在公开数据集上的聚类实验表明,相比于对比方法,DMR-NMF模型的聚类实验结果具有明显的优势。