论文部分内容阅读
随着信息数字化的不断发展,大数据成为日常生活中一个热点话题,在这些大数据中,图像占有很大比重,因此,图像分类技术进入了高速发展时期。图像分类作为一个经典问题,依然成为许多科研人员的研究课题,并已广泛的应用在网络技术、信息安全和公共安全等模式识别领域。然而现有图像分类算法,在训练样本受到噪声污染的情况下,图像识别率降低,算法的分类性能降低。针对这些问题,本文主要研究内容如下:(1)针对受到噪声污染的训练样本,PCA算法用数量较少的特征对高维样本进行描述,有效地从“丰富”的数据信息中获取最重要的元素和结构,去除数据的噪声;SRC算法通过采用单位阵作为误差字典,能够针对存在误差或损毁的样本图像进行很好的描述和表示;RPCA算法通过采用一个过完备字典作为误差字典,求取样本数据在该字典下的稀疏表示。通过这三种基本算法的图像分类性能对比,突出RPCA算法的优越性,表明基于图像特征的低秩特征描述可以解决图像受到噪声污染的问题。(2)LRR算法的低秩表示特性与RPCA算法对图像的表示特性非常相似,都是针对图像低秩特征进行描述,研究表明,LRR算法提取的图像低秩特征更有效,更准确。因为数据经常会遇到噪声的干扰,需要提取出数据所属的多个子空间结构,但RPCA算法对样本的所有特征数据都是通过用一个子空间来描述的,因此这样的数据描述就不准确。那么,使用低秩描述(LRR)不仅可以将样本数据中来自不同子空间的共性特征抽取出来,同时也剔除不稳定特征。(3)在样本图像受到大噪声干扰的情况下,LRR算法对于局部噪声就很敏感,图像的分类性能明显降低,因此本文提出一种改进的低秩表示算法,该算法能够有效地将样本数据中噪声误差去除,使得图像恢复更准确,分类识别率也得到提高。与传统的低秩表示算法不同的是本文算法在原算法模型中引入一个约束条件来保证系数的最稀疏性,获取图像数据在各个空间中的整体几何结构,它的有效求解也是通过增广拉格朗日乘子法(ALM)获得。尤其样本图像在有大噪声干扰的情况下,本文算法与其他算法相比,可以保持较高的识别率,具有很大的优势。最后,本文将提出的改进的低秩表示算法应用于人脸图像,该算法提取的特征更具有图像内在的信息,进而进行分类识别,并在ORL和Yale B人脸数据库上进行仿真验证,结果表明了该算法具有较强的抗干扰能力,提高了识别率。