论文部分内容阅读
图像表示问题是图像检索、物体识别等图像分类任务首要解决的基本问题,图像表示模型的性能对图像分类算法的性能有着决定性影响。词袋模型(BagofWords)是目前广泛使用的一个图像表示模型,对平移、旋转、缩放等几何变换具有良好的鲁棒性,在图像检索、物体识别等图像分类应用中取得了巨大的成功。特征量化是词袋模型的一个核心步骤,对词袋模型的性能有着关键性影响。但是,现有特征量化方法假设局部特征之间是相互独立的,忽略了局部特征之间的相互联系,从而降低了词袋模型的性能。
针对该问题,本文尝试利用先进的高维数据分析技术(稀疏表示和矩阵低秩恢复)来挖掘局部特征相互联系(用图来表示),并将其引入到特征量化过程,旨在提高词袋模型的表达能力,进而提高图像分类算法的性能。
论文的主要研究内容和创新之处包括:
1.提出了一种新的结构性稀疏图构建算法。该算法将图中单个数据对应的权重系数设定为一组,通过组内使用2范式约束(增加表示准确度),组间使用1范式约束(获取自适应稀疏图)的方式,构建结构性稀疏图e2,1图。该图继承了e1图能够自适应的获取稀疏图的优点,并且通过添加数据之间的相互约束,克服了现有算法只是针对单个数据迸行孤立表示的情况。实验结果表明,所构建的结构性稀疏图能够更加全面地反映数据之间的信息,特别是在样本标注率低、样本信息相对较少的情况下,该图所反映出的数据信息能够有效地提升数据降维和分类的效果。
2.提出了一个全新的非负低秩稀疏图(Non-NegativeLow-rankandSparseGraph,NNLRS-graph)构建算法。利用低秩和稀疏的约束能够有效把握数据的整体和局部信息的性质,通过对图构建的权重同时进行低秩和稀疏约束,构建更能反映数据关系的非负权重图。因此,获得的NNLRS图能够同时反映子空间结构和局部的线性结构,同时具有了生成性和区分性。在半监督学习框架之下,分别针对半监督分类和半监督判别分析的方法进行了构建图的比较,实验结果也证实了基于本文构建算法的构建图的有效性。
3.提出了一种非负稀疏局部线性编码方法。针对BoW模型中的特征量化问题,利用非负稀疏表示技术选择与待编码局部特征处于同一线性空间中的近邻点,然后以这些近邻点作为局部坐标系对当前局部特征进行线性编码。实验结果表明,通过考虑局部特征的空间结构,该局部特征编码方法显著优于现有的特征编码方法,有效地提高了图像非线性特征的区分能力,更有利于图像分类。