论文部分内容阅读
图像分类,作为图像处理领域的一个理论分支,其主要研究内容是如何把大量无序的数字图像通过计算机来自动进行分门别类。基于计算机视觉技术的图像理解和图像表示是其准确分类的基础,自从稀疏编码理论被引入到图像表示技术后,极大的促进了图像分类准确率的提高。稀疏编码是一种有效且普遍的编码方式,其编码过程就是利用过完备字典的基线性表示图像的过程,每个编码中的非零元素只占所有元素的极小部分体现了编码的稀疏性。稀疏编码之所以能够代替k均值聚类算法来生成字典,是因为稀疏编码算法在字典学习优化过程中给出了表示每个特征的字典基的优化加权,通过这种方法字典质量和特征量化精度都有很大提高。但是,稀疏编码算法仍然不是完美的,它在编码过程中忽视了特征的相关性,导致相似特征可能产生差异很大的编码,进而影响分类效果的提高。基于此,研究者们发现在稀疏编码优化方程中加入一个约束条件,使得相似特征能够产生相似的稀疏编码,同时能够降低特征量化误差,从而提高了图像分类的准确率。这种算法是对稀疏编码的一种完善,研究者们称这种算法为拉普拉斯稀疏编码。我们发现目前的稀疏编码算法大多是在特征原始空间进行,本文受核方法可以获得特征的高维非线性映射的启发,在稀疏编码过程中引入了核方法,提出了核稀疏表示。它不仅可以降低特征量化误差,而且增强了稀疏编码的性能。我们将这种核稀疏表示与现有的拉普拉斯稀疏编码进行了结合,提出了核拉普拉斯稀疏编码。实验表明,核拉普拉斯稀疏编码在图像分类领域胜过了拉普拉斯稀疏编码,且在Celtech-101、 Scene15和UlUC-Sport标准库上的实验中取得了非常好的图像分类效果。