论文部分内容阅读
随着计算机及多媒体设备的普及,每天都会有海量的数字图像产生、发布和共享,这给人们的生活提供极大便利的同时也对人们迅速地从浩如烟海的图像数据中寻找到自己所需要的信息带来了挑战。如何有效地分析、组织和管理图像数据,实现基于内容的场景分类已成为图像处理领域的研究热点。研究的难点在于如何使计算机能够从人类的认知角度理解场景图像的语义信息。为了提高场景分类的速度和准确率,结合DCT纹理特性以及超复数彩色空间并行性,本文先对DCT变换进行了研究,在提出三种DCT变换域下的场景分类算法的基础上,最终引入超复数提出了一种超复数DCT变换域下的场景分类算法。本文的主要研究内容包括*:(1)针对现有场景分类算法都是在非压缩域实现并且分类速度慢的问题,提出了一种DCT变换域的快速场景分类算法。DCT变换后频域系数具有能量集中性和多尺度多分辨率特征,该特征能够很好地反映图像纹理特征并且易于量化分析,若选择合适的变换块大小,DCT变换还具有较好的快速性。本文根据这些特征对场景图像进行DCT变换后提取频域系数进行分类实验,实验结果表明该算法很好地提高了场景分类的速度。(2)为了进一步提高场景分类准确率,根据谱残差的思想,本文又提出了一种基于差值向量的场景分类算法,该算法利用类间差异度较大的差值向量作为特征向量进行场景分类,实验结果表明该算法在提高了分类速度的同时也提高了分类准确率,而且还具有较好的鲁棒性。(3)本文所提基于差值向量的场景分类算法是一种半监督分类算法,针对这个问题,本文结合空间金字塔模型提出了一种DCT变换域的Bag-of-words场景分类算法,该算法把DCT系数作为图像特征描述子,通过直方图匹配的方式进行场景分类。实验结果表明该算法同时具有较高的分类速度和分类准确率。(4)本文以上所提三种算法以及现有的经典场景分类算法都是基于灰度图像或者是对彩色图像的颜色通道单独处理的,没有考虑到图像各个颜色通道间的关联。为此,本文最后通过引入超复数,利用彩色图像的R、G、B颜色分量构造超复数,提取超复数DCT变换后的系数特征进行场景分类,实验结果表明该算法很好地结合了图像的颜色和纹理特征,进一步提高了分类准确率。