论文部分内容阅读
随着信息技术和互联网技术的发展,每天产生的图像信息爆炸性增长,面对这么多的图像,我们更希望了解图像表达了什么信息,这就产生了图像分类技术。图像分类技术在现在已经应用到生活的各个方面,并且有很大的研究意义和价值,一个好的图像分类算法可以在很大程度上减轻人工分类的负担,快速的处理图像信息,现在已经成为计算机视觉领域重要的研究方向之一。
本文在传统的图像分类框架基础上,提出了基于显著性检测和目标定位的多特征融合图像分类算法。传统的图像分类方法一般提取单一的特征对图像进行分类,并且都是对数据集里面的图像直接进行操作。传统图像分类算法的一般流程:首先,提取局部底层特征;然后,利用训练集图像提取的局部底层特征训练大小为K的视觉词典;随后,利用特征编码方法和视觉词典对提取的底层特征进行编码;最后,训练分类器进行图像分类。本文主要做了以下几个方面的工作:
(1)图像预处理方面,在SEG显著性检测算法的基础上,提出了图像目标区域的分割和定位算法。首先,使用SEG显著性检测算法得到原图像的显著性图像,即概率图;然后,利用大津法阈值分割算法对显著性图像进行阈值分割,得到二值图像,并利用形态学处理的相关知识去除细小的噪声点;之后,寻找候选目标区域,本文提出的方法是寻找大于等于最大连通区域1/10的区域作为候选目标区域;最后,根据候选目标区域完成目标区域的选取。
(2)提取了三个不同类型的底层特征。由于单一的特征对于图像的描述能力太弱,不足以描述图像的所有特征信息,所以本文运用了多个不同类型的特征来描述图像信息。本文主要提取了三个底层特征:密集SIFT特征、HOG特征和Garbor特征。密集SIFT特征与传统SIFT特征的不同在于对图像进行密集网格采样,然后提取网格内的SIFT特征,这样既能提取局部信息又能描述全局信息。Garbor特征是使用平均分块的图像块与每个不同尺度不同方向的滤波器做卷积,所得到的滤波图像取均值得到的,与直接利用滤波图像做特征相比,维度更少,提高了计算速度。
(3)实现了底层特征的编码和空间金字塔池化特征的提取。由于底层特征区分能力弱,特征维数高,所以对提取的底层特征进行编码。首先,使用在线K-Means聚类算法对提取的底层特征进行聚类,形成不同大小码本的词典;然后,在分析现有编码方法的基础上,选择了重构误差比较小的局部线性编码来对底层特征进行编码;之后,利用最大池化,得到图像的最大池化特征;最后,又使用了空间金字塔模型,对图像在不同分辨率下进行划分,提取每个图像块的池化特征,得到具有空间位置信息的编码特征。
(4)提出基于多特征的融合方法。本文分别采用了前期融合方法和后期融合方法进行实验,前期融合的时候,本文除了对多个特征进行直接串联拼接融合之外,还提出了根据单一特征的识别率确定特征权值的方法进行融合;后期融合的时候,本文的思路是:提取训练集图像三种不同的编码特征,然后分别输入到三个SVM分类器中,分别训练三个SVM分类器,对于待分类的图像,分别把三个特征输入到训练好的分类器中,根据输出的得分和标签综合决策得到结果。通过实验对比,直接串联拼接的融合方法效果更好,所以对比实验采用这种融合方法做了对比实验。
本文在公开数据集Caltech101上对提出的算法做了两组对比试验,并且与传统的图像分类方法和单一的特征分类方法做了对比实验,验证了本文算法的可行性和准确性。
本文在传统的图像分类框架基础上,提出了基于显著性检测和目标定位的多特征融合图像分类算法。传统的图像分类方法一般提取单一的特征对图像进行分类,并且都是对数据集里面的图像直接进行操作。传统图像分类算法的一般流程:首先,提取局部底层特征;然后,利用训练集图像提取的局部底层特征训练大小为K的视觉词典;随后,利用特征编码方法和视觉词典对提取的底层特征进行编码;最后,训练分类器进行图像分类。本文主要做了以下几个方面的工作:
(1)图像预处理方面,在SEG显著性检测算法的基础上,提出了图像目标区域的分割和定位算法。首先,使用SEG显著性检测算法得到原图像的显著性图像,即概率图;然后,利用大津法阈值分割算法对显著性图像进行阈值分割,得到二值图像,并利用形态学处理的相关知识去除细小的噪声点;之后,寻找候选目标区域,本文提出的方法是寻找大于等于最大连通区域1/10的区域作为候选目标区域;最后,根据候选目标区域完成目标区域的选取。
(2)提取了三个不同类型的底层特征。由于单一的特征对于图像的描述能力太弱,不足以描述图像的所有特征信息,所以本文运用了多个不同类型的特征来描述图像信息。本文主要提取了三个底层特征:密集SIFT特征、HOG特征和Garbor特征。密集SIFT特征与传统SIFT特征的不同在于对图像进行密集网格采样,然后提取网格内的SIFT特征,这样既能提取局部信息又能描述全局信息。Garbor特征是使用平均分块的图像块与每个不同尺度不同方向的滤波器做卷积,所得到的滤波图像取均值得到的,与直接利用滤波图像做特征相比,维度更少,提高了计算速度。
(3)实现了底层特征的编码和空间金字塔池化特征的提取。由于底层特征区分能力弱,特征维数高,所以对提取的底层特征进行编码。首先,使用在线K-Means聚类算法对提取的底层特征进行聚类,形成不同大小码本的词典;然后,在分析现有编码方法的基础上,选择了重构误差比较小的局部线性编码来对底层特征进行编码;之后,利用最大池化,得到图像的最大池化特征;最后,又使用了空间金字塔模型,对图像在不同分辨率下进行划分,提取每个图像块的池化特征,得到具有空间位置信息的编码特征。
(4)提出基于多特征的融合方法。本文分别采用了前期融合方法和后期融合方法进行实验,前期融合的时候,本文除了对多个特征进行直接串联拼接融合之外,还提出了根据单一特征的识别率确定特征权值的方法进行融合;后期融合的时候,本文的思路是:提取训练集图像三种不同的编码特征,然后分别输入到三个SVM分类器中,分别训练三个SVM分类器,对于待分类的图像,分别把三个特征输入到训练好的分类器中,根据输出的得分和标签综合决策得到结果。通过实验对比,直接串联拼接的融合方法效果更好,所以对比实验采用这种融合方法做了对比实验。
本文在公开数据集Caltech101上对提出的算法做了两组对比试验,并且与传统的图像分类方法和单一的特征分类方法做了对比实验,验证了本文算法的可行性和准确性。