论文部分内容阅读
近年来,随着智能图像分类技术的迅速发展与日趋成熟,一般图像分类问题的算法效果和性能都已经逐步赶超人类的视觉系统,相关研究成果激励着人们向更高难度的问题发起挑战,于是细粒度图像分类问题开始引发研究人员的关注,这种分类任务需要判别同一大类下划分的多个子类。然而,不同子类间的样本拥有较高的相似性,同一子类下的样本又会由于拍摄距离、目标姿势、复杂背景等因素的干扰产生极大的差异,因此细粒度图像分类任务的难度远远高于普通的图像分类。而解决上述问题的关键就在于局部特征的定位和提取,因为对于细粒度图像而言,类间样本微小的差异性和类内样本被干扰的共性都隐藏在图像的局部区域中,只有通过稳定且细致的局部特征才能准确地进行描述,所以细粒度图像分类的关键问题就是如何提取更为有效和鲁棒的局部特征。本文针对细粒度图像分类任务的关键问题,对卷积神经网络(Convolutional Neural Network,CNN)和尺度不变特征转换(Scale Invariant Feature Transform,SIFT)两类特征提取方法的优势与不足进行了分析,从而提出改进细粒度图像分类准确率的局部特征组合思想。主要工作包括:(1)分析和阐述了一种基于CNN和SIFT的多种局部特征组合思想,结合SIFT特征对图像局部关键点的描述和CNN特征对图像高层语义的获取,获得对细粒度图像而言描述力和区分度都更为强大的特征表示,从而用来提高细粒度图像分类的准确率。(2)针对细粒度分类任务中的样本特点,对一般的SIFT特征提取过程进行优化,加强其朝向不变性。然后结合特征编码方法将优化前后的SIFT特征用于分类,并且在不同的特征编码参数下进行了多组对比实验,通过分析实验结果阐明了特征编码参数的选择对分类的影响,同时证明了优化工作的积极效果。(3)针对局部特征对细粒度图像分类任务的重要性,对CNN特征提取方案进行了设计,并结合实验结果分析和确定了最终方案。(4)实现本文基于SIFT和CNN特征的多种局部特征组合思想,并在细粒度分类标准数据集CUB-200-2011上进行实验证明了方法的有效性。