论文部分内容阅读
图像分类是计算机视觉里非常活跃并经典的研究领域,传统的图像分类难以适应人们生活日益增长的检索分类需求,细粒度图像分类逐渐获得了越来越多的关注。细粒度分类属于目标识别的一个子领域,具体是指在同一类别(如鸟类或鱼类)下识别类别或子类别的任务。由于传统算法依赖于大量的人工标注信息,因此在处理原始形态的自然数据方面时存在很大的局限性,并且在面对细粒度分类问题时,由于对捕捉目标结构信息的不足和缺乏对细节区域的描述使得分类准确度难以提高。随着近些年计算机视觉领域的不断发展,促使大量基于深度学习算法的提出,深度卷积神经网络给细粒度分类创造了新的机遇,同时也促进了该领域的巨大发展。现有图像分类一般是指对粗粒度物体类别的分类,比如:车辆,动物等不同类别间的对比,缺乏对类似物体之间精细问题的研究,所以难以对细粒度图像进行对比分析,不能做到准确的区分与多层次分类。因此,细粒度物体如何做到精细、准确、高效地分类,生成用户能够理解与应用的类别信息,是具有重要的研究意义与实用价值。主要研究工作如下:(1)针对现有细粒度分类算法的研究难点与现状进行分析,其主要难点在于图像中较大的类内差异与较小的类间差异,学习常用的目标特征描述子,研究常用特征的计算原理,总结常用特征提取方法中表现性能优异的算法的优缺点,选出适合本文的特征提取方法。(2)为了捕获细节信息的区域,实现其目标区域检测,使用能够减少过拟合的卷积神经网络模型,通过弱监督的方式来自动学习样本数据特征,不依赖部件标注信息,仅根据人工经验来设计特征提取器,输出函数为非线性的线段调整函数,采用第五层卷积层特征作为图像特征进行实验。(3)提出通过多尺度卷积特征匹配的方法对从卷积特征中生成的局部区域构造图像表示,以此训练SVM分类器实现细粒度图像分类,通过大量的实验验证,证明该算法取得良好的分类效果。