论文部分内容阅读
近年来,计算机视觉成为越来越热门的研究领域,而图像语义理解更是其中非常活跃的研究方向,从而实现对图像数据的有效管理、组织和再利用。在计算机视觉领域中,对于图像的认知一般分为三个层次:第一层是以感知层为主的图像内容分析,主要是低层特征的提取和处理,比如纹理、颜色、时空关系等;第二层是以认知层为主的图像理解,主要是中层特征的提取和语义理解,包括图像、场景、视频的主要区域等;第三层是以情感层的图像情感分析为主,该层主要是高层特征的分析,如人脸表情分类、图像情感分类等。人类对于图像的理解和表达更接近于认知层的分析,因此对于物体的检索与分类主要是利用图像包含的主要场景和主要物体来进行。这是计算机视觉领域较核心的问题,近年来引起了很多学者的关注和研究。现今对于图像的物体分类大多是针对粗粒度物体类别的分类,比如:汽车、房子、花丛等不同类别之间的分析,缺少的是相似类别之间的分析,无法做进一步更精细的划分和多层次分类。因此,如何更精细、准确、高效地实现图像的物体分类,具有着重要的理论意义和实用价值。本文以细粒度物体分类为出发点,构建了细粒度车型图像数据库,并深入研究了两种主流的物体分类方法,最后通过实验对分类方法进行分析与验证。第一种方法是基于部件模型的细粒度物体分类方法。它首先通过弱标记方法和隐支持向量机迭代判别算法对物体进行模型训练,再通过图像特征金字塔与部件滤波器的匹配来确定物体的部件区域及图像的中层特征,最后将图像的低层特征与中层特征融合起来从而得到新的图像特征。第二种方法是基于卷积神经网络的细粒度物体分类方法。该方法采用的是一个八层卷积神经网络结构。经过对同层相邻节点的响应进行局部归一化、对卷积层进行重叠池化、减少过拟合等方法优化网络结构,使用非线性的线段调整函数作为输出函数,最后采用卷积神经网络的第六隐层特征图作为图像特征进行实验研究。本文采用的两类细粒度物体分类方法均有不错的效果,通过实验验证,尤其是基于卷积神经网络的细粒度物体分类方法更取得了较好的分类效果。