论文部分内容阅读
近年来,随着数字多媒体技术的快速发展,图像数据的数量正在爆发增长。如何有效的使用计算机视觉技术实现对图像数据的管理和分类已经成为计算机视觉领域一个热门的研究课题。图像分类是实现图像管理的基础,而细粒度图像分类属于图像分类范畴,由于其数据在表观上非常近似,同时存在类内差距大于类间差距情况,使细粒度图像分类成为一个更困难也更值得研究的方向。针对细粒度图像分类,我们把研究重心聚焦于以弱监督的方法挖掘细粒度图像中的有判别力区域,并充分利用计算出的有判别力区域图像进行分类。在现有的工作基础上,分别利用物体显著度和空间变换提出了固定尺寸和自适应尺寸这两种有判别力区域计算方法。在固定尺寸有判别力区域计算方法中,即基于物体显著图的弱监督细粒度图像分类方法中,我们不使用额外的物体位置标注信息,利用模型对图像的注意力机制,提出一种新的显著图计算方法,计算物体上精细的显著值,再结合卷积神经网络的感受野和显著图计算出图像中多尺度的判别性区域,最后利用这些判别性多尺度区域训练多尺度模型,通过组合不同尺度的分类模型,充分地利用物体级的图像信息和物体局部的细节信息得到最优尺度组合。在CUB200-2011数据集上的实验结果表明我们提出的方法可以发现图像中的判别力区域并提高图像分类准确率。在自适应尺寸有判别力区域计算方法中,即基于自适应空间变换的弱监督细粒度图像分类方法中,向卷积神经网络中引入空间变换层,通过训练模型自动学习到每一张图像的空间变换参数,对输入图像进行了图像变换,去除无关背景等干扰,得到图像中有判别力的区域,最后使用这些计算出的图像小块进行模型的训练和测试,同时还引入了多尺度模型框架,将物体级尺度和局部级尺度的模型联合一起进行训练,使卷积神经网络可以充分利用物体级的图像特征信息和物体局部级的图像特征信息,最后使用交叉熵损失函数和Rank损失函数对模型进行交替训练,在CUB200-2011数据集上的结果显示该方法有效地提高了模型的分类性能。