论文部分内容阅读
图像精细分类是计算机视觉领域中最重要研究方向之一。近年来随着深度学习技术的发展,图像精细分类的效果有了显著提升。但是搭建这些分类模型仍需要大量的人力对图像数据进行类别标注。因此如何使用少量样本或更容易获取的数据替代人工标注的数据是研究者们探讨的重点。同时,通过互联网平台可以较为轻松地获取大量的弱标签数据,但是由于弱标签数据的真实标签难以确认而难以得到有效利用。针对此情况,本文从以下几个方面进行探讨,提出了一些利用弱标签数据生成有标签数据并优化图像精细分类模型的方法。1.针对从互联网获取的图像数据类别标签或图像内容不准确的问题,本文提出了一种基于混淆概率评估的弱标签数据标注方法。利用网络爬虫技术在各个搜索引擎上获取大量带有文本信息的图像数据后,通过预测分类模型对不同类别样本的混淆概率,判断出大量分类模型难以识别的标签正确的样本。相比直接判断样本标签的方法,本文方法有效降低了数据资源的浪费和数据的采集成本。2.以往训练图像分类模型需要事先获取所有图像数据的类别标签。这样的训练模式使数据搜集和模型优化不能同时进行。针对此问题,本文提出一种支持在线学习的分类模型训练方法,只需使用少量有标签的数据集初始化分类模型,在数据爬虫过程中实现模型训练,使数据收集和模型优化交替进行,减少了时间浪费,增加了数据收集和模型搭建的时间。3.图像精细分类的主要差异在于类别的细节,但通常图像分类任务中不提供对类别细节部位的描述。针对此问题,本文提出一种简单的,仅用样本类别标签实现图像关键性部位的检测方法。本文通过无监督的区域生成方法和图像分类模型,在不借助额外信息的情况下找到对分类重要的图像区域,并提高了图像精细分类的准确率。4.本文利用网络爬虫提炼生成了名为“Chinese Food”的图像精细分类数据集,可以当做是计算机视觉研究的一个标准数据集。该数据集包含20类具有中国特色的食物,共有73125个图像样本。