基于弱标签数据的图像精细分类研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:zyj3221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像精细分类是计算机视觉领域中最重要研究方向之一。近年来随着深度学习技术的发展,图像精细分类的效果有了显著提升。但是搭建这些分类模型仍需要大量的人力对图像数据进行类别标注。因此如何使用少量样本或更容易获取的数据替代人工标注的数据是研究者们探讨的重点。同时,通过互联网平台可以较为轻松地获取大量的弱标签数据,但是由于弱标签数据的真实标签难以确认而难以得到有效利用。针对此情况,本文从以下几个方面进行探讨,提出了一些利用弱标签数据生成有标签数据并优化图像精细分类模型的方法。1.针对从互联网获取的图像数据类别标签或图像内容不准确的问题,本文提出了一种基于混淆概率评估的弱标签数据标注方法。利用网络爬虫技术在各个搜索引擎上获取大量带有文本信息的图像数据后,通过预测分类模型对不同类别样本的混淆概率,判断出大量分类模型难以识别的标签正确的样本。相比直接判断样本标签的方法,本文方法有效降低了数据资源的浪费和数据的采集成本。2.以往训练图像分类模型需要事先获取所有图像数据的类别标签。这样的训练模式使数据搜集和模型优化不能同时进行。针对此问题,本文提出一种支持在线学习的分类模型训练方法,只需使用少量有标签的数据集初始化分类模型,在数据爬虫过程中实现模型训练,使数据收集和模型优化交替进行,减少了时间浪费,增加了数据收集和模型搭建的时间。3.图像精细分类的主要差异在于类别的细节,但通常图像分类任务中不提供对类别细节部位的描述。针对此问题,本文提出一种简单的,仅用样本类别标签实现图像关键性部位的检测方法。本文通过无监督的区域生成方法和图像分类模型,在不借助额外信息的情况下找到对分类重要的图像区域,并提高了图像精细分类的准确率。4.本文利用网络爬虫提炼生成了名为“Chinese Food”的图像精细分类数据集,可以当做是计算机视觉研究的一个标准数据集。该数据集包含20类具有中国特色的食物,共有73125个图像样本。
其他文献
他是中国第一代服装设计师.他在上海国际时尚联合会副会长任期中,推动中国八大服装品牌同赴米兰时装周.他将复兴中华时尚产业视为义不容辞的责任.他是中国走在时尚前沿的服装
期刊
香港芭蕾舞团成功献演《吉赛尔》庆祖国60华诞    作为庆祝祖国60华诞献礼演出中惟一一台来自香港的剧目,由香港芭蕾舞团带来的浪漫芭蕾经典《吉赛尔》近日成功在北京上演。  香港芭蕾舞团艺术总监区美莲说:“《吉赛尔》是一部重要的并最能显示舞蹈团实力的古典浪漫芭蕾舞剧。它不仅要求舞蹈演员舞艺精湛,更需要高超的演技。这无论对整个舞蹈团还是主要演员来说均是挑战。”  港芭的43位舞蹈演员来自11个不同的国