基于弱标签数据的图像精细分类研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:zyj3221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像精细分类是计算机视觉领域中最重要研究方向之一。近年来随着深度学习技术的发展,图像精细分类的效果有了显著提升。但是搭建这些分类模型仍需要大量的人力对图像数据进行类别标注。因此如何使用少量样本或更容易获取的数据替代人工标注的数据是研究者们探讨的重点。同时,通过互联网平台可以较为轻松地获取大量的弱标签数据,但是由于弱标签数据的真实标签难以确认而难以得到有效利用。针对此情况,本文从以下几个方面进行探讨,提出了一些利用弱标签数据生成有标签数据并优化图像精细分类模型的方法。1.针对从互联网获取的图像数据类别标签或图像内容不准确的问题,本文提出了一种基于混淆概率评估的弱标签数据标注方法。利用网络爬虫技术在各个搜索引擎上获取大量带有文本信息的图像数据后,通过预测分类模型对不同类别样本的混淆概率,判断出大量分类模型难以识别的标签正确的样本。相比直接判断样本标签的方法,本文方法有效降低了数据资源的浪费和数据的采集成本。2.以往训练图像分类模型需要事先获取所有图像数据的类别标签。这样的训练模式使数据搜集和模型优化不能同时进行。针对此问题,本文提出一种支持在线学习的分类模型训练方法,只需使用少量有标签的数据集初始化分类模型,在数据爬虫过程中实现模型训练,使数据收集和模型优化交替进行,减少了时间浪费,增加了数据收集和模型搭建的时间。3.图像精细分类的主要差异在于类别的细节,但通常图像分类任务中不提供对类别细节部位的描述。针对此问题,本文提出一种简单的,仅用样本类别标签实现图像关键性部位的检测方法。本文通过无监督的区域生成方法和图像分类模型,在不借助额外信息的情况下找到对分类重要的图像区域,并提高了图像精细分类的准确率。4.本文利用网络爬虫提炼生成了名为“Chinese Food”的图像精细分类数据集,可以当做是计算机视觉研究的一个标准数据集。该数据集包含20类具有中国特色的食物,共有73125个图像样本。
其他文献
常言道:到了四川才发觉世界美妙无比,那是因为四川多美女.而在四川丹巴还有一条美人谷,不但是美女云集的地方,而且还带有一连串难解之谜.不久前,一位在丹巴工作的朋友力邀我
期刊
2010年12月12日,上海这个冬季的周日,却飘着细密如织的雨,然而阴冷潮湿的冬雨,以及近期香港涌现的大量极难辨别的假黄金和周生生等知名珠宝品牌曝出的18K金产品“缺金”事件,并没
笔者的机器是联想品牌机,最近购买了一块P C I 接口的电视卡,安装好后能正常收看有线电视,但在 重启时会不定期死机。于是怀疑电视卡与原有的硬件 产生了冲突,但是在Windows
很多人都知道ADSL账号密码是跟固定电话号码捆绑的,也就是说即使别人知道了你的账号和密码,也不能用另一个电话号码上网。但是,却很少有人知道,如果别人知道了你的账号、密码
第45届台湾电影金马奖12月6日在台湾台中市颁奖。在电影《集结号》中扮演谷子池的大陆赏张涵予获得“最佳男主角”,著名作家刘恒也因该片获得“最佳改编剧本奖”。香港电影在
2015年初,江苏省张家港市旺农水产养殖专业合作社应用淡水渔业研究中心提供的底栖饵料生物增殖专利技术,使用牛粪、羊粪、酒糟等原料按一定配比混合发酵,并加入多种有益生物
他是中国第一代服装设计师.他在上海国际时尚联合会副会长任期中,推动中国八大服装品牌同赴米兰时装周.他将复兴中华时尚产业视为义不容辞的责任.他是中国走在时尚前沿的服装
期刊
上海世博会美国推介会1月2目晚在加州帕萨迪纳市开幕。中国驻美大使周文重、上海世博会代表团团长杨振武、中国驻洛杉矶总领事张云、美国国会众议员赵美心等中美官员和现场20
香港芭蕾舞团成功献演《吉赛尔》庆祖国60华诞    作为庆祝祖国60华诞献礼演出中惟一一台来自香港的剧目,由香港芭蕾舞团带来的浪漫芭蕾经典《吉赛尔》近日成功在北京上演。  香港芭蕾舞团艺术总监区美莲说:“《吉赛尔》是一部重要的并最能显示舞蹈团实力的古典浪漫芭蕾舞剧。它不仅要求舞蹈演员舞艺精湛,更需要高超的演技。这无论对整个舞蹈团还是主要演员来说均是挑战。”  港芭的43位舞蹈演员来自11个不同的国