基于深度学习的细粒度图像分类研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Rang3r
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数字多媒体技术的快速发展,图像数据的数量正在爆发增长。如何有效的使用计算机视觉技术实现对图像数据的管理和分类已经成为计算机视觉领域一个热门的研究课题。图像分类是实现图像管理的基础,而细粒度图像分类属于图像分类范畴,由于其数据在表观上非常近似,同时存在类内差距大于类间差距情况,使细粒度图像分类成为一个更困难也更值得研究的方向。针对细粒度图像分类,我们把研究重心聚焦于以弱监督的方法挖掘细粒度图像中的有判别力区域,并充分利用计算出的有判别力区域图像进行分类。在现有的工作基础上,分别利用物体显著度和空间变换提出了固定尺寸和自适应尺寸这两种有判别力区域计算方法。在固定尺寸有判别力区域计算方法中,即基于物体显著图的弱监督细粒度图像分类方法中,我们不使用额外的物体位置标注信息,利用模型对图像的注意力机制,提出一种新的显著图计算方法,计算物体上精细的显著值,再结合卷积神经网络的感受野和显著图计算出图像中多尺度的判别性区域,最后利用这些判别性多尺度区域训练多尺度模型,通过组合不同尺度的分类模型,充分地利用物体级的图像信息和物体局部的细节信息得到最优尺度组合。在CUB200-2011数据集上的实验结果表明我们提出的方法可以发现图像中的判别力区域并提高图像分类准确率。在自适应尺寸有判别力区域计算方法中,即基于自适应空间变换的弱监督细粒度图像分类方法中,向卷积神经网络中引入空间变换层,通过训练模型自动学习到每一张图像的空间变换参数,对输入图像进行了图像变换,去除无关背景等干扰,得到图像中有判别力的区域,最后使用这些计算出的图像小块进行模型的训练和测试,同时还引入了多尺度模型框架,将物体级尺度和局部级尺度的模型联合一起进行训练,使卷积神经网络可以充分利用物体级的图像特征信息和物体局部级的图像特征信息,最后使用交叉熵损失函数和Rank损失函数对模型进行交替训练,在CUB200-2011数据集上的结果显示该方法有效地提高了模型的分类性能。
其他文献
<正> 本文主张用审美意象作为文艺学体系的第一块基石。__ 一个学科的逻辑起点,应该是看似简单而实际上包含了事物未来发展的一切可能性的内在矛盾。生物学以细胞为逻辑起点,
随着社会经济的不断发展和人民生活水平的日益提高,用户对供电可靠性的要求越来越高。在对电力体制进行市场化改革的国家,供电可靠性是电力监管委员会监管和考核供电企业的关
目的:研究16层螺旋CT用于胸腰椎压缩性骨折椎管狭窄度、手术疗效评估。方法:选取某院2013年2月~2015年11月22例胸腰椎压缩性骨折患者为研究对象,对所有患者采用16层螺旋CT进行
分析了火灾自动报警系统质量通病的原因及危害 ,指出标准要求并提出相应防治措施。
我院从1986年~1996年收治飞行人员自发性气胸7例,现将护理问题及对策报告如下。1 临床资料1.1 飞行人员自发性气胸7例。年龄21岁~30岁5例,31岁~35岁2例;飞行时间:少于1000h5例,
政府门户网站是公众利用政府信息与服务的入口,与政府接触,表达自己意愿的一个平台。政府门户网站的资源建设应该以公众为中心,满足公众的需求。论文通过介绍政府门户网站以及资
目的:探讨后路减压+椎弓根钉固定+横突间植骨+Cage椎间植骨融合术治疗老年性腰椎滑脱并椎管狭窄的疗效。方法:收治老年性腰椎滑脱并椎管狭窄患者50例,均在后路减压和椎弓根钉固定
杜仲叶具有和杜仲皮相同的生理功能,资源丰富,作为饲料添加剂可行性高.综述了杜仲叶中多种活性成分的生理活性及饲养效果的研究进展,为杜仲叶在饲料中的全面应用提供借鉴.
春风送暖入长安。梦想在前,使命召唤。实践发展永不停顿,解放思想永无止境。只有理念再革新、思想再洗礼、格局再突破,大西安追赶超越才能再迎大进展。$$西安是一座有厚重感的城
报纸
股骨头坏死是一种致残率很高的疾病。全世界现有患者2000多万人,其中我国大约有500万人。令人担忧的是,这种并不引人注意的疾病越来越呈蔓延趋势。在北欧一些国家和俄罗斯,股骨