基于注意力机制的细粒度图像分类方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:king_wda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的蓬勃发展,人们日常生活中重复、繁琐的工作也逐渐被许多新技术所替代,这些新技术也被应用于许多领域中,如门禁、人脸识别、图片搜索相关信息等,信息识别的准确率也成为了这些领域中的主要问题。图像分类能根据图像中的特征识别出图像类别,是提高信息识别准确率的一种重要手段。细粒度图像分类是图像分类中的一个重要分支,其技术的核心是使用高效的网络模型或算法区分同一类别下的不同子类别。因此,探索细粒度图像分类具有很重要的现实意义和发展前景。但细粒度图像分类存在图像难以分辨的难点,如可能把同一子类识别成不同类别或把不同子类识别成同一类别等。鉴于细粒度图像分类面临的巨大挑战和重要的应用价值,本文从注意力机制、多尺度信息融合和渐进式训练三个方面展开研究,提出了两种细粒度图像分类方法:1、基于混合注意力机制的细粒度图像分类方法。本文提出了一种基于混合注意力机制的细粒度图像分类网络(Mixed Attention Network,MA-Net),其中包含基于空间和通道的混合注意力模块(Mixed Attention Module,MAM),该模块可以有效地关注图像中的重点区域,再从重点区域中获取具有高辨别性的细粒度特征。该注意力模块包含通道注意力子模块和空间注意力子模块,其中通道注意力子模块通过压缩图像空间维度的信息来得到通道维度上的重要信息,空间注意力子模块通过压缩图像通道维度的信息来得到空间维度上的重要信息。此外,为进一步提升分类准确率,使用数据增强方式对数据集进行扩充,避免网络产生过拟合现象。2、基于多尺度的渐进式细粒度图像分类方法。针对图像不同尺度中所蕴含的特征信息不相同这一特点,本文提出一种多尺度的渐进式细粒度图像分类网络(Mixed Attention and Multi-Scale and Progressive Network,MAMSP-Net)。除了混合注意力机制外,提出的方法利用网络的不同尺度来提取特定的特征信息,特殊的渐进式训练方式能够使该网络同时学习和融合图像不同尺度的特征信息。为促使模型中两个训练步骤一起工作,最终损失函数由四个损失函数组合优化得到。在模型测试阶段,考虑到基于不同尺度信息的预测都是有价值的也是互补的,提出两种预测结果:单一预测结果和多输出组合预测结果。所提的MAMSP-Net方法的多输出组合预测结果在三个国际数据集CUB、CAR、AIR上分别取得的精度为88.8%、95.0%、93.3%,较好地提升了细粒度图像分类性能。
其他文献
随着计算机硬件的飞速发展,为了得到极具真实感的图像,基于物理的渲染技术在游戏、影视等领域都得到了广泛的应用。其中实时渲染与离线渲染是两种主要的物理渲染方式,在渲染方法、渲染效率以及渲染质量上有很大的差异。对于类似次表面散射的复杂材质来说,实时渲染速度快但质量欠佳,离线渲染速度慢但渲染质量很高。为了加快复杂材质的渲染速度而不影响渲染的质量,本文主要从纹理优化方向上来研究复杂渲染的优化,结合深度学习与
学位
随着数据处理量的逐渐增大、数据处理要求的逐渐提高、业务开发的逐渐多样,传统的大数据开发平台已无法支撑如此多的业务迭代需求,本文的项目背景是在能够满足以上需求的大数据分析系统中,开发一套能够快速构建人事分析算法业务的算法运行库,该人事算法处理库着力于解决人事业务中算法开发门槛高、业务算法迭代速度慢、算法关联执行复杂等问题。本文结合可变性建模与规则引擎技术,提出了新的人事处理算法运行库,该算法运行库通
学位
自我国改革开放以来,社会经济得到较快发展,国内外文化与经济交流机会增加,形成了经济全球化的基本形势。信息技术、网络技术与通信技术的发展更是为跨境商业合作提供了条件与技术支持,各企业与单位对跨境电子商务人才的需求也逐渐增加。尽管国内高等教育单位早已开设了有关跨境电子商务的专业和课程,但其中大部分课程存在内容老旧的问题,科任教师对跨境电子业务的了解不多,科任教师对跨境电子商务人才的培养需求、培养目标认
期刊
线形腔型结构的单频光纤激光器凭借其结构简单紧凑、易于集成、不易跳模和稳定性高等优点,逐渐为众多科研工作者所关注。在本论文工作中,通过对构建成腔的光纤光栅(Fiber Bragg Grating,FBG)进行精确的温控,使分布布拉格反射式(Distributed Bragg Reflector,DBR)单频光纤激光器的有效腔长发生显著变化,实现了压窄激光输出线宽的目的。通过对线性啁啾光纤光栅局部点加
学位
本地化商务人才培养强调的是商务人才投入的本地化、商务人才效用的本地化与基于本地化的知识溢出。本地化商务人才培养受到投入主体的财力及投资意愿、商务人才生命周期、与地区产业需要的对称性、商务人才投入主体与受益主体的匹配性、外地商务人才流入等因素的影响。需要正视本地化商务人才培养的难点,并积极探讨本地化商务人才培养的提升策略,如需要积极提升当地居民的商务就业技能与职业素养,进一步畅通商务人才就业渠道,建
期刊
在中国人居演进历史上,产居混合现象长久不衰,“作”与“息”一直是乡村住居单元的两大核心。改革开放以来,以农户为主体的“草根经济”蓬勃发展,随着城市居民大量涌入乡村,乡村住宅的功能趋于多元,除居住与生产功能外还分化出消费功能。村民改造住宅空间时,需权衡其作为产业空间的经济效益与作为居住空间的宜居性,在多元诉求的博弈中,乡村住宅呈现出多样化的混合特征,同时也暴露出一些矛盾与问题,需要予以关注并寻求解决
学位
城市因集聚而产生,信息技术、交通互联和产业分工使城市对外联系日益频繁,全球和区域城市之间正在逐渐形成一个互联互通、协同互补的经济社会共同体。与此同时,我国城市经过不断地建设与发展,正在进入新型城镇化和区域一体化的高质量发展新阶段。因此,有必要在新常态背景下对我国的城市关系网络进行重新考察,探索促进城市经济增长和质量提高的新模式,并提出深化区域协调发展的规划策略。基于此,本文:首先,阐述了在全球化和
学位
当前研究认为孤独症谱系患者并不是单一因素致病的的精神类疾病,其临床表现与成长过程中的社交因素和环境因素有莫大关联,且孤独症谱系患者的神经病理机制尚未完全揭示。因此,本研究工作采用世界上最大的公开孤独症数据库之一的样本库,使用磁共振高分辨结构以及功能静息态数据来从功能、结构以及脑网络上挖掘孤独症谱系患者的病理产生过程的基础和成长过程中各年龄阶段的病理特征。本工作第一个板块结合了磁共振功能和结构影像,
学位
乙酰羟酸合酶(AHAS,EC 2.2.1.6)是支链氨基酸(BCAAs,L-缬氨酸、L-亮氨酸和L-异亮氨酸)生物合成途径中的第一个酶。AHAS由两个亚基组成:一个催化亚基,包含黄素腺嘌呤二核苷酸(FAD)、焦磷酸硫胺素(Th DP)和镁(Mg2+),以及一个增强催化亚基活性及稳定性的调节亚基。调节亚基还包含BCAAs的结合位点,这也使得BCAAs具有对AHAS的反馈抑制作用。AHAS存在于植物和
学位
刺激响应性凝胶材料能够在外界环境刺激下实现颜色、体积、形状等物理化学性质的变化,因而在人机界面、软机器人、柔性电子领域得到了广泛的研究。目前通过掺杂刺激响应性粒子或在凝胶网络中引入刺激响应性基团虽然可以实现对光、热、磁场等外界刺激响应的凝胶制备,但是凝胶体系设计的复杂性以及凝胶较差的机械性能可调性限制了它们的广泛应用。为解决上述问题,本论文主要完成了以下工作:本文基于凝胶网络与溶剂间氢键作用的调控
学位