基于深度学习的细粒度图像识别方法研究

来源 :江南大学 | 被引量 : 1次 | 上传用户:yxrlxggd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细粒度图像识别是对大类下的子类图像进行更为精细的划分,比如区分一只狗是哈士奇还是萨摩耶。细粒度图像识别的挑战在于其不同类之间的差异较小,相同类别有时差异较大等。基于细粒度图像中固有的特性,如判别性区域较小、图像特征差异化程度不够等,以往的识别方法存在着有区分度的区域信息提取单一和特征不够丰富等问题,使得此任务还存在一些改进空间。针对这些瓶颈,本文设计了多个以深度学习为基础的细粒度图像识别方法,在弱监督场景下提取细粒度图像中尽可能丰富且准确的信息,进而实现了识别准确率的提高。本文中完成的工作内容如下:1.基于高效通道注意力多分支网络的细粒度图像识别方法。针对现有的多分支结构网络大都仅使用单一注意力建议子网络捕捉图像细节,造成的图像部件信息较单一而影响识别表现的问题,提出了本章方法。首先,本方法在递归注意力神经网络的基础上,设计了一种基于高效注意力模块的多分支网络,捕捉通道间交互信息,更准确地捕捉目标的位置信息;其次使用了深度过参数化卷积将常用的普通卷积进行替换,使网络可学习的参数增多。此外还采用改进的注意力部件模块切割出多个图像关键区域部件,使网络关注到的图像部件信息更多样化。最后设计实验,在多个细粒度数据集得到的最终效果表明,本方法能够有效提升细粒度识别准确率。2.基于增强特征提升的细粒度图像识别方法。现有方法大多在提取图像特征时,最显著局部特征以外的特征提取不够,且单独处理局部特征,忽略了特征与特征之间的关系。因此,本文在特征增强抑制模块基础上,提出了加入金字塔残差卷积、软池化方法和特征聚焦模块的增强特征提升方法。在此方法中,金字塔残差卷积首先使用不同尺度卷积核捕捉场景中不同级别的特征,而软池化方法合理分配池化过程中的信息权重,二者联合增强了网络的非最显著特征提取能力。其次,特征聚焦模块利用上述过程挖掘到的更多特征,聚焦于获取多个局部特征中的相似信息作为判别性特征,进一步提高识别效果。设计的实验在多个数据集上的实验展示了此方法具有有效性和泛化性。3.基于生物系统发育树的多层次细粒度识别方法。受到部分细粒度识别方法引入其他学科概念和工具提高识别效果的启发,首先根据生物学先验知识针对数据集构造系统发育树,其次根据数据集特点进行优化,构建分类树,从而构造以生物分类学先验知识为基础的辅助分类体系,进行预先分类降低了较高层次下不同种类的误判率。其次引入基于Transformer的深度学习网络进行分类,提高了识别效果。本实验方法在两个不同生物图像数据集上的识别率都处于优秀水准,表明此方法的可行性和高效。
其他文献
三维人体姿态估计任务旨在从单目或多目视频图像中预测出准确的三维人体姿态。得益于低成本、高效率、易部署等优点,三维人体姿态估计在虚拟现实、智慧医疗、自动驾驶、人机交互等领域有着广泛的应用前景。作为计算机视觉领域的热门研究课题之一,三维人体姿态估计一直受到业内研究者的广泛关注。但该课题依然面临着诸多问题,限制其进一步的发展。虽然研究者们通过引入时序信息以及多视角信息,提高了算法预测的准确度。但是对于复
学位
命名实体识别(Named Entity Recognition,NER)旨在从非结构化文本中提取出人名、地名、机构名或其他专有名词等类型的实体。其作为自然语言处理领域的基础任务之一,在对话问答、机器翻译、信息检索和知识图谱等各种自然语言处理任务中承担着重要的角色,在许多落地应用中具有关键性作用。近年来,命名实体识别技术虽已趋向成熟,但仍然面临许多挑战,尤其是在中文命名实体识别方向中,字词边界模糊、
学位
针对目前推荐算法存在的问题,本文对社交化推荐场景中的推荐方法进行研究,设计了两个基于图神经网络的社交化推荐算法框架,实现提高召回率、优化排序结果的目的。本文的主要研究内容如下:1.基于多图注意力融合的社交化推荐算法。图神经网络技术在社交化推荐领域中有着广泛的应用。然而,随着扩散深度的增加,它往往会导致过度平滑问题,从而抑制其性能。本文提出了一种基于相似性的多关系注意力网络用于社交化推荐场景。提出的
学位
高分辨率高光谱图像同时具有丰富的空间信息以及丰富的光谱信息。因此,高分辨率高光谱图像在目标检测、识别以及跟踪领域有丰富的应用空间。然而,受囿于当前成像设备性能的不足,我们无法直接获取到高分辨率高光谱图像。而是只能退而求其次,在空间上以及光谱上进行一定的退化,转而对同一取景取得一组低分辨率高光谱图像和高分辨率多光谱图像,再通过一定算法的处理,将这一组图像尽可能重建还原成高质量的高分辨率高光谱图像。这
学位
作为图像理解和计算机视觉的基石,目标检测是解决图像分割、场景理解、目标追踪等任务的基础。现在目标检测算法种类繁多,根据是否包含区域建议网络可以分为两阶段目标检测算法和单阶段目标检测算法。根据是否具有锚框又分为基于锚框的目标检测算法和无锚目标检测算法。虽然现在的目标检测算法在精度和速度上都取得极大提升,但是由于视角的多样性,多尺度变化,遮挡和光照强度等复杂场景的影响,以及模型的泛化能力不足等问题使得
学位
阿尔茨海默症(Alzheimer’s Disease,AD)是一种不可逆的大脑神经退行性疾病,一旦发病就没有治愈的可能。随着我国老龄化程度的加深,阿尔茨海默症患者越来越多,给家庭和社会都带来了沉重的负担。日渐增多的患者,极大地增加了相关领域医生的工作量,而计算机技术飞速发展,使之在医学领域有广泛的应用。近年来深度学习技术蓬勃发展,使得深度学习技术在医疗图像的分类、分割等领域有了广泛的应用。因此利用
学位
近年来,随着深度学习的迅速发展,伴随着计算机硬件性能的快速提升,行人重识别在智能监控、智能安保领域扮演着越来越重要的角色,吸引了研究者的广泛关注。相较于过去基于手工设计特征的行人重识别方法,基于卷积神经网络的行人重识别方法从大规模行人图像数据中挖掘信息,具备更好的特征表示能力。很多最近的研究在这一领域取得了一定的成果,但仍存在很多问题需要解决。在行人重识别研究中,按监督级别的不同,可以大致划分为有
学位
准确和鲁棒的视觉目标跟踪是计算机视觉领域中最具挑战性的基础任务之一,在智慧安防、自动驾驶和机器视觉等场景中有着非常广泛的应用。在只给定初始目标状态的情况下,目标跟踪旨在实现对图像序列中后续目标轨迹和状态的准确估计,对目标跟踪算法提出了很高的要求。经过国内外学者多年的研究,目标跟踪方法取得了很大的进展。尤其是近些年来,基于孪生网络的算法提供了全新的跟踪范式,得到了广泛的关注,极大地推动了目标跟踪领域
学位
人群计数旨在利用给定场景中的人群特征估计人数和密度分布,其作为一项视频图像处理技术在当今很多行业中都发挥着重要的作用。尤其随着世界人口增长和城市化进程发展,人群计数的应用场景也越来越多,对社会安全和人群控制管理有着举足轻重的意义。得益于计算机硬件不断提升和深度学习飞速发展,近年来人群计数的研究取得了相当大的进展。本文针对不同复杂场景具体分析了现阶段人群计数存在的困难和挑战,主要研究和解决了场景中存
学位
高光谱图像是一种复合信息图像数据,同时包含了空间信息与光谱信息。与自然图像相比,高光谱图像拥有更为丰富的光谱特征。因此,高光谱遥感极具应用价值,在地质探测、环境监测、军事监视和农业领域内都有广泛的应用。近年来,随着光学传感器的发展,高光谱图像的成像质量越来越高,合理的分析高光谱图像数据可以准确的区分地物覆盖类别,高光谱图像分类也因此成为高光谱遥感中最为重要的应用之一。目前,深度学习凭借着强大的特征
学位