基于DCL改进的细粒度图像识别算法研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:zhanbusha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细粒度图像识别是计算机视觉中一项基础且重要的工作,其目的在于区分常人难以辨别的对象类别(例如不同子类的鸟类、花卉)。除了视觉分类中常见的姿态、光照和观察视角变化因素之外,细粒度数据集还具有一定的类间相似性和类内差异性,这些都是传统分类方法无法有效区分的。目前,利用机器视觉的细粒度分类方法是研究热点之一。然而,现有的细粒度分类方法仍存在一些缺陷(例如对目标局部区域进行精细特征表示不足)。为了进一步提高对细粒度图像的识别准确率,本文基于现有的细粒度图像识别框架DCL(Destruction and Construction Learning)进行改进,所做的主要工作如下:(1)针对DCL当中传统的对抗性网络模型对图像的几何特征学习效果不明显以及该网络训练困难的问题,提出了一种结合自注意力机制的对抗性网络模型。该模型在对抗性学习中引入自注意力机制来学习全局特征之间的依赖关系,从而增强了对几何特征的学习效果,同时为了提高模型训练的稳定性和有效性,在判别器中引入谱归一化。最后针对交叉熵损失在不平衡数据上训练时,会忽视少量样本的权重比例问题,使用焦点损失来对其进行替换。通过实验表明,该模型在刚性数据集上表现更具优越性。(2)为了进一步优化DCL的综合性能,在保证提高细粒度图像识别准确率的前提下,降低网络结构的复杂度,减少推理时间,提出了一种结合各轻量化模块的细分类网络模型。该模型在分类骨干网络中结合了高效通道注意力模块,可以在不降低通道维数的情况下通过卷积核大小为k的一维卷积来进行跨通道信息交互,从而显著地提升了模型对通道信息的建模速度。同时为了加快模型的推理速度,使用了最新的Rep VGG作为分类骨干网络,该架构具有类似于VGG的推理时间主体,通过结构重参数化的方法在训练过程和推理时间进行解耦,以达到精度和速度的均衡。为了获得更好的分类精度,使用了一种快速且高效的池化方法Soft Pool,使得在下采样激活映射中保留了更多的信息。通过实验表明,这些改进能够明显提升细粒度识别算法的精度,且降低了模型的复杂度。
其他文献
大刍草是现代栽培玉米的祖先种,蕴含了大量优良的抗性基因,是拓宽玉米种质的优良基础材料。转座子曾被认为是“垃圾DNA”,但越来越研究表明其在生物体中的重要性。随着测序技术的发展,大刍草及玉米基因组已经被测序。但是对含转座子的大刍草特异基因尚不明确。本研究首先利用比较基因组手段分析玉米B73与墨西哥大刍草(Zea mays ssp.Mexicana)基因组从而鉴定了含转座子的大刍草特异基因,其次对这些
卫星作为空天网络的组成部分,在全球移动通信领域中发挥着越来越重要的作用,对卫星通信系统的仿真与研究极具现实意义。在3GPP RAN会议上,非地面网络的解决方案已被纳入第五代移动通信(5G)标准,旨在弥补地面网络在信号覆盖、服务质量等方面的不足,5G NTN指出了非地面网络应用地面体制应关注的要素,包括移动性、链路预算、小区模式、服务连续性、频率规划、无线资源管理等,本文结合以上要素,以4G、5G为
四川花生种植、加工历史悠久,是西南地区最大的花生生产和消费地域,以独有的中粒型花生蜚声中外。本研究以栽培花生基因组作为参考进行酶切预测,通过SLAF-seq测序分型技术,对收集的70份四川省花生材料进行SNP标记开发。依据SNP分型结果,分析了70份材料间的系统进化关系和群体结构分化情况。通过两年栽培试验,结合表型鉴定与品质测试进行关联分析,鉴定参试材料重要性状显著关联位点,筛选重要性状候选基因,
试验选取均重为187.49±0.66 g的健康草鱼540尾,随机分为6个处理,每个处理设3个重复。分别饲喂含六种不同水平茶多酚(0、40、80、120、160和200 mg/kg)的饲粮。60天后考察茶多酚对草鱼生产性能和肌肉品质的影响以及作用机制,并根据生产性能和肉质相关指标作为标识确定生长中期草鱼饲粮中茶多酚的适宜添加量。试验结果表明:添加适宜水平的茶多酚提高了生长中期草鱼的增重百分比、采食量
随着人工智能的迅猛发展,多目标跟踪技术的应用场景越来越广泛,在安防监控、智能辅助驾驶、机器人导航等方向取得巨大成功。为了满足这些终端场景的需求,业界广泛采用神经网络处理器芯片进行应用开发。然而随着图像分辨率越来越高,部署在终端的各类人工智能算法算力需求也随之剧增,给神经网络处理器带来新的挑战。因此,本文在计算能力受限的嵌入式神经网络处理器上,设计一种高效、低计算量的4K高清图像多目标跟踪系统,为神
低延迟和高可靠性是无线通信发展的重要趋势。新一代数据链路系统,战术目标网络技术,以及第五代移动通信技术,都对延迟和可靠性提出了更高的要求。在通信业务数据多样化的今天,传统媒质接入协议已经不能满足某些高精度业务的质量需求,基于优先级统计的多址接入协议(SPMA)凭借其出色的性能表现能够应用于这些系统。与传统的链路层媒质接入协议相比,SPMA协议可以为不同的业务提供不同的QoS保障,为高优先级业务提供
由于人脸在二维图像上存在大姿态下的自遮挡问题,与人脸相关的算法在该情况下很难表现的令人满意。近年来基于深度学习的人脸重建算法受到了研究人员的关注,但还是存在一些问题。本文主要研究了基于三维形变模型的人脸重建网络,主要研究工作包括:1.当前人脸重建网络的训练都离不开二维人脸特征点数据集,但是当前这些数据集的标注并不统一,不同的人脸特征数据集标注了不同数量与位置的特征点,导致网络的训练中只能在特定的数
医学图像分析能有效地反映人体的健康情况,辅助医生诊断和治疗,因而受到了学者们的广泛关注。然而,由于医学图像涉及病人隐私,公开数据集稀少,可用的样本量也较少,这对医学图像的智能化分析带来了很大的不便。而元学习在处理小样本学习的问题上具有优势,因此,本文分别以医学图像的分类和分割问题为研究对象,研究基于元学习的医学图像分析方法,主要工作如下:(1)医学图像分割往往需要大量人工标注的数据进行训练,才能达
目的:探讨洛伐他汀(Lovastatin,LV)对三阴性乳腺癌(Triple-negative breast cancer,TNBC)细胞糖酵解的作用及分子机制。方法:1、LV对TNBC细胞代谢的影响:用LV处理TNBC细胞MDA-MB-231后,利用核磁共振氢谱(1H-NMR)技术检测细胞中的代谢物,并用偏最小二乘回归分析法(PLS-DA)分析代谢物VIP(Variable Importance
本研究的目的是考察成纤维细胞生长因子21(Fibroblast growth factor 21,FGF21)对骨骼肌肌纤维类型转化和胰岛素敏感性的影响,并探讨低蛋白日粮对猪肉品质和肌纤维类型的影响及FGF21在其中的作用。试验一:FGF21对小鼠骨骼肌肌纤维类型和胰岛素敏感性的影响试验采用2×2试验设计,选用24只体重相近的6周龄健康C57BL/6雄性小鼠,根据体重分为四个处理,每个处理6个重复