面向Few-shot图像分类的神经网络结构研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:JohnWaken19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大样本条件下,深度学习模型在图像识别领域取得了极大的成功,在很多图像识别任务中也已经超过了人类识别的水平。但在训练样本极少的情况下,传统大样本的深度模型极易产生模型过拟合和模型泛化能力低的问题,即大样本条件下的深度学习模型无法满足小样本条件下的学习问题。基于此,许多研究工作通过数据增强、自监督以及利用语义信息等方法以弥补训练样本量不足的缺陷,并引入迁移学习、元学习等方式来预训练模型或加速模型优化,进而改善模型泛化性能。但由于这些方法仍然无法满足训练样本量极少条件下对模型图像分类性能的要求。因此,本文基于传统的神经网络结构,针对上述问题完成了以下三个工作:1.提出了一种新的适用于Few-shot图像分类的混合注意力机制。在小样本条件下,样本的细节特征对分类性能的影响非常重要,而目前的方法很少关注图片的细节特征和空间特征。基于上述问题,本文提出将通道注意力和空间注意力结合起来,构成一种新的混合注意力机制。该混合注意力机制在空间维度提取更精细的特征,在通道维度提取更具区分性的特征。通过融合这两种不同的特征,学习更简约、更有用的信息,从而提高神经网络在Few-shot图像分类上的准确性。实验结果表明,本文提出的方法与现有的方法相比,模型的分类精度显著提高。2.提出了一种新的适用于Few-shot图像分类的双相似性网络(BSNet)结构。目前基于度量学习的Few-shot学习都采用单度量的网络结构,而这种结构极易产生度量偏差,导致模型的泛化能力降低,特别是在训练数据量较小的情况下则更为明显。为了解决这一问题,本文在单度量网络结构的基础上,设计了一种新的双相似性网络结构,从两种不同的度量角度对特征样本的空间进行约束,使学习的特征能同时适应两种相似性度量,将同一类内的样本映射到更小的特征空间中,从而缓解单度量模型带来的度量偏差问题。在多个细粒度数据集上的实验结果表明,本文提出的方法与现有的方法相比,模型的泛化性能显著提高。3.提出了一种新的适用于Few-shot图像分类的局部特征Transformer。目前的Few-shot学习往往会忽略局部特征间的关系,从而在特征提取时不能正确识别背景及无关信息,导致模型分类结果极易产生偏差,模型的泛化能力不足,特别是在训练数据量较少的情况下则更为明显。为了解决这一问题,本文在Few-shot分类任务下改进特征提取方式,设计了一种新的面向Few-shot图像分类的局部特征Transformer网络结构,在每张图像的局部特征间使用自注意力机制,使得图像的局部特征更加紧凑,从而让特征更具判别性和识别度。在多个Few-shot数据集上的实验结果表明,本文提出的方法优于现有的分类方法。本文通过对Few-shot图像分类问题的研究,所提出的三个方法都对神经网络结构进行了改进。这些改进的网络结构不仅能够提升Few-shot图像分类的性能,而且能够作为一个即插即用的模块应用于已有的网络结构上,来解决诸如目标检测、行人重识别、文本分类等其他任务。
其他文献
青少年肌阵挛癫痫(juvenile myoclonic epileps,JME)是一种集中发病于青少年时期的特发性全面性癫痫。其临床表现主要为:肌阵挛癫痫发作,全面失神发作以及全面性强直阵癫痫,认知障碍和运动障碍。目前对JME的研究均从脑网络全局拓扑结构特征的角度来分析JME的发病机制,而具有相似的全局拓扑结构特性的网络却可能体现不出不同的脑网络局部拓扑结构特征。因此,本研究利用复杂网络模块化的R
学位
大学英语视听说教学是大学英语教学至关重要的一部分,但对其课程思政的研究还有待完善,本研究以《新视野大学英语视听说教程(思政智慧版)》为抓手,通过深挖教材寻找大学英语视听说教学课程思政的切入点,讨论了PIER模式在视听说课程思政育人中的应用。大学英语视听说课程思政应当以教材为切入点,PIER模式实现了大学英语视听说教学过程与育人过程浑然天成,使学生在习得语言技能的同时收获德育教育。
期刊
流水车间调度问题是一种典型的组合优化问题,在现实工程中有广泛的应用。随着智能制造的发展,应运而生的分布式流水车间调度问题具有高维、复杂、多约束的特点,设计高效的求解方法有助于提高生产效率,提升企业竞争力。零等待流水车间调度问题是调度问题的一种,其特征是生产工序之间不能存在等待时间,这类问题常见于轧钢、食品药品加工过程。考虑到对资源和环境的影响,绿色制造已是世界各国关注的热点,发展绿色制造势在必行。
学位
大学英语课程在教学内容、教学材料、教学方法、教师背景等方面具有特殊性,因此在大学英语课程中开展课程思政既有必要性,也有艰巨性。大学英语学科内容与课程思政相融合存在常见误区,即:混淆课程思政与思政课程、简单等同于跨文化教育、单一化为人文教育、局限于语言文化知识传授等。基于这些问题,本研究尝试构建一个目标精准、内容系统、流程渐进、评价全面的“学术英语视听说”课程思政实施框架,该框架以“全球英语”和“产
期刊
我国《刑法》增设了妨害药品管理罪,该罪所侵害的是双重法益,在犯罪类型上属于具体危险犯,其“足以严重危害人体健康”的界定对犯罪构成要件作了限制。对于该罪与他罪竞合的情况,应坚持“法定刑标准说”并辅之以法益保护论,排除掉不应适用该罪名的情形,并在法秩序统一性之下完善该罪的行为规制内容。
期刊
“碳达峰、碳中和”目标的实现将推动产业结构和社会经济转型,给各行业带来巨大的发展机遇和挑战。越来越多的国家已就净零排放达成共识。本文介绍了国内外碳达峰碳中和形势以及能源转型的趋势,结合国际石油公司的转型策略,提出双碳目标下的石油企业的应对建议,包括提高能源开发利用效率、推动非常规天然气勘探开发、实施新能源工程应用、开展负碳技术创新及示范等,为未来石油企业更好地实现绿色低碳发展及“双碳”目标提供参考
期刊
深度学习作为非常火热的研究方向,落地应用广泛。本文基于深度学习技术,对气温进行时间序列建模,通过分析真实的气象数据,提出了改进的深度学习融合模型。本文主要研究内容如下:(1)数据处理与特征工程。数据集包含两种类别,图结构数据的处理过程是:首先通过经纬度计算出气象站之间的距离,然后通过距离得出图结构的表示;节点特征数据的处理过程是:首先使用方差选择法和相关系数法进行特征选择,然后将时间维度的数据使用
学位
命名数据网络(Named Data Networking,NDN)作为未来互联网体系架构最具竞争力的候选架构,由于其在移动支持方面的优势,NDN与车载自组织网络(Vehicular Ad-Hoc Networks,VANET)的集成架构NDN-VANET成为该领域研究热点。在VANET/NDN-VANET中广泛采用机器学习技术来解决通信、安全和交通管理等方面的问题,然而,机器学习的训练和预测阶段面
学位
近年来,随着计算机科学和人工智能等学科技术的发展和普及,3D场景理解在计算机视觉中引起了越来越多的关注,成为无人驾驶、机器人应用场景下的重要组成部分。尽管目标检测在2D方面取得了重大突破,但直接将这些方法运用于增加了维度和角度信息的3D检测任务中是不合适的,所以探索出更加适合3D检测任务的方法就显得尤为重要。随着传感器技术的不断发展,3D目标检测也不仅仅局限于用2D RGB图片转换来获取信息,更多
学位
由于大数据的广泛使用,以及各类智能电子设备的普及,特别是随着5G的迅速发展,流量出现了爆炸性增加,人们对通信速率的要求变得越来越高。以致射频通信的频谱资源出现紧张状态,无法满足现有的频谱需求。而无线光通信可以有效缓解频谱资源紧张问题。但无线光通信系统容易受温度、气候等环境因素以及电子设备硬件接收速率的影响,以至于限制了无线光通信的实际应用。因此,怎么在不改变系统功率、带宽的前提下,提高通信系统的传
学位