基于基类数据和新类别数据的小样本目标检测

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hurukun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机视觉研究领域越来越受到关注,其中分类任务、检测任务以及分割任务更是计算机视觉中的重点研究方向。随着深度学习技术的发展,目标检测模型的精度虽在不断提高,但是作为监督学习来说,其需要大量带标注训练样本的本质并没有改变。在实际场景中,训练出一个特定的目标检测模型需要大量的标注样本,而某些特定目标类别图像的获取具有一定难度。小样本学习致力于缓解该类问题,并且在图像分类任务中已具有一些研究成果。但是对于更难的目标检测任务来说,小样本学习还处于一个起步阶段,模型的精度和泛化能力都有待提升,需要后续复杂的处理技术和算法。因此,小样本目标检测是一项极具挑战性的任务。为了探究小样本目标检测任务的难点,本文基于“基类数据”和“新类数据”,研究小样本目标检测算法并改进模型,提高模型对于只提供少量样本的新类别目标的检测效果。以下是本文的研究内容:首先,在特征处理阶段,设计了大小自适应的全局特征注意力模块SGFA和支持集注意力模块SSA。SGFA能够分别在支持集和查询集分支上利用全局特征信息实现对不同大小特征的加权,提高模型在缺失样本条件下对重点特征的关注度。SSA通过提取支持集图像的类别特征来控制模型在检测过程中对特定类别目标的检测,使模型将检测的重心放在所给定的类别上。本文利用此结构来提高目标检测模型对只提供了少量标注样本的新类别目标的检测效果。其次,在最终检测阶段,设计出了“关系检测器”用来替代常规目标检测中的分类器。该关系检测器通过比较候选框特征和支持集类别特征的相似程度来实现分类,且可以在不改变结构的情况下实现不同类别数的N-way K-shot检测。该关系检测器使用简单的全连接结构,从全局、局部以及深度匹配模式中学习类别特征和候选框特征间的相似性。最后,为了验证各模块的有效性,本文在不同数据集上,通过设置不同数量的可利用新类别样本来进行实验探究,展示其在N-way K-shot小样本目标检测任务中的检测结果,且和相关研究者进行了对比分析。本文模型相比其他同类模型,在m AP指标以及大部分类别的AP指标上略优于其他方法。
其他文献
随着移动传感和无线通信技术的发展,基于位置信息的社交网络(LBSN)和服务(LBS)越来越多地出现在人们的日常生活中。这些应用在服务过程中产生了大量的时空数据,隐含着用户的移动规律和活动意图信息。这些信息可以为其它下游应用提供信息支撑,并促进各种时空数据挖掘任务研究。在各类时空数据挖掘任务中,轨迹用户链接(Trajectory-User Linking,TUL)问题的目的是将轨迹分类到生成该轨迹的
学位
<正> 本病是由于某种原因引起局部粘多糖堆积而造成的机体局部性水肿,多发生在胫骨前、手足背、肩背等部位,常并发于甲状腺机能亢进或减退的患者,西药疗效较差。近年来笔者用验方“水土散”治疗本病多例,疗效满意,兹介绍如下,以供参考。
期刊
在数字信息时代下,如何确保数据的安全性一直是大众关注的焦点。作为保障信息安全的关键措施,数字签名能够为网络通信供身份认证能力,确保消息在网络传输中的完整性与不可抵赖性。而随着云计算、物联网等新兴场景的爆发,单一的数字签名已不再能满足实际场景中的复杂业务需求。为此,具有不同功能特性的数字签名被相继出。其中,可撤销的数字签名不但兼具传统数字签名的数据安全保护能力,还拓展了有效的用户撤销机制,能够对密码
学位
目的:描述和分析1990—2019年中国居民尿路结石疾病负担变化趋势,为预防和诊治尿路结石提供参考。方法:基于2019年全球疾病负担数据,选取发病数、发病率、死亡数、死亡率、伤残调整生命年(disability-adjusted life years, DALYs)、伤残寿命年(years lived with disability, YLDs)、早死引起的生命损失年(years of life
期刊
本论文以中国高校法语专业基础阶段教学中的教师口语评估实践作为研究对象,旨在探究教师实践行为与其表征之间的关系,即双方如何相互构建,相互影响。文章在理论框架部分定义了评估的内涵、种类、作用、评估参与者及辅助工具;分析了口语在外语教学过程中的地位以及相关的口语活动;并对社会表征的概念、功能以及在外语教学中的运用做了阐述。在此基础上,论文将官方政策文件中对于口语教学和评估的要求作为研究的宏观背景,以上海
学位
部分失业是各国政府在突如其来之经济危机中常用的一种紧急就业政策,也可以被描述为一种不充分就业形态。在法国,从19世纪末以来,部分失业就随着工业革命的浪潮初现雏形,体现出国家对工厂工人的保护,但是多年来部分失业作为一项紧急反失业政策在法国政府的政策工具箱中始终不占主流。在过去的一个多世纪以来,法国社会经历结构性巨变和多次经济危机,尽管国家放松了对经济的管制,但是始终不曾真正退场,而是通过各项政策组合
学位
代理重加密(Proxy Re-Encryption,PRE)因其能安全地实现密文转换而备受关注,被广泛运用于云计算、车联网、物联网等场景中以实现灵活的安全访问授权功能。然而,目前绝大多数代理重加密方案仅针对单个密码体制设计,难以实现不同密码体制下的密文转换,从而无法满足异构场景中的使用需求。此外,现有的可穿刺代理重加密方案不仅承担着繁复的证书管理开销,而且仅在非标准的数学困难问题假设下实现了选择性
学位
<正> 宋××,女,24岁,1993年12月19日初诊。2年前颜面及下肢浮肿,按之凹陷,小溲短少。曾反复发作,西医诊断为慢性肾炎。2个月前,因劳累过度,上述诸症加重,开始治疗时投以大量中西利尿剂,小便虽有增加,但浮肿时轻时重,细观其面色晦暗,腰膝酸软,四肢清冷,纳差,舌质暗红胖
期刊
随着计算机视觉在各行各业越来越多的应用,业界对其实时性、内存消耗等性能要求也越来越高。然而,目前绝大多数视觉算法都是为计算资源充裕的服务器设计的,并不适用于资源受限的嵌入式终端。而针对嵌入式设备设计的视觉算法,也较少通过GPU对算法进行细粒度的拆分或优化,导致端到端延迟较高。基于以上背景,针对现有计算机视觉算法的GPU加速和细粒度重构问题,本文在多核CPU+GPU异构环境下,面向行人目标追踪,研究
学位
近年来,语义分割任务越来越受到计算机视觉领域研究者们的关注,是当前人工智能领域的研究热点之一。目前最先进的语义分割方法往往为了达到较高的性能而带来巨大的计算开销,难以做到推理速度与模型精度的平衡,并且对于硬件资源受限的设备来说难以部署。由于实时语义分割在人工智能领域应用的广泛性和必要性,所以吸引了众多的研究者,但是使语义分割模型能够达到分割速度与精度的平衡是一项具有挑战性的任务。为了解决这一难题,
学位