【摘 要】
:
深度学习模型在目标检测任务中取得了巨大的成功主要是因为深度神经网络可以从数据中学习更高级、更深层次的特征。然而深度学习模型严重依赖于大量的带标签数据,但人工数据标注费时费力、价格昂贵,并且在某些应用领域本来就没有足够的数据积累。深度学习分支下的小样本学习希望模型在学习了基类的大量带标签数据后,对于新类,只需要少量的带标签样本就能快速学习。因此,本文拟采用小样本学习思想,提出高效鲁棒的目标检测方法。
论文部分内容阅读
深度学习模型在目标检测任务中取得了巨大的成功主要是因为深度神经网络可以从数据中学习更高级、更深层次的特征。然而深度学习模型严重依赖于大量的带标签数据,但人工数据标注费时费力、价格昂贵,并且在某些应用领域本来就没有足够的数据积累。深度学习分支下的小样本学习希望模型在学习了基类的大量带标签数据后,对于新类,只需要少量的带标签样本就能快速学习。因此,本文拟采用小样本学习思想,提出高效鲁棒的目标检测方法。具体研究如下:(1)基于微调的小样本目标检测模型首先使用大量带标签的基类数据训练一个检测器,然后固定模型中的特征提取器,使用少量的K个带标签的新类样本对分类器和回归器进行微调。由于微调阶段带标签样本的数量少,容易造成过拟合的问题。针对上述问题,在Wang等人提出的模型的基础上,本文提出了一种基于K-组合均值的特征增强模块,具体做法是利用第一阶段训练好的特征提取器获取K个目标的特征,将这K个特征取C Km(1≤m≤K)的组合,为每个组合求其平均特征,并添加到每类的特征样本集合中,在微调阶段使用数量增多后的增强特征样本集对分类器进行微调。实验结果证明了该方法的有效性。(2)基于度量学习的小样本目标检测模型的输入是查询-目标图像对,输出是目标图像中与查询图像相似的区域。模型在基类上训练时,查询图像与目标图像的标签都是已知的,训练的目的是学习查询图像和目标图像之间的相似性度量,与类别无关,然后在测试阶段直接将学习到的度量用到新类数据集上。由于目标图像背景丰富,并包含多类前景对象,导致算法对于存在相互关系的类别容易产生错检的结果。针对该问题,本文提出了一种基于目标互换的数据增强策略。具体做法是,在基类上训练时,将目标图像中与查询图像属于同一类的目标互换,生成新的查询-目标图像对作为输入。实验结果证明通过这种策略为度量模块的学习提供了更具有多样性的对比样本,提升了在新类和基类上的检测精度。(3)由于基于度量学习的小样本目标检测算法只关注查询图像与目标图像之间的相似区域,导致该类算法对于外观相似的不同类目标和外观差异较大的同类目标检测精度差。针对该问题,本文提出了一种基于语义特征的特征对齐网络。具体做法为,将查询图对应的类别语义名称作为知识,计算对应的词向量作为语义特征,并与查询图的图像特征进行融合。实验结果表明该方法引入的语义信息是可行的,提升了在基类和新类上的检测精度。
其他文献
微波无线能量传输系统(MWPT)由发射端和接收端两部分组成,其接收端包括:接收天线、整流电路和阻抗匹配电路。因为能够进行远距离传输,微波无线能量传输系统具有很大的应用潜力。能量转换效率作为评价微波无线能量传输系统性能的重要指标,通过改善系统不同组成部分的转换效率可以达到提高整体效率的效果。为此本文通过对接收端整流电路的核心器件--肖特基二极管进行设计,优化器件的材料物理参数,旨在提高MWPT系统的
当前,大规模降低二氧化碳(CO2)排放是我国实现碳达峰、碳中和所面临的重大技术需求。基于醇胺溶液的化学吸收法是现阶段最为成熟的燃煤电厂烟气CO2的减排技术,然而再生能耗过高成为制约其大规模工业化应用的主要因素。降低溶剂水的无用功、开发高效低能耗的新型醇胺吸收剂,已经成为碳捕集领域重要的研究方向之一。针对传统醇胺水溶液在CO2捕集中存在的上述缺陷,本文选取具有较高CO2吸收容量的N-氨乙基哌嗪(AE
北京2022年冬奥会和冬残奥会(以下简称“北京冬奥会”)是我国重要历史节点的重大标志性活动,是展现国家形象、促进国家发展、振奋民族精神的重要契机。中国政府高度重视北京冬奥会筹办工作,习近平、韩正等多位中央领导同志作出了一系列重要指示,提出了四个办奥理念,其中就包括廉洁办奥。廉洁办奥理念对北京冬奥会筹办工作具有重要作用,应贯穿筹办工作始终。本研究主要运用文献资料法、访谈法和质性研究法,通过总结分析往
目的:踝关节扭伤是最常见的运动损伤之一,损伤人群众多。临床调查显示,73%的踝关节扭伤人群在损伤后18个月内仍存在后遗症状,表现为疼痛、活动度受限、关节控制不良、关节不稳及反复扭伤等,这一状态被定义为慢性踝关节不稳(Chronic Ankle Instability,CAI)。其中反复扭伤被认为是该人群最为困扰且治疗成本最高的问题,现阶段由于对CAI人群频发反复扭伤的原因及机制不明,除长期佩戴防护
在计算机视觉研究领域中,三维场景理解一直是一个重要的研究方向。随着三维点云采集设备的不断发展,基于三维点云的场景理解受到越来越多研究者的关注。三维点云语义分割作为三维场景理解中重要的基础性问题,被广泛地应用在自动驾驶、机器人导航、室内场景分析等实际场景中。但是由于三维点云的稀疏性、无序性和非结构化特性,以及相关点云采集设备的影响,使得三维点云语义分割问题仍然面临诸多的困难和挑战。本文主要研究三维点
传统图像传感器采用“帧扫描”的方式捕获场景中的信息,每帧图像中有大量冗余数据,并且受曝光时间的限制,时间分辨率难以进一步提高。受高等生物视觉神经系统的启发,动态视觉传感器(Dynamic Vision Sensor,DVS)的每个像素点独立地检测场景中光强的变化,光强变化超过阈值的像素点会产生像素事件信息,这些事件信息通过地址事件表示(Address Event Representation,AE
过渡时期理论是马克思主义理论特别是科学社会主义理论的重要内容,对于现实社会主义国家和准备走社会主义道路国家的实践具有重要指导意义。马克思、恩格斯把过渡时期界定为从资本主义向共产主义之间的革命转变时期。1917年十月革命胜利后,列宁在继承马克思、恩格斯过渡时期理论的基础上,对落后国家向社会主义过渡的方式进行了探索,先后尝试了以战时共产主义政策为特征的直接过渡,和以新经济政策为特征的迂回过渡两种方式。