基于域适应的目标检测算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:aiming9583o
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测往往假设训练数据集和测试数据集采样于同一分布,但这在现实条件下往往不成立,从而影响目标检测性能。基于域适应的目标检测可将在有标签的源域数据集上训练的检测器泛化到另一无标签的目标域数据集上,摆脱新数据集上繁重的标注工作。本文创造性地提出了两种域适应目标检测模型。现有方法一般将鉴别器部署在检测网络不同阶段并通过对抗训练拉近源域和目标域间的图像级特征或物体实例级特征,或用风格迁移拉近像素级特征。但这些方法仍有不足之处,图像级特征拉近只将全局特征对齐却忽略了类别信息,破坏了语义;实例级特征拉近将基于伪标签得到的实例特征的所有区域同等程度拉近,忽视了物体的局部结构特征和语义鉴别性特征,易受到不准确的伪标签的影响;在两阶段检测网络中,忽略了提升区域建议网络(RPN)的召回率,导致在目标域上漏检很多物体。为解决上述问题,本文创造性地提出了代表性特征对齐的域适应目标检测网络和基于增强RPN的域适应目标检测网络。代表性特征对齐的域适应目标检测网络设计由类别权重生成器、类别选择和类激活映射组成的代表性特征提取模块,将主干网络不同层的特征输入代表性特征提取模块逐层提取物体的局部结构特征和语义鉴别性特征,并将这些特征自适应融合后作为代表性特征,最后将源域和目标域同类别的代表性特征对齐,实现精确的特征对齐,降低背景区域的影响。基于增强RPN的域适应目标检测网络设计了增强RPN模块,即将根据源域标签裁剪的物体区域作为源域模板,分别将模板特征和图像全局特征进行实例归一化,消除域特定的全局信息的影响;再用模板特征通过余弦相似度滑动更新构建模板字典,字典中每一项对应一种类别;然后将每一项与全局特征的注意力计算结果融合后作为增强特征并将其输入RPN,可过滤掉背景和干扰物体,提升RPN召回率;此外,我们将增强特征在两域间对齐,实现前景对齐,进一步提升域适应目标检测性能。本文在多个基准数据集上进行大量实验,实验结果验证了本文方法的有效性。
其他文献
目前,聊天机器人是智能机器人和人工智能领域中的研究热点,它的主要目的和功能是实现智能化的人机交互。考虑到一个完整的对话会涉及到上下文,因此如何提高聊天机器人对上下文的理解成为了需要解决的主要问题。现在最新的研究方法是采用注意力机制将语句解析成更深层次的粒度表示,以此获得更多上下文间的相关信息,以提高模型的准确性。虽然基于注意力机制能以更低的计算量得到更好的准确率,但在挖掘不同层次粒度的信息方面仍然
学位
锂-氧气电池由于较高的理论能量密度(3860 mAh g-1),因而具有较大的应用前景,非常有望成为下一代新型储能电池。在锂-氧气电池中,过氧化锂(Li2O2)的难溶解性及难导电性导致电池充电电压过高(>4.0 V)和电池严重极化,进而导致电池的性能以及能量转换效率低下,情况严重时会导致电池过早衰竭。当前,Li2O2的分解问题一直无法得到有效解决。本论文针对上述问题,利用Au/Sn O2介孔纳米管
学位
二氧化碳(CO2)是大气中主要的温室气体。其在大气中含量的持续增加造成了严重的气候问题,未来将严重影响人类社会的可持续发展。因此发展CO2捕获和转化技术对碳减排并最终实现碳中和具有重大意义。其中,利用CO2和环氧化物通过环加成反应生成环状碳酸酯是最有前景的CO2捕获和转化技术之一。此方法不仅可以捕获CO2,其反应产物也可作为前驱物用于高附加值药物和聚碳酸酯的合成。由于CO2分子比较稳定,选择高效稳
学位
医学图像广泛应用于各类医疗诊断任务中。然而,在医学图像成像过程中,容易遭受环境干扰等因素的影响,出现获取的医学图像质量不佳或者感兴趣区域细节丢失等情况,给诊断带来障碍。传统的对比度增强方法可以有效提升图像质量,但是大部分方法在增强后会造成图像细节信息有不同程度的损失。对于医学图像而言,细节信息可能是诊断和治疗的关键。另外,现有的对比度增强算法大部分基于图像全局进行增强,但是在使用医学图像的时候更多
学位
多酸基配合物(Polyoxometaltes-based compounds)是无机化学领域的一个重要的研究方向。将多酸作为建筑模块,与金属阳离子和有机配体通过配位作用相互连接,形成结构多样、尺寸各异的一维链状、二维网状和三维化合物。金属-氧簇合物的合成方法多种多样,比如水热法、常温法等。另外,合成过程中的p H、反应温度和时间,以及原料的选择和配比都对化合物的合成有着重要的影响。由于多酸化合物的
学位
能源对于所有生物的重要性不言而喻。目前,为满足能源需求,化石燃料等资源的过度使用导致环境受到了严重的破坏。而CO2是化石燃料燃烧产生的温室气体之一,也是造成全球变暖的根本原因。为此,人们已经采取了许多措施来减少环境中的CO2含量,如碳捕获与储存、工程碳矿化和热化学还原等。但这些方法仍然存在一些缺点:成本昂贵、对电压和温度要求较高、不可持续等。因此,我们亟需一种替代的可持续的解决方案,同时实现环境中
学位
人脸图像超分辨率重建的目的是将一张或者多张低分辨率人脸图像恢复为高分辨人脸图像,它具有重大的应用价值。但是,如何在较大的超分因子下获得良好的人脸超分辨率重建效果,目前仍然是需要进一步探究的问题。因此,本文提出了一个基于人脸结构信息的重建网络和一个基于生成对抗网络的重建网络,以进行8倍超分因子的人脸图像重建。借助人脸的先验信息来引导网络的超分辨率过程,能够有效地增强人脸图像的重建效果。因此,本文提出
学位
目前,图像超分辨率研究通常可以分为两种,分别是单图像超分辨(Single Image Super-resolution,SISR)和参考图像引导超分辨率(Reference Image Guided Super-resolution,Ref SR)。其中,SISR仅接受单张低分辨率(Low-resolution,LR)图像作为输入,其重建的图像往往会产生模糊或者伪影现象,主要原因是因为原始的高分辨
学位
近年来深度学习技术在计算机视觉领域的成就令人瞩目,这和大规模标注数据集的面世密不可分。然而模型的性能对标注数据的规模、标注质量等非常敏感。从任务本身或者有限数据挖掘可用的先验知识并有效的融入网络结构设计、训练过程中,是缓解模型训练依赖数据的有效途径之一。本文就视频补全和伪装物体检测这两个计算机视觉任务,利用任务或数据的先验知识引导网络的设计和训练。视频补全利用视频中的可见部分,补全缺失的内容,使得
学位
作为一种分子振动光谱,表面增强拉曼散射(SERS)光谱技术可以提供分子丰富的“指纹信息”,灵敏度高,可以实现快速原位无损分析,已广泛用于食品安全、环境分析、生物医学和药物检测等领域。SERS技术在分析检测方面表现出的巨大优势,可以用于保健产品中非法添加化学药物的检测。本文制备了两种功能化的银纳米粒子作为SERS基底,用于不同种类化学药物的定性分析和定量检测。采用原位还原法在金属有机骨架(MOFs)
学位