开放场景的域适应目标检测与搜索方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lb_super
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测和搜索问题具有广泛的应用场景。然而,现有的检测和搜索算法往往基于封闭条件进行设计,忽视了开放环境下的应用需求。其中,目标检测算法常假设训练测试数据分布相似,忽略了实际运用场景的复杂性,缺少对不同环境的适应能力。目标搜索算法仅考虑前景信息,忽视了图像的复杂性,忽略了目标检测作为其前置任务的重要性。本文主要研究开放场景下的目标检测和搜索任务,通过跨域目标检测和多任务集成学习提升模型对环境的适应能力。本文主要有以下学术贡献:(1)提出了源域引导的多层级对抗跨域目标检测模型传统检测模型忽视了环境变化导致的图像分布差异,进而将其反应到特征上,导致模型环境适应能力差。为此,本文提出多层级对抗域适应模型以实现不同层级的域间差异最小化。具体来说,为了对不同卷积块中的特征进行混淆,本文提出了多层级对抗模块并设计了尺寸缩小模块以提升训练效率;为了实现目标层面的语义对齐,本文进一步提出了特征融合对齐模块并设计了加权梯度反转层以实现对难样本的学习。通过多层级对抗域适应学习,显著减少了域间差异,提升了跨域目标检测的精度和环境适应性。多层级对抗缩小了域间差异,但忽略了模型可迁移性。跨域目标检测中的目标域由于缺乏标签而特征分布杂乱。在对抗学习过程中,源域分布会靠近目标域,使其判别性特征分布被破坏,进而导致源域崩塌,影响模型可迁移性。为了在缩小域间差异的同时,保持模型可迁移性,本文提出了源域引导的训练策略。具体来说,通过知识蒸馏算法,利用源域预训练模型提供的分布信息对模型进行监督,进而帮助模型保持较好的源域分布,保证其可迁移性。此外,为了获得更好的特征边缘分布,本文提出了双判别器特征混淆模块以分离前景背景样本。最终,本文提出的源域引导多层级对抗模型可在缩小域间差异的同时,保持模型可迁移性。(2)提出了部分对齐的非对称三路检测网络对抗学习虽然减小了域差异,但也会影响模型的可迁移性。传统共享参数的网络会累积对抗学习产生的源域扭曲,造成模型可迁移性下降。同时,特征之间域差异难以完全消除,残留的域差异也会影响模型的效果。为此,本文提出了非对称的三路网络结构。具体来说,其中参数独立的辅助网络可以免受源域崩塌的影响,进而保证模型可迁移性。同时,辅助网络提供的辅助目标域样本调整了检测器的判决边界,缓解了残留域差异带来的影响。最终,模型在跨域目标检测任务中取得了更好的效果。然而,现有的基于对抗学习的域对齐方法均面向图像的整体特征。由于特定环境下采集的数据包含不适用于其他环境的私有信息,对特征进行整体对齐会强迫目标域特征包含源域私有信息,导致负迁移。为此,本文提出了部分对齐的特征混淆策略。具体来说,为了在训练过程中实时定位并对齐域共有特征,本文提出了域间对抗模块。为了分离域共有特征和域私有特征,本文基于互信息量理论提出了域内对抗。通过结合域内对抗和域间对抗,模型实现了域私有特征和域共有特征的分离,避免了负迁移的发生。(3)提出了“分而治之”的端到端“检测-匹配”集成网络图像搜索模型传统的目标搜索模型忽视了图像中的大量背景信息而独立进行设计,这使检测-匹配算法之间的耦合性不佳,难以取得较好的搜索效果。为此,本文提出了一种端到端的“检测-匹配”多任务集成网络,通过端到端多任务联合训练,提升检测和匹配任务的耦合程度。为了解决端到端训练中样本数目不足的问题,本文采用双路网络结构,在增加输入样本的同时,丰富了样本配对方式。为了训练特征度量,本文提出了在线匹配损失和难样本优先损失,通过特征存储增加训练样本数量。结合网络结构和损失函数的改进,模型实现了端到端多任务训练并取得了较好的实验结果。进一步研究发现,检测和匹配任务具有不同的关注点,即检测任务关注前景和背景等局部信息,而匹配任务更加关注前景的高级语义之间的差异性。然而,上述端到端集成模型利用相同的特征同时实现检测和匹配任务,从而增加了模型的训练难度。为此,本文提出了“分而治之”的网络设计思想。具体来说,通过在不同任务间共享浅层网络,分离深层网络,同时提升了检测-匹配任务的精度。此外,由于输入样本类别过少,难样本优先损失函数更新缓慢,本文进一步提出了一种基于特征中心的难样本优先损失以提升训练效率。结合损失函数和网络结构的改进,模型在目标搜索任务上取得了更好的表现。
其他文献
水力压裂页岩气初期采出率仅5%~15%,远低于预期。当前研究受限于缝内均匀流体压力假定,未反应实际缝内流体流动、泵速变化等引起的(沿裂缝长度)非均匀分布形式,以致对水力裂缝起裂扩展以及裂缝间交汇机制认知不够清晰,复杂缝网形成机理尚不明确,这直接影响页岩气抽采效率。为此,本文依托国家自然科学基金地区基金项目“非均压流体驱动水力裂隙起裂成网机理及有效缝网控制(52064006)”,以各向异性页岩为研究
学位
报纸
民族院校因其区别于其他普通院校的“政治”与“民族”属性,在培养人才方面具有特定的功能,主要体现在为少数民族与民族地区服务。从历史的角度进行考察,民族院校从创立之初即以培养少数民族人才为首要重任,并经历了政治干部人才、专业技术人才、高层次高素质人才再到以立德树人为根本的不同主导目的时期。民族院校培养民族人才特定功能的对象观、去向观、类型观在历史演进中具有不同的变迁特征,在其转型之余甚至引发了社会对这
期刊
在刑法教义学的推动下,我国刑法学从犯罪论体系着手,迈进了一个知识转型与理论更新时期。具体而言,刑法教义学的核心内容同时包含着对有效法的解释与刑法知识体系化。但相较于对有效法的解释,当下的刑法教义学似乎过于强调刑法知识体系化,它试图走向用一个体系解决全部犯罪论问题甚至刑法问题的路子。即在犯罪论体系中机械地发展统一的教义规则,致力于将体系完善到无需对具体问题进行考量,但却使得犯罪论体系丧失对接具体事实
学位
报纸
视频广泛使用于日常生活,公共安全,航天航空等应用领域。视频在采集,传输和存储中,因为受到各种因素的影响可能会产生模糊现象。由视频采集设备抖动或物体运动引起的运动模糊是最常见的视频模糊。模糊的视频不仅直观地影响视觉感受,而且会丢失视频中的部分重要信息,对视频信息的提取和辨识等分析工作带来影响。因此,如何有效地获得清晰的视频是学术界和工程界长期关注和研究的重点问题,因此,该研究有重要的学术价值和重大的
学位
随着经济的发展,人类社会面临的能源危机与环境污染问题日益突出。开发绿色、清洁、可持续的新型能源刻不容缓。氢能作为理想的终极能源,对人类社会摆脱化石能源依赖与实现可持续发展起着至关重要的作用,而电解水制氢被认为是人类社会实现绿色发展的关键环节。然而现阶段电解水制氢过高的成本严重阻碍了该技术的进一步发展,其根本原因在于电解过程析氢、析氧过电位高导致能量利用率低、能耗高。因此设计和制备高性能、廉价的电解
学位
遥感影像涵盖的目标范围广泛,既有尖锐边界且独立于背景环境的人造物体目标(如车辆、船舶、建筑物等),又有边界模糊且属于背景环境一部分的景观目标(如山地,丘陵区域),在军事目标精确打击、国防安全、土地资源调查、生态环境监测、自然灾害监测、地质灾害探测等领域有广阔应用前景。遥感影像目标检测技术是遥感影像处理与分析中的核心研究内容,旨在某个给定的遥感影像中,检测其是否包含一个或者多个感兴趣目标,并确定每个
学位
随着中国经济进入高质量发展阶段,科技发展对于社会生产力提升的推动作用更加突出。作为一项重大决策,近年来国家创新驱动发展战略得到了循序渐进的部署与推动,在此过程中城市作为创新资源与环境的载体,已不断提升自身自主创新能力,但总体上仍面临创新投入少、创新质量不高以及关键核心技术亟待攻关等现实困境。优化营商环境是城市追求科技创新的一种有效方式,只有营商环境达到一定水平,才有可能促使国家获得技术创新优势,优
学位
21世纪后建筑火灾发生起数仍居高不下,而火灾不仅引起建筑材料性能的退化,而且直接影响钢结构建筑的安全性。从世贸中心的真实火灾事件和卡丁顿真实火灾试验中可以知晓钢结构中最薄弱的部分是节点域,其在保持结构的鲁棒性方面起着决定性作用。在现有标准火和自然火试验研究中,发现传统半刚性节点由于碳钢螺栓的高温敏感性而可能过早失效,这样其他连接构件的性能未能完全发挥。然而,奥氏体螺栓不仅在常温下表现出显著的延性,
学位