基于迭代融合与双向增强的目标检测算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zhangqian728
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为图像理解的核心任务,目标检测是目标跟踪和实例分割等复杂视觉任务的基础。目标检测的任务就是识别图片或者视频中出现的预先设定好的目标物体类别并且返回目标的准确坐标位置和类别置信度。近年来,随着深度学习技术的发展和应用,研究人员们设计和实现了许多新的高效目标检测器。由于目标检测经常应用于诸如异常事件检测和汽车自动驾驶这样对实时性要求比较高的任务,单阶段目标检测器由于其较高的推理速度,成为了众多研究者们优化和改进的重点。目标检测在不同的复杂场景中物体的尺寸差异很大,其对于小物体的检测比较困难,而且可能出现角度偏差和物体遮挡等现实问题,这都会导致检测器的检测效果并不理想。所以,如何在单阶段目标检测器的基础上设计出检测精度更高同时实时性高的目标检测器具有重要的研究意义和价值。本文基于此研究意义所做的工作如下:(1)为了设计出检测精度更高的目标检测网络,本文首先调研并分析了现阶段基于单阶段目标检测器的检测框架的缺点和不足,然后又基于单阶段目标检测SSD提出了迭代特征融合模块。在模块设计中,特征金字塔前一级的输入特征图通过卷积生成三个具有不同接受域的特征图,然后将它们级联生成下一级的特征图。网络结构的层级间迭代融合使特征图不仅获得了足够详细的形状信息,而且添加了相应的上下文语义信息,提升了网络整体的检测精度。(2)为了更进一步地发掘出金字塔结构中特征图的特征表示能力,本文对目前特征增强结构的优缺点进行了分析,并且在SSD的基础上设计出了一种全新的双向特征增强模块。在双向特征增强模块中分别把通道增强模块和空间增强模块集成在两个不同路径中,最终把它们融合在一起,从而使特征图能够同时在两个维度上进行特征增强。(3)为了进一步获得检测精度更高的单阶段目标检测器,本文将双向特征增强模块和迭代特征融合模块结合在同一个检测网络中,并进行了大量的实验来验证检测器的高效性。在PASCAL VOC 2007、PASCAL VOC 2012和MS COCO三个广泛使用的数据集中的训练和验证结果表明,本文的模型在保证推理速度基本不受影响的情况下实现了更高的检测精度。
其他文献
合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种高分辨率成像传感器,能够提供丰富的地物信息。与光学图像相比,SAR图像可以在全天候、全时条件下获得更有效、更全面的地物信息,从而有效提高了地物分类的能力。因此,现阶段SAR图像地物分类在相关领域扮演着越来越重要的角色。本文立足于SAR图像分类的主要问题——图像预处理以及分类,开展了SAR图像地物分类算法的关键技术研究。
学位
人体皮肤表面积(Body Surface Area,BSA)在体质评价、运动训练,尤其是医学领域等都有着广泛的应用,是一个重要的生理参数。烧伤患者的治理、用药量的定量计算等都需要用到人体皮肤表面积。然而传统的体表面积计算方法往往存在着指示性状较少、计算模型单一、数据集多是欧美人为主等问题,导致临床应用存在精度低的问题。三维扫描获得的体表面积精度较高,但其也存在着花费高、耗时长等问题。而随着深度学习
学位
异常行为检测是计算机视觉方向一项复杂的任务,该任务的目的是从真实场景的监控视频中自动检测出不符合正常行为规范的运动片段,这对于构建智能安防监控系统有着重要的应用价值。异常行为检测的难点在于真实场景中行为异常与否的判断会受到周围场景与其他运动个体的影响,难以通过直接分析运动特征进行判断。本文在总结现有异常行为检测方法的基础上,考虑异常行为的社会力模型,以及正常与异常行为的特征差异性,从真实场景的监控
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种主动式的遥感微波技术,能对识别目标进行全天时、全天候的监测,被用于军事侦察、地理测绘等多个领域。SAR图像高精度分类作为SAR图像解译的重要一环,一直受到国内外研究人员的关注。随着图像分辨率的快速提高,使原本适合中低分辨率的SAR图像分类算法,难以适应高分辨率SAR图像的处理需求。针对该问题,本文在了解SAR成像原理的基
学位
显著性目标检测是一项基于人类视觉注意理论的计算机视觉任务。光场显著性目标检测作为其新兴的一个分支,以光场提供的丰富图像类型为数据来源,通过充分提取场景包含的特征来准确地识别并分割出场景中吸引注意力的完整物体,提高在复杂背景、复杂光照、物体与背景相似等挑战性场景下的性能。研究表明,颜色、方向、运动、深度和聚焦都是影响视觉注意的因素。由于光场所提供图像类型的特殊性,现有基于深度学习的方法只基于上述部分
学位
水下传感器网络通常由若干具有特定任务的传感器节点组成,每个节点具有独立的通信和计算能力,为探索和开发海洋提供了新思路和新方法,已广泛应用于海洋资源的勘测、污染源的追踪以及辅助导航等领域。在实际应用中,常利用水下自主航行器AUV移动收集数据,但AUV逐个遍历传感器节点易造成移动路径过长、数据收集效率低下;固定AUV的巡游路径遍历网关节点易造成节点间通信能耗分配不均和局部热区问题。本文针对上述不足,提
学位
三维重建技术能够恢复二维图像所不具备的深度信息,在军事、医疗和无人设备等领域具有重要的作用,是计算机视觉中获取信息的重要手段。和传统三维成像技术相比,通过偏振三维成像系统模型获取目标表面的偏振线索,从而恢复目标高质量的重建表面形貌的方法,具有搭建成像设备简单、操作过程便捷、高精度和高性价比的优点,受到了越来越多学者的关注与研究。(1)本文研究了基于漫反射的偏振三维成像技术的原理。以光的反射与折射原
学位
领域适应旨在解决传统机器学习方法依赖大量标记良好的训练数据以及领域偏移导致模型需要重新训练的问题,主要是利用一个相关的源领域来辅助目标域上的学习,通过最小化源域和目标域的分布差异,使在已标记的源域数据上训练的分类器能在无标记的目标域实例上取得满意的泛化效果。近年来,对抗学习被认为是学习域间不变特征的一种有效机制,对抗域自适应也成为了一种日益流行的领域适应方法。然而实际应用中影响领域适应性能的关键因
学位
随着移动通讯、物联网、航空航天等行业的不断发展,通信系统的集成度持续提高,对天线微型化设计的需求也随之增加。由于无线通讯设备的空间限制,一般要求天线具有较低的剖面高度。人工磁导体(Artificial Magnetic Conductor,AMC)在一定频段内具有同相反射的特性,可以取代理想电导体(Perfect Electric Conductor,PEC)作为天线反射板,有效降低天线剖面高度。
学位
随着遥感传感器技术的不断发展,高光谱图像分类成为目前研究的热点。由于在目前遥感传感器设计中,光谱分辨率与空间分辨率互相约束,无法兼得。因此,对于光谱分辨率较高的高光谱图像,空间分辨率往往很低,会导致混合像元的大量存在。从纯像元的角度考虑,混合像元会导致像元的光谱特征显著性降低,可分性减弱;从分类的角度考虑,纯像元地物与不同地物目标以不同比例混合,会导致类内松散,类间耦合。因此,混合像元导致同类别的
学位