基于条件生成对抗网络的目标检测研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zxc00663340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着多媒体信息技术的快速发展以及深度学习技术在众多领域的应用和研究,目标检测作为计算机视觉中比较重要的一个分支,也得到了学术界和工业界的普遍关注。目标检测的难点在于在保证可靠检测精度的同时,还需要适当优化网络结构以提高对目标的检测速度。在众多目标检测经典算法中,多是依靠候选区域算法来预先假设目标的位置,然后再利用诸如非极大值抑制算法去除冗余的目标框从而得到最终的检测结果。其中,最具代表性的是采用卷积神经网络的Faster R-CNN以及YOLO系列算法。不同于这类目标检测方法,受到生成对抗网络在图像感知(图像重建、风格迁移等)任务上有优秀表现的启发,本文尝试利用其实现对简单场景(单一目标)下的检测。具体来说,本文提出了一种新的基于背景分割思想的生成对抗网络(De-Background Generative Adversarial Network,DBGAN),该方法通过对抗学习策略,使得模型学会分解图像中的前景(默认为目标物体)与背景来感知目标物体的边界,生成只包含目标物体的图像,从而完成对目标的检测。此外,在构建网络时,本文同时在生成器和判别器中引入注意力模块,使模型更加关注目标物体处的特征学习和判别;在模型中引入归一化操作,减少梯度异常,加快模型的收敛速度。本文在PASCAL VOC数据集上进行了广泛实验,结果表明本文提出的方法在单一目标场景下的检测任务中,不仅可以保持较高的检测精度,同时也大大地提升了检测速度。
其他文献
基于信道状态信息(CSI)的动作识别近年来发展迅速,与基于图像,穿戴设备等方式的动作识别相比它具有保护隐私,无需光照,方便等优点。但是目前大多数CSI动作识别系统在新环境中使用或识别新类型的动作时,都需要重新收集大量样本并重新训练模型,这大大降低了CSI动作识别的实用性。为了解决这个问题,本文设计了一种基于元学习的CSI动作识别系统,当将其用于新环境或识别新类型的动作时,它只需很少的数据对模型进行
合成生物元件(Bio Brick)是符合合成生物学装配标准的基因片段。合成生物元件数量急剧增长导致数据质量问题变得复杂而有争议。本文通过比较多种机器学习方法,构建数据驱动的合成生物元件质量评估方法,减轻领域内研究人员逐一判断合成生物元件质量的负担。本文从被分类模型准确识别的能力以及与同类型数据形状保持一致的能力,即准确性和一致性两个维度提出合成生物元件质量评估方法。(1)基于准确性的合成生物元件数
多源遥感图像融合是指将同一区域不同传感器的多幅遥感图像加以综合,通过特定的技术合成一幅新图像的过程。合成孔径雷达(Synthetic Aperture Radar,SAR)和多光谱图像因成像机理不同,而具有较大的差异。SAR图像具有强大的穿透力,不受恶劣天气影响,能够全天时全天候成像,表征丰富的地表纹理和结构特征。多光谱图像含有丰富的光谱信息,可以有效识别不同类型的地物信息,具有优越的目视效果。因
协同过滤技术由于其灵活性、高性能等特点被广泛应用在推荐系统中。传统的协同过滤方法基于矩阵分解的方式,对用户和产品表征进行建模,以获得用户对产品个性化的兴趣偏好,但是其性能往往受限于用户评分数据的稀疏性。近年来,随着图卷积网络的发展,基于图的推荐算法成为了研究热点。图卷积网络通过迭代式的邻居聚集方式将图结构信息编码在节点表征中,可以有效的缓解评分数据的稀疏性问题。尽管基于图卷积网络的推荐算法在推荐精
光学成像技术作为人们认识世界的一种视觉方式,已经成为现代社会科技发展一个重要的方向。随着科技的迅速发展,如何解决复杂场景的散射介质视觉成像和获取有效的信息进行目标重建成为当下研究的热点话题。由于光在传输过程中散射效应是无法避免的,光携带的目标信息会发生畸变,因此,传统的光学成像技术受限,造成成像模糊、散斑等问题。近年来,偏振信息与光的强度、相位、波长这三个基本属性应用的领域越来越广泛。偏振信息已被
视频行为分析是计算机视觉领域重要的研究课题,在智能安防、医疗监护、人机交互、虚拟现实、自动驾驶等领域有着广泛的应用价值,其目的是利用计算机检测视频序列中运动数据获得符号化的动作信息,然后从动作符号中抽取动作特征并进行理解从而实现动作分类或检测。然而,由于视频内容的复杂性和行为的多样性,行为分析任务面临着巨大挑战。现有的视频分析方法虽然能够较好地完成相应视觉任务,但是存在一定的局限性。现有识别和检测
随着对地观测技术的不断更新,高分辨率遥感图像的数据量飞速增长,如何高效的从海量遥感图像中提取有价值的信息是遥感从业人员亟待解决的问题。语义分割为高分辨率遥感图像中的每个像素指定一个明确的土地覆盖类别,现已成为地物信息判读的主流方法,并在土地资源规划、环境保护和自然灾害监测等领域发挥着至关重要的作用。由于应用场景的不断拓宽,依赖手工设计特征的传统图像分割算法难以应对日益复杂的遥感图像分割任务需求。因
近年来,随着各国遥感技术的蓬勃发展,遥感卫星的数目越来越多,其空间、时间和光谱分辨率均大幅度提升,在军事侦察、资源调查、灾害监测等领域发挥着越来越重要的作用。由于单一传感器只能提供有限的信息量,为了充分利用多源传感器的数据,图像融合应运而生,合成孔径雷达(Syntheic Aperture Radar,SAR)图像和多光谱图像融合就是其中一个研究热点。SAR图像与多光谱图像融合的关键在于如何提取S
在室内的许多场景,如家庭、办公室都需要对人员进行识别,这对于智能家居、智能安防等领域来说十分重要。人员重识别是指在某设备下检测到某人员,当其再次出现时能够识别出来。传统的人员重识别技术使用基于摄像头的系统,其成本较高、需要巨大的计算量和存储开销,还涉及到了隐私的问题,在多变的外部环境中会受到角度、服装、背景、光线等等因素的影响。热释电红外(pyroelectric infrared,PIR)传感器
人脸图像合成是计算机视觉中的基本问题之一,其目的是将自然人脸图像从一个目标域,经过算法合成转换到另一个目标域。它在安防系统、数字娱乐、图像修复、去模糊等领域有着广泛的应用。尽管经过几十年的研究,在面对复杂的自然图像时,图像合成模型的表现仍不尽如人意。合成图像面临的主要挑战是真实性、多样性和与输入条件一致性。鉴于近些年生成对抗网络的出现提升了人脸图像合成的结果,本文在人脸图像合成的两个应用方向上分别