基于卷积神经网络的目标检测器采样优化研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:xiao959907530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉的一个重要领域,它在当前很多热门领域如自动驾驶汽车,计算机辅助医疗诊断,交通情况监测当中都有着广泛的应用。目标检测是一个从整体到局部的过程,在这个过程中,输入图像被采样出多个区域样本,形成巨大的采样空间。由于前景样本的稀疏性,使得采样空间中绝大多数样本是背景样本,导致目标检测问题中悬殊的前景、背景样本比例,限制了检测精度的进一步提升。在基于区域的目标检测器中,区域建议阶段以及其它依赖于区域建议阶段的后续采样策略的使用有效地降低了采样空间中背景样本的数量,提升了目标检测的精度。在深度卷积神经网络应用于目标检测领域的初始阶段,检测精度普遍不高,基于区域的目标检测器因其在检测精度上的优势,被广泛研究和应用,在目标检测领域中处于主导地位。随着目标检测精度的稳步提升、目标检测需求向移动端和嵌入式设备转变以及主流应用场景对检测速度的要求日益提高,目标检测任务的瓶颈由较低的检测精度变为较慢的检测速度。基于区域的目标检测器受限于庞大的模型和缓慢的检测速度,其实际应用受到了很大的限制。相比于基于区域的目标检测器,一致过程目标检测器放弃了区域建议阶段的使用,获得更快的检测速度。一些先进的一致过程目标检测器甚至可以达到实时目标检测的要求,在近年受到了广泛关注。但放弃使用区域建议阶段也带来了负面影响:一致过程目标检测器需要处理更大的采样空间,更悬殊的前景、背景样本比例。严重的前景、背景样本不平衡问题导致一致过程目标检测器的检测精度难以提高。现有部分工作致力于利用采样方法优化一致过程目标检测器的检测过程并取得了一定的成果,但是它们多依赖于特定的结构或者是损失函数形式,当前很多前沿的一致过程目标检测器,例如YOLO系列目标检测器,无法使用此类方法提升检测精度。本文针对一致过程目标检测器中通用采样优化方法的空白提出了LRM(Loss Rank Mining)方法。首先,我们分析了采样优化在基于卷积神经网络的目标检测器中的发展过程,通过将采样优化方法后置,使得一致过程目标检测器的原始结构得以保持,进而维持了一致过程目标检测器的速度优势。其次,我们分析了一致过程目标检测器的结构特点,使用输出特征图来完成采样优化,其在一致过程目标检测器中是普遍存在的、用来表示预测结果的结构,保证了LRM方法在一致过程目标检测器上的通用性。第三,我们将LRM方法设计为训练策略,在预测过程中不引入任何额外的计算量,在保证预测速度不变的前提下,提升了检测精度。最后,前景样本因其稀疏性在检测器模型上表现往往较差(成为困难样本),我们据此建立了前景样本和困难样本的联系,通过采样困难样本使检测器在训练中更关注前景样本。实验证明,LRM方法在多个数据集上有效地提升了主流一致过程目标检测器的检测精度。本文通过分析目标检测任务的不同子任务的特点以及在不同输入的情况下困难样本的分布情况,针对现有的基于一致过程目标检测器的采样优化方法定位精度不高以及对不同输入数据适应性不好的缺陷,引入注意力机制以及数据驱动思想设计了ALRM(Adaptive Loss Rank Mining)方法。它从两个方面提升模型鲁棒性,进而提升了模型的检测精度:一是通过在采样时增加模型对定位任务的注意力,使模型更加关注定位精度差的样本,进而提升总体检测精度;二是对于不同的输入图像,根据区域样本的损失函数值分布以自适应的方式采样区域样本,提升了模型对不同输入图像的鲁棒性,进而提升了整体的检测精度。同时,ALRM避免了超参数的使用,能够使用单一模型适应不同的数据,也使得模型的训练过程变得更加简单,提高了实用性。实验证明,ALRM方法在多个数据集上对主流一致过程目标检测器检测精度的提升效果均超过其他现有方法带来的精度提升。
其他文献
随着计算机图形学的发展,三维网格模型成为了许多几何应用的重要组成部分,尤其被应用于一些对网格质量要求较高的场景中如数值模拟和三维打印等。然而由于现有的三维网格获取
近年来,光学Tamm态(OTS),一种被局域在两种不同介质接触面的表面波。由于具有易被激发、对电磁波的强局域性等特性受到了研究者们的关注。不同于表面等离激元,光学Tamm态的激
结构损伤识别检测在国家推进现代化的过程中越来越成为一个重要的研究领域,结构损伤识别的方法也多种多样。其中,把采集结构受到激励后的动力响应作为损伤的基础是全局损伤识
肠道微生物是一个复杂、动态的生态系统,在人体健康中扮演着重要的角色。从微生物时间序列数据推断微生物之间的动态相互作用,对于理解人体肠道内微生物的合作和竞争机制是十
具有高浓度氧缺陷的中空立方ZnSnO3在气体敏感传感器上的表现是优异的。氧缺陷可以缩小半导体的带隙,使材料表面吸附更多的氧,使电子转移效率更高,提高传感器响应;而比表面积
智能批阅是智慧教育的一个重要研究内容,包括自动评分和自动反馈两个子任务。自动评分是指对于学生答案通过训练好的语言模型给出分数;自动反馈则是要指出学生答案的错误点并
为了解决当今社会层出不穷的交通安全问题,车联网(Vehicular Ad-Hoc Networks,VANETs)应运而生,并快速成为近些年来的研究热门。在车联网系统中,通过车辆与车辆或车辆与其它
激光自混合效应是激光器发出的光射到外部物体表面,经过反射或散射后其中一部分光又反馈回激光器,此时的反馈光携带了外部物体的信息,与腔内光混合后调制了激光器输出光的光
城市旅游的兴起给城市公园带来了发展的契机,城市公园不仅丰富了市民的文化生活内容,而且也增强了人们锻炼身体、增强体质的体育意识。城市居民参加体育锻炼的积极性越来越高
随着下游用户对冷轧带材板形质量要求的不断提高,板形控制理论及其相关技术不断得到研究人员的重视并逐步获得深化与发展。控制模型是控制系统的灵魂,实现高精度冷轧板形自动