论文部分内容阅读
目标检测是视觉领域研究的重要方向,在多个领域中有重要的应用价值。目前检测在背景嘈杂条件下,由于受到遮挡、光线不足等条件影响,目标发生形变,导致对模型的要求也日益提高,需要克服更多难题与干扰来提高其鲁棒性。如何在多种因素的影响下设计一个能精准识别目标的模型,成为该领域的重中之重。
早期结合滑动窗口与图像缩放的算法检测成本高、效率低,多数高效算法都是基于卷积神经网络(CNN)被提出,虽在一定程度上控制了算法开销,并提高了对通用目标的检测准确率,但在对小尺度目标检测时效果仍不理想。研究发现,网络低层的特征图分辨率虽高,但抽象语义不足;高层的特征图因多次降采样操作使得尺寸变小但有丰富语义信息,造成边缘细节和目标定位相关的信息有所缺失。对实际尺寸较小的目标检测时,对特征的表达能力有更大需求,在较低层的特征图上进行更精密的采样,利用较深层的语义对目标的特征弥补。为此本文针对以上难题提出一种对稠密连接块之间全连接的方法融合各层级特征,对较浅层的特征做精密采样,生成的特征语义信息更丰富。本文研究内容如下所述:
(1)针对现有算法对小尺度目标的提取特征不充分、在部分场景中目标存在对图像占比小、特征易丢失、检测精度低的问题,提出一种对稠密连接块之间全连接的方法融合各层级特征,实现对各层特征信息的复用,在一定程度上弥补模型提取特征的信息缺失,得到了更具鲁棒性的特征提升检测精确度。
(2)在网络中参考残差结构思想,设计增加类似卷积与反卷积结构(Convolutional-Deconvolutional Network)超分辨率技术,通过一种跳跃式的短连接来达到修正proposal位置的目的,加强模型对目标定位的性能,加快网络的收敛速度,并用RoIAlign来避免区域不匹配多带来的损失,降低对计算力的需求,改善模型对较小目标检测的精度。
(3)针对图像中小目标边界模糊不清、背景和噪音占比大,难以检测到弱小目标的问题,借鉴SENet的思路,增加MSC模块优化提取特征,对网络最终输出的特征,同时在通道(channel)和空间(spatial)维度上,增加注意力机制来进一步地提升检测精度。
此外,本文实验均使用公认数据集,设计消融实验对比,验证改进模型对尺寸较小目标的检测有效性。我们的方法提取特征更具鲁棒性,检测质量更高,在mAP达到81.6%的同时AP(如bottle等)提升到72.4%,相比其他代表性算法有明显的优势。
早期结合滑动窗口与图像缩放的算法检测成本高、效率低,多数高效算法都是基于卷积神经网络(CNN)被提出,虽在一定程度上控制了算法开销,并提高了对通用目标的检测准确率,但在对小尺度目标检测时效果仍不理想。研究发现,网络低层的特征图分辨率虽高,但抽象语义不足;高层的特征图因多次降采样操作使得尺寸变小但有丰富语义信息,造成边缘细节和目标定位相关的信息有所缺失。对实际尺寸较小的目标检测时,对特征的表达能力有更大需求,在较低层的特征图上进行更精密的采样,利用较深层的语义对目标的特征弥补。为此本文针对以上难题提出一种对稠密连接块之间全连接的方法融合各层级特征,对较浅层的特征做精密采样,生成的特征语义信息更丰富。本文研究内容如下所述:
(1)针对现有算法对小尺度目标的提取特征不充分、在部分场景中目标存在对图像占比小、特征易丢失、检测精度低的问题,提出一种对稠密连接块之间全连接的方法融合各层级特征,实现对各层特征信息的复用,在一定程度上弥补模型提取特征的信息缺失,得到了更具鲁棒性的特征提升检测精确度。
(2)在网络中参考残差结构思想,设计增加类似卷积与反卷积结构(Convolutional-Deconvolutional Network)超分辨率技术,通过一种跳跃式的短连接来达到修正proposal位置的目的,加强模型对目标定位的性能,加快网络的收敛速度,并用RoIAlign来避免区域不匹配多带来的损失,降低对计算力的需求,改善模型对较小目标检测的精度。
(3)针对图像中小目标边界模糊不清、背景和噪音占比大,难以检测到弱小目标的问题,借鉴SENet的思路,增加MSC模块优化提取特征,对网络最终输出的特征,同时在通道(channel)和空间(spatial)维度上,增加注意力机制来进一步地提升检测精度。
此外,本文实验均使用公认数据集,设计消融实验对比,验证改进模型对尺寸较小目标的检测有效性。我们的方法提取特征更具鲁棒性,检测质量更高,在mAP达到81.6%的同时AP(如bottle等)提升到72.4%,相比其他代表性算法有明显的优势。