论文部分内容阅读
SSD(Single Shot MultiBox Detector)是一种比较流行的目标检测方法。目前,目标检测的方法颇多,使用卷积神经网络的目标检测占据主导地位,但是卷积神经网络在结构上存在固有的问题:高层网络感受野比较大,语义信息表征能力强,但是分辨率低,几何细节信息表征能力弱。低层网络感受野比较小,几何细节信息表征能力强,虽然分辨率高,但语义信息表征能力弱。SSD采用多尺度的特征图来预测物体,使用具有较大感受野的高层特征信息预测大物体,具有较小感受野的低层特征信息预测小物体。这样就带来一个问题:使用的低层网络的特征信息预测小物体时,由于缺乏高层语义特征,导致SSD对于小物体的检测效果较差。本文在分析介绍经典的SSD算法基础上,针对目前较新的SSD算法存在的问题,提出两种改进算法。1、提出一种改进SSD的目标检测算法MSSD(Modified Single Shot MultiBox Detector)。采用基于 FPN(Feature Pyramid Networks for Object Detection)的网络结构对SSD网络进行高低层的融合并且改进了传统上采样的结构。将高层的语义信息融入到低层网络的特征信息中,丰富预测回归位置框和分类任务输入的多尺度特征图来提高检测精度。将SSD训练所使用的VGG16网络替换为深度残差网络,优化候选框回归和分类任务输入的特征图提升检测精度和速度。实验表明,MSSD模型无论在检测精度上还是检测速度上都优于传统的SSD模型。2、提出一种改进的MSSD的目标检测算法TMSSD(Top-Down Modified Single Shot MultiBox Detector)。本文通过优化预测层的通道来提高网络速度,改进了残差单元结构,并且借鉴了 TDM(Top-Down Modulation)结构中所用到的上采样方法,改进了 MSSD中的特征金字塔网络结构,将高层语义信息与低层语义信息融合,提高检测精度。实验表明,TMSSD模型无论在检测精度上还是检测速度上都优于MSSD模型。