论文部分内容阅读
目标检测技术作为计算机视觉中一个重要的研究方向,被广泛应用于智能交通、图像检索、智能监控等领域。传统的目标检测算法大多是基于人工设计的特征和小样本训练的,受运动模糊、形态变化、环境变化、目标遮挡等诸多因素影响,检测性能不尽人意。随着深度卷积激活特征在图像分类领域取得突破性的成果,整个学术界和工业界都广泛地利用深度学习进行目标检测。尽管基于深度学习的目标检测算法在检测性能上极大地超越了传统方法,但是距离人所能达到的水平依然有着很大的差距,现有目标检测方法在速度和精度上仍有较大提升空间。为此,研究一种检测速度较快,整体检测精度高的目标检测算法是一项十分有价值的工作。因此,本文在前人研究工作的基础上,提出了一些改进策略,归纳如下:1.深入分析了SSD(Single Shot Multibox Detector)算法的优缺点,考虑到SSD网络中用于预测的特征图没有再利用,提出一种相邻特征图融合的网络结构AFFSSD(adjacent feature map fused SSD),以SSD网络为基本框架,将部分高层特征图进行反卷积,以“element-sum”操作与低层特征图进行融合形成新的特征图。以选择融合的特征图来区分,将AFFSSD分为AFFSSD(7&4)和AFFSSD(5&4),在PASCAL VOC2007数据集上的平均检测精度分别为78.9%、79.1%。在MSCOCO数据集上AFFSSD(5&4)小目标的平均检测精度为8.9%,要高于SSD与DSSD(Deconvolutional Single Shot Detector)。2.为了进一步增强特征图的语义信息,提出一种二次特征融合的网络结构TFFSSD(twice feature fused SSD),将经过特征金字塔网络融合后的低层特征通过下采样的方式再与高层特征进行融合,使高层特征图中也包含低层特征的语义信息。在MSCOCO数据集上的实验结果表明,TFFSSD在中、小目标上的平均检测精度比AFFSSD(5&4)分别提高了0.3%、0.6%。