论文部分内容阅读
卷积神经网络(Convolutional Neural Networks,CNNs)在目标检测领域表现卓越。然而由于其参数规模过大,深度卷积神经网络中往往存在大量冗余。本文选取了现今最优的实时检测网络单发多框检测器(Single-shot Multi-box Detector,SSD)进行了冗余分析与删减。SSD网络以广泛应用的视觉几何组网络(Visual Geometry Group,VGG)为基础,并将VGG网络尾部的全连接层替换为多个卷积层。基础网络VGG的网络结构十分庞大,这是为了与包含1000种类别目标的ImageNet数据集相匹配。然而SSD网络主要基于包含20类目标的VOC数据集进行训练。面对如此之少的训练类别,SSD网络的基础网络VGG显然是参数过量的。规模过大的基础网络不仅会带来存储空间的浪费与运行速度的降低,甚而会出现过拟合问题造成SSD网络检测精度的下降。本文主要通过反卷积与数据驱动法等深度网络可视化方法,对SSD基础网络中存在的冗余参数进行了分析与删减。由于深度卷积神经网络的“黑盒子”特性,前人往往只能盲目的删减网络参数,无法针对性的剪除无效参数。为了有效寻找SSD网络的冗余参数,本文采用深度网络可视化方法以解释SSD网络的特征学习,并寻找无效学习的网络参数。基于网络特征学习的分析,本文提出了一种迭代式网络删减方法,能够在保持精度的前提下有效剪除无效学习的冗余参数。实验主要以VGG基础网络的最后一个卷积层conv53为例,以反卷积图片的形式分析其特征学习,并剪除了该卷积层的冗余卷积核。结果表明了本文的网络删减方法能够在保持高精度的前提下,有效实现卷积神经网络的压缩与删减。删减后的SSD网络获得了比原始网络更高的平均精确度均值(Mean Average Precision,mAP),而且当卷积层conv53层中仅留有4%的参数量时mAP仍然与原始网络相当。