论文部分内容阅读
近年来,以深度卷积神经网络为代表的深度学习模型极大的推动了计算机视觉研究的发展。然而,随着网络模型准确率的提升,这些网络模型的规模和计算开销也越来越大。这使得这些深度神经网络模型在一些计算资源有限的移动端应用场景中的部署难以实现。为此,研究者们提出了轻量级卷积神经网络模型,使得在移动应用场景下部署性能较高的实时CNN模型成为了可能。但是,轻量级神经网络模型的研究仍面临着诸多问题与挑战。首先,轻量级网络模型设计空间较小,特征表示能力不足。其次,轻量级网络模型信息容量较小,提取到的特征信息较少。这些问题导致其精度与大型网络模型有较大的差距。另外,在复杂计算机视觉任务中,轻量级网络模型较弱的特征表示能力导致其精度难以满足实际应用的需求。本文针对上述问题进行了研究,主要工作如下:第一,本文对轻量级网络模型中常用的“稀疏连接”卷积操作进行了分析,并提出了一种轻量级卷积神经网络模型MENet。首先,本文设计了 Merging操作和Evolution操作以促进通道分组间的特征融合。然后,利用这两种操作,本文构建了一种轻量级的基础网络模块,称为ME模块。最后,以ME模块为基础,本文设计了 MENet网络模型。实验证明MENet相比于主流轻量级网络模型在多个视觉任务上实现了性能上的提升。第二,本文对轻量级网络模型中下采样策略对模型性能的影响进行了分析,并提出了一种基于快速下采样策略的轻量级网络模型FD-MobileNet。该模型具有以下三点优势:(1)它显著地减少了网络模型的计算开销;(2)它能够增加网络模型的信息容量,进而提高模型的精度;(3)它的基础网络模块非常简单,因此对工程实现非常友好,能够更有效地利用计算资源。实验证明FD-MobileNet相比于现有模型实现了精度上的提升,同时保持了较快的实际预测速度。第三,本文探索了在移动端实时检测任务使用两阶段检测模型的有效性,并提出了 Mobile Light-Head R-CNN轻量级目标检测模型。该模型遵循了 Light-Head R-CNN的设计原则,并且针对移动应用场景对其特征提取网络、候选区域生成网络以及R-CNN子网络进行了一系列的改进。同时,本文设计了上下文增强模块以及空间注意力模块以获取更有判别性的特征表示。与主流轻量级目标检测模型相比,Mobile Light-Head R-CNN在提高计算效率的同时实现了检测精度的提升。