论文部分内容阅读
近年来,随着预测和分类精度不断提高的需求,相应的更深层次更复杂结构的深度神经网络模型逐渐被提出和应用。而网络精度性能提高的同时也带来了神经网络模型尺寸和运算量的增加,以及运行效率的降低。随着移动和嵌入式设备的大量普及和边缘计算场景的增加,在实际应用中,往往要求深度神经网络模型既要保证较高的精度,又要具有良好的实时性。目前的嵌入式边缘计算设备在计算能力和存储资源方面难以满足实际需求,因此只有在精度、网络的参数规模及速度等方面进行很好的权衡和折中,即在有限的计算能力和资源之下实现最优的模型精度性能,这样才能将深度神经网络更好地应用于移动端的边缘计算。本文重点研究针对目标检测模型YOLOv3的轻量化改进问题,通过引入Mobile Net模型的思想和其它针对性措施,使改进的YOLOv3模型能够更好地在嵌入式终端设备上实现实时高效目标检测,从而为边缘计算场景下的应用提供可能的方案。主要工作包括:一、将Mobile Net与YOLOv3结合,提出一种轻量化神经网络结构Mobile Net_YOLOv3,使所提模型可以部署在嵌入式移动终端平台上实时运行,且平均检测精度相对其他轻量化模型有所提高。Mobile Net模型是Google公司开发的一种轻量级深度学习分离模型,适用于移动嵌入式环境,在保证精度可以满足要求的前提下具有较低的延迟。YOLOv3则是YOLO模型的最新改进版本,该模型融合了YOLOv2和Faster R-CNN锚点(anchor)机制理论,兼具有这两种算法的优势,在运行速度方面继承了YOLO算法而且可以像Faster R-CNN一样精准。但YOLOv3模型对于很多嵌入式移动平台来说运算量还显偏大,因此本文利用Mobile Net的思想和深度可分离卷积结构对YOLOv3模型进行改进,提出Mobile Net_YOLOv3网络模型。所提出的新模型充分发挥了这两种网络模型的优点,在模型识别精确度和运行效率方面实现较好的折中。在国际通用数据集上的测试结果表明,所提出的Mobile Net_YOLOv3模型相比原YOLOv3模型性能相当但运算量有明显降低,相比其它轻量化模型性能和运算效率均有所提升。二、提出一种针对小目标及遮挡情况的改进YOLOv3模型。虽然Mobile Net_YOLOv3相对原有YOLOv3模型在实时性上有所改善,但还存在检测小物体与遮挡物体检测精度不高的局限性。针对此问题,本文设计出一种多尺度特征融合注意力网络(MSFAN),能够有效减少图像卷积后对特征信息的丢失,提高检测精度。同时针对数据集中小目标样本少的问题提出了数据过采样和增强策略,进一步提升了模型对小目标的检测能力。实验结果表明,MSFAN模型的平均检测精度相比原模型YOLOv3在PASCAL VOC数据集上提升5.2%、MS COCO数据集上二者精度相当,而速度均提升近一倍。