论文部分内容阅读
作为计算机视觉领域的基本问题之一,目标检测系统实现了对图像中每个目标对象的分类,同时在目标中心点四周绘制大小适当的边界框来对目标进行定位。目标检测任务是视频分析、场景理解等其他计算机视觉任务的重要基础。近年来,得益于深度学习技术的飞速发展,智能安防、自动驾驶等领域的研究进展迅速,新目标检测算法层出不穷。目标检测技术的突破使得对快速准确的目标检测系统的需求越来越多,诞生了系列算法。
虽然目标检测算法已经取得了很大进步,仍存在以下挑战:目标对象会发生旋转和尺度变化,尤其在尺寸极小时,由于小目标携带的信息量少,特征提取困难,无法进行精确的对象定位;目前常用的目标检测算法在高性能计算机上依然存在着检测精度和速度无法兼顾的问题,导致难以在可移动开发板上找到精度和速度的平衡点。
本文提出以小目标检测精度和速度相均衡为基础的深度学习目标检测算法,实现JetsonTX2(TX2)嵌入式开发平台和深度学习目标检测算法的优势结合,更符合现实应用的需求。针对常用行人检测数据集中小目标样本较少的问题,采集并标注了训练数据集,与常用行人检测数据集进行联合训练和效果对比。同时,本文基于YOLOv3-Tiny算法进行改进,考虑到YOLOv3-Tiny网络结构相对简单且用于输出预测结果的特征图感受野较大,在网络中增加了卷积层并根据特征金字塔的思想对高层和低层特征图进行融合。此外,在网络中使用深度可分离卷积代替普通卷积,构建了轻量化的小型卷积神经网络,使网络更适合于资源受限的嵌入式平台。最后,针对开发平台的硬件特性进行了内存调度优化和线程设计,避免了不必要的拷贝操作,在TX2开发平台上实现了速度和精度的折中。
实验结果表明,本文所提出的算法在TX2开发平台上实现了小行人目标检测,且对小行人目标的检测效果优于常用的目标检测算法。此外,本文所提出的算法网络结构简单,在计算效率上更有优势,而且本文所提算法的模型权重较小,在资源加速方面具有良好的性能,在嵌入式开发平台上的精度和速度之间达到了较好的平衡,具有更强的开发性和实用性。
虽然目标检测算法已经取得了很大进步,仍存在以下挑战:目标对象会发生旋转和尺度变化,尤其在尺寸极小时,由于小目标携带的信息量少,特征提取困难,无法进行精确的对象定位;目前常用的目标检测算法在高性能计算机上依然存在着检测精度和速度无法兼顾的问题,导致难以在可移动开发板上找到精度和速度的平衡点。
本文提出以小目标检测精度和速度相均衡为基础的深度学习目标检测算法,实现JetsonTX2(TX2)嵌入式开发平台和深度学习目标检测算法的优势结合,更符合现实应用的需求。针对常用行人检测数据集中小目标样本较少的问题,采集并标注了训练数据集,与常用行人检测数据集进行联合训练和效果对比。同时,本文基于YOLOv3-Tiny算法进行改进,考虑到YOLOv3-Tiny网络结构相对简单且用于输出预测结果的特征图感受野较大,在网络中增加了卷积层并根据特征金字塔的思想对高层和低层特征图进行融合。此外,在网络中使用深度可分离卷积代替普通卷积,构建了轻量化的小型卷积神经网络,使网络更适合于资源受限的嵌入式平台。最后,针对开发平台的硬件特性进行了内存调度优化和线程设计,避免了不必要的拷贝操作,在TX2开发平台上实现了速度和精度的折中。
实验结果表明,本文所提出的算法在TX2开发平台上实现了小行人目标检测,且对小行人目标的检测效果优于常用的目标检测算法。此外,本文所提出的算法网络结构简单,在计算效率上更有优势,而且本文所提算法的模型权重较小,在资源加速方面具有良好的性能,在嵌入式开发平台上的精度和速度之间达到了较好的平衡,具有更强的开发性和实用性。