论文部分内容阅读
作为机器视觉领域中的基础问题之一,目标检测在过去十多年间获得了广泛的关注与研究。随着嵌入式技术的不断发展与嵌入式设备的日益成熟,针对边缘端的目标检测更是成为了当前的研究热点,并在不同领域、不同任务中获得了广泛的应用。当前,基于深度神经网络的端到端检测模型获得了远超传统方法的最优性能。然而,这些模型具有复杂度高、运算量大等特点,无法满足低功耗、实时处理等重要要求,因而无法直接部署在边缘端嵌入式设备上。本文针对基于嵌入式GPU平台的目标检测应用进行研究,以无人机单目标检测作为具体应用场景,从数据分析、算法研究、系统优化等方面逐步实现出具备高检测准确率、低功耗且满足实时运行的目标检测系统。具体而言,首先基于单目标检测任务设计出一套基础检测算法框架,该框架支持训练、预测两种工作模式,并由四个子模块构成。然后根据无人机单目标检测任务的特点,从检测尺度选取、特征提取网络结构、模型训练损失函数等方面对基础检测框架进行了深度优化。完成算法级设计与优化后,将检测框架在Nvidia Jetson TX2嵌入式GPU平台上进行实现,并根据硬件平台的特点,采用批处理技术以及流水线技术对检测系统进行加速。本文采用LPODC单目标检测数据集完成系统训练及性能评估。在本地测试集评估中,本文所设计的单目标检测系统能够获得0.886 Io U的检测准确率,同时在Jetson TX2的Max-P-Core-All模式下能够以28.46 FPS速度实现实时检测,并具有10.640 W的运行功耗;在2018 DAC系统设计竞赛官方评估中,本文所设计的系统具有0.691的检测Io U,同时在Jetson TX2的Max-N模式下能够达到25.30 FPS的实时处理速度及13.27 W的运行功耗。该系统在2018 DAC系统设计竞赛最终准确率、功耗、速度的综合评估中获得了53个系统中的第2名。