论文部分内容阅读
传统的目标检测算法检测速度慢、鲁棒性差,无法满足要求日益增高的无人机检测任务。与传统的目标检测算法相比,基于深度学习的目标检测算法检测速度快,但是却依赖PC机强大的计算能力和存储资源。与之形成鲜明对比的是:无人机自身或者其搭载的嵌入式设备计算资源和存储资源严重受限,远不能达到基于深度学习的目标检测模型推理的需要。因此,研究压缩目标检测模型的算法,对于嵌入式设备中部署基于深度学习的目标检测算法以提高无人机的应用水平具有十分重要的意义。为此,本文在深入研究目标检测算法的基础上,深入剖析目标检测模型,针对SSD目标检测模型的特点,定制化压缩算法,并针对无人机目标检测任务的需要,完成基于ARM+GPU架构的嵌入式平台部署。针对无人机目标检测任务进行需求分析,明确需要达到的技术指标。选取Single Shot Detection(SSD)目标检测算法,该算法能够很好的适应机载下视图像多尺度、多形变的特点,但是由于嵌入式平台计算和存储资源受限会使其性能下降。为提升模型在嵌入式平台的性能,对该模型进行了深入研究,结果表明SSD检测模型可以从减少通道数和计算量两个方向进行压缩。针对SSD目标检测模型通道数多的特点,设计了面向SSD全卷积模型的使用面向特征提取网络或全局的剪枝算法。该算法使用LOSSO回归将通道稀疏化,然后再利用线性最小方差重构通道,最后重复以上训练流程,能保证通道剪枝后的模型精度高保真。基于PASCAL VOC数据的SSD目标检测模型上的实验结果表明:全卷积目标检测模型通道剪枝算法能提高模型在嵌入式平台的推理效率。针对SSD目标检测模型参数量大,消耗计算资源多的特点,设计了针对SSD目标检测模型的参数量化压缩算法。该算法引入“模拟量化”模块,以保证模型经过量化运算后其精度高保真。基于PASCAL VOC数据的SSD目标检测模型上的实验结果表明:全卷积目标检测模型的量化算法也可以提高模型在嵌入式平台的推理效率,同时面向量化推理的模型计算量压缩方法通过短时间训练即可获得最终的量化模型,训练成本也更低。针对机载下视场景检测任务,使用本文设计的压缩算法可以解决嵌入式平台计算资源不足问题,压缩模型在嵌入式平台的推理时间。对于实际的机载下视应用场景,首先采集图像制作机载下视数据集,训练基于机载下视数据集的目标检测模型,在上位机使用对压缩推理时间更优越的参数量化压缩算法压缩模型,将模型移植到选定的ARM+GPU架构的NVIDIA TX1嵌入式平台进行全面测试。测试结果表明,在机载下视图像识别任务中,本文的量化压缩算法,能有效压缩嵌入式平台推理时间,帮助机载下视目标检测任务更好的完成。