论文部分内容阅读
利用多旋翼无人机进行目标检测,实现军事侦察、灾后搜救、海上救援等任务应用价值极大。多旋翼无人机的目标检测也是实现目标跟踪、自主避障等任务的基础,对于多旋翼无人机的目标检测和自主避障研究具有重要的科学意义和实用价值。由于多旋翼无人机体积及挂载能力有限,部署在其上的处理器内存及计算能力受限,导致利用多旋翼无人机进行目标检测任务时速度受限。此外,航拍图像具有目标遮挡、目标尺度变化大、图像视场大、单目标较小、背景环境复杂等问题,导致利用多旋翼无人机进行目标检测任务的精度较低。传统的ViolaJones检测器、HOG行人检测器、可变形部件模型等目标检测算法通常是按照区域选择、特征提取、分类回归的步骤进行目标检测。传统方式模型相对简单,难以提取深层次特征,用于多旋翼无人机的目标检测效果较差。近年来基于深度学习的目标检测算法:R-CNN系列算法、SSD算法、YOLO系列算法较传统算法优势明显。通过对这几种常用算法进行综合分析比较,YOLOv3算法具有速度与精度的综合性能优势,更加适合部署于多旋翼无人机等移动端设备。但原始YOLOv3算法计算量仍较大,本文主要针对多旋翼无人机的自身特点,对YOLOv3进行改进,提出更适用于部署至多旋翼无人机的YOLOv3-CPA目标检测算法。为减少YOLOv3的计算量与内存占用,通过通道剪枝(Channel Pruning)的方式对YOLOv3中的通道权重进行量化,实现冗余通道的删减。经实验验证,通道剪枝后的YOLOv3模型大小及参数量可减少80%、浮点运算次数(FLOPs)降低70%、前向推断速度为原始YOLOv3的2倍左右。为减少航拍图像复杂背景对多旋翼无人机目标检测的影响,提高目标检测平均精度均值(mAP),同时更有效地利用计算资源,对YOLOv3加入通道注意力机制与空间注意力机制,赋予航拍图像的特征不同权重,使得网络具有更优异的特征筛选能力,并且能够更加关注重要特征,抑制非重要特征,提高了目标检测的效率及精度。针对航拍图像中存在较多的目标遮挡问题,通过将YOLOv3中的非极大值抑制(NMS)策略更改为SofterNMS与Soft-NMS结合使用的方式,使目标检测中的目标遮挡导致模型召回率低的问题得到改善,边界框位置更加准确。经实验验证,通过Softer-NMS与Soft-NMS结合使用可使模型召回率提高13%左右。通过加入注意力机制与NMS策略更换,改进的YOLOv3-CPA算法较原始YOLOv3进行无人机目标检测任务时mAP可提高5%左右。在模型部署阶段,通过利用NVIDIA推出的高性能深度学习推理优化器TensorRT,在不同精度下,可使改进的YOLOv3-CPA算法前向推断速度提高2-3.4倍。最终改进的YOLOv3-CPA算法部署至多旋翼无人机上搭载的NVIDIA TX2及Xavier时,对于416×416大小图片,检测帧率可分别达24.1FPS、47.6FPS,基本满足实时性要求。此外,通过利用改进的YOLOv3-CPA算法和深度卷积神经网络进行了多旋翼无人机自主避障的应用验证。通过多旋翼无人机搭载的双目摄像机进行图像信息采集,利用设计的深度卷积神经网络进行多旋翼无人机期望姿态角及油门量预测,在特定场景下,可实现多旋翼无人机自主避障成功率在85%左右。利用改进的YOLOv3-CPA算法进行特定类别障碍物检测,多旋翼无人机可实现视觉障碍物检测,并利用障碍物边界框实现自主避障路径的优化,在特定场景下,可实现多旋翼无人机自主避障成功率在94%左右。视觉自主避障进一步证明了YOLOv3-CPA算法的有效性。