论文部分内容阅读
随着计算机视觉技术的快速发展,基于深度学习的目标检测算法为检测精度带来了新的突破。在实际应用中,成本和功耗的限制,促使嵌入式设备成为了深度学习目标检测算法的另一实现平台。本文立足于基于深度学习的目标检测算法,对算法进行改进以适应嵌入式平台的计算,并在TMDSEVM572x评估板上进行了车辆检测和行人检测的测试和评估,具体工作如下:在算法改进方面,分别进行了速度和精度的改进,使得检测网络的计算量和准确率达到了平衡。本文首先立足于SSD检测算法,进行了仿真测试与分析。为改进速度,借鉴ResNet设计了10层的卷积神经网络Net10作为SSD算法的基础网络,用作分类特征的提取,并在此基础上进行迁移学习,回归目标位置及进行分类预测。该网络的计算量远小于目前的主流分类模型。为减少网络轻量化带来的准确率损失,首先根据实际应用场景对训练数据集进行了相应的筛选,并根据筛选后样本目标的大小分布,选取了不同深度的特征响应图进行预测,重新设计了对应于各层特征响应图产生候选框的大小与高宽比。最终车辆检测的平均精度在BDD100K数据集和KITTI数据上分别达到了88.8%和85.6%,行人检测的平均精度分别达到了73.8%和79.3%。在实现方面,利用嵌入式平台的有限资源实现了基于深度学习目标检测算法较为快速准确的推理过程。本文首先利用caffe-jacinto框架对算法模型进行了稀疏化训练,使得网络权重参数的稀疏度达到了60%以上,并在此基础上对权重参数进行了8位量化。根据各类核的计算性能,对网络拓扑结构进行了分组,基于TI deep learning库设计了DSP核和EVE核分摊网络推理计算的流程,并进行了检测应用的开发。标记了cityscape数据集中的200张图片作为最终测试集,评估板上EVE+DSP推理计算单帧(288×512大小)的时间为150ms左右,车辆检测和行人检测的准确率和召回率都达到了85%以上。