论文部分内容阅读
自动驾驶技术在未来交通智能与互联化发展中扮演重要角色,它可以在为人们的出行规避风险的同时,提供便利。而计算机视觉技术在自动驾驶技术中发挥着重要作用,其中又以目标检测技术为重中之重。近年来,深度学习异军突起,将计算机视觉技术推陈出新,从而为自动驾驶的真正落地提供了极大的助力。但是,自动驾驶场景中的感兴趣目标,如行人、车辆等,大小尺度繁多,且道路背景变化极大,又有光线强弱和模糊遮挡等因素干扰,面向自动驾驶场景的目标检测算法的性能还有待于提高。本文以上述内容为背景,深入研究了面向自动驾驶场景的目标检测算法,主要内容包括:(1)自动驾驶场景下的目标检测对算法精度和速度的权衡提出了需求,并对场景中多尺度目标都敏感,尤其是其中的大量小目标。针对这一问题和单阶段算法固有的处理样本类别不平衡问题方面的缺陷,本文设计了一种平衡正负样本的单阶段目标检测算法BANet,该算法结合扩张卷积和特征融合思想对SSD算法的网络结构进行改进,以增大感受野和丰富浅层语义信息,从而增强模型对小目标的敏感度;为解决单阶段算法训练过程中固有的样本类别不均衡问题,本文重新设计用于将预测边框分类的损失函数,以替代原算法中标准交叉熵。KITTI实验结果显示,BANet在准确率指标m AP上超越了原SSD算法。(2)同时,为了优化模型的存储空间和降低其计算量,减少其对硬件配置的依赖,本文设计了一种轻量化的单阶段目标检测算法Tiny FCOS,吸纳无锚框逐像素预测的FCOS算法的优点,规避了锚框所带来的所有人工超参数与额外计算量,同时利用其pixel-based结构结合语义分割中的技巧进一步发挥其潜力:以轻量化语义分割模型LEDNet中的基本网络结构构建轻量化主干网络,并采用标准化空洞卷积组结构搭建轻量化的特征金字塔,同时对原FCOS预测分支进行简化。以与目前主流的轻量化模型Tiny YOLOv3相仿的参数量、计算量、速度,在数据集PASCAL VOC的测试集上的实测精度指标mAP也超过了Tiny YOLOv3。同时,KITTI实验结果显示,在自动驾驶场景这种高分辨率输入时也不失为一种精度与速度兼顾的目标检测算法。(3)本文将上述提出的算法应用于自动驾驶场景目标检测系统中,从而实现对道路中行人车辆等主要目标的实时检测与识别功能并进行可视化展示,最后结合Python GUI技术完成本系统的设计与展示功能。