论文部分内容阅读
随着国家新基建政策的提出,人工智能、5G等新科技成为国家将来发展的重点,而作为5G和人工智能相结合的智能车领域的发展也同样备受期待。在智能车领域,环境感知一直是研究的重点,语义分割作为智能车环境感知中的一大分支,可以逐像素对道路场景图像中的交通参与者、道路边界、障碍物等目标物体进行分类,并为智能车系统提供丰富的图像信息。本文主要研究面向智能车场景的语义分割算法,分别从语义分割算法精度、语义分割算法实时性、语义分割模型部署三大角度来展开研究。首先,提出了基于改进的注意力机制的语义分割模型来提高语义分割算法精度。由带有全局注意力提取模块的空洞金字塔池化模块GASPP结构提取多尺度感受野信息,由带有选择性注意力机制的网络结构作为解码器,并在此基础上,构建了语义分割网络模型GSANet,在Cityscapes数据集上达到81.6%m IoU的精度,在Cam Vid数据集上达到79.2%m IoU的精度。考虑到智能车场景下语义分割算法的实时性,提出了基于改进的轻量化网络的实时语义分割模型。在轻量级网络Mobile Net v2的基础上,构建了具有空洞卷积和注意力模块的网络作为主干网络用于特征提取,并在空洞金字塔池化模块ASPP上利用不同大小的池化操作来编码邻近的语义信息。在此基础上,构建了轻量级语义分割模型Light Seg。在单个RTX 2080Ti GPU上测试,Cityscapes数据集以每秒47.5帧的速度达到73.8%m IoU的分割精度,Cam Vid数据集上以每秒38.5帧的速度达到67.6%m IoU的分割精度。最后,提出了基于剪枝和推理加速的语义分割算法优化方法。在模型训练阶段,采用通道剪枝的方法减少所设计的语义分割模型的参数量的同时保持分割性能。在模型推理阶段,采用批归一化BN层和卷积层合并来实现GPU推理加速。然后,对所提出的几种优化方法完成了对比实验,证明了优化方法的有效性。