论文部分内容阅读
目前,人工智能时代已经到来,各种传感器制造水平也取得了长足的进步,车辆的智能化水平不断提高,自动驾驶逐渐从幻想变为现实。感知系统作为车辆获取道路信息的关键部分,其性能与自动驾驶车辆的安全性有着直接关系。当前,自动驾驶对感知的需求正在由二维空间向三维空间演变,这要求感知系统不仅能够得到道路关键目标在空间中的位置,而且还需要知道目标的姿态。目前存在的问题是双方面的,一方面是如何实现对目标参数的精确估计,另一方面是如何保证感知的实时性,基于这两个问题,本文从图像、点云以及二者融合的方向进行研究,提出了一种基于融合的感知算法,实现了对道路障碍物的实时精确感知与参数化分析。本文的主要研究内容和成果如下:首先,本文对基于图像的视觉感知算法进行了研究,设计了一个适用于目标检测和语义分割的Backbone,在此基础上构建了目标检测和语义分割模型,通过特征共享,构建了二者的联合模型,极大地减少了参数量和计算量,实验证明,联合模型能够以较快的速度同时执行目标检测和语义分割任务,在保证精度的前提下,满足了实时性的要求;然后,本文以Point Net为基础,设计了一个直接处理原始点云的网络Point SSD,该网络能够应用于点云目标分类、语义分割以及3D目标检测任务,由于在体系结构设计中引入了注意力机制,Point SSD能够以更加轻量的结构提取到更加有效的特征;最终,本文提出了一种基于图像和点云融合的FrustumPoint SSD目标检测算法,该算法以联合网络和Point SSD为基础,实现了对道路障碍物的精确参数估计,通过逐点融合图像语义特征,弥补了点云稀疏性问题,对小目标和困难目标的精度有所提高,在点云处理过程中,对点云数据组织格式进行了优化,提高了推理速度。在KITTI 3D目标检测数据集上,该算法表现出了较高的精度,以NVIDIA GTX1080Ti为计算平台,融合检测算法推理时间为54ms。