论文部分内容阅读
随着卷积神经网络的发展,以及硬件技术的进步和大数据时代的到来,物体检测技术不仅检测率得到大幅提升,而且检测速度也极大加快。这使得物体检测在一些要求实时检测的系统中得以实现。诸如面向车载系统的物体检测任务,通过车载摄像头捕捉当前行驶道路的图像信息,对图像中的汽车、行人和骑行者进行自动准确实时地检测,即识别与定位。传统的物体检测算法需要人工提取特征,导致了鲁棒性差、平均检测率低的问题,难以对多类别物体进行检测。基于滑动窗口和基于候选区域的物体检测算法需要后处理,存在检测速度达不到实时和内存需求大的问题。而基于回归方法的物体检测算法,检测速度快、内存需求小,可以对多类别物体进行检测。但是目前基于回归方法的物体检测算法检测率较低,尤其是小物体和被遮挡物体。为了解决上述问题,本文对基于回归方法的物体检测算法进行改进,在保证检测速度达到实时的前提下,提高检测率和召回率。SqueezeDet算法在KITTI数据集上具有最快的检测速度,同时也是基于回归方法中检测率最高的物体检测算法之一。本文在SqueezeDet算法基础上进行改进,以提升平均检测率。在网络结构上,提出了带有闸门机制的越层连接结构,在高层特征空间进行抽象表达的同时,利用浅层的细节特征提升了小物体和被遮挡物体的检测率;在损失函数方面,将包围框的宽和高归一化为相对变化,改善了基准方法中存在的大物体和小物体包围框损失优化不平衡的问题,同时为了提高分类准确性,还将错误分类的惩罚项加入到分类损失的计算中;在包围框过滤时,采用加权的非极大值抑制方法,以解决基准算法中存在的包围框冗余的问题。另外,基准方法的网络层数较少但池化操作较多,由于池化操作导致细节信息难以保留,小物体和被遮挡物体检测率低,因此提出了用扩张卷积替代池化操作,在不改变分辨率的前提下扩大了模型的感受野。实验结果表明,本文算法在KITTI数据集上的平均检测率为80.1%,召回率为81.6%,检测速度为0.032 s。与基准算法相比,平均检测率提升了3.4%,召回率提升了2.8%,检测速度提升了2.7 ms。本文还将程序移植到移动设备,验证了算法的可用性和实时性。