论文部分内容阅读
隧道中行人目标的快速准确检测对保障隧道交通安全有着重要作用。相比于传统的机器学习检测算法卷积神经网络可以自动学习图像丰富的特征,具有较强的特征提取能力,基于卷积神经网络的行人检测算法在检测速度和检测精度上有明显优势。但在隧道环境中,环境光照不足,监控视频图像模糊,噪声多,行人目标在隧道监控视频中目标小、像素低,难以发挥卷积神经网络特征提取能力强的优势。因此,研究基于改进卷积神经网络的隧道行人目标检测具有重要的理论和实际意义。近几年,R-CNN(Region-based Convolutional Neural Networks)系列卷积神经网络在目标检测方面取得了较好的效果。论文以Fast R-CNN和Faster R-CNN检测网络为基础,针对Fast R-CNN候选区域提取时间过长问题以及Faster R-CNN在隧道环境下行人特征提取效果不佳问题展开研究,提出了一种新的前景提取方法以及超分辨率网络与Faster R-CNN级联的行人目标检测网络,并对Faster R-CNN中的RPN(Region proposal network)网络和NMS(Non-maximum suppression)算法提出改进以提高检测精度。本文的主要工作和贡献如下:(1)论文首先介绍了Fast R-CNN检测网络,分析了Fast R-CNN算法中采用的Selective Search候选区域提取算法原理,针对Selective Search算法提取候选区域时间过长的问题,提出了采用速度更快的背景差分与帧间差分法相结合的前景提取方法,从而减少检测时间。(2)通过反卷积操作进行图像特征可视化分析,发现卷积神经网络在隧道环境下,对低分辨率行人目标提取的特征表达能力不足。针对该问题,提出了级联超分辨率网络与Faster R-CNN的新的SR-CNN行人目标检测网络。论文基于超分辨率重建实现对图像高频信息的补充,增加图像细节信息,使Faster R-CNN生成语义信息更丰富的特征图,从而提升检测精度。(3)针对Faster R-CNN中RPN网络提取候选区域时,采用的锚边框产生算法中Anchor候选框尺寸通过手工设计,没有利用行人的尺度先验信息,导致提取的候选窗口不够准确的问题,论文采用K-Means聚类算法对行人真实标注框进行统计得到锚边框的尺度,以生成更高质量的候选窗口,提高预测框回归的准确性,从而提升检测精度。(4)Faster R-CNN算法中处理重叠窗口时,采用基于固定阈值的贪心算法,会将超过阈值的重叠窗口删除,对重叠目标容易造成漏检。针对该问题,论文采用一种改进的非极大值抑制算法,设置一个分数衰减函数降低重叠窗口的分数,而不是直接置零,避免重叠目标的直接删除,该方法能有效减少重叠目标的漏检。综合上述改进,形成一种新的基于改进卷积神经网络的New-CNN行人目标检测网络模型。采集重庆高速公路隧道监控视频图像制作数据集,分别对改进网络模型进行训练和测试。实验结果表明,与原始Fast R-CNN和Faster R-CNN算法相比,论文提出的方法分别在检测速度和检测精度上有所提升,在实际隧道环境中也取得了较好的检测效果。