基于卷积神经网络的隧道行人目标检测算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:dldx05444011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隧道中行人目标的快速准确检测对保障隧道交通安全有着重要作用。相比于传统的机器学习检测算法卷积神经网络可以自动学习图像丰富的特征,具有较强的特征提取能力,基于卷积神经网络的行人检测算法在检测速度和检测精度上有明显优势。但在隧道环境中,环境光照不足,监控视频图像模糊,噪声多,行人目标在隧道监控视频中目标小、像素低,难以发挥卷积神经网络特征提取能力强的优势。因此,研究基于改进卷积神经网络的隧道行人目标检测具有重要的理论和实际意义。近几年,R-CNN(Region-based Convolutional Neural Networks)系列卷积神经网络在目标检测方面取得了较好的效果。论文以Fast R-CNN和Faster R-CNN检测网络为基础,针对Fast R-CNN候选区域提取时间过长问题以及Faster R-CNN在隧道环境下行人特征提取效果不佳问题展开研究,提出了一种新的前景提取方法以及超分辨率网络与Faster R-CNN级联的行人目标检测网络,并对Faster R-CNN中的RPN(Region proposal network)网络和NMS(Non-maximum suppression)算法提出改进以提高检测精度。本文的主要工作和贡献如下:(1)论文首先介绍了Fast R-CNN检测网络,分析了Fast R-CNN算法中采用的Selective Search候选区域提取算法原理,针对Selective Search算法提取候选区域时间过长的问题,提出了采用速度更快的背景差分与帧间差分法相结合的前景提取方法,从而减少检测时间。(2)通过反卷积操作进行图像特征可视化分析,发现卷积神经网络在隧道环境下,对低分辨率行人目标提取的特征表达能力不足。针对该问题,提出了级联超分辨率网络与Faster R-CNN的新的SR-CNN行人目标检测网络。论文基于超分辨率重建实现对图像高频信息的补充,增加图像细节信息,使Faster R-CNN生成语义信息更丰富的特征图,从而提升检测精度。(3)针对Faster R-CNN中RPN网络提取候选区域时,采用的锚边框产生算法中Anchor候选框尺寸通过手工设计,没有利用行人的尺度先验信息,导致提取的候选窗口不够准确的问题,论文采用K-Means聚类算法对行人真实标注框进行统计得到锚边框的尺度,以生成更高质量的候选窗口,提高预测框回归的准确性,从而提升检测精度。(4)Faster R-CNN算法中处理重叠窗口时,采用基于固定阈值的贪心算法,会将超过阈值的重叠窗口删除,对重叠目标容易造成漏检。针对该问题,论文采用一种改进的非极大值抑制算法,设置一个分数衰减函数降低重叠窗口的分数,而不是直接置零,避免重叠目标的直接删除,该方法能有效减少重叠目标的漏检。综合上述改进,形成一种新的基于改进卷积神经网络的New-CNN行人目标检测网络模型。采集重庆高速公路隧道监控视频图像制作数据集,分别对改进网络模型进行训练和测试。实验结果表明,与原始Fast R-CNN和Faster R-CNN算法相比,论文提出的方法分别在检测速度和检测精度上有所提升,在实际隧道环境中也取得了较好的检测效果。
其他文献
玻璃纤维编织网增强混凝土(Glass Textile Reinforced Concrete,简称GTRC)是一种新型建筑材料,其具有高承载力、抗裂性能好、耐腐蚀等优点。研究玻璃纤维编织网与基体之间的粘
目前生物传感器检测乳酸的方法具有特异性高、灵敏度高、操作简便、快速简单等优点。因此基于无创的生物传感技术检测乳酸的方式在运动医学领域具有广阔的应用前景。通过检测
由于工业机器人的持续发展与完善,目前装配机器人被广泛应用于各种工业领域,主要完成装配手机、汽车,机械装置、电子产品及其组件等的任务。装配机器人也从早期的程序控制型
波达方向(Direction Of Arrival,DOA)估计是阵列信号处理领域的研究热点之一,在雷达、声纳、导航、无线通信、语音处理和射电天文学等领域具有较为广泛的应用。目前大多数常规
图像分割是图像分析处理过程的一个关键步骤,在医疗、机器视觉、遥感图像分析等众多领域被广泛应用。本文提出一种基于改进布谷鸟的模糊C均值聚类(Fuzzy C-Means clustering,
相较于无线传感器网络(Wireless Sensors Networks,WSN),移动Ad Hoc网络(Mobile Ad hoc Network,MANET)是一种具有空间大尺度、高动态的典型分布式网络,广泛应用于有人/无人
图像抠图方法指的是对目标对象进行准确的前景估计,从而实现前后背景信息的分离。传统的图像抠图方法一般是结合彩色图像以及人工辅助信息进行求解,其核心为以下两点:1)人工
荧光半导体材料,尤其是无金属元素的强荧光半导体材料,在很多领域如量子器件和生物医药中都有着广泛的应用。目前研究的较多的无金属元素的半导体材料是碳基材料,主要包括碳
镁合金作为“21世纪绿色环保材料”之一,在实现材料轻量化、节能环保等方面有显著作用。传统镁合金(AZ系、AS系)已普遍应用于飞机、汽车零部件,但与此同时镁合金较差的耐磨性
随着科技的发展、社会的进步,高校面临的环境也在不断变化,我国高等教育事业的发展进入前所未有的新局面。随着高校教学活动变得越来越复杂,学校资金来源的方式日趋多样化,与