基于深度学习的航拍车流实时检测与追踪方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:woyaodeaihaiyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器计算能力的快速提升,深度学习算法在计算机视觉领域取得了巨大的突破,为计算机视觉相关的很多问题提供了解决方案,其中包括车流检测与追踪问题。传统的车辆检测算法大都基于路口摄像头数据进行研究,此方法在现实应用场景比较低效。随着低空航拍器的快速发展,获取低空航拍影像的难度下降,但依然需要很大的标注成本。目前,基于低空航拍数据的车流检测与追踪方法不能兼顾准确性与实时性。基于上述背景,本文提出基于深度学习的航拍车流实时检测与追踪方法。针对航拍图像的标注样本不够的问题,本文在YOLO检测算法的基础上,采用弱监督的训练方法进行了改进。通过少量标注图像训练了一个车辆分类器,利用区域推荐方法从图中挑选出候选框,由此分类器给候选框进行粗标注。粗标注的图像将用于初始化YOLO的卷积网络层,由此提升模型的检测性能。经过实验验证,本文提出的改进方法能使用少量的标注图像结合大量的未标注图像进行训练,并达到大量标注图像训练的模型效果。针对基于航拍数据的实时车流检测问题,本文利用Faster R-CNN的anchor机制和全卷积网络思想对YOLO算法模型进行了改进。利用全卷积网络思想改进YOLO的全连接层,提升YOLO的检测速度。通过anchor机制改进YOLO的目标框提取层,使其学习目标框的先验知识,从而学习到更多强特征,以提升模型检测精度。并利用多分辨率和多视角的训练方法对YOLO训练网络进行改进,提升检测模型的鲁棒性,使得模型更适用于现实复杂的场景。实验结果表明,本文提出的改进方法保证了实时检测效果,同时在复杂的场景具有88.8%的m AP。针对基于航拍数据的车流追踪问题,本文采用匹配式追踪方式。通过设计一个车辆匹配模型,即将视频中前后两帧的检测结果作为匹配模型的输入,根据检测框的尺寸、颜色直方图、位置等信息进行匹配,从而实现车流的追踪效果。
其他文献
非线性科学是研究非线性现象共性的一门新兴的交叉学科,其主要研究内容包括孤子、混沌和分形,同这三个概念相对应的理论共同构成了非线性这门学科的理论基础.本文主要介绍了
聚类分析是研究数据聚簇模式的技术.由于它始终是数据挖掘研究的重要内容、手段和工具,因此,聚类分析又是一个被不断探索并充满创新的研究主题.离群点检测是研究包含在数据中
自二十世纪九十年代起,随着电子信息等技术的发展,各种随身电子设备,例如智能手机、多媒体播放器等各类便携设备的运算和存储能力得到了巨大的进步。用户希望像在台式机或者笔记
近年来,随着网络的迅猛发展以及各种新型网络业务的出现和广泛使用,IP网正在从当初单纯传送数据向可传送数据、语音、活动/静止图像的多媒体网络转变。目前的IP网络所提供的是
随着分布式计算技术的不断发展,分布式计算环境逐渐成为企业信息化建设的基础结构,企业业务过程越来越多的构建在分布式计算环境之上,跨越多个不同的分布式技术。 本文对分布
当今用于手工计算的空间角度的计算已有很多的方法(如:六面体法、投影几何法等),但这些方法用于计算机的算法还需作很多的工作。可以说在当今的工业设计制造中,空间角度的计
本文首先分析了网络故障相关的基本概念:网络故障诊断体制和故障定义、分类。在研究实现这些网络故障诊断的基本功能的基础上,研究了基于CBR的智能故障诊断技术,提出了故障案
数字化时代已经来临,互联网也在逐渐走进人们的生活,电子图书便是数字化时代技术发展的必然产物。和纸制书相比,电子图书借助计算机网络,使人们能更充分地享受到数字化资源存
互联网作为人们信息交流与资源共享的平台,保存了大量含有主观性信息的数据。如何从这些海量数据中提取出人们感兴趣、携带观点的文本,并对其进行情感分类是目前研究的热点之
由于移动Agent计算模式自身的特点,使移动Agent技术有着广阔的应用前景。通信是移动Agent不可缺少的服务之一。通信安全与否,通信效率的高低,直接影响着移动Agent系统的安全性和