基于YOLOv3改进的夜间车辆检测算法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:bjyoung
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
夜间车辆检测是智能交通领域的一项重要任务。夜间光线的不足会导致交通事故发生的概率大幅增加,也使得交通部门难以对实时交通状况进行准确监控,因而夜间车辆检测任务的研究,对于未来交通系统的先进化发展具有重要推动意义。现有的夜间检测存在夜间数据匮乏与算法针对性不足等问题。具体而言,良好的训练数据能够为算法的优越性能提供保障。然而,现有的夜间车辆数据集的数据大多光照良好,且场景单一,几乎不包含极暗情况下的样本,导致预训练后的算法难以适应真实夜间交通情况。针对于夜间交通数据样本的规范与扩充,已经成为智能交通领域亟待解决的问题。此外,现有的目标检测算法主要聚焦于正常光照下的检测性能,依赖良好的照明和晴朗的天气条件,针对夜间检测任务的应用缺乏足够探索。针对上述问题,本文制作了一个包含各种真实场景的大型夜间车辆检测数据集(VID)。该数据集通过高速公路监控视频、行车记录仪、手动拍摄等多种渠道,对不同亮度情况、天气情况与场景情况的交通图像进行了采集。同时,该数据集以车灯实例为正样本进行了标注,并额外标注了干扰检测效果的路灯实例,为夜间车辆检测任务,提供了大量的极低光照数据,丰富了各种天气场景的高难度样本,能够成为交通领域实用有效的公共数据集。此外,针对于夜间车辆检测任务,基于单阶段的目标检测框架YOLOv3,本文提出了具有针对性的YOLOv3-night模型,在提升模型对于车灯类小尺度目标关注程度的同时,对YOLOv3中的网络层数进行了轻量化缩减,取得了优于YOLOv3的检测性能。
其他文献
点云的法向是各种点云处理任务中的基本特征,随着深度神经网络的兴起,最近已经有相当多的利用深度学习方法的点云法向估计方法被提出,相比于传统方法,这些基于深度神经网络的方法无论从速度上还是精度上都取得了巨大的成功。然而,大多数基于深度的方法都采用从输入数据提取出的特征直接回归法向量这一思路,这对于存在异常值的数据来说,往往表现得很差,对训练数据十分敏感。同时,这使理解黑盒模型中点云法向量估计机制变得十
学位
三维人体重建是计算机视觉领域的重要问题,该问题关注的是如何在静态三维扫描数据的基础上,重建一个具有参数化表示人体网格模型,从而可以进行姿势驱动。三维人体重建在游戏、电影、虚拟现实和增强现实等领域具有十分广泛的应用,因此具有重要的意义。本文首先简单地介绍了三维人体重建问题的背景和相关工作,包括常见的三维数据结构、常见的参数化人体模型以及基于不同思路(优化或者回归)和不同表示(参数化模型或者隐式函数)
学位
最优传输理论研究可分度量空间中概率测度之间的最优传输变换。给定两个概率分布和对应的传输代价函数,最优传输问题求解使得总传输成本最小的传输方案。近年来,随着最优传输理论和算法的不断发展,最优传输理论在深度学习、图像处理、经济学和医学等领域都发挥出巨大的作用。因此,研究计算最优传输问题的高效算法,有助于最优传输理论更好地应用于各个领域。本文首先对求解最优传输问题的三种不同算法进行了介绍和实验,它们分别
学位
深度学习是机器学习的一个分支,通过分层学习获取数据的内在规律和表示层次。目前深度学习被广泛应用在计算机视觉、自然语言处理、语音识别、量子化学以及医学等领域,尤其在图像识别中表现出了出色的性能,这离不开大规模、高质量的数据集以及GPU性能的提升。在传统的图像识别任务中,训练数据的类分布往往受到人工的影响,即不同类别的样本数量基本一致。然而真实应用场景中的数据集通常表现出长尾分布,这给图像识别任务带来
学位
本文以对比分析理论、第二语言习得理论作为指导,采取学科内两种语言交叉研究的方式,对国际中文敬语教学进行系统地梳理总结。通过对比分析以及问卷调查的方式,分析以韩语为母语的学生学习汉语敬语时所存在的主要问题及原因,并结合调查结果及具体教学实践经验提出相关教学建议,以期能在一定程度上为对韩汉语敬语教学提供一些参考。全文主要分为五个部分。第一部分是绪论,主要对文章的研究内容、研究方法、研究综述等进行了概述
学位
《六十种曲》作为“现存明代汇刻传奇最丰富而重要之总集”(傅惜华语),兼有文人案头本与舞台演出本的双重性质,具有很高的研究价值。道具是戏曲创作和戏曲演出中的重要组成部分,对戏曲研究具有重要意义。故对《六十种曲》道具进行研究是可行并具有价值的,既能为《六十种曲》研究增添新的内容,又能将戏曲的文本研究与舞台研究紧密联系起来,还有助于当代剧作家借鉴前人的道具设计进行戏曲创作。本文以“《六十种曲》的道具研究
学位
作为计算机视觉领域的研究热点,图像生成任务具有巨大的理论研究价值与实际应用潜力,其中,场景图像生成由于需要同时考虑多个物体以及物体间复杂的交互关系,更具挑战性。然而,当前大多数方法均从复杂的文本描述、场景图、场景布局中生成场景图像,往往需要用户或是详细阐述物体属性及关系,或是构造专业性较强的结构场景图,或是固定物体间的布局关系,因而用户友好性不足。为了给用户提供便捷化的场景图像生成方式,本文基于知
学位
单幅图像去雨在计算机视觉领域中是一项具有挑战性的任务,且在恶劣有雨环境中获得的图像会影响后续高级视觉任务的性能,因此提出一个高质量的模型来解决图像去雨问题至关重要。本文首先提出一个新颖的密集特征金字塔网格网络(DFPGNet)来解决单幅图像去雨问题。不同于以往的特征金字塔方法,本文提出的密集特征金字塔网格(DFPG)模块采用多路径和多尺度方法,使得DFPG能够融合五个来自不同路径和不同尺度的特征并
学位
当今世界,随着科技的发展,数据量爆炸性增长。一方面是生活产生的数据增加,一方面是数据处理是会使数据维度增加。比如,在购物系统中,若是商品种类中有一万种不同的物品,经过独热编码后将变成一万多种特征。大量的数据,大量的特征一方面,使得大规模模型的算法有了更好的精度,神经网络机器学习等依托于大量的数据在处理各种问题中展现了其优越性,但是另一方面,也对算法有了更多的要求。过大的数据量使得模型训练变得及其缓
学位
本文从对比语言学的观点出发,探讨了中韩数量结构中的结合方式、意义对应关系、感情色彩等的共同点和差异点。本文以汉韩名量词和动量词为研究对象,运用对比语言学、文献研究法以及归纳分析法等理论、方法探究汉韩量词数量结构的特点。本文以21世纪世宗语料库(2011)、《韩中辞典》、《汉语量词大词典》、CCL语料库为语料对汉韩量词进行搜集、分类、对比研究。由于韩国语中存在大量汉字词,两种语言的使用存在不少共同点
学位