面向交通夜视场景的目标检测算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:herirong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测作为计算机视觉的重要研究内容之一,在工业,军事,智能监控,人脸识别,多目标追踪,自动驾驶技术等领域有着广泛的应用。当前,随着人工智能与自动驾驶等技术的研究不断推进,基于深度学习的目标检测越来越成为国内外学者们研究的热点。基于Darknet53特征提取器的YOLOv3网络模型具有检测精度高,检测速度快等优点,但仍存在对于小目标检测能力不够强,边界框定位不够精准以及模型权值文件较大等问题。为此,给出了一种基于改进YOLOv3模型的目标检测算法。将YOLOv3的特征提取模块由Darknet53改为具有可减少计算量及加快前向传播速度等优点的Vo VNet模块,并将YOLOv3的损失函数中的边界框损失函数由Io Uloss改成有利于提高边界框定位能力的GIo Uloss。此外,为增强网络模型对目标的分类与定位能力,在用不同数据集训练时,适配数据集对应的anchor参数。在公开的数据集VOC2007+VOC2012和Visdrone2018上实验,实验结果表明,在不影响YOLOv3算法实时性的前提下,给出的算法提高了目标检测的m AP,在公开数据集Visdrone2018上训练得到的m AP达到40.9%,比传统YOLOv3的m AP提高了8.7%;在公开数据集VOC2007+VOC2012上训练得到的m AP为81.6%,比传统YOLOv3的m AP提高了3.5%;在作者自制的交通夜视场景数据集上训练与测试,m AP可以达到84.1%。同时,权重文件由234M减小到163M。此外,探究了不同的损失函数对网络模型性能指标的影响。同时,为进一步减小网络模型的权重文件大小,通过将YOLOv3的特征提取器改为Ghost Net模块,将边界框损失函数由Io Uloss改为GIouloss,给出了一种基于改进YOLOv3的轻量化目标检测网络模型。在公开数据集Visdrone2018进行实验,改进的轻量化模型的m AP比YOLOv3的轻量化模型YOLOv3-tiny提高了14.28%;在作者自制的交通夜视场景数据集上训练与测试,m AP可以达到95.3%。同时,权重文件由234M减小到89.9M。此外,探究了不同的损失函数和不同的输入图片尺度对网络模型性能指标的影响。
其他文献
随着现代社会的高速发展和城市化的加快,居民持有汽车的数量在急速的增长,在给人们带来便利的同时,由于道路车辆过多、道路和安全意识匮乏等诸多原因,车辆行驶安全问题日益突出,交通安全形势严峻,正逐渐成为人们关注的焦点。所以,人们寄希望于将现代高科技技术应用在车辆上,从而降低事故的发生率,智能交通系统由此诞生。汽车生产商将此系统与车联网技术的使用,具有解决交通安全问题的可能,并且拥有广大的市场和美好的发展
在人们快节奏的生活模式下,心血管类疾病发生的概率大大增加,已成为威胁人们身体健康的主要因素之一。心率,作为一种身体机能反馈指标,在心血管疾病的预防和诊断中都发挥着极为重要的作用。对于心率的测量,人们在很长一段时间内依赖于传统的接触式方法。但是,在连续监测过程中,接触式会带来活动受限和皮肤压迫等弊端,因此在动态心率监测和特殊人员护理等方面实用性不足。近年来,成像式光体积描记术(Imaging Pho
群组行为识别是计算机视觉领域中一项具有挑战性的任务。与传统的个体行为识别相比,群组行为识别不仅需要理解场景中个体的行为,还需要推断个体之间的潜在交互关系。准确捕捉场景中的时空信息,并对个体间的交互关系进行推理是理解群组行为的关键。本文在总结现有群组行为识别方法的基础上,考虑个体行为理解对群组行为识别的重要性,致力于构建灵活有效的交互关系推理网络,主要解决群组行为识别任务中以下几个问题:第一,考虑个
大力发展光伏(Photovoltaic,PV)发电可以缓解我国目前面临的能源短缺、电力供应不足以及环境污染等问题,独立光储系统不依赖电网运行,在无电或频繁停电的场所得到了广泛应用。在光储系统运行过程中应保证瞬时功率平衡、系统稳定、安全运行,因此如何有效地解决光储系统功率分配和能量管理控制问题依然迫在眉睫。本研究选择将超级电容(Super Capacitor,SC)与全钒液流电池(Vanadium
条纹投影轮廓术作为一种非接触式三维测量技术,因其高速、高精度以及高鲁棒性测量能力而广泛应用于工业诊断、视觉导航,医学诊断等众多领域。高速,高精度的测量是条纹投影轮廓术的最终目标。然而,提高测量速度,特别是在不降低测量精度的情况下,是条纹投影轮廓术发展中存在的一个巨大的挑战。并且条纹投影技术在新领域单像素测量领域应用较少,而单像素测量在非可见波段有优秀的表现,将两种技术结合进行测量的方法值得深入研究
柔性力学传感器由于具有随形性、延展性等特点,其在可穿戴电子、服务型机器人等新型领域上具有较大应用潜力,从而成为当前研究热点之一。碳系导电高分子复合材料符合柔性力学传感器良好体表共形要求兼具成本优势被大量应用。利用实验手段来探究碳纳米管和石墨烯共混对传感器电学性能上的提升难以揭示它们行为的物理规律。通过建立数值模型或解析模型才可以准确探究粒子微观参数与材料宏观参数间的联系。本文创新的通过建立适合于三
聚氨酯是一种具有广泛用途的高分子材料,国内的聚氨酯消费总量占据全球的半壁江山,聚氨酯的化工生产在旺盛的市场需求下具有巨大的市场潜力。近几十年中国聚氨酯生产技术发展迅速,生产规模显著扩大,但是随之产生了生产现场分散管理困难和生产数据的“信息孤岛”等问题限制了企业的进一步发展。搭建统一的生产数据中心,设计可以集中监控生产现场和查询统计生产数据的信息系统具有重要意义。课题组之前为安利公司开发了一至三期聚
随着机器视觉在自动化生产领域的广泛应用,在测量和装配设备中加入视觉系统,根据视觉定位的结果引导设备执行后续任务,对提高设备的感知和决策能力具有非常重要的意义。本文以机器视觉和图像处理技术为基础,主要对测量仪器及装配机械臂等设备的视觉引导及定位技术进行研究。对相机的成像原理及双目视觉成像模型进行分析,对张氏标定法进行了详细的推导,选取合适的相机与镜头设计并搭建了标准的双目视觉系统实验平台,通过标定实
随着计算机视觉技术的不断发展,图像已经成为传递信息的重要媒介,如何从海量的图像数据中获取人们需求的高质量的图像显得尤为重要,图像修复作为图像处理中的关键技术,已经成为计算机视觉领域重要研究课题之一。近几十年年来,国内外学者基于数学建模等理论对图像修复做了深入研究,并尝试将其从实验推广到实际应用。然而,实际应用中图像受损区域复杂多变,传统图像修复算法难以完成高质量的修复过程。近年来,深度学习凭借其对
人工智能自出世以来几经沉浮,终于在算法突破、算力提高及海量数据的推动下于21世纪迎来了质的飞跃。卷积神经网络(Convolutional neural network,CNN)作为代表算法之一,在医学、无人驾驶、语音识别等领域都表现优异。CNN需要对大量测试样本进行训练从而更新网络参数,想要获得更高的识别精度,其代价是更多的网络参数和更大的计算复杂度。Winograd算法可通过减少卷积层所需的乘法