基于深度学习的交通标志检测系统研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hmilymemo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通标志检测是自动驾驶任务中的重要一环,也是当前的研究热点之一。然而,现有的交通标志检测算法仍然存在一些问题,比如计算量大,检测速度较慢;训练流程复杂;对交通标志的细粒度分类能力较差等。本文充分调研了交通标志检测领域的数据集和算法,根据交通标志数据集的特点和计算机视觉相关领域中各算法的解决思路,对交通标志检测任务中存在的问题和难点展开了研究,本文主要的工作内容和创新点总结如下:1)现有的交通标志检测算法存在算法检测速度慢和训练流程复杂的问题。针对该问题,本文改进了扩展特征金字塔网络,采用自适应学习特征融合权重系数的方式来合成扩展特征层,并通过特征增强模块过滤高层特征的噪声信息,相比原有的特征纹理传输网络,参数量大大减少,算法的推理速度从1.7帧每秒提升到3.3帧每秒,并且不依赖于现有算法分阶段的训练方式,简化了训练流程。2)现有算法对于交通标志的细粒度分类能力不足,本文提出了基于局部特征选择的双路径网络,通过引入判别性较强的局部特征,并根据特征对分类的重要性进行增强或抑制,有效地改善了算法对交通标志的细粒度分类能力。3)本文提出的算法在多个数据集上进行了大量的实验,相比基准方案均提升了将近一倍的算法检测速度,同时也取得了较高的检测精度。特别地,在清华-腾讯100K交通标志数据集上达到了94.49%的精度,高于现有的算法。4)设计了一个以本文算法为核心,基于客户端/服务端架构的交通标志检测系统,具有跨平台的交通标志检测和扩充交通标志数据集的功能,并通过测试验证了系统的可用性。
其他文献
近年来深度学习方法在医学图像分割领域取得了显著成效。然而,深度学习分割模型的性能高度依赖于训练样本的标签质量。医学图像的像素级标注依赖于专家的经验,十分耗时且容易出错,导致训练样本不可避免存在大量标签噪声,严重影响分割模型的性能。如何消除标签噪声对分割任务的干扰仍面临挑战,是目前的研究热点方向。医学图像分割场景中的标签噪声主要包含两类:1)由标注者的疲劳或粗心导致的随机标签噪声;2)由于目标结构复
学位
在新一轮科技革命和产业变革的背景下,快速发展的计算机技术与传统汽车行业深度融合,智能汽车成为产业发展的战略方向。作为智能驾驶关键技术中的数据前端,车辆感知系统利用多种传感器收集数据,并以此为基础进行算法分析,提取有价值的外部环境信息,供车内乘员及辅助驾驶系统做出驾驶行为决策。本文主要研究设计和实现一个车辆多模态视觉感知系统,选用可见光与红外摄像头作为视觉传感器,以此为基础实现像素级和语义级的外部环
学位
人体实例分割旨在对图像中的每一个人体都给出像素级的识别结果,是计算机视觉领域的一个重要研究问题,在手机等移动终端上具有良好的应用价值。本文基于业内主流的Yolact方法设计了一种能在移动终端实时运行且具有较高精度的人体实例分割算法,命名为Yolact Mobile,算法主要做了两个方面的改进:(1)针对多尺度人体特征难以准确表达的问题,本文在主流的人体实例分割模型Yolact框架基础上提出了更优的
学位
基于视觉与雷达融合的即时定位与重建技术(Simultaneous Localization and Mapping,SLAM),是室外场景位姿估计和建图的主要技术手段之一。它融合了相机和雷达两方面的优势,一方面利用相机获得较高的输出频率,另一方面利用激光雷达直接获取大范围的场景结构信息。然而,现有融合方法的视觉模块(即深度增强视觉里程计)大多采用特征点法。但是,基于图像信息提取的2D特征点和激光雷
学位
二维虚拟试衣技术利用服装与人体图像合成虚拟试衣图像的方式来模拟服装的试穿效果。当前主流技术手段利用人体的体型姿势信息对服装图像进行扭曲变换,弥补服装与人体间的空间错位,然后再将扭曲服装与人体图像进行融合得到合成图像。然而,空间错位是无法完全消除的,人体与扭曲服装之间的未对齐区域会在融合过程中混入无关纹理,从而在合成图像的服装区域造成模糊和伪影。因此,如何解决上述问题是二维虚拟试衣领域面临的重要挑战
学位
在教育信息化高速发展的背景下,许多学者在教育数据挖掘领域开展研究,而其中最热门的研究是成绩预测。成绩预测基于学生的成绩数据、行为数据、或其它个人数据预测学生未来表现。早期的成绩预测主要依靠学生的成绩数据,随着大数据时代的到来,可用于成绩预测的数据得到了极大地扩展。然而,目前成绩预测研究仍存在着采用的数据类型比较单一,数据规模普遍较小的问题。针对这些问题,本文开展了基于较大规模多源数据的成绩预测研究
学位
近年来,包含电脑生成的图形、文本和动画的屏幕内容(Screen Content,SC)越来越受到人们的欢迎,如屏幕共享类型视频。其中,屏幕内容编码在屏幕共享方面发挥着极其重要的作用。然而,屏幕内容编码仅仅沿用了普通编码器的帧内预测框架,屏幕内容的帧内预测编码仍存在提升空间。因此,本文分别针对屏幕内容的帧内划分树结构和帧内预测模式对帧内的编码算法进行优化。一方面,针对帧内预测的双树划分结构进行优化。
学位
在嵌入式摄像头系统中实现基于机器视觉的目标检测算法,是安防领域走向智能化的重要一步。传统的深度学习算法设计与实际部署至目标平台是相对独立的两个环节,由于设计平台与实际部署平台之间存在的硬件架构差异,许多GPU平台上设计得到的算法无法充分利用目标平台的硬件计算能力,该问题已经成为许多研究人员关注的焦点。针对目前嵌入式摄像头部署的智能算法无法充分利用硬件计算资源,算法精度与实时性无法兼顾的问题,本文研
学位
随着社会的发展和深度学习技术的完善,构建深度学习模型自动分割图像中异常模式,成为了计算机视觉领域的研究热点之一。该项任务具有重要的研究价值和广泛的应用前景,例如其可被应用于质检领域,发现产品上存在的瑕疵。然而,该项任务还存在着巨大挑战,如异常样本难以获取,异常区域视觉可分辨性低,异常模式具有未知性等,因此通常要求模型能在基于正常图像学习的情况下,对待检图像中的潜在异常进行分割。基于上述任务设置,近
学位
科研领域知识图谱将科研平台下的海量数据以图结构形式彼此关联起来,使其更符合人类的认知思维,方便了科研人员对领域知识的组织和管理。然而,当前科研领域知识图谱存在知识缺失的情况,导致其下游应用效果欠佳,因此对科研领域知识图谱进行补全至关重要。本文提出了一个知识图谱补全模型Trans-Cap Net,模型主要包括两部分:利用图谱现有知识进行补全的链接预测部分和利用外部数据源知识进行补全的知识抽取部分。在
学位