用于交通标志检测的轻量级卷积神经网络设计

来源 :天津大学 | 被引量 : 0次 | 上传用户:kittyranger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通标志检测与识别是高级辅助驾驶系统中的一项重要任务,高级辅助驾驶系统需要提前检测出交通标志的位置和类别,获得其传达的信息,并做出相应的反应,规范驾驶行为,以提高驾驶过程的安全性。目前主流的交通标志检测与识别算法的精度已经到达较高的水平,但是由于深度学习算法延时长、计算成本高等问题,在移动平台部署深度学习算法仍然具有很大的挑战性,所以仍需要对网络进行压缩,从算法上减少网络的参数规模和计算量。本论文的主要贡献如下:(1)针对交通标志检测与识别方法参数量与计算量过大的缺点,采用轻量级卷积模块搭建了一种轻量级的交通标志检测与识别网络,并融合一种轻量级的通道注意力机制,在增加了少量参数的情况下提升了网络的性能;根据交通标志检测任务的特点,提出一种针对小尺寸交通标志的数据处理方式,采用了训练时多尺度、mixup等数据增强策略,能够深入挖掘训练集的信息,在不增加额外推理时间的前提下提升网络的效果。(2)针对剪枝过程中难以选择剪枝比例的问题,提出一种自动阈值搜索的剪枝方式,能够根据不同的目的自动搜索剪枝的比例;为了进一步提升剪枝后模型的性能,提出一种基于非对称卷积的知识蒸馏策略,在训练过程中可以增加学生网络的特征表达能力,而推理时不增加额外的计算开销,进一步提升了网络的性能。本论文采用公开的交通标志数据集TT100K,对不同网络结构、不同的模型压缩策略进行了一系列对比实验,最终本论文提出的模型的mAP为0.913,模型的参数量约5.26M,FLOPs为62.26B。实验结果表明,相较于先进的目标检测算法,本论文设计的算法可以在参数量与计算量更小的前提下,达到与之相似的检测性能,实现小尺寸交通标志的检测。
其他文献
图像分类技术是计算机视觉领域的一个热门研究方向,它不仅可以有效提升信息检索的效率,而且在图像分割、目标检测等领域都有着重要的应用价值。传统的分类方法需要手动提取特征,特征提取不充分;深度学习技术以其强大的自主学习能力,为图像分类提供了新的思路。为进一步提高分类准确率,论文基于人眼对视觉信息的感知特性,利用卷积神经网络,对图像粗粒度分类方法进行了深入的研究,主要内容如下:第一,论文提出了一种双路特征
学位
随着电子产品的飞速发展,显示器等硬件制造水平的提高,人们不仅想要更为清晰的图像,也期待炫目的视觉效果。面对即将到来的8K超高清时代,新一代的显示设备不仅提供了更高空间分辨率,也能够提供更高的比特深度,从另一个角度增强图像显示的画质。但现有大部分图像和视频都是以较低比特深度存储,为了适应高比特深度的显示系统,实现低比特深度图像转化为高比特深度图像的处理技术,就成为这一特定过渡时期的图像处理技术的研究
学位
近年来,光纤周界安防技术飞速发展。其中,基于双马赫-曾德干涉仪(Dual Mach-Zehnder Interferometry,DMZI)的分布式光纤传感系统以其检测范围广、响应速度快、损耗小以及能够进行定位等特点得到广泛研究应用与发展。目前,该系统在报警与定位方面的研究已经比较完善,然而在后续的模式识别方面还有所欠缺,仍待进一步的研究与发展。开发一种识别精度好、效率高的事件识别方案一直是光纤周
学位
<正>一提起世界上最大的生物,同学们一定会想到蓝鲸。到目前为止,人们已发现的最大的蓝鲸体长约33.5米,体重约200吨,可以说是"海上巨无霸"。但是,1998年美国林业局的科学家们在美国俄勒冈州马卢尔国家森林发现的奥氏蜜环菌才是世界上已知最大的生物体。就算是最大的蓝鲸和它相比,也好比是"小巫见大巫"。
期刊
图像是一种重要的信息载体,然而,在获取图像的过程中存在一些导致信息丢失的因素,如雾霾等。在雾霾环境中,存在较多的粉尘、液滴等物体,受粉尘等对物体反射光和大气环境光的影响,捕捉到的图像通常呈现整体亮度偏高、颜色失真、轮廓模糊等问题,导致相关计算机视觉任务性能下降。因此,本文基于特征融合和深度学习,研究了多种关于雾霾图的复原算法。本文首先叙述去雾算法的背景和研究现状,然后以大气散射模型为基础,阐释雾霾
学位
红外和可见光图像在军事、电力、医疗、安防等领域有着重要应用价值,然而,基于多模态数据实现不同应用时,应用任务的复杂度会随着输入数据模态的多样性而升高。因此,利用红外与可见光图像融合技术,创建一幅综合多模态信息的融合图像,不仅能够综合多模态图像的互补信息,提升信息利用率,而且降低了后续应用任务的复杂度。面向实际应用需求,本文基于深度学习技术,深入挖掘了图像模态的多样性,以及复杂场景下不同模态样本差异
学位
21世纪是海洋的世纪,随着科技的发展和人们对海洋兴趣的增加,越来越多先进的观测设备被投入到海洋探索领域,其中最具代表性的就是水下滑翔机。由于大多数海洋现象具有分布广泛和随时间变化的特点,单台水下滑翔机已经不能满足一些观测任务的需求。多台水下滑翔机构成的编队,能够充分利用优越的高时空分辨观测能力,可以完成单机不能完成的任务,将在海洋环境立体观测网的构建中发挥不可替代的作用。路径规划与编队控制一直是水
学位
形成于印支期的酸性侵入岩与新疆西昆仑地区成矿关系密切。卧龙岗二长花岗斑岩位于黑石北湖—三道河子岩浆岩带中段,岩体周边发育多种有色金属矿床。本研究针对二长花岗斑岩,采用LA-MC-ICPMS方法进行锆石U-Pb同位素定年,结果为(239.47±0.78)Ma~(222.36±0.64)Ma,指示岩体形成于中—晚三叠世。二长花岗斑岩属于准铝质—过铝质、高钾钙碱性—钾玄岩系列。岩石全碱含量较高,里特曼指
期刊
计算思维的提出有助于培养学生从计算机视角解决问题的思维能力,但在实际落地时存在教学资源匮乏、评价难以开展等问题。《普通高中信息技术课程标准》中明确计算思维的核心是算法思维,通过深入研究课标中广义算法思维和计算思维的定义和能力构成,提炼出狭义算法思维的概念,将其作为发展高一学生信息技术核心素养的首要思维能力和评价对象。依据SOLO分类理论探究算法思维的层次水平,提取高中课程中算法部分的评价要素,确定
期刊
人们常常通过拍摄屏幕来获取信息,但这样得到的图像往往包含采样混叠造成的摩尔条纹噪声(简称为摩尔纹)。摩尔纹的存在大大降低了屏幕拍摄图像(后文简称“屏摄图像”)的质量,对后续的图像处理和分析造成障碍。因此,研究如何去除屏摄图像摩尔纹具有重要的现实意义。摩尔纹复杂多变,其形状和颜色会因拍摄角度、拍摄距离、显示设备型号和相机型号的不同而变化,因此屏摄图像去摩尔纹任务充满挑战。本文首先对摩尔纹的特性进行了
学位