目标检测网络轻量化及推理加速技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lpf881
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在上个十年,目标检测领域出现了许多基于深度卷积网络的优秀模型。在性能不断提升的同时,算法计算量严重增加。在以智能驾驶为代表的边缘计算应用场景中,目标检测算法需要离线推理,实时性要求严格,且计算硬件资源有限,很难满足大型网络推理的需求。Nvidia等厂商针对边缘计算场景研发了高性能硬件平台,这引入了新的课题:如何改良目标检测算法以适应边缘计算需求,并高效地利用边缘计算硬件设备。为了提高计算效率,本文提出了一个基于YOLOv5的轻量级目标检测算法。研究了YOLOv5网络结构,基于特征金字塔和路径扩充结构搭建了特征融合网络,引入基于锚定框的位置回归,搭建了多尺度检测头。在此基础上对算法进行了一些优化,包括使用H-swish激活函数,引入C-Io U计算位置损失,空间金字塔池化结构的优化和注意力结构的移除。研究了流行的卷积神经网络模型,分析了逐点卷积、深度可分离卷积等轻量级结构高效的原因。分析轻量级网络Shuffle Net V2基本单元原理,对通道重排和通道分割结构进行了改进,解决了特征复用不均匀问题,并引入了逆残差结构。使用改进后的基本单元搭建了轻量级骨干网络,替换YOLOv5原本的主干网络,在保持网络宽度不变的情况下,显著降低了参数量和计算量,同时增加了网络深度。研究了快速算法原理,推导了Winograd快速卷积算法,通过减少冗余乘法提高计算效率。基于CUDA实现了im2col+GEMM快速卷积算法,主要改进是优化了访存效率并复用了缓存。实现了卷积层/批正则化层算子融合,通过改变权值的方式优化掉了批正则化层,减小计算量的同时减小了核函数调用。研究了水平算子融合方法,通过融合并行等尺寸卷积核,提升了CSP模块的效率。论文最后,在多个平台上进行了消融实验,验证了论文中对YOLOv5、Shuffle Net V2改进措施的有效性。同时,在Jetson Nano硬件平台部署了前文设计的轻量化目标检测网络,使用MS COCO验证集对所构建的算法进行评估,构建简单的视觉系统进行实际测试,证明了模型轻量化、推理加速工作的价值。在上述工作的基础上,总结了卷积神经网络轻量化的规律,为将来的工作提供了经验性的指导。
其他文献
随着不可再生能源的紧缺,分布式可再生能源发电大量出现,随之孕生出可实现电能变换与能量流动控制的电能路由器。并联直流变换器(DC/DC Converter)可在额定电压下提供更大的输出功率,且无需使器件承受更大的电流应力,因此适用于电能路由器之中。然而其应用受网络控制中的传输时延与量化问题所影响,因此本文旨在研究并联DC/DC变换器网络控制系统(Networked Control System,NC
学位
目的 分析交叉配血患者不规则抗体(IA)筛查阳性结果的分布特征。方法 选择2020年4月至2022年3月于江西省中西医结合医院和南昌大学第二附属医院进行交叉配血的7 545例患者作为研究对象。所有患者均进行IA筛查,并对筛查阳性患者进行抗体特异性鉴定。统计交叉配血患者IA筛查阳性情况,分析IA筛查阳性患者的分布特征及IA阳性患者的特异性鉴定情况。结果 7 545例患者中有59例IA筛查阳性,阳性率
期刊
本文研究了短期负荷预测的方法,总结了BP神经网络预测算法的原理和技术,做出了该网络的电力系统短期负荷预测的模型,并依次针对隐含层节点个数为10、20、30的该模型作了预测对比、误差分析。除了这些之外,针对该模型联系中的占比以及阈值初始化出现的问题,利用遗传算法对该网络的算法做了完善,根据日气象特征和遗传算法改进了BP神经网络电力负荷预测模型。从日气象特征出发,建立了BP神经网络电力系统短期负荷预测
学位
随着分布式电源的大量并网,配电网的电气特性发生显著变化,主动配电网是以达到高效管理含分布式电源配电网为目的而提出的新兴发展方向。作为主动配电网研究的重点课题,主动配电网重构是优化配电网络,提高电能质量的有效手段。本文以含分布式电源的主动配电网作为主要研究内容,对静态重构和动态重构两方面进行深入研究,具有一定的现实意义。具体研究内容如下:首先,介绍了几种分布式电源的数学模型、潮流计算方法及配电网重构
学位
随着油气资源开采的愈发深入,面临的地质环境向着复杂化发展,因此如何提升钻井效率、降低能量损耗、节约成本是油气资源高效开发面临的关键问题之一,高压电脉冲破岩是脉冲功率技术的新型应用,该方法不仅可以实现无污染、低成本破碎岩石,更是可以将系统中的能量直接作用到岩石内部,降低能量转化过程的损耗提升破碎岩石的效率。目前高压电脉冲破岩还处于实验室研究阶段,因此用于电脉冲破岩的脉冲功率装置是深入研究、评价、分析
学位
<正> 例一:刘××,女,38岁。1982年2月17日行人工流产,术后回家,全身寒颤,体温38.5℃,曾口服土霉素二天,无效。2月20日晨因腹疼难忍,以人流术后感染收入院,当日下午请中医会诊。病人精神紧张,痛苦面容,高烧38.8℃,恶寒,呼吸急促,心率100次/分,腹痛难忍而拒按,脉浮数,舌质暗
期刊
无线电能传输技术(Wireless Power Transfer,WPT)具有安全、可靠、灵活、环境适应性强等特点,受到人们的广泛关注。在大部分实际应用中,系统需要从电网获取能量,在低压应用场合,系统需具有较高的降压比,此外由于实际应用环境的复杂性,对WPT系统的稳定性提出了更高的挑战。在此背景下,本文开展了基于半桥三电平变换器(Half-Bridge Three-Level Converter,
学位
机械式电压电流发生器作为成熟稳定的电压电流发生设备,可以在较为宽泛的范围内实现一定的电压电流的稳定输出,其在测试领域有着广泛的应用。而精度较高的电动式电压电流发生器一般是前端通过步进电机驱动接触式调压器动触头旋转一定的角度,快速稳定的输出一定的正弦电压信号,电流输出通过在调压器后端加接副边为扁铜条的固定变比降压变压器实现大电流输出。随着测试领域要求的提高,对较高电压电流发生器调压器的精度要求也越来
学位
随着环境探测、生物医疗、智能交互、机器仿生等领域的快速发展,具有强适应力和变形能力的机器结构的研发受到了越来越多学者的关注。在这样的时代背景下,由柔性材料制作而成的软体机器人成为了当前的一大研究热点。介电弹性体材料因其出色的性质在软体机器人领域备受青睐。但是目前由于材料的发展还不够充分,需要高压输入才能实现驱动。高压无线驱动便是拓展介电弹性体材料应用领域的一种直接手段。除此之外,高压无线驱动在光电
学位
永磁同步电机具有效率高、可靠性能强和功率密度大等显著优点而被广泛应用于新能源电动汽车、风力发电、数控机床、伺服控制、机器人运动控制等诸多领域。尽管永磁同步电机具有诸多优势,但其仍然是一个多变量、强耦合和非线性的复杂系统,对控制系统的设计提出了很高的要求。在传统的矢量控制中,如经典的PI控制并不能够使永磁同步电机表现出高品质的动态性能、高精度的稳态性能和抗干扰的强鲁棒性能,难以满足高精尖领域下的工作
学位