基于FPGA的目标检测加速器设计

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:lxmcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于卷积神经网络的目标检测算法在工业、农业、军事等众多领域得到广泛的应用。为了适应复杂多样的应用场景,目标检测模型的结构逐渐复杂,模型参数量、计算量迅速增长,使得算法部署到低功耗嵌入式设备的难度增大。因此本文基于可编程、高能效的FPGA设计了一种低功耗、高吞吐的目标检测加速器,在嵌入式设备上实现了高效的目标检测系统。本文展开了目标检测加速器的系统研究,通过建立Xilinx ZCU104平台的Roofline模型,对多种目标检测模型的参数量、结构和速度进行了分析。根据算法在平台上的预估计算性能,选定YOLO v2算法完成加速器设计。更进一步的,面向FPGA对YOLO v2算法进行优化,通过层融合简化算法的前向推理过程,采用动态定点表示法对网络参数进行了量化,缓解了浮点型数据和运算带来的运算压力和存储压力。针对算法卷积循环优化展开研究,确定了输入特征图通道与输出特征图通道相融合的循环展开方式以及输出特征图数据复用的循环交换方式,提高了目标检测加速器系统的并行性和计算效率。最后,基于片内异构计算设计了一种软硬件协同处理机制和系统架构,分别利用ARM与FPGA的不同优势完成算法不同层的运算,并设计了加速器系统的数据通路。接下来,本文设计了一种高效普适的加速器IP核,实现了YOLO v2任意运算层的加速。具体的,采用循环展开、循环分块、乒乓缓冲和多通道数据传输等方法设计加速器IP核中的相应功能模块,优化数据传输,减少传输延时,提高了加速器的数据吞吐量。最后本文使用高层次综合工具优化加速器IP核的实现,并在Vivado中完成目标检测系统的Block Design,进而将比特流、权重等文件导入FPGA中实现PS端的相应功能,集成完整的目标检测加速器系统。本文在Xilinx ZCU104平台上进行实验,验证了本文设计的功能正确性,并对功耗与性能进行分析对比。实验结果表明本文设计的目标检测加速器可以在功耗为3.98 W的情况下达到28.3 GOPS的吞吐量,实现了7.1 GOPS/W的能效,其能效是使用CPU(GPU)完成YOLO v2运算的108(23.48)倍。与其他相关研究的对比表明,本文设计的CNN加速器在吞吐量和功耗方面取得了有竞争力的表现,满足了嵌入式平台应用场景的要求。
其他文献
研究背景:近年来心脏手术患者中高危高龄患者比例增加,神经系统并发症成为了影响心脏手术预后的重要方面。目前,对患者围术期血流动力学的监测能够反映全身总体的氧供状况,但对氧供氧耗的平衡及个别器官的灌注情况却难以反映。近红外光谱(near-infrared spectroscopy,NIRS)脑组织氧饱和度(r Sc O2)监测可以对大脑额叶皮质进行连续实时的无创监测,反映脑组织的氧供氧耗平衡情况。手术
学位
为探究某重载铁路列车最高运行速度由80 km/h提高至90 km/h后既有货车的安全性能,评估提速的可行性,综合考虑列车服役条件、车辆及车钩缓冲装置结构,基于多体动力学理论建立了多节连挂重载货车动力学仿真分析模型,并采用现场试验数据验证了模型的有效性,进一步通过仿真分析研究了C80与C64K货车空车、重车的非线性临界速度,对比分析了C80与C64K货车提速后的动力学性能,探明了转向架关键参数对既有
期刊
多节段脊髓型颈椎病病情严重、手术风险大、并发症多,一直是临床治疗的难题。手术治疗方式主要包括前路、后路、前后联合入路。前路减压融合手术可以直接去除致压物,有效纠正、维持颈椎生理前凸,但存在融合失败,相邻节段退变,颈椎活动度丢失等并发症。后路手术主要包括椎管扩大成形术、椎板切除术及其改良的椎板切除融合内固定术,单纯椎板切除术术后易出现严重颈椎不稳、后凸畸形、神经周围粘连等问题,目前临床已较少应用,其
学位
研究目的创伤、骨肿瘤、截骨等各种原因常造成不同程度的骨缺损,这是骨科临床中常见的问题,不利于骨的愈合,对患者的预后和长期生活质量均产生巨大的影响,常需要对骨缺损进行修复。因此,骨科临床对骨修复材料的需求十分巨大,每年数百万骨缺损患者迫切需要骨移植或替代物的植入。骨修复生物材料的研究已成为当今最重要的前沿研究领域之一,并对人类健康、社会及经济发展产生着深远的影响。理想的骨修复材料需要具有与骨组织匹配
学位
高光谱图像包含丰富的地物信息,被广泛应用于许多场合。由于各分类模型具有不同的分类性能,如何有效利用各分类模型性能的差异性是实现融合分类的重要环节,为此提出了一种基于DS证据理论的多模型融合分类的高光谱图像分类方法。由于现有的分类模型从HSI数据的空间域和光谱域提取不同的特征,因此产生的预测结果不同。本融合方法采用多层感知机网络和随机森林网络进行融合分类实验,该网络借助各分类网络的提取特征的差异性,
期刊
[目的]1、探讨创伤性颅底动脉损伤的临床特征及诊疗规范。2、利用动脉内高压注射法制备创伤性颅底动脉损伤(TSBAI)动物模型,探讨巨噬细胞极化在创伤性颅底动脉损伤后再狭窄中的具体作用机制及调控因素。[方法]1、回顾性分析315例创伤性颅底动脉损伤患者的临床资料,按颅底动脉解剖部位和血管损伤的病理类型进行分类,分析显微外科手术、血管内治疗以及保守治疗的临床预后,利用改良的Rankin评分(m RS)
学位
目的 探讨综合疼痛管理策略(疼痛评估频次改良)对住院期间发生爆发痛患者的影响。方法 纳入2021年1-12月共60例住院期间发生过爆发痛的患者,其中包括常规疼痛评估频次的30例患者(对照组)和疼痛评估频次改良的30例患者(改良组)。比较两组患者的睡眠情况、爆发痛疼痛程度和发生频次,以及患者满意度情况。结果 改良组患者的睡眠质量评分较对照组明显降低[(14.57±2.36)分vs.(18.20±2.
期刊
目前,互联网金融飞速发展,金融与科技加速融合,银行业面临着全新的机遇与挑战,数字化、智能化成为各大银行转型和突围的方向。随着智能手机的普及,手机用户数量飞速增长,手机银行APP成为银行至关重要的流量入口,其零售客户基础庞大,金融端有比较强的变现能力,但手机银行APP的用户粘度和用户价值增长探索能力一直比较低。银行机构如何通过金融科技赋能,创新手机银行APP的服务能力,以APP为平台搭建服务场景生态
学位
在经济全球化的进程中,数据所带来的推动力量逐渐增强。数据凭借其特有的动态流动特征,带来了更加丰富的价值。数据出境是数据跨境流动的重要部分。面对呈现指数级增长的跨境流动数据,作为数据体量大国,我国如何在数据出境中规避风险和保证效益是亟需探讨的问题。我国目前已基本形成数据出境法律框架,主要由《网络安全法》《数据安全法》《个人信息保护法》构成,但其配套法律措施不尽完善。除法律之外,纷繁的部门规章及规范性
学位
20世纪以来,利用光复振幅(幅度,相位)、时间、波长和偏振等光学物理特征对光通信系统容量进行提升已趋近上限。为了进一步提高光通信系统的容量,本文对轨道角动量(Orbital Angular Momentum,OAM)在光通信中的应用进行研究。OAM是一种新的物理维度,且与上述光学物理特征之间相互独立。携带OAM的光束被称为涡旋光束,轨道角动量键控(Orbital Angular Momentum
学位