基于FPGA的YOLOv3-Tiny算法的设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:zhongyuzhang09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于神经网络的目标检测算法在自动驾驶、身份认证、国防安全和医疗卫生等领域都有着飞速的发展,这些领域更多的是嵌入式环境下的应用,对设备的性能、功耗和尺寸都有严格的要求。因为神经网络具有巨大的计算量,单纯依靠通用中央处理器(Central Processing Unit,CPU)计算难以达到性能要求,需要使用其他处理方法进行加速。目前主流的加速方法中,图形处理器(Graphics Processing Unit,GPU)尺寸大、功耗高,在小尺寸低功耗的嵌入式平台上难以应用。专用集成电路(Application Specific Integrated Circuit,ASIC)过于定制化,跟不上神经网络迅速更新的快节奏。相比之下,现场可编程门阵列(FieldProgrammable Gate Array,FPGA)具有低延时、低功耗、并行化计算、可编程的特点,更适合用于嵌入式系统环境下神经网络的硬件设计。针对自动驾驶在嵌入式系统环境下检测其他车辆的应用需求,本文在FPGA平台上实现了基于卷积神经网络的目标检测算法的硬件加速。本文的主要工作包括:首先,对主流的应用神经网络的目标检测算法进行分析,从中选择了YOLOv3-Tiny算法进行硬件加速。其次,使用高层次综合工具(High-level Synthesis tool,HLS)设计了基于FPGA的YOLOv3-Tiny算法硬件加速器,并采用了流水线结构和一系列优化策略,对网络的卷积层、池化层和上采样层等实现了并行化加速。针对FPGA资源不足的问题,本文将32位浮点数量化为16位定点数,节约了FPGA的资源,同时提高了运行速度。最后,本文使用Xilinx公司生产的Pynq-Z2开发板对加速器设计进行了测试,在检测道路上车辆的应用场景下,使用实际拍摄的照片作为测试图片,验证了加速器在检测车辆时的有效性,并将实验结果与使用Intel Core i5-8300H CPU和使用NVIDIA Geforce GTX 1050Ti GPU检测车辆的结果进行了对比。实验结果及对比表明,本设计可以准确检测出道路上的车辆,检测速度达到了使用CPU检测速度的2倍,功耗相比所使用的CPU和GPU进行检测的结果低了很多。本文设计的加速器实现了对YOLOv3-Tiny目标检测算法的加速,可以用于自动驾驶领域相关的嵌入式目标检测应用中,完成对道路上其他车辆的检测工作。
其他文献
目的(1)通过现场问卷调查,了解南京市某社区老年人群的健康状况及高血压、高血压前期流行情况,分析老年人群高血压及高血压前期的患病相关影响因素。(2)根据高血压相关危险因素构建高血压发病风险评估模型。为社区老年人群高血压的一级预防和健康管理提供依据。方法(1)2016年3月—2016年12月,在南京市某社区医院,采用整群抽样方法调查在该医院进行健康体检的60周岁及以上居民,进行现场问卷调查和体格检查
随着移动互联网的高速发展,互联网中的短文本信息越来越多。如何对短文本中的信息进行挖掘和分析成为了自然语言处理研究领域的一个重要课题。但是因为用词的不规范以及上下文信息较少,短文本中实体的含义往往非常模糊,同名的实体指称在不同的语境下可以指代不同的实体对象,带有强烈的歧义性,这给短文本的研究任务带来了挑战。对模糊同名实体的判定包含两个主要的环节,分别是文本中模糊实体的识别以及模糊实体歧义性的消除。实
目的:全身性炎症能够导致多器官功能损伤,在神经系统可表现为认知功能障碍,但是并不清楚炎症通过何种机制引起认知功能障碍。越来越多的证据表明,补体C3/C3a受体(C3a R)信号通路是先天性免疫防御的关键组成部分,在认知和神经退行性变中起重要作用,而其功能障碍与许多神经系统疾病有关。但是,尚不清楚补体C3/C3a R信号通路是否参与全身性炎症诱导的认知功能障碍。本研究旨在建立脂多糖(LPS)诱导全身
目的心脏手术因其手术对象的特殊性以及手术操作的复杂性被公认为高风险手术,术后常发生严重并发症导致ICU滞留时间延长、费用增加甚至患者死亡,遂术前对患者进行有效的手术风险评估以及对术后死亡患者的死亡原因进行讨论分析具有重要的临床应用价值。Euro SCOREⅡ是国际上公认效果肯定,被广泛应用于心脏外科手术的风险评估模型。本研究拟验证Euro SCOREⅡ中的各类危险因素与心脏手术患者死亡原因的相关性
近年来,室内三维模型感知重建在服务机器人、室内家装设计与语义导航定位等新兴应用领域发挥的作用愈加重要。附有纹理信息的RGB-D相机点云特别适合实现室内场景三维重建,但是重建模型局部会存在空洞和弯曲形变。为了提升重建质量,本文分别采集序列影像点云与相机点云,对这两类点云融合配准并实现三角化网格重建与纹理映射。实验证明,与单一数据源的点云重建模型方法相比,本文算法重建后模型更加细腻真实。本文的主要研究
过去的二十年中,由于半导体工业加工精度的不断提升、材料的进步,使得处理芯片的运算能力不断增强的同时体积不断缩小、功耗不断降低。电子产品的性能有了巨大的发展,手机从一个单纯的移动电话,发展成了一个多功能的信息平台,渗透进了普通人生活的方方面面。然而,同样作为电子产品的数码相机,发展则要慢许多。尤其是专业数码相机的人机交互没有充分发挥电子技术发展所带来的红利。本文的设计方法基于FBS模型,其是在概念设
目的1.应用静息态功能磁共振(rs-f MRI)技术研究带状疱疹(HZ)急性期脑区功能活动和脑血流量的改变,探讨脑区功能改变与带状疱疹后神经痛(PHN)之间的关系。2.总结播散性带状疱疹(DHZ)患者临床资料,探讨发生播散性带状疱疹和带状疱疹后神经痛的影响因素。方法1.以2017年9月至2020年1月期间在东南大学附属中大医院皮肤科就诊的32例HZ急性期患者(实验组)及18例年龄、性别、受教育程度
学科认证是工程学科专业的资格认定,目的是给与达到或者超过了规定的工程学科教育质量标准的高校与专业相对应的学科专业认可。高校在认证专家前来认证前往往想要先自我评估学科专业的情况,判断是否能够通过学科认证从而及时的在教学过程中进行适当调整。学科认证平台的研究便是为了帮助高校管理者能够更好的了解自身学科的实际情况而进行的。本课题首先对用户进行调研,运用观察法与访谈法来对用户进行研究,分别从功能需求、情感
近年来,随着新兴网络技术的兴起,网络功能逐渐丰富,各种网络协议层出不穷。然而网络设备中各种芯片基本采用硬连线的设计方式,其设计之初就已经确定能够支持的所有协议类型。如果出现新的协议,在不改变网络设备架构的前提下,网络设备很难在短时间内实现对新协议的支持。为此,研究运用在以太网中的可编程网络设备势在必行。本文以网络设备中的基本部件数据包解析器为研究对象,结合RISC-V(Reduced Instru
本文对比了单独臭氧(O3)、O3/氧化剂和O3/稀土元素改性氧化铝(Al2O3)系统降解非处方性非甾体抗炎药——阿司匹林(ASA)和非那西丁(PNT)的效能,研究了影响因素和反应机理,提出了有关反应动力学模型,并从矿化角度评估了工艺的应用前景。与单独O3系统相比,氧化剂——过一硫酸盐(PMS)的加入可以显著提高药物的去除效果。在O3浓度为1.0 mg/L、ASA和PNT初始浓度为55.0μM时,加