基于HLS的Tiny-yolo卷积神经网络加速研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:leolee4510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolution Neural Network,CNN)在计算机视觉领域得到了广泛的应用,特别是在图像的识别、分割以及目标检测等方面突显出了较好的应用前景,但是目前大部分卷积神经网络系统基本上都是在GPU环境下运行。尽管GPU能够实现实时处理,然而其功耗大,成本高,难以满足一些低功耗低成本应用领域的要求,因此能够研究出一套速度快、准确度高以及功耗低的目标检测系统具有重要的实际意义。与其他目标检测神经网络相比,结构简单、检测速度快的YOLO(You Only Look Once)卷积神经网络更适合应用于低功耗设备。目前已经有一些相关研究将YOLO运用于低功耗设备,由于在ARM架构的嵌入式设备上运行神经网络,其速度非常慢,因此大多数是基于FPGA开发的专用硬件加速器。虽然相对于ARM,基于FPGA的专用硬件加速器大幅提升了目标检测速度,但是其实现难度大,开发周期长。通过分析卷积计算的并行性和Tiny-yolo网络结构的并行特征,基于ARM+FPGA双架构的ZC702开发板,使用HLS进行硬件加速。通过权衡网络的运行速度和硬件资源的消耗,以流水线并行处理算法为主,定点运算为辅,设计了3个IP核,在提高运行速度的同时,大大缩短了开发周期。实验结果表明:经过硬件加速的Tiny-yolo网络比未经硬件加速的版本在速度上提高了6到7倍。由于加速的网络采用了定点计算,与原始的浮点数据类型的网络相比,目标检测结果有一定的误差,但基本能够保持较高的检测精度,适合应用于实际工程之中。
其他文献
煤炭在我国能源利用中占据着举足轻重的地位,煤矿安全尤其是井下生产环境的安全则一直是煤矿行业的重中之重。目前煤矿企业对于井下工作人员的检测主要依托于已装备的井下人
目的系统检索报告/介绍应对国内外重大灾害的医院应急准备相关文献并加以总结与分析,为我国医院建立应对突发事件的应急准备提供参考。方法系统检索MEDLINE(1950~2008.6)、CNK
阐释计算机辅助训练的内涵,根据武术套路运动的特点,将计算机辅助训练在武术套路运动中的应用划分为:计算机辅助训练计划的制定、训练专家在线解决训练难题、计算机仿真技术、计
针对往复柱塞泵采用的阀式配流结构存在结构松散、节流损失大、效率受工作频率影响大等问题,提出了一种结构简单紧凑、节流损失小、工作稳定、配流无滞后的往复柱塞泵转套式
目的探讨超声引导下经皮激光消融治疗良性甲状腺结节的疗效和安全性,为治疗良性甲状腺结节提供依据。方法选取2014年4月-2017年4月在我院进行治疗的258例良性甲状腺结节患者
目的探讨和分析新生儿黄疸的发病因素和治疗手段。方法回顾性分析我院收治的83例黄疸患儿的临床资料。结果患儿中有63例治愈,15例好转出院,5例治疗无效转上级医院治疗,有效率
为了解大学生主动学习与教育需求的发展特征,经对贵州省1443名大学生开展问卷调查,发现大学生解决问题的主动性不足;自制力差,易受周围环境影响;缺乏理想抱负及正确的人生观
随着市场经济建设过程中,经济和科技的快速发展为电子商务崛起和发展创造了条件,当前,电子商务成为我国市场经济建设中重要的产业模块,不仅带动了我国经济的整体发展,同时在
在凤凰洞发现的古文字是商代早期文字。通过对洞内第一组书写文字的初步释读,确认凤凰洞为商族原始宗庙遗址,后世的郊宗石室之制即其流风余俗。《左传.昭公八年》所记根牟一
针对量子密钥分发终端设备中八路量子态光信号在设备出口处存在固有时间偏差的问题,设计了一套以TDC-GPX为核心的量子密钥分发光源时序校准系统。系统对量子态光信号进行光电