卷积神经网络的FPGA实现优化技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xjc132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能的应用日益广泛,方便了人们的生活。卷积神经网络(Convolutional Neural Network,CNN)是人工智能的一个重要分支,在图像分类、语音识别等领域被广泛应用。CNN的主要实现方式包括CPU、FPGA、GPU和ASIC,其中基于FPGA的实现由于具有设计灵活、功耗较低等优点,越来越受到关注。但基于FPGA实现CNN也面临着如何使用片上资源获得更大的算力、如何实现高吞吐率等挑战。本文将运算量最大的卷积层作为重点,研究了基于FPGA的CNN优化实现技术。通过将这些技术用于实现快速超分辨率卷积神经网络(Fast Super-Resolution Convolutional Neural Network,FSRCNN),对这些优化技术进行了实验验证。主要工作如下:分析了卷积层计算过程中存在的并行性,为性能优化提供依据。研究了计算单元优化技术并设计了两类高效计算单元。基于一维Winograd算法和卷积分解的思想,设计了一种高效卷积计算单元(Efficient Convolutional Element,ECE),减少了FPGA片内乘法器(DSP)的使用。根据DSP的特点和乘法运算过程,实现了一种只使用一个DSP就能同时计算A×C和B×C的高效乘法计算单元(Efficient Multiplication Computation Unit,EMCU),其中A和B为8bit的有符号数、C为8bit的无符号数;基于乘法分解的思想对EMCU进行了优化,改进后的EMCU单元在A、B、C的位宽为13bit时也能工作。基于Zynq-7035 FPGA对FSRCNN进行了优化设计。比较了单卷积层处理器(Convolution Layer Processor,CLP)和多CLP结构的优缺点,基于多CLP结构实现FSRCNN。对FSRCNN进行定点,且模型精度损失不超过4%。设计了缓冲模块,以满足卷积计算单元对数据的需求。使用流水线技术对CLP内部及各层CLP之间进行优化,提高了FSRCNN的工作频率。对各层CLP进行并行度优化,提高了流水线工作效率。将ECE和EMCU应用于FSRCNN中,减少了DSP的用量。实验结果表明,本设计使用的高效卷积计算单元、高效乘法计算单元、流水线优化、并行度优化等优化实现技术可以提升DSP资源的算力、提高CNN的吞吐率。本文在FPGA上实现的FSRCNN可以将360×202的图像重建为1080×606的图像,其工作频率可达150MHz,吞吐率可达250GOPS(Giga Operations Per Second,每秒十亿次运算数),与5600G CPU相比实现了949倍的加速。
其他文献
针对新建公路工程精确空间信息快速获取的难题,提出了一种基于无人机LiDAR的勘测设计方法。首先通过分析LiDAR系统主要误差源的影响,介绍无人机LiDAR系统选择方法,然后介绍利用无人机LiDAR数据及与公路CAD协同设计方法。公路工程勘测表明:利用无人机LiDAR获得的激光点云精度高程优于15 cm,可满足新建公路工程定测与施工图设计精度要求,该方法极大增强了公路工程高精度数据获取的灵活性。
期刊
在信息传输量剧增的今天,频谱资源日益紧张,轨道角动量(Orbital Angular Momentum,OAM)因其可以携带大量信息的特点而备受关注。轨道角动量的不同模式相互正交,使得携带轨道角动量的电磁波理论上在同频率点可以同时传输无穷多个模式,从而有效地扩充信道容量。目前产生轨道角动量的天线主要以均匀圆形阵列(UCA)天线为主,但是其传统的馈电网络大多较为复杂庞大,需要进一步的实现集成化和小型
学位
数值计算的方法在当下的电磁工程领域占有举足轻重的地位,为适应快速发展的行业需求,各类电子器件的设计生产和测试评估愈发依赖准确的仿真模拟指导。有限元方法作为一种杰出数值近似手段,广泛应用于电磁场领域的仿真应用之中。为了满足日益多元化、复杂化、快速化的仿真需求,设计出性能更优的电子器件,有必要寻求更高效、快速的有限元方法进一步提升电磁问题的求解能力。本文基于有限元方法和计算电磁学理论,针对电磁本征问题
学位
近年来,随着我国智能制造水平的不断进步,煤炭产业的发展不断创新,大胆引进先进的新材料、新技术和新工艺。液压支架是井下综采工作面最主要的生产设备之一,其乳化液作为传统液压系统的工作介质,因工作面液压管路存在跑、冒、滴、漏等问题导致乳化油融入地下水,造成严重的水体污染和土壤油质化。为积极响应国家煤炭资源绿色开采的发展理念,探索以纯水系统代替乳化液的成套技术,重点攻克了纯水制备装置、纯水高压泵站和纯水支
期刊
近年来,1型糖尿病(Type 1 diabetes mellitus,T1DM)受到国家和社会的广泛关注。研究显示,T1DM患儿血糖控制不佳致使其照护者心理健康状况发生变化,例如,T1DM家庭照护者存在崩溃、抑郁、焦虑等心理问题。针对患儿血糖控制不佳的问题,以往研究主要集中在医疗领域以及患儿本身的心理状况,而较少关注患儿照护者心理健康是否对血糖控制产生影响,因此本研究主要探讨1型糖尿病血糖控制与照
学位
随着先进雷达、电子对抗、高速通信、医学成像等技术的快速发展,短毫米波和太赫兹频段电磁波的应用与发展在国内外信息技术界备受关注,并且这些应用对相应信号源的工作频率、带宽和功率等工作性能的要求逐渐提高。回旋器件作为电真空器件中重要的一员,其电子注通过角向群聚的方式在横向上换能,可采用低阶过模结构来提高工作频率和功率容量,因此回旋器件可以用于实现大功率短毫米波源。本文利用本征模分析方法研究了220GHz
学位
SRAM(Static Random-Access Memory)是集成电路的重要组成部分,在CPU、MCU、FPGA等芯片中都扮演重要的角色,SRAM的性能影响这些芯片的性能。但是SRAM的优化又困难重重,一方面受限于制造工艺,随着晶体管尺寸的减小,工艺生产过程中不可避免地引入了缺陷,导致SRAM良率降低;另一方面,受器件和电路的限制,按比例缩小很难前进,即使芯片的最小尺寸缩小,也会受到短沟道效
学位
儿童主任制度已走过十余年的发展历程,成为打通儿童福利传递“最后一公里”的关键一环。然而,在儿童主任制度执行过程中,制度缺陷凸显,出现制度变通执行甚至执行失灵现象,使其成为一项“隐形的制度”,远未能实现制度预定目标。本文尝试引入街头官僚理论的视角,基于对26名儿童主任的深入访谈,从微观的角度自下而上分析儿童主任制度执行现况,探讨儿童主任制度与实践之间的内在张力。本研究根据儿童主任在政策执行中的自由裁
学位
功率半导体器件是电能处理领域的核心,在高压大功率电路中应用广泛。随着低碳生活的倡导,电能作为一项绿色能源,极大的促进了社会的可持续发展,各种用电设备正是凭借功率半导体器件对电能的转换才得以运转。然而,对于功率器件来说耐压VB和导通电阻Ron,sp是一对难以调和的矛盾,因此很多器件结构被提出来实现二者的优化。从阻型耐压层VDMOS(Vertical Double-Diffusion MOSFET),
学位
集成电路领域的发展已经进入后摩尔时代,传统CMOS工艺中器件的特征尺寸虽然仍在不断缩小,但是其性能已近乎达到瓶颈。此外,集成电路的能耗问题愈发受到人们的关注,漏电流所引发的静态功耗随着特征尺寸的减小而不断变大。为解决上述问题,具有低能耗,非易失,存储密度大等优势的自旋电子学器件得以蓬勃发展。目前自旋电子学的前沿研究集中在自旋轨道力矩(spin-orbit torque,SOT)和表面拓扑结构等方面
学位