基于FPGA的卷积神经网络训练加速器的设计与实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:abcd432110000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络被广泛应用于物体检测、图像分割及图像分类等领域。随着卷积神经网络算法的快速发展,卷积网络规模不断增大,训练需要大量的时间和资源,严重限制了训练在资源有限平台的部署。为了满足嵌入式设备对于实时性和低功耗的要求,各种硬件加速器应运而生。其中,FPGA具有可并行处理、能效高、可重配置和设计周期短的优势,成为了实现训练加速器的理想平台。本文结合块浮点与延迟更新两种技术,提出一种全整型的混合精度训练框架。基于块浮点数据格式,本文的权重和输入特征图在正向传播中均量化至8位,输出特征图梯度在输入特征图梯度计算和权重梯度计算中分别量化至16位和32位,使得训练准确率较单精度浮点方案损失不超过1%;同时结合块浮点与延迟更新技术,解决了低精度训练中权重无法直接更新的问题,并有效节省了存储空间。实验结果表明,在处理时间方面,与单精度浮点训练方案相比,本文混合精度方案中卷积运算可获得5.21~6.35倍的加速;在存储空间方面,与单精度浮点训练方案相比,本文方案节省39.4%~72.1%的存储空间,与块浮点直通估计器方案相比,本文方案节省3.0%~35.7%的存储空间。为支持上述训练框架,本文基于Zynq-7000系列FPGA平台,实现了一款高性能的卷积神经网络训练加速器。在硬件设计中,提出一种可配置的卷积单引擎架构,既支持正向传播,又支持反向传播(输入特征图梯度计算和权重梯度计算);根据权重梯度的计算特点,提出一种基于数据流方式的优化方案,使其可以支持不同尺寸的权重梯度计算,并实现K×K(卷积核尺寸)倍的并行加速。本文基于VGG-like模型训练对加速器性能进行评估。实验结果表明,在200 MHz时钟频率下,本文提出的卷积神经网络训练加速器平均性能可以达到50.8 GOPS。性能是Intel Xeon E5-2630 v4 CPU平台的7.4倍,能效是Tesla K40C GPU平台的16.2倍。
其他文献
报纸
我国西北干旱区蒸发强烈、降雨稀少,地下水造成土壤水分、盐分以及植被分布的重要因素。近几年的人工输水工程使得内陆河流下游的尾闾湖输水量增加,导致周边地下水位和植被发生了显著变化。因此,迫切需要研究地下水位变化对土壤水、盐的影响规律,为该地区生态环境变化评估提供科学依据。本文在国家重点研发计划项目课题“生态脆弱区地下水合理开发及生态功能退变防控机制与基础研究”(2017YFC0406101)资助下,选
学位
梯级水库与滨海湿地都是受人为扰动较为强烈的水体,大量人为活动会影响水生生态系统。浮游植物作为水生生态系统主要的初级生产者,其光合作用效率对水生生态系统的变化具有很好的指示作用。目前,关于浮游植物在梯级水库和滨海湿地中光合作用效率的时空变化以及其具体的影响机制还未完全了解。为此,本研究以乌江流域、南北盘江流域的梯级水库以及东部沿海的21个滨海湿地为研究对象,通过野外采样调查了浮游植物光合作用效率(F
学位
重建湖泊水位历史、掌握其演变规律和机制,对水资源管理、生态环境保护、旱涝灾害防治以及认识区域水文气候变化机制皆有重要意义。中国西南地区湖泊众多,然而目前对于该区的湖泊研究主要集中在全新世气候变化以及近100年来水质变化、水体富营养化、重金属污染等方面,对于湖泊水位尤其是古湖泊水位的研究尚不充分,且方法较为单一。本文在高精度AMS 14C测年的基础上,基于云南阳宗海古湖岸演变重建了该湖近千年水位变化
学位
砷(As)是一种广泛分布于自然环境中的重金属,其不同形态具有明显的毒性差异。其中,无机As毒性远强于有机胂,亚砷酸盐毒性远大于砷酸盐。由于不同形态As毒性差异巨大,因此成为当前水体重金属污染研究领域的热点之一。水库水体受光照、滞留时间、水深等因素影响,会产生明显的季节性分层和氧化还原环境交替演化的现象,进而改变As的赋存形态和其迁移转化过程。然而,现有研究多针对湖库水体、沉积物中的总As浓度时空变
学位
工业革命以来,人为成因的活性氮排放成倍增加,导致从点位到区域水平的大气氮沉降显著提高,诱发了一系列的生态环境问题。因此,分析大气氮沉降的通量及其来源对制定活性氮污染物的减排策略和评估氮沉降效应至关重要。目前,观测网络和模型模拟等方法提供了许多点位和区域的氮沉降通量信息。但是由于大气氮沉降化学形态复杂、直接观测成本耗费较高,导致很多地区仅能通过稀疏的观测点位、有限的观测时间序列获取沉降速率,区域范围
学位
草地生态系统土壤有机碳、氮在全球碳、氮生物地球化学循环中扮演重要角色。评估草地土壤有机碳、氮含量并了解其控制因素对管理和改善易退化草地至关重要。北方农牧过渡带具有生产和生态双功能,蕴藏着丰富的草地资源,是中东部地区的生态保护屏障。然而,气候变化和人类活动导致生态环境日益脆弱,草地生态系统恢复成为重要问题。本论文以北方农牧过渡带草地生态系统为研究对象,基于广泛的野外调查和多种统计方法分析土壤有机碳、
学位
目的:纳豆激酶(Nattokinase,NK)是枯草芽孢杆菌(Bacillus subtilis,B.subtilis)在发酵过程中产生的一种丝氨酸蛋白酶,具有溶解血栓的功效。然而,发酵的代谢产物组成缺乏系统分析且NK功效评价尚不够全面。本研究旨在筛选高产NK菌株并优化其液态发酵的配方及条件,通过代谢组学分析不同发酵原料的代谢产物差异,在此基础上,评价以红芸豆为原料发酵产生的NK在溶解血栓、口腔溃
学位
沙尘暴是影响气候环境、社会经济、人类健康和安全的重要因素。在基于岱海沉积物AMS14C、210Pb、137Cs精确定年基础上,我们利用沉积物砂质组分含量的变化重建了中国北方过去500年高分辨率沙尘暴活动历史。结果表明:(1)岱海沉积岩芯DH18-3沉积物粒径分布范围为0.32~709.63μm,大部分样品为单峰分布,少数样品有不明显的双峰分布特征。主峰范围为4~10μm,次峰范围为12~15μm,
学位
太赫兹波具有宽带性、穿透性、安全性等独特优点,因此在无线通信系统、成像等领域具有广阔的应用场景。具有较高输出功率的太赫兹压控振荡器是实现上述应用的基础。CMOS工艺具有低成本,易于系统集成等优点,已成为目前太赫兹振荡器设计的主流工艺。然而,太赫兹频率已经接近甚至超过大部分CMOS工艺的最高振荡频率,这导致晶体管性能在太赫兹频段会迅速恶化,此外低供电电压限制了晶体管的输出摆幅。这些因素导致采用基波实
学位