卷积神经网络加速器及其Verilog HDL代码自动生成设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:skyedge228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络与嵌入式人工智能平台的发展,将卷积神经网络应用部署到资源受限的嵌入式平台并实现低功耗实时的前向推理成为了当前研究的重点之一。在提高卷积神经网络模型准确率的同时,其深度与参数的个数也在不断增长,传统的处理器已经无法支撑如此庞大的计算,从而需要针对卷积神经网络结构的特点,设计相应的神经网络硬件加速处理器以达到低功耗实时的前向推理。为了便于开发与应用,还需要提供友好的硬件加速系统开发环境,可以快速无缝地将卷积神经网络应用部署到嵌入式平台。为了解决以上两个问题,本文提出了卷积神经网络加速器及其Verilog HDL代码自动生成设计。主要工作内容如下:1)基于FPGA的卷积神经网络硬件加速设计。首先对卷积层,池化层,激活层和全连接层的并行加速可行性进行分析,并分别设计了这些层的并行加速方案。在卷积层的硬件加速设计中,根据卷积层并行加速的可行性,提出了两种计算方法和四个可并行的部分;然后设计了两个基本单元,分别为全并行乘法-加法树单元和高效的窗口缓存单元;之后设计了三种不同的并行加速方案,来适应不同的卷积层结构。最后通过实验表明在MNIST数据集实验对比中,本文设计的加速器能效比达到32.73GOPS/W,比现有的解决方案高了34%。2)卷积神经网络硬件加速器Verilog HDL代码自动生成系统设计。首先分析了卷积神经网络加速器传统设计方法与代码自动生成设计方法存在的问题,然后针对这些问题,采用基于模板的代码自动生成技术,设计了一个可以从给定的模型结构与数据json文件自动生成卷积神经网络硬件Verilog HDL代码的系统。根据系统的功能将其分为三个主要模块,分别为模型解析模块,数据量化模块和代码生成模块。之后详细介绍了三个模块的设计。最后综合以上完成了整个系统的搭建,通过实验验证了系统的功能,并表明本文设计的系统具有较好的灵活性,通用性和扩展性。
其他文献
分布式能源系统能够合理有效利用清洁与可再生能源,被认为是解决能源危机和环境污染问题的一个重要途径。但由于传统分布式能源系统通常为“点对点”供应,供给与负荷两端的波动性容易导致供需错位,从而降低其潜在的节能减排功效。为解决上述问题,诞生了分布式能源网络概念,其以能源融通方式连接区域内多个分布式能源系统,并集中调度能源网络内供能关系,以达到区域内能源供需之间的动态平衡。其中,优化调度过程是提升分布式能
为研制应用于船用低速机缸套的新型铸铁材料,提出多尺度设计稀土掺杂Tarkall-C合金,使其符合设计使用要求。本文主要使用多尺度模拟方法,从第一性原理计算及有限元模拟两个方
以生理指标评定运动员的心理状态在实际应用中有时因某些因素的影响而使其复杂化了。文章就其中一些问题如对生理指标变化的非单一对应性结果的解释、自主生理反应的特导性、
目的止血带及时有效的运用可有效降低四肢大出血的死亡率,挽救出血所致的战伤潜在可存在者(potentially survivable,PS)生命;而止血带在战伤中的应用和相关培训仍在不断更新
含硫杂环化合物,如2-氨基苯并噻唑和噻吩,是一类重要的有机化合物,广泛存在于天然产物和生物活性分子中,在合成化学和制药工业中有着广泛的研究和应用。近几年以来,使用无机
当下,网红的发展模式日渐成熟,虚拟网红异军突起,熊本熊、Line Friends、吾皇等虚拟形象IP陆续闯入人们的视野。熊本熊和Line Friends从势能、魅力人格体、社群和仪式感四个
为研究不同添加水平酵母多糖对哺乳犊牛生产性能、瘤胃发酵参数、胃肠道发育及消化酶活性、瘤胃微生物区系以及免疫相关基因表达的影响,试验选用56头健康的、初生重相近的荷
轴向柱塞泵中滑靴的倾覆偏磨、回程盘的磨损与其所受应力大小有关。为改善二者的磨损性能,研究预紧力增大对滑靴、回程盘应力变化特性的影响。通过对A4VG125型柱塞泵中心弹簧
图像检索技术在搜索引擎、电子商务、医学领域、搜索引擎以及工业等领域具有重要的地位。近年来,随着互联网技术的高速发展,尤其是微博、豆瓣等社交网络的流行,图像、视频、