基于FPGA的卷积神经网络并行加速器设计

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:wei2859699
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以深度学习为代表的智能算法在机器视觉、图像处理、模式识别等多个专业领域得到广泛的实践与应用。卷积神经网络作为深度学习中一种重要的算法结构,在实践中常用图形处理器(GPU)、专用集成电路(ASIC)与现场可编程阵列(FPGA)作为硬件加速平台来加速运算卷积神经网络算法。其中FPGA拥有大量逻辑资源,具有可重构、低功耗与高性能的优势受到人们关注。在此背景下,本文基于FPGA平台对卷积神经网络并行加速器进行设计,主要研究内容如下:通过理论分析卷积神经网络的模型,对不同拓扑结构的卷积神经网络实现的效能与负载进行比较,选择适合的卷积神经网络模型SqueezeNet并对其进行微调。以此为基础,结合卷积神经网络的结构特点,探讨卷积神经网络推理运算过程中的并行化策略,同时对卷积神经网络模型运算与数据交互所需要的逻辑资源与存储需求进行综合分析。针对卷积神经网络模型在FPGA并行化参数映射的问题,提出能够加速卷积神经网络模型运算性能的系统架构,设计可行的运算单元与存储模块,通过硬件优化技术对加速器系统的运算负载与数据缓存进行优化设计。同时,为避免重复的数据访存影响系统整体运算效率,提出生产者-消费者模式对网络层进行融合,以达到最大化片上数据重用与最小化外部存储器读写的目的。以赛灵思ZYNQ-XC7Z020 SOC为开发平台,基于高级综合工具完成卷积神经网络计算IP核的设计。根据卷积神经网络各层次结构特点设计各功能结构块,并对其进行指令优化以提升运算效率。使用Vivado开发工具对加速器系统进行综合实现,完成基于FPGA的卷积神经网络加速器系统设计。随后验证加速器系统运行的有效性并分析整体资源使用情况,通过对GPU、CPU的识别速率对比实验,表明本文加速器设计的性能与功耗优势。
其他文献
传统的金融理论说明市场是有效的,投资者是非常理性的,但股市的诸多状况是不能用其解释的。我国股市的股票收益情况取决于投资者主观情绪的影响。本文主要研究投资者情绪指标
结合G-M计数管的特点,讨论了用于辐射剂量测量时的能量响应、线性、灵敏度等问题及其改进措施。
Musashi家族是一种RNA结合蛋白,通过调节Notch和Wnt信号通路影响多种干细胞的增殖和分化。Musashi家族在多种恶性肿瘤中异常表达,可作为肿瘤标志物和潜在靶向治疗位点。Musas
本文在我国开始实施《金融机构衍生产品交易业务管理暂行办法》,积极稳妥地推动衍生金融品市场的建立与发展的背景下,针对衍生金融工具交易频繁、金额巨大、蕴藏风险,而相关
<正>提起雷锋,你想到了什么?是不是那张雷锋站在汽车旁的照片?照片中的雷锋,站在阳光下,站在汽车旁,笑得那么灿烂,笑得那么满足。提起学雷锋,你想到了什么?是不是想到了,每年
语言是人类交际的工具,是文明与文化的代表,语言和文化更是密不可分。对外汉语教学不仅是对汉语的语言结构、语言符号的学习,同时还是学习汉语语言符号所表征的新的文化内容
以GLM201-1液体γ活度监测仪为代表介绍了闪烁体探测器在田湾核电站辐射监测系统中的应用并对该仪器的结构、原理、使用情况进行了初步研究。
随着支付方式的更新、配送程序的优化,网购已经成为人们生活中必不可少的一种购物方式。但与发展势头良好的网购市场相反,不少电子商务企业仍然处于亏损状态,即使企业销售规模在不断增加,但是低价销售带来的收入依旧无法填补技术和商品存储等方面的成本支出。本文选取的A电商零售企业就面临着同样的问题。A电商零售企业是一家典型的化妆品电商零售平台,它的企业特性决定了其经营活动需要其他关联企业配合完成。A电商成立数十
2018年,山西新华书店集团太原有限公司旗下连锁公司销售净收入10021万元,完成年计划任务的114.37%,达到太原公司优秀值考核指标。其中图书销售9408万元,非图商品销售613万元,数字
期刊
通过对不同质量厚度的ZnS(Ag)涂层和不同厚度的塑料闪烁体相结合的复合闪烁体探测效率的实验研究,找出了其最佳结合比,使复合闪烁体对α、β粒子的探测效率达到最优化。