卷积神经网络的FPGA算法加速研究与实现

来源 :杭州电子科技大学 | 被引量 : 1次 | 上传用户:liupen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络的落地是近几年的重要研究发展方向之一,卷积神经网络因其特性,被广泛应用在图片识别和图像处理领域。随着深层的卷积神经网络在各大数据集上的精度越来越高,其网络框架也逐渐复杂,不利于移动端和嵌入式端的实际应用。因此,一批面向移动端的轻量级神经网络出现了,为移动端和嵌入式端的应用提供了可能性,相应的轻量级神经网络的加速和部署成了目前发展的一大热点。本文将轻量级神经网络与FPGA相结合,通过FPGA对典型的轻量级神经网络Mobilenet V2进行了加速实现。首先,本文对轻量级神经网络的国内外研究现状和发展趋势进行了介绍,列举了国内外为轻量级卷积神经网络设计和发展所做的努力。然后对国内外的轻量级神经网络的加速实现的研究现状进行了分析介绍,并在此基础上提出了本文的研究方向,即Mobilenet V2的FPGA加速实现。接着,对Mobilenet V2的网络框架进行了深入分析,并对其中涉及到的FPGA加速相关的知识进行了分析。在此基础上,对各个算子的加速框架进行了设计,并设计了相应的外部存储结构,从而提高外部存储的带宽利用率,接着给出了框架的具体实现过程。最后,对设计的Mobilenet V2进行了详细的测试,测试结果表明,本文提出并实现的基于FPGA的Mobilenet V2卷积神经网络加速框架各个模块工作正常,能完整实现Mobilenet V2的图片分类功能,并且在带宽受限的情况下,仍能达到与传统处理单元(ARM,CPU)相似或更快的图片分类速度,比优化过的ARM实现快44%,与优化过的CPU实现相比,性能接近,同时本文所设计的加速框架兼容性和可移植性强,在带宽不受限时,本框架的计算利用率为94%,在资源不受限时,本框架可以重复例化最小计算单元,从而实现更高的并行度,提高整体的计算速度。
其他文献
云杉矮槲寄生(Arceuthobium sichuanense)是中国特有的一种多年生寄生性种子植物,主要侵染青海云杉、青杆等云杉属树种,使寄主枝条产生扫帚状丛枝结构,影响树木生长,严重时使
离心泵偏离设计工况运行时,内部流动会趋于不稳定,导致效率下降,能耗上升,磨损加剧,严重时甚至会引发安全事故。因此,及时准确地诊断离心泵工况,很大程度上保障了离心泵运行
目的:探讨壮骨强筋片对前路颈椎次全切除及钛网植骨融合内固定(ACCF)术后植骨融合情况、脊髓功能恢复和疼痛缓解的影响。方法:根据纳入标准和排除标准,选取在2016年10月1日至2018年10月1日期间行颈前路椎体次全切联合钛网植骨融合内固定术(ACCF)的脊髓型颈椎病患者76例。按照随机数字法把76个病例分成实验组、对照组两组各38例,两组患者均行ACCF术、相同的术后处理和持续佩戴颈肩护具。实验
本研究旨在分析四川消费者对本地生产及进口服装的认知及购买意向的差异。本研究的目的是:建立四川省大学生在选择服装时考虑的认知;确定四川省大学生对进口服装的认知,并确
致病菌感染引起的多种疾病给人类健康带来了严重的威胁,抗生素是目前临床上治疗此类感染性疾病最简单、有效的手段。然而,由于抗生素长期的不规范使用和滥用等问题,导致了对多种抗生素具有耐药性的“超级细菌”不断出现并迅速蔓延。因此,拓宽思路,研发新型、广谱、强效且生物利用度高的纳米抗菌材料具有一定的现实意义。本论文主要探讨两类超小尺寸纳米颗粒(WO3-x,CN)的抗菌性能,并通过理论计算结合多种实验技术,深
随着铁路交通的快速发展,铁路系统的正常运行对铁路交通安全保障工作十分重要。在列车运行过程中,异物侵入铁路周界可能会引发严重的交通事故,继而造成人员伤亡和经济损失。
随着高等公路的迅猛发展以及汽车的普及,高速公路出行越加普遍。汽车高速行车工况下,车窗开启所产生的气动噪声严重影响舒适性;而车窗长时间关闭,二氧化碳浓度升高又容易产生疲劳诱发交通事故。因此,深入分析气动噪声意义重大。本文采用直接计算LBM-LES法,对某款实车全尺寸模型进行仿真分析,结合道路试验对包含风振噪声的较宽频段气动噪声进行研究。揭示风振噪声发声机理,分析风振噪声主要影响因素,归纳总结不同工况
随着大数据技术和人工智能技术的高速发展,网络结构作为一种常用的数据结构,用于描述现实世界中实体之间的复杂关系,在许多的领域中已经被大量的使用。常见的应用包括在网络
黑钨矿钨酸盐电极材料因稳定的物理和化学性能、环保、低成本以及良好的电化学性能等优点,成为超级电容器电极材料的研究热点。本论文采用共沉淀法制备了 Ni1-xCoxWO4(x=0、0.1、0.15和0.2)样品。由X-射线衍射(XRD)和场发射扫描电子显微镜(FESEM)知,Co掺杂对NiWO4的晶体结构和表面形貌影响不明显。X-射线光电子能谱(XPS)分析表明,Co离子是+2价的形式进入到NiWO4
随着人工智能学科的发展以及计算能力的提高,基于深度学习的人体行为识别研究已经成为热门的研究课题之一,同时也是非常有挑战性的研究难点。因为人体行为识别技术在人类社会