基于FPGA的高性能MobileNet硬件加速器

来源 :南京大学 | 被引量 : 0次 | 上传用户:ahdx2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的不断发展,利用深度神经网络处理大量数据成为主流。但是随着网络精度的提高,网络参数在不断增长,实时处理数据的难度日益增大,因此降低网络复杂度和提高硬件运算速度势在必行。轻量型神经网络的出现降低了神经网络的复杂度,用百分之一的参数量和运算量,达到了和普通神经网络相当的准确性。同时HLS的不断发展,降低了硬件的开发难度,许多机构研制出了专用的低能耗神经网络加速器,大大加快了神经网络的运行速度。本论文提出一种基于FPGA的Mobile Net加速器架构。论文首先介绍了对传统神经网络和基于深度可分离卷积的轻量型神经网络,并详细的研究了Open CL开发和优化的方法。基于二者在并行计算上的共通点,论文提出了一种基于FPGA的高性能,可扩展的神经网络加速器架构。该全流水架构分为四个模块,并行地实现了Mobile Net的加速。经过优化的架构减少了加速器与外界的数据交换,提高了加速器的吞吐率,加快了网络的推理速度,降低了加速器的功耗。本文基于Inter Arria10 FPGA平台,通过Open CL实现了神经网络硬件加速器,对低精度量化的Mobile Net V1进行了网络加速实验。实验证实了,加入流水和低精度运算等多种优化方法,可以加快运算速度,提高加速器的吞吐率,降低硬件功耗等,大大优化了加速器的性能。硬件加速器对Mobile Net V1的推理时间为39.85ms,能耗为22.5W,峰值吞吐量达到48.8 GOPs,其加速比是CPU的2.7倍,能耗比是GPU的3倍,基本达到FPGA神经网络加速器的先进水平。
其他文献
本论文首先利用Argo资料与SODA温盐资料,探讨了孟加拉湾障碍层季节变化特征,并分析了纯IOD事件年份及其与ENSO事件共同发生年份障碍层的变化特征及其成因机制。而后,以2013年
涡轮发动机及更先进的涡轮基组合循环超燃冲压发动机内部叶片表面温度已经超过2000 K,通过超临界压力下的碳氢燃料流经旋转叶片内部通道来进行对流冷却是一种新型高效的方法
活血止痛胶囊为珠海安生凤凰制药有限公司生产的品种。该品种是该公司最大拳头产品,年销售额近4亿元人民币。活血止痛(胶囊)由当归、三七、乳香、冰片、自然铜和土鳖虫六味中药材构成,采用打粉入药的生产工艺,每次服用量较多等问题。从现代中药制剂角度设计,并予以解决其存在工艺粗犷、服用顺应性较差等缺陷。本论文为进一步提高该产品的科技水准和顺应性,开展了对该产品提取工艺的二次改造研究,并选择目前医患乐于接受的现
心脏病作为我国居民身体健康的头号杀手,受到我国居民的广泛关注。人们为了追求健康,对于医疗系统提出了越来越多的要求,这就对医生的工作效率提出了新的要求。而目前的医生
在技术更新加快、市场化竞争加剧的当代,领导者的作用空前强大,但领导者一人的能力未必足够应对这种场景,可能还需要来自企业员工的建议或意见,因此员工建言和员工沉默行为分
针对日益严重的水资源问题以及大负载下的最大功率捕获问题提出了风力海水淡化系统,风力海水淡化系统包括风能捕获模块、驱动模块跟海水淡化模块。垂直轴风力发电机被固定在
目的:探讨冠心病(Coronary heart disease,CHD)病人血清白介素-6(InterIeukin-6,IL-6)、组织金属蛋白酶抑制剂-1(Tissue inhibitor of metalloprotease-1,TIMP-1)水平与冠状动脉粥样硬化性心脏病中冠状动脉粥样硬化斑块稳定性及中医寒热辨证的关系。从而进一步揭示炎症反应与冠状动脉粥样硬化斑块稳定性、中医寒热辨证的关系,
生脉注射液是以生脉散(含红参、麦冬、五味子)为源,经现代工艺制成的一种中药静脉注射剂,广泛应用于心源性休克、心肌梗死、感染性休克等症状。本文以现行生脉注射液质量标准为基,从初步纯化、超滤、抗氧化三个方向进行研究,完善并优化各个工艺参数,为今后生产工艺的控制和改进提供了参考。在纯化工艺方面,在原有生脉注射液纯化工艺的基础上,考察了红参、麦冬、五味子经水提或醇提之后,应用正交设计筛选了不同浓缩倍量和在
人脸识别作为目前学术界和工业界研究的热点问题,已经被广泛应用于智能安防、金融安全、移动支付等多个领域。然而伴随着业务范围的迅速扩大,人脸信息库中的身份数量也快速增
随着人们环保意识的提高和能源危机感的加重,世界各国相继制定一系列的可再生能源发展规划,其中风能具有污染小、开采成本低以及易维护等优点成为各国的首要选择。世界各国对