基于FPGA的Alexnet前向网络加速

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:wxxsdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着芯片制造工艺和协处理器的不断发展,FPGA芯片内部集成了越来越多的DSP以及片内存储资源,使得FPGA在计算密集型硬件加速方面具有巨大优势。作为典型的计算密集型应用,深度神经网络中的卷积神经网络在人脸识别、图像分割等领域都具有重要的指导意义和应用价值,一直备受学术界和工业界的青睐。然而,目前通用处理器实现卷积神经网络的方法,无法充分挖掘网络模型内部的并行性。在目前对实时性和低功耗的应用需求越来越旺盛的前提下,越来越多的研究人员开始采用FPGA对基于卷积神经网络的应用进行开发。Alexnet作为卷积神经网络领域内具有重要历史意义的一个网络模型,不仅证明了卷积神经网络在复杂模型下的有效性,并使用GPU使大数据训练在可接受的时间范围内得到了结果。因此,研究Alexnet模型的计算加速对复杂模型下卷积神经网络加速的研究具有重要意义。论文以此为研究背景,在充分研究和分析了当前研究成果的基础之上,设计实现了一种基于FPGA的Alexnet前向网络加速器,通过优化模型结构、流水式层间处理以及提高网络并行性来提高网络的整体识别速度。本文的主要研究工作包括:1、对Alexnet前向识别网络性能的主要影响因素进行了研究并对网络模型中激活函数和池化模块进行了优化改进。论文首先对网络模型中存在的并行性计算进行了研究。其次,给出了前向计算过程的分析以及乘法计算量的分析。最后,分析激活函数和池化模块的计算量,并结合激活函数和池化模块比较计算输出最大值的特点以及FPGA的特性,对网络模型进行了优化。在保证输出结果不变的前提下,减少了 397428次比较运算,占激活函数和池化模块优化前计算量的76.4%。2、完成了基于FPGA的Alexnet前向网络关键模块的优化设计。本文首先完成了卷积神经网络内部基本单元的设计及其二维并行加速的设计,分析了二维并行加速的加速比。其次,根据每层输出的缓存结果的数据量大小,对芯片内部的块RAM资源进行合理的分配,从而确定了每层网络的并行度,完成了网络内每一层结构的设计。3、完成了基于FPGA的Alexnet前向网络实现及性能分析。基于FPGA开发平台,完成Alexnet前向网络整体框架设计及实现,编写仿真文件进行验证,并完成对资源使用情况以及设计性能进行分析。给出了前向识别网络中每一层具体所需的计算时间,列出了加速器设计整体的资源使用情况,完成了与GPU、CPU识别速率的对比,并对识别结果的正确性进行了验证。
其他文献
目的探讨超声检查诊断先天性肌性斜颈的应用价值。方法先天性肌性斜颈患儿一侧胸锁乳肌纤维性挛缩,二维超声对患侧进行连续扫查,观察病变部位的回声及范围,应用彩色多普勒超
日本证券交易犯罪评析吉林大学法学院于秀峰日本证券交易法明令禁止证券交易中出现的各种不公正的行为,目的就是从根本上保护广大投资者的合法权益和证券市场的健康发展。在证
翻转课堂是对传统教学结构的改造.翻转课堂的基本特征表现为"更丰富的教师角色"、"更丰富的课堂互动体验"以及"技术的充分应用",翻转课堂在实施中应强调三个环节,即课前自主学习,课
2008年1月1日起施行的《劳动合同法》和《就业促进法》为劳动者包括妇女维护其劳动权益带来了春风,但现实中侵犯妇女劳动权益的事件仍屡屡发生。本文分析了我国女职工劳动权
进入后金融危机时代以来,受美国经济复苏减缓、欧元区债务危机加重及国内经济结构调整等因素的影响,我国港口集装箱运输业务增速也随之高位回落。因此,分析新经济形势下我国
作为作家和文化批评家,梁秉钧在小说、新诗、散文、评论等方面均有卓越之贡献,成为香港文化品牌之一。从1997年开始,他致力于"食馔诗学"的实验,从饮食文化的角度,重新思考历
11月9日,泸水市副市长李续亮到新城区调研市档案馆建设情况,并在市档案局党员活动室举行座谈,州档案局领导班子成员参加调研。
中国城镇化速度的加快,城市人口数量的增加,需要城市管理部门保证良好的城市市容市貌和经济市场秩序。但是,近几年媒体曝光较多的热点执法事件,使城管工作越来越得不到市民的
《南方与北方》是伊丽莎白·盖斯凯尔第二部描写工业革命的小说,这部写于1855年的作品反应了英国维多利亚工业革命时期的社会状况。有关《南方与北方》研究的热点大都集中在
目的:了解《麻醉药品和精神药品管理条例》等新的法规实施以来,我院麻醉药品的使用状况,为临床用药与管理提供参考。方法:提取我院2006—2010年麻醉药品使用数据,计算药品用