基于FPGA的卷积神经网络关键技术研究与实现

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:sjzafei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络已广泛应用于计算机视觉领域,随着网络深度的加深和相应数据库的增大,对硬件计算能力的需求也是成倍增长。同时随着IC设计和制造工艺的进步,具有高速、高密度的FPGA芯片得到了快速发展,主流的FPGA芯片通过集成大量的DSP硬核实现了高性能的乘法计算,使得FPGA芯片特别适合网络并行计算结构的实现,所以本文基于FPGA平台对卷积神经网络的加速计算进行了深入研究,主要研究内容包括以下3个方面:首先,卷积神经网络的各个硬件计算单元的计算效率决定着整个网络硬件架构的性能,所以如何设计和优化网络的各个硬件计算单元是首先需要解决的问题。本文通过对卷积神经网络算法的研究和实验,优化并减少了网络计算的复杂度,省去了在硬件上设计和实现复杂的计算模块,为卷积神经网络的硬件实现降低了难度,然后通过对各个方案的性能对比,本文选择了卷积层、池化层和全连接层的最优神经元硬件计算单元模块的设计方案。其次,应用场景的改变会使卷积神经网络的拓扑结构做出相应的调整,所以如何实现卷积层、池化层和全连接层的硬件计算模块参数化和通用性的设计同样是一个需要解决的问题。根据卷积神经网络前向传播过程的Verilog HDL代码结构,本文通过C++设计一个小型的中间件实现了网络各模块的参数化封装和网络计算模块的通用性设计,通过调用中间件里的函数生成所需要的Verilog HDL代码的顶层模块、中间层模块和底层模块。最后,由于FPGA芯片的片上资源是有限的,如何充分利用FPGA芯片上的资源实现最优的卷积神经网络计算加速架构是一个关键问题。本文首先通过实验分析卷积层、池化层和全连接层的硬件资源和并行神经元个数的关系曲线,然后在FPGA芯片资源约束条件下,通过资源占用的关系曲线建立卷积神经网络的最小前向传播时间和对应的各层并行神经元个数关系的数学模型,最后针对本文所选用的Virtex-7 XC7VX485T芯片,通过该数学模型实现最优的网络计算加速方案设计,本文方案的计算性能优于之前文献的方案,而能效比也和其他文献方案基本一致。
其他文献
随着微机在控制领域的日益重要,微机原理和接口技术类课程也相应地成为了大专院校很多专业的专业基础课程。作为一名不仅从事该方面教学多年,而且给多个专业讲授过该课程的教师
《舆论监督法治化研究》系邵阳学院唐光怀副教授的新著。该书由湖南大学出版社2007年8月出版,系湖南省社会科学基金立项课题的研究成果,是作者近几年来的心血凝结,是作者用哲
基于当下我国政府在基础设施领域大力推广PPP模式的重要政策导向以及国内污水处理厂PPP项目不断发展的现实背景;本文参照国内外相关准则中的规定并结合实务操作,对目前国内SP
<正>二十几岁的时候,我立志不做"官",专求"学"。这个志愿我始终不曾放弃。抗战期间,"从政"的机会一度来临。但从长考虑之后,我决定保持我二十年来
新疆由于生态环境脆弱及对自然资源开发利用不当,致使人类生存条件日趋恶化。为迎接经济建设重点西移,必须加强受损生态系统恢复与重建研究,走经济发展与人口、资源、环境相协调
本文对大连商品交易所棕榈油与豆油期货价格之间的动态关系及套利交易进行了研究,运用协整理论检验棕榈油和豆油期货合约之间的长期均衡关系,构建开仓和平仓信号,通过协整系
从当前国内较大型医院的就诊现状来观察,患者就医时70%以上的时间均花在了排队挂号、缴费、候诊以及取检验结果等琐碎事情上。就医过程中的费用不透明性,检验报告的延迟发放,
<正> 一、前言铜电解精炼过程中,较铜负电性的杂质,当其以离子状态进入溶液后,若不与电解液中的其它成分作用产生沉淀时,则绝大部分在电解液中积累,当其在电解液中的浓度超过
<正>如何应对公共突发事件,是当今世界各国高度关注的一个重大现实课题,直接反映着各级政府的执政能力和水平。万州作为重庆市第二大城市、渝东北地区的经济政治文化中心,同