面向可重构平台的卷积神经网络加速方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:shmilyxin2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在图像识别领域,卷积神经网络得到了高速发展和广泛重视。而神经网络中大规模的矩阵乘加运算并不适应于当前复杂的CPU结构,因此普遍使用基于GPU的异构计算平台的解决方案进行加速。但是GPU平台由于功耗较高,在部署方面存在局限性,而FPGA等低功耗平台同样适合于神经网络的部署,本文针对卷积神经网络在FPGA可重构平台上的解决方案,主要做出了以下贡献:  1.从神经网络结构和硬件结构两方面提出神经网络加速方案。在网络结构方面,本文提出了通过动态范围精度量化、网络剪枝与改变数据编码方式这三个方面对网络结构进行优化,一定程度上降低了网络对于计算和访存的需求,为FPGA平台上神经网络的部署提供了基础。在硬件结构方面,本文提出了片上队列缓冲、卷积操作向量化以及池化操作维度分解等加速方案,并为神经网络在FPGA平台上的运行设计了一套完整结构。  2.提出了一套软硬件结合的神经网络完整部署方案。本文提出了一套端到端的将现有神经网络部署到FPGA平台的模型与方案,称为FPNN。通过FPNN,用户只需输入网络的结构定义,工具便可自动进行网络结构的优化并利用OpenCL模型生成FPGA的硬件配置并完成部署。  3.在Arria10FPGA平台上验证并对系统设计进行测评。为验证神经网络在FPGA平台上的实际效果,选取了利用AlexNet与Faster-RCNN网络的两个典型场景,在基于Altera Atria10FPGA的DE5a-net开发板以及主流CPU、GPU平台上进行测试。测试结果表明,在结果准确度仅有微小下降的情况下,FPGA平台的神经网络运行速度远超CPU平台,并能在仅消耗十分之一功耗的前提下达到与Nvidia Titan Xp GPU相近的运行速度。
其他文献
ICRH(Ion Cyclotron Resonance Heating)天馈线远程控制与状态检测系统是EAST-ICRH控制子系统之一。基于FPGA的天馈线远程控制与状态检测系统实现解决了新型ICRH天线和传输系
射频识别(RFID)是一种利用无线射频的远距离通信方式实现的非接触式的自动识别技术,和其它识别系统相比较具有速度快、实时性强、采集准确性高等优点。随着技术的发展,RFID系
语音识别技术具有重要的理论价值和广阔的应用前景,近年来受到了人们的广泛重视。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解
近年来,关于分布式哈希表(DHT)的研究非常多,有通过模拟仿真、理论分析等方法的,也有从实际测量角度出发的。eMule中基于Kademlia算法的KAD网络是当前最大规模的DHT实现,任何时刻
随着计算机和互联网的飞速发展,互联网的信息量呈现爆炸式增长。信息量的增加既为人们的生活带来了便捷,也给人们提出了巨大的挑战。在海量的信息面前如何高效的获取信息以及如
“中国Web信息博物馆”(Web InfoMall),是一个针对中国互联网信息的搜集、存储与历史浏览服务的海量信息系统,5年来已经积累超过25亿中国互联网上出现过的网页,数据量已经超过30
随着互联网技术的蓬勃发展、信息量的爆炸式增长以及深度学习技术研究和应用的普及,人们对于计算能力的需求不断提高。在传统通用计算已逐渐无力应对大规模、高并发计算需求的
随着互联网的高速发展,网络新闻已经成为人们获取信息的重要途径。传统的新闻门户虽然拥有海量信息,却只是扮演信息集合的角色。用户只能被动式地浏览网站提供的信息,查找需要的
随着集成电路工艺特征尺寸的进一步细化,相邻连线之间的串扰对电路功能与定时(timing)的影响越来越大,并可能使得电路在运行时失效。准确和快速地找到潜在的串扰故障,并针对这些
网格的最终目的是消除信息孤岛,实现真正的资源共享。在河南省基础与前沿技术研究计划项目“领域自适应的网格服务组合算法研究与实现”的支持下,以网格服务质量评价与网格服