应用于手写数字识别的卷积神经网络算法与FPGA实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:njcxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写数字识别本质上是图像识别问题。近年来,在大规模应用图像数字识别的领域,卷积神经网络(Convolutional Neural Network,CNN)依靠在算法性能上的突出表现被广泛使用。但是,CNN作为计算密集和存储密集的多层神经网络,面临着高效硬件实现的挑战。目前,现场可编程门阵列(Field Programmable Gate Array,FPGA)凭借其高性能、低功耗、可编程的特点成为对计算密集型算法进行硬件加速的最具吸引力的实现平台之一。因此,如何在FPGA上高性能地实现应用于手写数字识别的卷积神经网络系统,对于图像识别的发展具有重要的理论研究意义和实用价值。首先,本文研究了面向硬件友好的CNN运算模型,在综合考虑电路复杂度与算法识别率的情况下确定CNN的具体算法,并在MATLAB上完成了CNN的训练、测试和参数提取。同时,为在FPGA上高性能地实现CNN,本文研究了CNN计算的并行特征、激活函数的多种硬件实现方式以及快速算法的算法强度缩减特性。然后,本文提出了两种CNN实现的硬件加速方案。方案1是基于循环变换方法的CNN加速器设计,该方案在硬件体系结构上平铺卷积神经网络的所有层,使得其适用于层数少的CNN。其中,通过CNN计算的循环变换方法可实现高效的并行流水线电路,以提高吞吐率(Throughout,单位为GOPS:Giga Operations Per Second)。方案2是基于快速滤波算法的CNN加速器设计,该方案设计了卷积神经网络逐层加速的硬件体系结构,使得其更具拓展性从而适用于具有更深层拓扑的CNN。其中,为减少CNN的计算量,将二维的快速滤波算法引入到CNN,以提高吞吐率并降低硬件资源的消耗。最后,在Xilinx kintex-7 KC705开发板上搭建系统的测试平台,并利用手写数字集MNIST对所设计的CNN加速器进行测试和性能分析。对于方案1,输入时钟为150 MHz时,电路的吞吐率为20.62 GOPS,数字字符的识别率为98.68%,DSP(Digital Signal Processing)硬件资源占用565个。对于方案2,输入时钟为100MHz时,电路的吞吐率为20.49 GOPS,数字字符的识别率为98.48%,DSP硬件资源占用284个。通过与相关文献对比,本文所实现的CNN加速器能有效地提高吞吐率。
其他文献
高蛋白饲料黄粉虫的饲养黄粉虫俗称面包虫,为鞘翅目拟步行科粉甲属的昆虫。它食性杂,饲料来源广,饲养设备简单。投资少,效益高,2~4千克麦麸可产1千克黄粉虫。黄粉虫含粗蛋白质51%,脂肪28.56%,是鸡
<正>邓小平是久经考验的无产阶级革命家,是中国共产党第二代中央领导集体的核心,是建设有中国特色社会主义的总设计师。以他的名字命名的邓小平理论是当代中国的马克思主义,
会议
随着时代的发展与进步,传统大学语文教学已经不能够适应时代发展要求,信息时代对于大学语文教育也不仅仅局限于对知识的获得,而是更强调复合型人才的培养。所以,大学语文教学
<正>经济和社会发展到一定程度后,为了弥补政府调控与市场不当竞争所造成的行业缺陷,于是产生了行业协会。当前,公共资源分配不公等社会问题日益复杂,靠市场经济体制已经不能
夫《红楼梦》至奇者,在“横看成岭侧成峰”,先贤谓之“经学家看见《易》,道学家看见淫,。才子看见缠绵,革命家看见排满,流言家看见宫闱秘事”也,每良友雅集、品茗闲坐、清谈红楼亦人
厂站自动化主要包括电厂自动化和变电站自动化这两个方面,对我国供电企业的发展有着很重要的作用。文章结合我国变电站自动化的情况,对其自动化发展的现状以及发展技术进行分析
一、改革中等教育结构,适应经济建设的需要是当前教改的重要课题。党的十一届三中全会之后,我国城乡正在进行一场深刻的经济体制改革。实行对外开放、对内搞活经济政策,已在
【正】 尽管离婚是世界上各国普遍存在的问题,然而,在多民族多宗教印度,它却是一种极端复杂而又奇特的现象。在印度,人口普查资料总是把离婚和分居放在同样地位,但是,印度夫
本文是生产力布局方法的探讨。作者应用分布模型于生产力布局实践,主要做了以下工作: 1.对生产结构从地区和部门作了投入产出分析, 2.把一般性的区域模型改造成了确定区域生
有计划的大规模治理沙漠是祖国改变西北面貌具体措施之一,从国民经济意义上看,沙漠在我国分布面积较大,包括戈壁在内为17亿亩约占祖国总面积1/4。内蕴藏着丰富矿产、药材、