基于FPGA的卷积神经网络加速器设计

来源 :电子科技大学 | 被引量 : 21次 | 上传用户:lynneselina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机性能的不断发展,以及对机器学习领域的深入研究,卷积神经网络(convolutional neural network,CNN)成为了近年以来最为热门的机器学习算法之一。由于其复杂的网络结构和训练方法,卷积神经网络是极为耗费计算资源的一种算法。传统的卷积神经网络是基于通用中央处理器(central processing unit,CPU)执行计算的,这样的计算不但缓慢低效,而且难以满足实时性的计算要求。由于现场可编程门阵列(field-programmable gate array,FPGA)具有高度的并行性以及灵活性,能够更好的承担卷积神经网络的计算任务。本文基于FPGA硬件提出了对卷积神经网络计算的加速方法,使用该方法对ETL9B手写日本语数据库进行了识别验证,获得了99.7%的识别正确率,同时减少了约90%的时间消耗。首先,本文第一章简单介绍了卷积神经网络的基本概念以及应用背景。阐述了卷积神经网络算法的发展状况,尤其是基于硬件的卷积神经网络的现状及不足,提出了基于硬件卷积神经网络加速器设计方案。其次,在第二章中本文详细介绍了卷积神经网络的工作原理,包括图像卷积,池化采样,激活函数的计算以及反向传播的训练方法,文章还简要介绍了几种著名的卷积神经网络结构。再次,本文第三章详细阐述了基于坐标旋转数字计算方法(coordinate rotation digital computer,CORDIC)的激活函数计算原理,并且对传统的CORDIC算法进行了优化。提出了一种基于查找表和贪心策略相结合的综合旋转策略(unified rotation strategy,URS),加快了传统CORDIC算法的迭代收敛过程。第四章,详细分析了基于FPGA的卷积神经网络硬件加速器的设计,完成了CORDIC处理器的设计,卷积核的设计,池化采样模块的设计,以及控制模块的设计。最后,在第五章中给出了设计系统的仿真及测试结果,并且使用设计的系统对ETL9B手写日本语数据库进行了训练,验证了系统的可靠性。对比软件系统的训练结果,极大的缩减了训练时间,体现出FPGA在卷积神经网络训练中的优势。
其他文献
该网站建设是设计一个购物商品类网络平台,该平台具有最基本的前台商品浏览功能和后台管理功能。该文对购物商城系统的实现所基于的技术、总体设计及主要功能模块的实现进行
勃起功能障碍(ED)的发病率和就诊率日益增高,尤其在40岁以上人群,且其发病率与年龄呈正相关,预计2025年全球ED患者可达3亿人左右。目前,对ED病理生理学机制的研究逐渐深入,对
<正>一、管中窥豹——"七选五"高考典型真题细体验研读下面两道典型的高考"七选五"真题,你发现了什么?A Tips for cooking on a Tight Schedule From my experience,there ar
<正>"交变电流"一章是电磁感应现象中的一个典型应用,是该部分知识的提高和升华,它与电路、电磁场、电磁波联系紧密,更与工农业生产和日常生活紧密结合,在实际生活和生产中有
人们对语言的认知是基于对客观世界体验为基础,认知体验的普遍性使得语际转换成为可能,所以隐喻具有可译性。但是不同民族之间语言文化差异又决定了隐喻可译性的限度。本文以
通信技术的快速发展缩短了企业间的技术差异,增加了企业在技术层面的双元创新难度。现有研究表明,随着通信技术的快速发展,企业双元创新能力对管理层面的依赖性将会越来越强
新一轮国土资源大调查工作开展以来,东昆仑地区新发现了一系列矿床和找矿新线索,特别是白干湖钨锡矿床、肯德可克钴金铋多金属矿床和骆驼沟大型钴金矿床的发现,成为东昆仑地
东北虎(Panthera tigris altaica)是世界珍稀濒危物种之一。近年来,栖息地破碎化、猎物密度降低和人类的猎杀使得野生东北虎的数量急剧下降。在中国,野生东北虎仅分布于黑龙
对纳米Fe3O4的制备工艺进行了研究,掌握了制备过程中反应时间、反应物浓度配比、反应温度、沉淀剂浓度等工艺条件对反应产率的影响,用红外光谱、X射线衍射法对其进行表征,研
作为马克思主义文学理论家的马歇雷,师承阿尔都塞,将“意识形态与文学”的关系的讨论引向深入。追溯马歇雷早期理论,他辨析了意识形态“虚幻”与文学“虚构”双重逻辑对文学