基于FPGA的卷积神经网络加速器的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cherrychenghui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能(Artificial Intelligence,AI)技术飞速发展,被广泛的应用于各种领域,可以实现智能图像分类、目标识别以及自动驾驶等。卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习(Deep Learning,DL)最重要的算法之一,通过感受区域和参数共享降低了网络参数并提高了模型扩展性。现场可编程门阵列(Field Programmable Gate Array,FPGA)作为一种可重复编程的硬件结构,不但可以实现低功耗的计算而且并行计算的特点刚好与卷积神经网络相契合,所以本文结合图像识别技术,对卷积神经网络加速器在ZCU102开发板的嵌入式系统实现进行研究,探索出一种高性能、低功耗和低成本的图像分类嵌入式系统加速方案。首先,在对比分析深度学习和卷积神经网络的典型算法以及硬件加速平台的特性基础上,针对squeezeNet网络模型,采用两种优化方法:网络结构的优化和硬件速率的优化,提出了可用于高效率图像分类CNN模型。随后基于GPU平台对CNN模型进行训练,结果表明在ILSVRC2012(ImageNet Large Scale Visual Recognition Challenge)数据集下对图像分类的平均分类准确率达74%以上。其次,与传统的图像分类处理器的实现方式相比,采用Xilinx推出的ZynqZCU102 SoC平台集成的“ARM+FPGA”的嵌入式系统实现方式具有高性能、低功耗、实时性和灵活性优势,并且考虑到FPGA并行计算模式与CNN很契合,故提出了基于FPGA实现CNN算法的硬件加速器设计。随后基于赛灵思推出的HLS开发工具将编写实现图像分类的卷积神经网络算法的C语言代码转化成寄存器传输级(RTL)实现,并封装导出RTL级CNN的IP核在Vivado环境中集成硬件加速电路。集成电路经过综合实现得到BITSTREAM文件,将BIT流文件下载到FPGA中,完成FPGA资源的布局布线。最后,基于ZCU102开发板“ARM+FPGA”的SoC架构,采用软硬件结合的方式进行图像分类CNN硬件加速系统验证平台构建和测试。该架构使用FPGA实现图像分类算法的硬件加速和图像数据传输,使用ARM实现图像的采集。结果表明本文CNN加速系统实现的最高频率可达250MHz,在250MHz条件下一副图像的识别时间为2.33秒,速度是仅使用ARM的9.29倍,是仅使用Intel(R)Xeon(R)CPU E5-2630v4@2.20GHz的4.9倍。对ImageNet2012数据集中50000张验证图像进行测试,可以达到73.322%的TOP-5正确率。最大功耗为7.488W,远低于通用处理器的功耗。因此,验证了Zynq ZCU102平台能高效低功耗地实现图像分类识别。
其他文献
目的:研究镇喘保肺汤对肾气虚证支气管哮喘人体尿液异常代谢的调节作用。方法:收集肾气虚证支气管哮喘患者12例为哮喘组,选取8名正常人为健康对照组,采集哮喘组使用镇喘保肺
以中国职业排球联赛共计24家俱乐部(男女排各12家)为调查对象,运用文献资料法、专家访谈法、实地考察法等研究方法对我国职业排球俱乐部的发展情况进行研究,描述了我国职业排
第一种表现为诉诸“爱国主义”“民族正义”等口号之下的民粹主义言论,掩盖群体暴力行为的非法性。在网络民粹主义的极端话语非理性中,“爱国”显然成为施暴与逾越法律事实依据
期刊
目的研究分析人类ARGONAUTE和DICER基因家族在结肠癌中的表达意义。方法通过实时荧光定量聚合酶链式反应(PCR)测定人类ARGONAUTE和DICER基因家族在结肠癌组织和癌旁组织中的
[目的]研究广西集约化养殖场猪饲料重金属Cu、Zn含量及其猪粪便Cu、Zn残留特性,为猪粪有机肥的安全合理使用提供理论依据。[方法]采集广西集约化养殖场35个猪饲料和47个猪粪便
随着食品安全问题越来越被重视,建立一种应用于食品的快速检测方法迫在眉睫.近红外光谱分析技术以其分析速度快、无损、预处理简单、易于实现在线检测等特点,已发展成为一种
目的:探讨血浆P-选择素水平对不稳定心绞痛(UAP)患者主要不良心血管事件(MACE)的影响。方法:选择2014年3月至2015年9月广西北海市卫生学校附属医院收治的156例UAP患者作为研究对象,
针对苏联政治经济体制长期以来积累的种种弊端,戈尔巴乔夫上台后首先从政治体制改革入手,对民主集中制进行重新认识,试图矫正权力过分集中的问题。随着改革步伐的推进,在其"
目的 探讨病理冷冻切片制作的质量.方法 严格规范操作取材、切片、固定、染色、封片等制片过程中的各个环节,对制片质量进行观察.结果 经光镜观察切片,切片组织切面完整,厚薄
网络地图服务是随着Internet的广泛应用而产生的一种数字地图新的应用方法,它不仅可以为用户提供现势性很强的地图空间数据资源,也可以使用户将自己的研究成果以网络数字地图