基于SDSoC的卷积神经网络算法实现

来源 :北京化工大学 | 被引量 : 2次 | 上传用户:shying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Network,CNN)是深度学习的一个分支,这种网络擅长图像的解析与识别。它使用了其独特的网络结构,改善了传统的算法对大批量图像处理识别结果,运用其权值共享、子采样等技术,有效地解决了图像形变和位移等非线性特征提取和识别的问题。鉴于图像卷积计算的特性,海量以及重复的乘加运算需要极大的运算资源和大规模带宽存储资源。近年来,随着人工智能的发展热潮,为深度神经网络寻找和设计性能和效率更适合的引擎逐渐随之成为了一个热点。由此,本文从卷积神经网络的模型特点出发,结合了 FPGA硬件的优势,从软件算法和硬件资源两个层次重新分析模型的并行性,设计了一种基于FPGA的卷积网络加速引擎。首先为了提高卷积网络的处理速度,本文提出了一种将卷积核循环映射到实际电路中的整体加速方案。因FPGA片上资源限制,全并行CNN网络无法实现,只能将部分功能移植到FPGA中加速计算。在后面的实验部分着重比较了在资源约束的情况下不同方案的计算结构带来的性能差异,实现了最大化加速计算,提升计算数据吞吐率,降低无效数据搬运带来的效能损耗。其次针对以往嵌入式FPGA异构架构开发过程慢的过程进行体验与改进,基于最新的SDSoC全系统优化编译器,设计了卷积神经网络C++代码,加快整体开发周期。在实验验证环节,提出了一种基于Xilinx的Zedboard平台简单有效地网络模型Lenet-5模型。在针对MINST数据集的测试中,达到了相对于单纯CPU平台比较好的加速效果。通过使用Vivado HLS高层次综合工具,针对卷积网络的卷积和池化操作,采用流水线、循环展开、数组分块等加速策略,设计实现了效率优化的加速器IP核。全系统设计连接方案将会使用Xilinx SDSoC,比较不同数据通路带来的效能影响,探索数据传输和数据处理的最优化方案。实验结果显示,通过并行化卷积IP和整体架构设计,能以较高的数据吞吐率和较好的并行性,卷积网络处理速度达到了满意效果。
其他文献
本文从原型衣的形成过程入手,阐述了省的产生、省量计算和省量的消除技巧,总结了女装各种风格衣身结构平衡时前、后浮余量的消除方案,提出了衣身结构平衡综合处理的一般模式。
基于互联网技术的数字网络形成了新的社会组织形态——“数字共同体”。意味着“社会媒体”时代正式来临。这种社会结构、交往和信息传播方式变革给党建工作带来了三个方面的
目的:初步研究浸渍法、微波法、超声波法脱除百合中二氧化硫的效果。方法:在不同温度下,采用浸渍法、超声波处理百合;在不同微波功率下,脱除百合中残留的二氧化硫,用标准碘液
本文主要研究"一带一路"与中国新时期周边战略两者间的关系。首先从中国外交总体战略视角、周边面临的紧迫问题、现实可操作性三个角度论证了"一带一路"提出的周边视角。然后
能源与电力系统是现代社会人类生存和发展的基础,在发电、热转换等能源传输和转化过程中存在着极大的低效和浪费,造成日益严重的环境污染与资源消耗.针对能源电力系统中的经
中国人物画创作有着悠久的历史,其中产生了大量的艺术作品,它们都是古代传统文化的艺术结晶。重新回顾传统,学习经典,对于我们当代的人物画创作来说,有着重要的意义。安格尔认为,漠
目的介绍高膳食纤维抗糖尿病作用及其临床应用.方法以国、内外发表的文献为依据,对近年来高膳食纤维的降血糖、降血脂及临床应用研究成果进行综述与评价.结果高膳食纤维具有
我国220kV电压等级以上输电线路长度已达32.7万km,运行的电压等级交流最高为750kV,直流为±500kV。随着输变电建设项目的增多,相应的信访事件日益增多。在分析输变电建设项目
王蒙《组织部新来的青年人》发表于《人民文学》1956年9月,秦兆阳对这篇小说的修改引起了一场轩然大波。秦兆阳的修改主要集中在对区委书记周润祥形象的改写和对林赵爱情的强