FPGA加速卷积神经网络训练的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：youkangstrong

【摘要】

：

卷积神经网络(Convolutional Neural Network,CNN)是一种具有多层结构的深度学习模型,通过大规模的训练学习从高维度的数据中提取复杂的特征。卷积神经网络的训练过程具有处

【作者】

：

魏小淞

【出处】

：

西安电子科技大学

【发表日期】

：

2004年期

【关键词】

：

卷积神经网络训练现场可编程门阵列硬件加速并行性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

卷积神经网络(Convolutional Neural Network,CNN)是一种具有多层结构的深度学习模型,通过大规模的训练学习从高维度的数据中提取复杂的特征。卷积神经网络的训练过程具有处理流程复杂,计算量庞大的特点,同时涉及大量数据的传输以及隐层数据的缓存。为了解决更抽象和复杂的问题,卷积神经网络的规模越来越大,传统通用计算机平台的串行操作模式已经很难满足网络训练的需求。而具有大量逻辑、运算单元的现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)在性能、并行运算、功耗和尺寸等诸多方面具有突出的优势,很适合用于加速卷积神经网络的训练过程。论文对卷积神经网络的训练过程进行了深入的研究,分析了训练过程的并行性和现有的FPGA硬件加速架构。在此基础上,本文提出了一种全新的基于Zynq系列FPGA架构的硬件训练框架,用于加速卷积神经网络的训练过程。Zynq芯片的PS(Processing System)作为整个框架的控制中心,PL(Programmable Logic)被设计成训练计算核心负责训练过程的计算加速,由前向引擎、反向引擎和隐层数据队列构成,实现训练过程前向传播和反向传播的同时运算。根据训练过程的特点,本文分别设计了前向、反向引擎中的子模块,通过模块级联实现实际网络训练模型的搭建。本文在训练框架的基础上采用了四点优化策略进一步提高训练框架的加速性能。改进数据传输形式和卷积计算方式,有效地降低模块的计算输出延迟;通过对隐层数据进行编码实现数据的压缩,能够将数据存储量压缩到原来的4%,大幅降低数据存储量;根据反向传播的数学特性,对反向传播的计算量进行缩减,减少反向传播中的无效计算,提高了计算资源的利用率。为测试验证基于Zynq芯片的训练框架的加速性能,本文利用赛灵思的FPGA开发套件进行设计的仿真和实现。以LeNet-5网络为示例,利用提出的训练框架搭建网络的训练模型,并利用ZC706评估板进行硬件的板级实现。然后本文对实现的硬件系统进行了性能测试:采用计算缩减的方法可以将网络层反向传播的计算量平均降低34%;在32位浮点数精度下,采用本文的框架训练LeNet-5网络的的计算性能可达33.6GOPS,每次mini-batch取100的训练迭代仅需要7.9ms,且消耗的功率不到5W。同时本文将基于FPGA的实现与CPU和GPU平台进行了性能比对。同样进行LeNet-5网络的训练,论文提出的训练框架的计算性能是CPU平台的6.8倍,能量效率(energy efficiency)是GPU平台的9.7倍。因此,相对于CPU和GPU平台,本文设计的训练框架能在更低的功率消耗下达到更高的计算性能,更高效地实现卷积神经网络训练的加速。

其他文献

小联醇生产与多段冷激式绝热反应器

根据生产实践，综合现行小联醇生产工艺条件，笔者认为多段冷激式绝热反应器较为适用，并推荐使用冷激－间接换热复合式内件。

期刊

联醇多段冷激式绝热反应器

道家人格量表题项版的编制与反思

基于文化影响人格的视角,结合对道家人性论的分析,建构道家人格结构理论模型,本文将道家人格操作化界定为:道家人格指在道家思想文化的影响下,与道家人性论之'自然本真&#

期刊

传统文化道道家人格道家人格测量

琥珀：一个有生命力的小说意象

余红是一位情感细腻的作家，她有一双锐利而又温情的眼睛，她观察人物细致入微，举手投足，一笑一颦，她不仅不会放过，而且总能以体贴之心去体谅每一个人的内心，她把这种体谅和温情作为最

报纸

邢广程简介

邢广程1961年生。中国社会科学院学部委员,中国社会科学院中国边疆研究所所长,中国边疆研究所创新工程首席管理,研究员,法学博士。中国社会科学院研究生院博士生导师。中国社

期刊

中国社会科学院研究生院马克思主义理论研究和建设工程上海合作组织中国边疆创新工程人才工程博士生导师戈尔巴乔夫

商品“三包”消费者有自主选择权吗？

【正】主持人:今年8月20日,蔡某到一家商场购买了一台彩电,使用不到三天,电视屏幕上就出现了雪花、杂音,有时甚至有图像没有声音。蔡某找到商场,要求退货。可商场营业员答复

期刊

商品“三包”消费者自主选择权时效性消费者权益中国

中国人整体思维方式量表的编制与确认

关于东西方思维方式差异的研究是近20年来文化心理学关注的热点问题。这些研究不仅有助于人们理解东西方人行为表现的差异,而且能够帮助人们更好地处理文化冲突,以正确的态度

期刊

文化思维方式中国人整体思维方式量表社会认知

氟杜合剂与氟芬合剂对剖宫产术后寒战发生率的对比分析

<正>围术期寒战对病人的生理及心理影响很大,其发生率很高,尤其剖宫产术后病人寒战发生率更高,各家报道不一,有的报道达87%。选用合适的术中辅助用药可减轻术后寒战的发生从

期刊

氟芬合剂剖宫产术后寒战椎管内麻醉

基坑降水引起的地基附加应力及沉降简化计算

探讨了基坑降水导致周围地基沉降的机理,通过借鉴水库水位下降时的水面曲线计算公式,并简化和分解由降水导致的附加荷载后,推导出一套计算基坑降水引起的地基附加应力和地表

期刊

基坑降水水面曲线附加应力沉降

高炉液压系统污染的危害与防范

对高炉液压系统现状进行了分析，找出可能造成污染的成因及时采取相应的防范措施，减低液压系统设备故障率，保证高炉的正常生产。

期刊

高炉液压系统污染源控制

长垣县蒲田食用菌合作社由弱变强的发展历程

近年来，河南省长垣县委、县政府将食用菌种植确定为全县农业主导产业之一。在长垣县提起食用菌种植，必然会说到蒲田食用菌专业合作社。近日，该合作社负责人张安永向笔者谈起发展

期刊

专业合作社食用菌长垣县主导产业发展经历河南省县政府负责人

FPGA加速卷积神经网络训练的研究与实现

与本文相关的学术论文