低功耗高性能的卷积神经网络硬件加速器设计

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:lovesyb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolution neural networks,CNN)因其在图像识别、语音识别和无人驾驶等方面具有的卓越性能而被国内外广泛研究。随着其性能和精度的提升,CNN的层数和计算量显著上升。经过线性整流函数后,CNN含有超过50%的零值数据。零值数据的计算不会改变计算结果,但是它消耗较高的能耗和计算周期。因此,零值数据的非还原压缩方法和压缩数据的复用方法成为目前急需解决的问题。本文以此为研究对象,从以下三个方面开展研究工作:(1)多路径包连接电路提升传输效率;(2)非还原压缩的编译码方法降低功耗和计算周期;(3)编码行复用方法提升数据的利用效果;(4)基于低功耗高性能的CNN硬件加速器的设计。主要工作有:(1)设计多路径包连接电路针对传统包连接电路(Packet connect circuit,PCC)的(X,Y)路由算法导致的多播传输的节点数量少、传输效率低,不能同时实现多种传输方式等情况,以及无法满足CNN每一层传输数据量大、传输方式复杂的要求,本文设计多路径包连接电路提升传输效率。多路径包连接电路采用两条多播输入通道和一条单播输出通道实现数据的输入-计算-输出的相互独立,结合多播和路由接收模块的判断机制实现多种传输方式。实验结果表明,与传统PCC相比,通道建立时间降低60.4%,数据包传输时间提升2.53x。(2)设计非还原压缩的编译码方法针对传统编译码方法在CNN领域中压缩率低,传输和计算时的再还原,以及零值在计算中仍无法实际跳过等情况,本文设计非还原压缩的编译码方法并实现其硬件化设计。编码时,该方法根据卷积计算的特性,对输入数据的每一行进行0/1编码,保留每行有效值个数,提升压缩率;在译码时,该方法根据有效值个数将编码与对应的有效值发送进入计算单元,计算单元根据编码进行移位译码计算,达到跳过零计算的目的,提升计算速度。实验结果表明,总的压缩率达到58.91%,其中,单层最高的压缩率达到48.64%。(3)设计编码行复用方法针对目前尚未有对压缩数据进行数据复用方法的情况,本文提出编码行复用方法。该方法充分挖掘压缩数据的数据量低的优点,利用卷积核在输入特征图向下滑动过程中产生的行数据复用,采用分时复用方式提升编码数据的利用率。实验结果表明,与Eyeriss的固定行复用相比,片外存储的读写次数降低45%。(4)设计低功耗高性能的CNN硬件加速器根据多路径包连接电路、非还原压缩编译码方法、编码行复用方法,本文设计低功耗高性能的CNN硬件加速器,设计多路径包连接电路、编码电路、控制电路、发送电路、计算电路,使用配置链配置每一层卷积的计算参数。实验结果表明,计算速度与Eyeriss相比,加速比为14.8x。
其他文献
2008年10月27日,以“开放的西部,美好的未来”为主题的第九届中国西部国际博览会在四川省成都市世纪城新会展中心隆重开幕。四川水井坊股份有限公司,作为“第九届西博会”的
<正>9月16日下午,云南省民族宗教委召开"不忘初心、牢记使命"主题教育总结会议,传达学习中央和省委"不忘初心、牢记使命"主题教育第一批总结暨第二批部署会议精神,对全委主题
会计信息失真对企业的发展会产生阻碍作用,尤其对中小企业的影响格外明显。本文主要探究中小企业会计信息失真的表现及策略,对其表现以及原因进行分析,在结合实际的基础上,制
现代信息社会环境下,公共图书馆电子阅览室发挥着越来越重要的信息服务功能,是图书馆服务的主要阵地。镇海区图书馆在村(社区)图书分馆电子阅览室的软硬件的合理配置、资源的
<正>青城派功夫属道家内功,据传创自青城丈人,据薛道光注《悟真篇》云:"张紫阳仙翁遇青城丈人,授金液还丹之妙道"。是则张紫阳亦曾师事之也。青城派功法入门下手即以清静为宗
<正>2013年11月1日至11月3日,安徽芜湖。国家体育总局举办的2013年中国体育文化博览会通背拳展区现场,一位身着传统练功服装的中年武者,应观众之邀,不厌其烦地一遍一遍演练通
期刊
<正>1929年12月召开的中国红军第四军党的第九次代表大会(即古田会议)是我党我军建设史上的一个重要里程碑。加强和改进思想政治工作的一个基本原则,就是善于把我党的思想政
沥青路面智能压实技术能够实时反映沥青路面碾压过程压实度、压实温度等参数,从而实现碾压过程质量动态监控。该文通过对在现场采集的大量CMV(Compaction Meter Value,压实度
随着网络信息技术的发展,我国已步入大数据时代,大数据分析给管理会计的发展增添了新的内容。本文主要分析了大数据时代下管理会计的内涵及大数据为管理会计发展提供的机遇,
RAMS(可靠性、可用性、可维护性、安全性)管理在铁路行业应用十分广泛。为促进城市轨道交通行业发展的规范化、国际化,有必要进行RAMS管理方面的探讨。文章主要对RAMS中的安