深度学习算法可重构加速器关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:liyunfeng890406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着大数据时代的到来,数据呈爆炸性增长。如何有效地组织海量数据并从中提取有价值信息成为一个难题。深度学习模型是一个多层的神经网络,模拟了大脑皮层的层次学习结构,能够对大数据进行数据挖掘、特征提取和分类等操作,已成为机器学习领域最为炙手可热的模型之一。深度学习算法是典型的计算密集型应用,速度瓶颈和对大规模计算平台的依赖也日益成为深度学习算法实用和推广的障碍,因此,深度学习算法加速技术的研究逐渐成为热点。利用FPGA平台和可重构技术,对深度学习算法进行硬化实现,是实现深度学习算法加速处理的有效途径。目前,采用FPGA实现的深度学习算法加速器研究刚刚起步,还局限在对特定算法的定制实现和加速。本文针对深度学习算法的可重构加速器技术进行研究,期望能够为深度学习算法提供一个通用的硬件加速平台。本文首先对各类深度学习算法的算法流程、执行特征、操作要素等方面进行分析,总结和归纳深度学习算法中典型的运算模板。基于分析,提出了标量处理器与向量处理器相结合的协处理器架构,命名为SVP-DL(Super-Vector co-Processor for Deep Learning algorithms),并设计了专门的指令集系统,用来编写应用程序在SVP-DL上运行。接下来文章详细介绍了在SVP-DL处理器上映射深度学习算法的方法,并针对算法映射自动化进行了探讨。我们将SVP-DL处理器布局在Xilinx XC7VX485T芯片上,并针对DBN算法的运行结果与软件运行结果进行了对比,实验结果表明,在SVP-DL处理器上有2倍多的加速比。在未来的工作中,我们将研究深度学习算法在FPGA集群上的加速研究,以期更加充分的挖掘算法的并行性,达到更好的加速效果。此外,还要完善自动化工具链,使深度学习算法的加速更加容易操作,以期得到更好的推广。
其他文献
随着基于可重配置计算技术的FPGA器件等的快速发展和普遍使用,一些计算密集型任务可以在FPGA上灵活的实现并执行,硬件任务作为一个和软件任务等同的概念出现在系统设计中,使传统
随着集群系统的需求越来越大,集群系统方案的开发越来越受到重视,特别是中小规模的通用服务器集群设计。基于U 盘的服务器集群系统方案就是针对中小规模通用服务器集群来进行研
椭圆曲线密码系统的安全性建立在椭圆曲线离散对数问题的难解性上。同其它公钥密码系统相比,它的执行速度快、密钥长度短、安全性高,因而日益受到人们的关注,成为公钥密码学
WWW(简称Web)和无线局域网是近年来发展最快、最激动人心的网络技术。Web由于其操作简便、功能丰富,使得Internet真正实现了大众化。与此同时,无线通信技术迅速普及,越来越多的
随着信息化时代的发展,各种各样的数据随之而来,数据结构多样化以及数据规模对相关技术提出了巨大挑战。对于处理大数据的许多应用,MapReduce编程框架的优势很明显,在谷歌、
在分布式存储系统中,基于纠删码的容错机制相比于基于副本的容错机制能够极大地节省数据存储开销。然而,纠删码修复所产生的大量数据传输影响了系统性能,阻碍了纠删码在实际
发展智能安防系统,是解决城市化过程中出现的人民生命和财产安全威胁、重大安全事件后期数据排查处理困难等问题的有效途径之一,是未来安防系统的主要发展和研究方向。基于视
网格计算系统就是将地理分布、系统异构、性能各异的各种资源,包括超级计算机、大规模存储系统、个人计算机、各种设备等组织在一个统一的框架下通过高速互连网络连接并集成
测试驱动开发(Test-Driven Development,简称TDD)是一种可预测的软件开发方法,它是敏捷思想的重要体现,是极限编程的技术核心。它不仅在极限编程中广泛应用,同时也适用于其它开发
文件系统作为操作系统的重要组成部分,决定了操作系统本身信息和用户数据在存储设备上的组织方式。随着嵌入式系统硬件设备的普及和价格的不断降低,以及嵌入式系统应用领域的不