论文部分内容阅读
随着互联网技术的蓬勃发展、信息量的爆炸式增长以及深度学习技术研究和应用的普及,人们对于计算能力的需求不断提高。在传统通用计算已逐渐无力应对大规模、高并发计算需求的情况下,异构计算能够为深度学习释放更强的计算能力,达到更高的性能要求,并可应用于更广阔的计算场景。本文通过对目前主流的深度学习算法等进行分析,针对性的设计了一个面向深度学习的异构加速结构。 本文的主要研究内容和贡献包括: 算法特征分析与提取。通过对目前常用的深度学习算法,如GoogleNet、VGG、SSD算法分析其计算特征,将多种深度学习算法归纳为有限个拥有不同计算特征的深度学习共性算子类,通过图表及结构框图的形式展示出来,同时生成最小算子级别的伪指令流。 通用SoC仿真建模平台的搭建。对通常组成SoC平台所需要的组件进行仿真建模,得到一个SoC模拟器的仿真平台,可以对任意SoC系统进行事务级的仿真,计算性能参数,功耗等SoC系统评估必需的结果。 异构计算平台的SoC架构设计。可以实现对多种深度学习算法进行硬件加速,例如GoogleNet、SSD等。根据算法特征分析与提取,进行面向深度学习的硬件加速AI IP核的设计,构建整个异构计算平台的SoC架构,并通过仿真建模平台进行实验验证。SoC系统的性能功耗比大于1.5TOPS/W,可以通过GoogleNet算法对10路1080p30fps视频逐帧处理,每帧端到端的处理时间≤30ms。