论文部分内容阅读
GPU已经被广泛应用于卷积神经网络加速,而传统的GPU执行单元主要适用于对3D图形渲染进行加速,其性能功耗比与神经网络专用加速芯片有一定的差距。针对卷积神经网络计算和数据的特点,在充分利用GPU现有计算单元的基础上,提出了新的稀疏矩阵加速单元的设计方案,解决了GPU加速神经网络低性能功耗比的问题。