基于线性脉动阵列的卷积神经网络计算优化与性能分析

来源 :网络与信息安全学报 | 被引量 : 0次 | 上传用户:sirius1394
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大部分FPGA端上的卷积神经网络(CNN,convolutional neural network)加速器设计未能有效利用稀疏性的问题,从带宽和能量消耗方面考虑,提出了基于线性脉动阵列的2种改进的CNN计算优化方案。首先,卷积转化为矩阵相乘形式以利用稀疏性;其次,为解决传统的并行矩阵乘法器存在较大I/O需求的问题,采用线性脉动阵列改进设计;最后,对比分析了传统的并行矩阵乘法器和2种改进的线性脉动阵列用于CNN加速的利弊。理论证明及分析表明,与并行矩阵乘法器相比,2种改进的线性脉动阵列都充分利用了稀疏性
其他文献
研究一类具偏差变元的中立型Lienard型方程的周期解存在性,给出了这类方程周期解存在性的若干充分条件.
本文对Fibonacci数列性质进行了深入一步的讨论.给出并证明了Fibonacci数列的一个有趣的概率性质.从而在相当大的程度上推广了文献中的有关结果.
建立了主正阵和完全主正阵关于正稳定的两个结果。
在电力巡检工作中,巡检方法逐渐从原先的人工巡检,升级为无人机智能巡检。然而,恶意无人机入侵电力巡检工作区域,会给电厂的生产带来诸多安全问题。针对电子围栏技术在管控恶
本文讨论一类正定复矩阵的某些性质,特别给出了两个正定复矩阵的积仍为正定的条件,以及正定复矩阵的一种分解.
本文给出了由随机样本的高阶矩求末知概率密度的级数展开式的方法,并通过计算实例对应用方法和密度逼近作了分析说明.
近10多年来为了适应高等数学的教学改革与新制订的教学大纲的要求,出版了一些新的高等数学教材,统观这些教材,有以下几个明显的特点: 1.突破了原有的知识体系(公共课部分:解
本文利用有限域上的向量空间的Cartesian积定义了一种结合方案,然后,利用空间与子空间的一些关系构造出了几种新的PBIB设计.
本文讨论概率论中分段概率密度函数常见的一些较难的重要运算,即定积分、广义积分、二重积分和广义二重积分运算以及两个分段概率密度函数的积、商运算.
前苏联高等工科院校非常重视基础课教育,因而,基础理论课一特别是数学课程放在重要位置,苏联高等工科院校的教育是按专业培养高级技术人员,培养目标是工程师,大学毕业即完成