嵌入式神经网络加速器及SoC芯片

来源 :仪器仪表学报 | 被引量 : 0次 | 上传用户:fairycx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高人工智能加速器的运算效率和功耗效率,提出了一种新的卷积神经网络(CNN)加速器结构,并实现了神经网络存算一体的方法.首先,设计出一种神经网络架构,其具有高度并行计算以及乘加器(MAC)单元高效运行的特性.其次,为了降低功耗和面积,采用了对称的静态随机存储器(SRAM)阵列和可调数据流向结构,实现多层网络在SRAM中高效计算,减少了访问外部存储器次数,降低了功耗,提高运算效率.通过中芯国际40 nm工艺,完成了系统芯片(SoC)设计、流片与测试.结果 表明运算速度在500 MHz下,算力可达288 GOPS;全速运行功耗89.4 mW;面积1.514mm2;算力功耗比3.22 TOPS/W;40 nm算力面积比为95.1 GOPS/mm2.与已有文献的相比,算力功耗至少提升4.54%,算力面积至少提升134%,对于嵌入式场景应用较适合.
其他文献
针对检重秤测量过程中受振动干扰影响严重的问题,提出一种基于外部输入非线性自回归模型(NARX)的动态神经网络系统辨识的抗振新方法.通过加速度传感器的冗余分布,对检重秤系统的振动特性进行估计,结合空载传送情况下称重传感器由振动干扰产生的误差,利用动态神经网络对振动干扰信号进行自动辨识,建立振动信号分析模型,用以匹配消除动态检重信号中的振动扰动.在共振状态下,与滑窗滤波、自适应陷波等传统抗振方法进行的仿真与测试实验对比,证明基于多加速度传感器的动态称重抗振性能更优,最终实现运行速度达2 m/s,最大秤量200