面向卷积神经网络加速器的对数近似计算单元设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:zp_3000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近似计算是一种常用于容错性应用中的计算电路设计手段,该方法是通过牺牲一定数据精度来提升集成电路的能效。近期的研究表明,卷积神经网络推理过程存在离散的分类特征,对计算中可接受误差的容忍度比较高。本课题结合对数近似计算原理,设计了一种能效较高卷积计算单元,可以在保证一定精度的情况下降低计算单元功耗,提升卷积神经网络硬件加速器的能效。本文的设计工作主要有三点。1.优化了对数近似计算原理中的高位筛选算法,扩增了高位筛选特征位的范围,从而改进了对数近似计算在卷积操作中存在的误差累积问题,使得近似误差以趋于零的方式在零值两侧振荡。2.在新算法映射至电路的过程中,提出了高位筛选算法的低功耗硬件映射方案,同时针对不同应用场景提出了筛选电路的分组评估办法。3.本文通过对大量卷积输入误差特征的分析,提出了一种自适应误差补偿单元,将单元误差率降低到3%以内。本文搭建了卷积神经网络硬件加速器,使用MINIST手写库验证其功能,通过RTL模块整合和DC逻辑综合。在SMIC-40nm工艺库,1V供电电压,250MHz频率下,与精确的卷积计算单元相比,课题方案缩减了28.86%的单元功耗,18.1%的延时和2.82%的面积;与迭代对数近似方案相比,课题方案多缩减了12.36%的功耗和8.4%的延时。将近似计算方案应用于卷积神经网络后,缩减了8.2%的加速器功耗,主要为计算功耗,采用近似计算单元后的加速器功耗为75.98m W。
其他文献
学位
基于单光子雪崩光电二极管(Single Photon Avalanche Photodiode,SPAD)的近红外单光子探测技术,逐步向着结构更简单、检测更高效的方向发展,通过降低SPAD的暗计数和后脉冲概率,有效提高了光子探测效率与信息传输的安全性和可靠性。基于窄门控检测的单光子探测技术,利用极短的门控可探测窗口,能够对光子触发的雪崩信号进行快速淬灭,确保SPAD工作的可靠性,能有效提高信息的传
学位
学位
随着集成电路技术的不断进步,静态随机存取存储器(Static Random Access Memory,SRAM)在片上系统(System on Chip,So C)中的作用越来越重要。灵敏放大器(Sense Amplifier,SA)具有检测小信号摆幅并实现快速放大的功能,使其成为了SRAM中不可或缺的组成部分之一,并且对SRAM的性能、功耗具有重要影响。低电压下,出现单端读出结构的存储单元,差
学位
学位
随着互联网的迅速发展,人们对高服务质量(QoS)的需求不断增长。数据中心作为网络流量的主要载体,面临着巨大的网络资源管理的挑战。为了对网络流的QoS性能指标(如时延、抖动以及丢包率等)进行优化,就必须对网络的传输特性进行建模。也就是说,只有理解了网络拓扑结构、流量强度以及路由方式等各个变量之间复杂的内在联系,对网络进行建模,利用建模后得到的网络模型对网络流的候选路由方式进行评估,才能知道应该如何对
随着信息体量不断增长、全球趋于互联互通,需要通信系统具有更大的容量和更快的传输速度。光纤通信优势明显且应用广泛,是高速信息传输的关键技术。本文的主要研究内容是应用于时钟数据恢复电路中的锁相环(Phase-Locked Loop,PLL)设计和应用于光接收机前端放大器中的低压差线性稳压器(Low Dropout Regulator,LDO)电路设计。锁相环和低压差线性稳压器都是光通信系统中重要的功能
随着信息应用技术的高速发展,完备的数据成为各行各业发展的必要前提,在此背景下,数据共享也成为云存储技术的热门应用之一。然而由于数据本身蕴藏的巨大价值,数据在共享过程中的安全问题愈加严重。恶意用户、恶意云存储服务器以及黑客会通过各种方法窥探用户的隐私,常见的两种情况分别是通过用户的数据访问模式来推测用户访问数据的内容以及通过发布的数据来挖掘用户敏感信息。针对用户数据访问模式的保护,通常利用不经意的随