针对高性能低功耗NPU的形式验证应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fei5051484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和物联网技术的蓬勃发展,用于加速神经网络计算的神经网络处理单元(Neural network Processing Unit,NPU)逐渐成为系统级芯片研发热门领域。高性能NPU的设计复杂性也给验证工作带来巨大挑战,尤其是运算处理和内存访问这类复杂逻辑单元。传统模拟仿真验证方法耗时低效的同时也存在难以保证功能验证完备性的问题,进一步导致极端缺陷逃逸。所以应用高效的形式验证方法来对运算处理和内存访问核心单元进行更加完备的验证就显得非常有必要。本文针对某款高性能低功耗NPU内核的运算处理和内存访问单元验证工作,主要做了以下两方面的改进。1)提出了一种适用于复杂的数据路径模块的高效等价性验证方法。针对内核运算处理单元,首先,基于Python环境对其所支持的神经网络运算类型的C++参考模型,完成随机验证。其次,对卷积数据通路conv2d单元,针对其中4个纯组合逻辑子模块,编写TCL脚本实现对应功能逻辑。再次利用数据路径验证(DataPath Validation,DPV)方法来充分验证不同配置下conv2d单元设计的功能正确性。最后针对激活数据通路中32位Booth乘法逻辑存在证明无法收敛的问题,采用等效-级联证明方法得到解决。2)提出了一种利用分解-抽象模型来完成内存访问单元DMA模块的形式验证Signoff方法。针对内存访问单元,首先利用AXIAIP搭建了 AXI2AXI bridges的形式验证环境,完成对应模块断言检查属性的设计实现,并利用形式属性验证(Formal Property Verification,FPV)方法验证所有的检查属性都达到了所需证明深度,完成了 AXI2AXI bridges三个模块的功能验证。其次通过分析DMA模块属性检查过程中遇到的不确定性证明结果,采用数据传输抽象和地址抽象的方法简化逻辑,使形式探索的深度达到了对应的有界性证明阈值。最后完成DMA的有界性形式属性验证Signoff,确保内存访问单元的功能实现得到了详尽验证。本文在进行形式验证的过程中,针对激活数据通路中复杂Booth乘法的等价性验证,传统形式验证方案运行长时间后无法证明该硬等价问题,而采用等效-级联证明方法后仅用3625秒就成功得到解决。其次针对DMA形式验证中不确定或有界性证明结果,未采用分解-抽象模型复杂化管理方法时,形式引擎探索内部状态机计数器更新2次需要遍历40~50个时钟周期,在采用分解-抽象模型方法后缩减到10~15个周期,并由此发现了在子系统验证中遗漏的3个极端角落Bug。这些方法可以给目前行业内面临的挑战性验证任务如何应用形式验证去解决提供一定参考。
其他文献
近些年来,随着机器学习的快速发展,卷积神经网络(Convolutional Neural Network)和循环神经网络(Recurrent Neural Network,RNN)在图像处理和与时序有关的问题取得了较好的成绩。RNN最常使用的变体LSTM在其结构基础上引入了门单元控制信息的输入、保留与输出,克服了普通的RNN在训练时发生的短时依赖、梯度消失和爆炸等问题,使神经网络对于之前较长时间的
学位
高通信速率、高系统可靠性等电子系统特性要求板级系统的仿真须具有更好的精确度和更快的仿真速度,因此良好的IBIS模型对元器件板级仿真至关重要。一个IBIS模型需满足对SPICE等工艺级模型以及元器件实物测量数据的高关联度。目前针对IBIS模型的研究中主要是仿真方面的研究,即通过仿真的方式实现IBIS模型的建模或者IBIS模型解析器的算法研究,及采用IBIS模型完成板级应用仿真从而确定具体器件板级系统
学位
高速串行SerDes(串行器Serializer及解串器Deserializer的简写)以差分方式,通过加重/均衡,时钟恢复等技术实现高速通信,具有芯片所需引脚少,传输距离长等优点,逐渐取代了传统并行总线,已成为高速/大规模FPGA/ASIC不可或缺的通信模块。SerDes芯片设计研发过程中,验证环节必不可少。通过验证,可提升芯片设计研发的效率,降低流片成本,提供质量保证。目前SerDes验证主要
学位
卷积神经网络(Convolutional Neural Network,CNN)已在深度学习领域得到了广泛应用。但随着任务复杂度的提升,神经网络模型的参数量和计算量急剧增加,模型训练和推理所消耗的硬件资源和功耗也随之增大,给算法模型的硬件部署带来了巨大挑战。而脉冲神经网络(Spiking Neural Network,SNN)的事件触发机制具有计算和存储需求少、功耗低的优点,因此逐渐成为深度学习领
学位
在国内国际双循环发展格局的要求下,夜间经济有利于满足消费需求、增加就业机会、提高地区影响力。近年来各地政府越来越多地开展夜间经济项目投资,但项目价值未能有明确的估值方法。夜间经济项目具有投入高、不确定性强、周期长的特点,其高度不确定性增加了夜间经济项目投资的机会价值。因为不确定因素蕴含巨大的投资价值,与传统投资决策方法(如折现现金流方法)相比实物期权方法注重不确定因素,故本文拟通过期权定价模型评估
学位
WebP是一种兼具高压缩率和优秀图像质量的图像压缩系统,用于对互联网图像进行压缩处理。然而,WebP压缩系统的优秀压缩性能依赖巨大的计算负荷支撑。受制于CPU的串行处理结构,服务器集群的WebP压缩计算效率低下。在时下热门的云数据中心处理场景中,WebP压缩任务会产生较大的服务器CPU算力负荷及能量开销。因此,有必要结合FPGA或ASIC的并行计算优势,将WebP系统硬件实现,从而最大化WebP任
学位
卷积神经网络作为实现人工智能芯片的经典深度学习神经网络,因其优秀的特征学习和表达能力被业界广泛关注,基于卷积神经网络的人工智能芯片在图像识别、目标检测等诸多领域大放异彩。然而为了满足复杂多变的应用场景,芯片中的网络规模被不断扩大,随着卷积神经网络层数的不断增加,网络出现了过拟合现象,多次卷积、池化的中间操作使得特征图尺寸缩小,图像有效特征信息减少,导致网络层处理精度不足甚至退化,影响最终结果的准确
学位
互联网金融利用网络平台,借助快速扩张的线上渠道,建成了功能强大的金融服务机制,同时积累着大量客户数据,并以此为基础不断完善迭代自己的金融服务机制,这对于主要依靠传统物理网点现场办理业务来提供金融服务的商业银行来说,面临着巨大的威胁,尤其在金融服务逐步线上化的影响下,网点如何优化其客户关系管理,如何建立持续稳健的客户关系,把传统物理网点的优势发挥出来,是商业银行关注的重点。邮储银行S分行是股份制零售
学位
激光是当前人们获得高时间分辨率的最主要的工具。随着激光脉冲宽度逐步缩短至阿秒量级,其对于超快过程的探测范围可以被拓展到各种物质形态中的电子运动过程,也为超快信息、材料科学、生命科学等领域的研究提供了全新的视角。为了方便在微观尺度下实现对电子运动的实时探测,获得更短脉冲宽度、更高光通量的阿秒脉冲已成为当前学术界的研究重点。少周期脉冲是实现激光脉冲从飞秒量级提升至阿秒量级的重要纽带。目前,通过少周期脉
学位
复杂网络具有协同创新网络的核心特征。创新网络成员之间的互动有助于协同创新网络的发展。此外,不断上涨的医疗费用和医疗行业的大量商机等不断变化的市场环境,对改进创新创造产生了强烈的需求。然而,由于医疗行业的分散性和复杂性,创新发展很困难。利用协同创新网络的概念,让企业建立新的角色并与许多利益相关者进行互动,这可能是解决问题的一种方法。本研究主要把加纳的协同创新网络和医疗保健服务作为研究对象,接着考察了
学位