人工智能(AI)指令集模拟器关键技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:infoerp2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国内集成电路行业的飞速发展,芯片复杂度的不断提高,如何确保所研处理器的正确性成为了芯片研发流程中的一个重要内容。指令集模拟器(ISS)作为芯片设计、验证、应用等阶段中不可或缺的重要工具,可以通过建立目标处理器的功能模型,来模拟每条指令在目标处理器上的执行结果。对于复杂度更高的人工智能(AI)芯片,开发一款仿真速度快、模拟精度高的指令集模拟器,更是有助于加速芯片架构探索和设计,对缩短芯片研发周期和验证操作系统性能也具有重要意义。由于现有的模拟器大都是对单核、多核处理器的模拟,很少适配大密度并行线程以及相关线程同步,对采用单指令多线程(SIMT)体系结构的处理器的功能完备性、并行算子的功能验证缺少良好的支持。因此,设计一款能良好兼容SIMT体系结构的指令集模拟器是非常必要的。本文在深入研究了各种指令集体系结构后,结合功能需求和开发环境,提出了一种SIMT体系结构的模拟思路,并使用System C建立了一种AI芯片的系统级功能模型,实现了所有指令的功能模拟。通过该模拟器,验证了指令集的功能完备性,提升了芯片研发效率。论文首先研究了处理器工作原理和模拟器技术理论,比较分析了业界较为普遍的编译型和解释型模拟策略的基本工作原理和优缺点。其次从所研发处理器的功能需求、指令集体系结构、寄存器类型、线程与存储结构入手,提出了一种SIMT体系结构的模拟思路,给出了模拟器的主体框架、层级结构以及总体实现流程。接着根据模拟器总体框架,对其进行了功能的分解,从模拟器各主要子功能模块的设计思路和实现方式的角度剖析模拟器底层工作流程细节。最后,论文设计并通过了覆盖此模拟器的所有指令的测试用例,验证了AI指令集的功能完备性,成功运行了一系列的并行算子,保证AI算法在芯片运行正确,使其能够满足AI处理器研发的各种需求。该指令集模拟器以软件的形式模拟了处理器的指令功能,不仅验证了指令集的功能完备性,还可以在后续软硬件协同验证过程中,通过芯片验证平台对ISS和RTL模型进行结果比对,确保RTL代码正确性,对保障芯片成功研发具有重要意义。
其他文献
20世纪70年代,世界范围内社会、经济与政治领域的一系列变革促使博物馆、遗产地等文化展示场所将目光转向"体验"。体验不仅代表一种与过去对话的新方式,而且也是文化产业兴起后的必然之路。在这种情况下,博物馆对实物收藏、保护、研究的关注转至观众的兴趣、行为、参观效果上。相应地,体验成为博物馆实现其公共使命、树立博物馆形象的手段。然而,体验是否真如人们所描绘的那样美好?在《转型期博物馆的哲学观察》一书中,
学位
嵌入式Flash存储器是一种广泛应用的非易失存储器,很多MCU以及IoT芯片都在内部集成了Flash。Flash作为Memory的一种类型,其无需电源即可保持数据,与传统硬盘相比传输速度更快、功耗更低、体积小、不易损坏、且价格更低,已经被广泛使用作为SOC芯片中的存储器件。由于嵌入式Flash的接口协议不同于标准AMBA总线接口,为了将其集成到SOC中,需要设计控制器实现两种协议的转换,完成Fla
随着半导体技术的高速发展,模数转换器(ADC)作为通信、视频传输等领域的重要组成部分,ADC的精度、速度要求也随现今的发展有着更为严苛的规定。在众多的ADC结构里,算法ADC具备着高精度、低功耗、低成本的设计优势。因此本文针对高精度低功耗算法ADC进行了相关的研究。论文首先介绍了本课题的研究背景以及意义,并对算法ADC的基本特性进行了分析;其次对传统的算法ADC进行了改进,使用了冗余符号位编码(R
超高清视频是继视频数字化、高清化之后的新一轮重大技术革新,将带动产业链各环节发生深刻变革。但超高清视频数据量巨大,导致对其传输、存储和处理压力巨大。在带宽有限的情况下,视频传输帧率往往为30 Hz或者60 Hz。但由于播放设备往往存在差异,主流显示设备的刷新率一般为60 Hz,少数高端产品会有刷新率更高的屏幕。由于片源和屏幕之间的刷新率存在差异,会出现例如拖影、停顿、模糊等现象,使得我们观看的视频
二氧化钛(TiO2)是一种非常重要的宽禁带(~3.0-3.2 e V)半导体材料,由于其经济无毒且具有物理化学性质稳定的特点,而被广泛应用于紫外探测、光催化和环境能源再生及保护等各个领域。但由于TiO2对可见光吸收有限且其性能受形貌及晶型影响较大,严重阻碍了TiO2在各领域的应用。近年来,为提高TiO2对整个太阳光波段的光谱吸收,科研工作者主要采用以下三种方式提高其性能,(1)控制形貌:低维纳米线
Al Ga N/Ga N异质结具有很强的自发和压电极化效应,即使在没有任何掺杂情况下,只有极化应力也能在Al Ga N/Ga N异质结界面的量子阱中产生高密度的二维电子气体。Al Ga N/Ga N HEMT在高频电子器件和高功率中具有很大应用潜力。然而,在高功率器件应用中,Al Ga N/Ga N HEMT的结温持续升高成为制约其进一步发展的瓶颈。传统衬底上的Al Ga N/Ga N HEMT具
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种成像分辨率高、全天时、全天候、作用距离远的微波成像系统,凭借其诸多优点合成孔径雷达在军用和民用领域发挥着巨大作用。在追求合成孔径雷达技术应用能力不断提高的大环境下,合成孔径雷达工作模式目前已经发展出条带模式、聚束模式、滑动聚束模式、扫描模式、循序扫描地形观测等工作模式。滑动聚束模式既解决了条带模式下方位向分辨率受限问题,
高维数据集引起的“维数灾难”问题不仅增加了计算内存和运行时间,而且会导致学习器分类性能的下降。而特征选择技术通过排除冗余和不相关的特征来减少数据维度,从而提高学习算法的性能。但在特征选择中,寻找最优特征子集是一个NP难问题,使用传统的贪婪式搜索方法极易陷入局部最优。而群智能算法中的蚁群优化算法因其出色的全局和局部搜索能力和灵活的图形表示方式而广泛应用于特征选择。但是当前基于蚁群算法的特征选择方法主
随着科学技术的不断发展,软件已服务于生活中的各个方面,同时其数量与种类仍在不断增多。但其实大多数企业采用的软件开发方式因工作的重复度过高,具有开发效率慢的缺点。因此在软件开发领域出现了一种基于软件资产进行软件开发的方式,即软件重用。软件重用的实施必须具备两个基本条件,分别是存在大量的可重用软件资产供开发人员挑选以及存在一个可重用软件资产库管理系统来管理可重用软件资产。但现有系统因具有缺少资产安全性