基于Genus的X86 CPU核频率提升设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tezon1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电路综合是超大规模集成电路芯片设计中承前启后的一个重要环节,综合的策略从方方面面影响着综合网表的质量。近十年来,随着工艺进入深亚微米级别,前后端网表差异过大成为了制约芯片设计质量的一个重要因素。过去的工程实践常常将综合阶段的互连延时做理想化或者归一化处理,但是这样做的弊端开始显现;而且,传统的逻辑综合往往不考虑单元的位置信息,使得一些需要物理信息的综合策略无法很好实现,导致WNS指标变差,时钟频率下降。除此之外,关键路径的优化是进一步提升芯片的有效频率需要考虑的另一个重要因素。现有一基于台积电7nm工艺的X86架构CPU软核,本文使用Cadence公司的综合软件平台Genus,针对在先进工艺下综合CPU芯片由于前后端工具不适配而导致的网表质量下降、时延增加以及关键路径不容易收敛等问题进行研究,得到了适合本设计的综合策略和关键路径优化方案。本论文主要的工作内容如下:首先,按照传统的逻辑综合方法,提出一套时序优先的综合策略,包括在关键路径上禁用单元延时较大的SVT、LVT单元、约束大扇出单元并确定最优扇出约束值、禁用容易产生局部绕线阻塞的大扇入多比特触发器、约束合并触发器动作按照时序优先原则进行等四个要点。研究网表发现,在执行诸如合并触发器这类需要参考位置信息的综合动作时,综合网表中触发器合并率、触发器平均比特数等指标与单元摆放网表的相应指标有较大出入。分析原因,一方面说明后端设计工具并不认可综合工具做的合并决策,又重新做了调整。另一方面,将综合阶段的互连延时做理想化处理使得延时估计过于乐观,放过了一些关键路径,使之在综合的阶段没有被发现,直到单元摆放完之后才暴露出来,加大了这些路径优化的难度。接着,为解决前后端网表不适配导致时序变差的问题,在对比了两种物理综合方法的基础上提出一套时序优先的物理综合策略。首先,按照本CPU芯片内部模块的数据流流向完成芯片的布图规划设计,并用DEF格式文件保存。然后,在沿用逻辑综合方案中所制定的时序优先综合策略的基础上,又在综合过程中引入布图规划中的单元位置信息及工艺库中的物理信息完成物理综合。实验结果表明,综合网表中各项触发器合并指标与单元摆放网表的相应指标基本持平,说明两个阶段的决策一致性较高。同时,网表的有效周期优化了15ps,有效频率从2.55GHz提升至2.65GHz,增幅为4%。最后,研究关键路径的优化问题。依据“先全局,再局部”的关键路径处理思路,分别制定了全局和局部的关键路径优化策略。第一步,依据本CPU设计中大量关键路径呈现“并行分布”的特点,选择TNS优化模式。对比实验的结果表明,该模式能得到更好的WNS指标,使有效频率提升至2.74GHz,高于默认模式的实验结果2.65GHz。第二步,针对仍未能被优化掉的局部关键路径,分析其产生的具体原因,并对路径延时的影响因素做定量分析。发现可通过对相邻非关键路径加过约束的方法,限制其起点触发器映射成大尺寸单元,使得关键路径的总努力下降,得到更小的逻辑深度,从而降低关键路径的延时。最后,研究并提出完整的确定最优约束值的算法。实验结果表明,按照该算法完成局部路径优化以后,综合网表的WNS指标提升18%,单元摆放网表的WNS指标提升17.5%,有效周期从2.74GHz提升至2.79GHz,基本实现时序收敛于2.8GHz的目标。
其他文献
量子信息学作为量子物理和信息科学交叉形成的一门新的学科,发展至今,在理论和实验上都已经取得了丰硕的成果。量子通信是量子信息科学的一个重要的分支,以量子态作为载体传输信息并且利用量子的独特的物理性质来保证通信的安全性和高效性。量子通信从起初的单光子通信到现在利用量子的纠缠特性进行通信,在不断的突破与进步。量子远程制备作为量子通信的主要研究内容,是实现量子远程通信、量子网络、量子计算的重要一环,在量子
随着集成电路的生产工艺不断进步,显示驱动芯片得以飞速发展。显示驱动芯片规模不断扩大,承担了更多的功能。显示驱动芯片结构复杂程度的不断上升,不仅会对芯片设计提出更高的要求,也会给芯片成品测试带来更多的挑战。现如今的消费电子市场芯片产品迭代周期不断缩短,为提高芯片的品质,降低芯片成本,减少芯片测试时间,可测试性设计逐渐占据了重要地位。可测试性设计主要方法是将芯片测试纳入芯片的设计规格中,通过在芯片中添
近年来,人工智能和集成电路领域的飞速发展对健康医学产生了深远的影响,机器学习可以利用病人大量的临床数据对其病情做精确地分析,智能计算机系统可以为卫生专业人员提供治疗方案。智慧医疗在电子信息、生物医学、数据分析等领域进行深度交叉融合,在引领未来医疗时代等方面具有重要意义。植入式生物医疗芯片作为智慧医疗的硬件载体,逐渐成为近年来的研究热点。植入式生物芯片需要植入生物体内获取被测者的生理参数,因此需要有
声源定位包括利用传感器阵列测量声场中的声学量和利用反向传播算法重建声源在声场的分布图像。目前声源定位在工业生产、医疗、地质研究和军事等领域都有着广泛的应用。麦克风阵列信号接收作为声源定位过程的关键步骤,其对声源信号采样的质量直接影响着后续的声源定位准确性。根据采样定理,麦克风阵列接收信号频率的上限受到阵元间距影响,下限受到阵列大小影响。所以对于超出频率限制范围声源信号,麦克风对信号的采样质量会下降
图像分类任务是计算机视觉领域的基础问题。随着互联网和人工智能技术的快速发展,每天都会产生大量的图像数据。图像分类技术已经应用到很多生活和工作场景中,因此很多互联网公司和科研机构将图像分类作为研究重点。目前基于深度学习算法的图像分类已成为主流,但性能提升的同时模型也越来越大,如何在提高分类正确率的同时减少模型参数量是一个具有挑战性的课题。本文针对该问题提出了新颖的轻量分割卷积、沙漏模块、多尺度注意力
大数据时代的来临,导致我们需要处理和分析的数据越来越多,用户和企业很难在本地对这些数据进行有效的管理和分析。伴随着云计算技术的日渐成熟,越来越多的用户和企业选择将数据上传到云服务器中来减小本地服务器的压力。云服务器可以为用户提供巨大的存储空间和高效的处理器,而用户只需要支付很少的费用就可以享受到这些服务。为了保证用户的隐私安全,常用的处理方法是将数据加密后再上传到服务器中,但是通过传统的加密技术得
学位
近年来,为了使芯片的上市周期缩短提高效率,节省成本,SoC(System on Chip)已经开始推广运用能够复用的IP(Intellectual Property)核,DDR4的主流速度达到了2133Mbps,在业内使用量较高。而与DDR相匹配的DDR PHY(Physical)常被当作一个高速IP核来使用,当DDR PHY作IP使用时,由于使用者对内部架构和设计并不完全了解,很多时候使用者把D
近年来,随着集成电路产业工艺技术的不断推进,芯片的电路规模日益扩大,内部复杂度逐渐提高,与之带来的功耗问题成为了芯片设计人员不可忽视的重要因素。而在各类便携式智能医疗设备中,考虑到其日常使用场景和性能指标,如何有效控制内部控制芯片功耗也是当前研发人员首要考虑问题。因此,在保证芯片的可靠稳定和性能需求基础上,实现低功耗的设计目标,具有重要的实现意义。本文研究对象为某款针对医疗市场研发的血红细胞检测芯
在工业控制中,脉冲宽度调制(PWM)作为一种有效的数字信号控制模拟电路技术,被广泛用于电力电子、电机控制及机械控制等领域中。为了满足工业控制需求,需要在SoC芯片中集成PWM发生器,本课题基于SoC技术完成了符合APB总线接口标准的四相PWM IP核的设计与验证,论文的主要工作如下:针对工业控制芯片的PWM功能需求,完成了PWM核的前端设计,包括总体架构定义、模块功能划分、模块原理设计等工作,设计