针对片上光互连新型众核系统热可靠性的设计与优化

来源 :重庆大学 | 被引量 : 0次 | 上传用户:ganmaogaishilangren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着纳米工艺的持续发展以及集成电路设计方法、制造工艺、生产和测试技术的长足进步,CMOS晶体管尺寸不断缩小,集成至单个芯片上的晶体管数量呈指数级增长。片上众处理器系统(Multiprocessor System-on-Chip,MPSoC)成为超大规模集成电路和嵌入式系统的主要设计框架。依托片上光网络(Optical Network-on-Chip,ONoC)新型互连架构为处理器间通信提供的超高带宽、低延时和超低能耗的数据传输能力,该系统具备强大的并行处理能力、高效的计算和通信效能、优秀的资源利用率以及良好的可扩展性,被广泛应用在高性能计算乃至超算系统中。然而,受限于芯片散热技术、封装工艺和供电技术的不足,密集的处理器运行将迅速升高片上功耗密度,导致处理器温度过热,进而影响系统热可靠性,威胁芯片寿命与安全。为了控制功耗密度以保证芯片处于安全温度范围内,片上集成的处理单元无法同时全部开启或者运行在高频率/高电压状态,其中一部分计算单元不得不关闭,这就是“暗硅(Dark Silicon)”现象。暗硅时代下,热可靠性是新型众核芯片面临的关键性挑战:在计算层面,为保证处理器核心的热安全,暗硅众处理器面临着严重的利用率墙(Utilization wall)困境,处理器核心的低利用率造成了对片上处理资源的浪费,极大限制了众核系统计算性能的提升;在通信层面,受热光效应影响,光介质的光学性质随环境温度的变化而发生变化。考虑到尚不成熟的硅光子纳米制造技术,用于处理器间通信的核心光器件极易受片上温度梯度的影响。芯片热量分布不均和波动将会严重威胁片上光网络中数据传输可靠性,因而无法保证高质量片上通信。综上可知,针对基于片上光网络的新型众核系统热可靠性的设计与优化是高性能计算研究中关键且亟待解决的问题。解决这一问题既具备重要的学术价值,又具有广阔的实际应用前景。为此,本文基于对片上光网络新型众核系统的研究与设计,采用系统级的任务映射策略、网络级的路由技术、软硬件协作式片上光网络热量监测方案以及器件级调谐技术,从计算和通信两个层面全方位地研究了保障芯片热可靠性、协同优化系统计算性能、通信效率和能耗开销等多个目标的关键技术。主要研究内容如下:(1)研究并提出了针对暗硅众核处理器的温度预测与优化调度算法。通过研究不同制造工艺下处理器类型和暗硅现象对运行在多处理器上的计算任务的影响,本文对处理器产热和散热过程在空间和时间上的复杂行为进行了系统化分析和建模,构建了一个准确高效的众核处理器温度预测模型。基于对处理器温度的实时预测,进一步提出了一个两阶段式的芯片温度优化任务映射方案,以最大程度优化芯片温度分布,提升计算性能。第一阶段采用基于混合整数线性规划(Mixed Integer Linear Programming,MILP)的温度优化方法,以获得具有最低芯片峰值温度的全局最优任务映射方案。第二阶段提出启发式算法--芯片安全温度约束下的任务选择(Temperature-Constrained Task Selection,TCTS)算法,用以选择众处理器系统能够承受的最大任务子集,获得处理器计算性能与热可靠性的平衡。两阶段式的方案相结合,可获得全局最佳任务分配方案。不仅保证芯片始终处于安全温度范围,片上温度分布最佳,同时最大程度地满足任务的计算需求。将形式化方法(Formal methods)与启发式算法(Heuristic algorithms)相结合,优化了求解最优解问题的规模,使其具有高效性和良好的可扩展性。(2)基于软硬件协同设计,提出了两个全新的片上光网络热量监测与优化实现方案,为保障众核系统通信网络的热可靠性奠定了坚实基础。集中式热量监测方案:通过系统化地分析和建模核心光器件的热敏性以及片上光网络的热效应,深入研究网络拓扑、光路由器结构以及片上热量分布对处理器间光通信过程的影响,所提出的集中式方案将硬件层光路由器结构设计和软件层路由策略相结合,几乎无需额外硬件支持,能够实现准确、低计算开销的集中式热量监测。集中式方案具有信息集中、管理方便、能够实现片上光网络全局同步热量监测等优势,然而,其可扩展性有限。随着网络规模的增大,集中管理所有网络节点的复杂度呈指数级增长。相比之下,分布式热量监测方案能够实现更高的灵活性和可扩展性。分布式热量监测方案:首先,设计了一个基于级联微环谐振器(Micro-ring Resonator,MR)的耐工艺偏差(Process Variation,PV)的光学温度传感器(PV-tolerant Optical Thermal Sensor,PV-OTS)。通过全面分析和建模硅光子纳米制造工艺偏差和器件级波长调谐技术对片上核心光器件-微环的热敏性的影响,利用波分复用(Wavelength Division Multiplexing,WDM)技术中‘潜藏’的冗余性实现耐工艺偏差的热量测量,该传感器实现了快速、准确、可靠和低能耗的片上温度监测。基于该传感器设计,进而提出了一个轻量级优化实现方案,命名为Arb Link。结合对光路由器结构和片上光通信过程的分析,通过在时间和空间上复用光路由器,该方案仅引入了超低硬件成本和面积开销。所提出的设计思路和实现方案对不同拓扑网络和通用路由器结构具有适应性、对不同规模的网络具有可扩展性。(3)研究并开发了片上光网络通信性能、能耗和热可靠性协同优化路由技术。本文分析和建模了处理器间数据传输冲突对通信性能和能耗的影响,深入研究了片上热量梯度对处理器间通信可靠性的影响。为保障片上光网络热可靠性,本文提出了一个网络级热可靠路由标准。结合高效的器件级波长调谐技术,可实现高质量、高可靠的光数据传输。基于被保证的通信热可靠性,进一步提出了两种高效的通信冲突和热量感知路由算法,以协同优化片上光网络通信性能与能效。一为基于MILP的最优路由方法,可获得理论证明的全局最优路由方案,最小化数据传输冲突和通信能耗。此外,本文相应地提出了具有高度可扩展性的启发式算法—通信争用感知路由(Contention-Aware Routing,CAR)算法,以在多项式时间内获得近似最优路由方案。所提出的路由技术适用于大规模的片上光网络系统,且对2D-Mesh和2D-Torus拓扑结构具有良好的适应性。
其他文献
作为一种绿色清洁的可再生能源,风能在我国获得快速发展,连续五年新增装机容量和装机总量位居世界第一。装机容量的快速增长,尤其是海上装机容量的增加,导致风电场风电机组的总体运维成本急剧增高。同时,风电机组价格的持续下降,进一步压缩了装备制造商的盈利空间。因此,在结合大数据和现代人工智能技术的条件下,如何突破风电机组故障智能诊断关键技术,是风电装备企业实现“降本增效”的关键,也是当前风电行业面临的重要挑
骨-韧带、骨-肌腱与骨-软骨等结合部位是肌肉骨骼系统中结构与功能特异的界面组织(enthesis/interface tissue),在运动过程中具有传递力学载荷、缓冲冲击、消弱应力集中等重要作用。肌肉骨骼系统常见疾病如交叉韧带撕裂、跟腱拉伤等都会涉及界面组织的损伤。据统计,每年全世界约有3000万例与肌腱/韧带相关的临床手术,手术过程中骨与肌腱/韧带直接进行结合,体内原有的功能性组织界面缺失、加
天然岩体是由节理面纵横切割而成的多裂隙体,它的强度特征和破坏特征一定程度上受到这些节理面的控制,因此研究含节理岩体的剪切行为对认识工程岩体的失稳问题具有重要意义。本文借助三维扫描技术和三维打印技术等逆向工程技术,以自然节理为研究对象,围绕影响节理形貌特征和剪切行为的因素开展了研究,解释了节理各向异性特征的机理,提出了基于节理多形貌特征的评估其粗糙度的新指标,建立了考虑不同影响节理剪切行为因素的剪切
COREX工艺是最早实现工业化生产的熔融还原炼铁工艺,由于取消了烧结和炼焦环节,因此该工艺具有流程短、工序少、污染轻等特点。COREX工艺包含了预还原竖炉和终还原熔化气化炉两个反应器,其中熔化气化炉炉顶有两套布料系统:Gimbal布料器和DRI挡板布料器,分别用于将块煤和竖炉预还原的直接还原铁(DRI)同时加入熔化气化炉内。因此,熔化气化炉内的布料设备结构、物料属性以及布料模式均与高炉有明显的不同
随着世界经济增长速度逐渐放缓,市场竞争环境日益激烈,产品创新成为企业获得市场竞争优势的重要途径。科学技术的快速更新迭代,以及客户个性化、多样化的产品需求,使得产品创新任务变得更加复杂多变。如何实现产品创新任务与人员有效匹配,从而提高产品创新设计能力,缩短新产品开发周期,已经成为企业提升产品竞争力的关键。然而,由于创新环境的不确定性、匹配偏好信息缺乏、匹配决策者非完全理性等因素,产品创新任务与人员匹
目的:约12%-13%的胃癌患者存在HER2过表达,抗HER2靶向治疗联合化疗能明显延长HER2过表达的晚期胃癌总生存期。胃镜活检标本或者手术标本进行免疫组化(IHC)和荧光原位杂交(FISH)是获得患者HER2状态的主要方法,因胃癌存在高度肿瘤异质性,样本的HER2状态不能代表全身所有肿瘤的HER2表达情况,且检测方法的有创性使其无法反复进行。靶向HER2的PET/CT分子显像,有望无创、直观的
心脏病是危及人类健康的严重疾病。2018年中国心血管病患病率处于持续上升阶段。推算现患病人数2.9亿,心脑血管病占比近总人口20%,并居主要疾病死亡率的首位,且呈逐年上升趋势,而全球范围内需要接受心脏瓣膜置换手术治疗的患者人数预测2050年将达到85万。二尖瓣是个复杂的器官,腱索是二尖瓣组成部分,这个结构的功能是在收缩期协助二尖瓣正常的闭合,瓣叶受力的情况下将力均匀的分散并传递到乳头肌上,腱索发生
本文主要包括两个方面的工作,一是基于顺序统计量讨论了多个常见连续型总体参数的齐次性检验问题;二是基于发生函数与BELL多项式讨论了相互独立负二项分布卷积的精确展开.检验多个连续型总体参数是否齐次性的问题一直是统计学中的重要研究内容,例如经典的方差分析就是检验多个正态分布总体均值是否相等的方法,而且方差分析在实验设计、风险投资、质量管理等诸多领域中有诸多的实际应用.进而讨论更多常见多个连续型总体参数
随着物联网技术、大数据、人工智能等新一代信息技术的飞速发展,各种用于交互通讯的传感器的需求数量急剧增加。如何解决海量传感节点供电问题已成为现代信息技术发展的瓶颈。通过能量采集技术,将环境中储量丰富、分布广泛的可再生清洁能源转换为电能,为无线传感网络节点供电,是打破传统供电方式限制的有效解决途径。摩擦纳米发电机作为一种新的颠覆性的能源收集技术,具有前所未有的输出性能和相对较低的成本,已被证明是实现环
煤矿开采引起岩层移动造成地面沉陷与采动覆岩结构的变形破坏密切相关,认清采场上覆岩层的结构及变形垮落特征是预测覆岩运动规律及沉陷发展过程的基础。以往采动覆岩结构研究主要基于结构承载方式的覆岩结构假说和承压层材料特征的板梁结构理论,第一种结构假说重点集中于采空区两侧结构承载形式的分析,对承载区的量化等问题分析较少;第二种板梁结构研究重点集中于采空区上部具有较强承载能力的岩层变形垮落特征,对工作面前方采