大规模众核微处理器互连网络体系结构及性能分析研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:wd707800502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于多核甚至众核设计的高性能处理器,是未来艾级高性能计算机的支撑技术。高带宽、低延迟、低功耗和强扩展性的互连网络对于释放处理器核强大的并行计算能力、提高众核处理器的性能有十分重要的意义。目前,众核系统的设计挑战中,互连通信逐渐成为制约系统性能提升的瓶颈。新兴的3D集成技术和硅基光子器件在芯片功能、集成密度和功耗方面有独特优势。这些新技术、新器件的发展成熟为解决众核系统互连瓶颈带来新的机会。本文以研究众核系统互连瓶颈为出发点,探索众核微处理器互连网络的创新型体系结构,并利用网络演算理论对众核互连网络进行建模与分析。主要研究内容包括四个方面:(1)众核系统片上核间互连网络体系结构核间传输的报文以控制报文为主,对实时性有着极高的要求。随着计算核节点数增多,传输延迟成为限制大规模众核处理器核间互连网络性能的首要因素。以Mesh为代表的简单低维片上网络结构,虽然布线简单,但由于其网络传输跳步数随着系统节点规模呈比例增长,很难满足大规模众核芯片的低延迟传输需求。利用3D集成技术,本文提出了一种三维扁平蝴蝶形网络的拓扑结构,用于大规模众核处理器的核间电报文传输。采用整数线性规划模型,我们克服了蝶形网络中高阶路由器和长互连线的布线挑战,成功地将扁平蝴蝶形网络嵌入到三维叠层中。扁平蝴蝶形拓扑是一种高维拓扑结构,扩展性强,尤其适合大规模计算核节点之间的互连。三维蝶形网络在保证Mesh连通性的同时增加了额外的捷径链路,同时利用高速的垂直互连线,实现了核间报文的快速传递。实验结果表明,三维蝶形网络能够有效的降低核间互连延迟,显著的提升众核处理器性能。(2)众核微处理器光访存网络体系结构访存互连对众核处理器至关重要,如果不能快速的存取数据,众核处理器强大的并行计算能力将很难发挥。随着单片上集成的处理器核数越来越多,访存通信带宽需求也急剧增长。传统的基于电IO管脚的“处理器-存储器”互连方案在大规模众核芯片中遇到了挑战,电互连方式很难在满足严格的功耗预算的前提下,为片上众核提供足够大的访存带宽。利用新兴的硅基光电子器件和3D集成技术,我们提出了一种高带宽、低功耗的光访存网络方案,用于众核处理器与DRAM之间的互连通信。这种基于光突发交换协议的访存网络采用光互连接口代替电IO管脚,能够实现众核处理器和存储器的高带宽无缝互连。除了带宽优势外,与以往的光访存网络相比,新方案的波长资源利用率得到了极大的提高,进一步提高了访存通信的功耗效率。实验结果表明,基于光突发交换协议的访存网络的功耗效率比光线路交换的访存网络提高了近2倍,比电接口方案提高了6倍。(3)芯片尺度光网络中的电控制层拥塞避免方案由于光缓存、光逻辑器件缺失,光电混合网络大都采用电控制层,负责资源仲裁、链路控制。在芯片尺度光突发交换网络研究中,我们发现,大量的细粒度光突发报文、严格的传输延迟限制和中等的网络工作频率限制了光网络的电控制层处理能力,极易导致严重的网络拥塞。因而,我们提出了一套流量整形方案,解决电控制层网络拥塞问题。在注入网络前,系统中所有报文流首先进行全局协调和整形,确保中间任何节点上的控制报文聚合流速率不会超过其最大处理能力,以达到减轻控制层拥塞的目的。我们采用优化算法,选取报文流整形器的整形参数(比如,报文流速度和报文突发性参数)。这种拥塞控制方案在一定程度上,为各个报文流的端到端传输进行资源预约,在带宽方面提供基本的服务质量保证,可以有效的缓解由控制层拥塞引起的光突发报文丢失现象。基于合成流量和真实运用轨迹的实验表明,这种新方法能有效避免控制层拥塞,降低报文丢失率,提高芯片尺度光突发交换网络的系统性能。(4)芯片尺度光互连网络性能分析芯片尺度光互连网络的设计需要平衡多方面的因素,包括网络延迟、吞吐量、能耗和硅片面积占用。这些系统级互连参数的选择直接影响整个芯片的性能,因而进行片上网络的性能分析,对系统的设计具有重要意义。为此,我们开展了芯片尺度光网络的解析建模工作。利用随机网络演算理论,我们建立了光突发交换网络的存储资源需求模型,以及光器件的波长资源需求估算模型。仿真实验与数值分析的结果表明,这些解析模型计算得到的边界相当紧致。利用这些随机网络演算分析模型,我们可以快速评估众核系统光互连网络的系统级设计参数,比如存储器资源需求、传输延迟、光器件资源需求等。在设计初期,建模分析网络的性能,还可以提前降低设计风险。总的说来,我们的解析模型刻画了系统性能与网络负载、体系结构之间的关系,有助于迅速找出影响性能的关键因素和设计瓶颈,促进设计空间收敛。综上所述,本文研究了众核系统的互连瓶颈问题,提出了新的网络体系结构,并基于网络演算理论,对该体系结构进行了解析建模和性能分析。本文理论与实际结合紧密,为众核处理器互连瓶颈问题提供了新的解决方案,对推动高性能处理器技术发展做出了积极的贡献,并进一步扩展了网络演算理论的运用领域。
其他文献
采用热活化过硫酸盐法,考察了过硫酸盐浓度、温度、水土比和初始pH对柴油污染土壤氧化修复的影响,并分析了其动力学和热力学参数。结果表明,当Na2S2O8摩尔浓度为0.8mmol/g、
三次采油开发对地面参数提出新的要求,原油及污水处理温度较高。降低温度,将影响污水的粘度、沉降除油速率、过滤及滤料再生效果;升高温度,天然气消耗快速增长,产、耗不平衡
秦始皇处理梁山宫泄密事件的方法虽然粗暴,但至少证明他的信息是畅通的;秦二世也深藏在后面,却导致信息的闭塞、扭曲。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在企业运营过程中,企业盈余质量是对企业价值进行评价的主要因素,并且,公司治理以及注册会计审计对企业盈余质量有着直接射影响,公司治理和注册会计师审计水平两者相互联系和促进。在本文中,主要论述了公司治理和注册会计师审计,在分析内部审计以及股权结构等对企业盈余质量产生影响的基础上提出了相应的对策。也就是说,从目前市场实际发展现状入手,将政府自身的调控功能全面的发挥出来,以此加大我国监督管理力度、健全有关
基于多个访谈案例资料分析发现,转型期中国农业家庭传承过程中女性地位脆弱,与当前家庭农业劳动力短缺的现实,以及女性在家庭农业经营中的实际贡献并不相符。这既有传统文化
长篇小说《沧浪之水》所描绘的是当代知识分子在道德良知与现实利益矛盾的挤压下 ,心灵的蜕变过程。小说表现了当代知识分子在时代大潮中的窘迫与失落 ,提出了在市场经济背景
硬盘是当今解决低成本、大容量信息记录的关键技术之一。自2006年起,磁记录硬盘已经从传统的水平记录进入了垂直记录时代。进一步提高垂直磁记录硬盘的记录密度需要减小记录
陕西省是二元经济结构非常显著的地区,强烈的二元结构背景,既是经济发展的现实基础,又是影响改革与发展进程的基本因素,二元结构矛盾已成为陕西省经济社会进一步发展的“瓶颈
读书的方法,据我个人的经验,有两个条件:一精,二博.一精从前有“读书三到”的读书法:实在是很好的;不过觉得三到有点不够,应该有四到,是眼到、口到、心到、手到.眼到:眼到是