面向大规模HPC新型互连网络芯片体系结构与关键技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户：apple2008zxffxz

【摘要】

：

采用目前高速互连技术构建百亿亿次量级(E级)系统将面临系统功耗难以承受、网络拓扑难以实现、延迟显著增加、系统可靠性难以承受、互连网络工程化密度难以提高等诸多挑战。

【作者】

：

徐实

【出处】

：

湖南大学

【发表日期】

：

2018年01期

【关键词】

：

高阶交换芯片融合互连网络光串行接口收发器光交换

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

采用目前高速互连技术构建百亿亿次量级(E级)系统将面临系统功耗难以承受、网络拓扑难以实现、延迟显著增加、系统可靠性难以承受、互连网络工程化密度难以提高等诸多挑战。因此需要探索新的互连技术,包括更高阶交换芯片、融合互连体系结构、新型光电互连交换技术等来有效改善互连网络性能,降低互连系统功耗,改善整个系统可靠性及可扩展性。本文通过分析国内外高性能互连网络以及相关核心技术现状,将主要围绕高阶互连交换芯片结构及容错技术、面向内存互连网络体系结构的高速通信接口优化技术、以及下一代100Gbps光串行接口收发器技术及可扩展光交换技术等方面开展研究,以期取得关键技术突破,缓解E级系统通信墙问题,高效支撑E级应用。本文取得的主要贡献和创新点如下:(1)高阶互连路由交换芯片结构及容错关键技术针对更高阶路由器体系结构硬件复杂性大、可扩展性弱、缓冲资源受限、系统鲁棒性差等问题,提出了一种基于聚合瓦片的高阶交换芯片路由器微体系结构(ATR),并提出了基于M/D/1排队理论模型的瓦片性能解析优化方法,能将64阶路由交换芯片存储开销及全局总线开销分别降低40%~50%,同时可获得YARC结构98%左右的饱和吞吐率及交换延迟性能。基于聚合瓦片交换结构,在交叉开关调度方面设计了一种面向高阶交换的公平性波阵面仲裁调度算法,仅利用较少开销实现了时序快、吞吐率高、仲裁公平等特点,与传统DRRM算法比报文平均调度时间和平均响应时间降低约15%和21%;在协议及流控制机制方面,提出了分布式分级路由及动态多队列流控制机制有效缓解了路由器缓冲和输入缓冲资源紧张问题,并最大限度地保证缓冲区按需分配;在容错机制方面,设计了智能化网络管理引擎,并提出了故障检测和故障恢复智能算法,允许自动维持故障场景下的网络稳定性,并相对re-coil路由策略和U-turn路由策略具有更好的网络性能。(2)面向内存互连网络的高速通信互连接口优化关键技术面向高性能计算、大数据、云计算、认知计算等需求,研究E级高性能计算机融合互连网络结构以提供低延迟高可靠带宽平衡的数据访问能力。围绕内存网络体系结构及高速通信互连接口技术,首先面向国产多核处理器提出了一种适应大数据处理的内存网络体系结构,利用内存和互连紧耦合设计无需经过PCI-E接口,有效降低了数据传输开销,同时还能为大数据处理计算系统提供大量内存共享能力。其次提出了内存网络存储控制器中高速通信互连接口结构及优化技术,包括:精简的链路层协议、串行和源同步技术相结合的多组并行总线通道技术、“读命令优先”和“推断写”命令调度技术、多通道并行总线低延迟偏斜结构及虚拟活跃页缓冲器优化技术等。优化后高速通信互连接口能匹配两个存储通道DDR带宽。通过对合成负载和真实负载两种负载在国产处理器平台上测试表明互连接口最高有效带宽为14GB/s,64线程Stream测试激励下总访存带宽为96.99 GB/s,内存访问延迟仅约150ns。虚拟活跃页缓冲器结构能使64线程Stream Open MP程序访存带宽提高16.86%,NPB-MPI程序执行速度提升6%。(3)100Gbps光串行接口收发器技术及可扩展光交换技术针对目前高速互连芯片50Gbps串行接口在功耗密度、资源面积、信号完整性等方面限制因素,开展对100Gbps光串行接口收发器技术研究。基于近年来低插入损耗的硅光子开关获得突破进展,提出一种新的光路时分复用(OTDM)方案,利用级联高速光开关在光路上实现多路的分时复用和解复用,将多路低码率位流复用到单路高波特率光链路上,实现了100GBaud传输。通过引入暗调制模式统一传输链路上的信号幅度,解决跨时钟周期串扰问题,进一步实现5路25Gbps信号的分时复用,将单一波长光载波上实现的传输带宽进一步提升到125Gbps。其次利用光交换低功耗和高阶特性搭建大规模网络解决可扩展性问题。提出了一种基于阵列波导光栅路由器的高性能互连网络架构,通过波长聚合和波长复用构造嵌套分层次2D树拓扑架构,减少了系统所需波长总数,使用8个波长构造一个262144结点规模的系统互连。在一个100000结点的系统中,阵列波导光栅路由器(AWGR)互连网络所需的光纤和交换机数量只有胖树的50%和35%。总功耗仅胖树的40%左右。

其他文献

综合护理方式在胫腓骨骨折护理中的应用

目的观察在胫腓骨骨折护理中应用综合护理方式的临床效果。方法选取2012年8月至2015年7月来我院就医的胫腓骨骨折住院病患80例,将病患随机分为实验组和参照组,前者以综合护理

期刊

综合护理胫腓骨骨折护理满意度

滑移门平顺性的多目标稳健性优化设计

随着MPV车型的市场占有率逐步提高,滑移门作为MPV车型常用的一种车门形式越来越受到重视,其中作为滑移门特有的运动平顺性对滑移门整体性能有着直接的影响,因此需要在前期的滑移门平顺性设计当中,对其动力学特性进行分析与优化。本课题来源于某汽车研究院,论文将研究滑移门平顺性的多目标稳健性优化设计。论文的主要研究内容如下:(1)以某MPV车型的滑移门为研究对象,对滑移门运动系统的结构和特点进行分析,建立了

学位

滑移门平顺性多体动力学多目标优化设计稳健性优化

基于Ecopath模型的大亚湾增殖种类生态容量评估

大亚湾是我国南海北部典型的半封闭性海湾,因其自然条件优越、饵料丰富,栖息的鱼类种类繁多,是多种经济鱼类无可替代的产卵场、育幼场和索饵场。本研究首先结合历年来大亚湾生态系统环境与资源状况,分析了大亚湾生态系统历年的变化状况;以大亚湾南部渔业资源与环境调查数据为基础,研究了大亚湾鱼类资源的种类组成、物种多样性和资源量及其年际变化,分析大亚湾鱼类资源群落变化趋势,利用Ecopath with Ecosi

学位

增殖放流生态容量Ecopath模型大亚湾黑鲷

电力工程项目实施阶段的合同管理分析

电力建设项目的工程合同是对项目工期、项目质量以及项目投资的定义,同时对于工程合作方的权利、义务以及责任有着明确的规定,是建设双方的活动准则,并且具有一定的法律效力

期刊

合同管理电力工程项目实施阶段

小叶女贞籽油脂肪酸组成及对自由基的清除作用

以小叶女贞种子为原料,采用超临界CO2萃取小叶女贞籽油,用气相色谱-质谱联用技术（GC-MS）分析小叶女贞籽油的脂肪酸组成,并用分光光度法测定小叶女贞籽油对ABTS自由基和DPPH自由

期刊

小叶女贞籽油脂肪酸气相色谱-质谱联用自由基

浅论文化人类学与传播学的关系

文化人类学与传播学是一脉相承的两个学科,随着时代的不断发展,两个学科交叉融合,相互促进,不断向前发展。本研究对两个学科的关系进行探讨,梳理了两个学科交叉融合的历程,总

期刊

文化人类学传播学理论渊源交叉融合

公安机关执法普法一体化建设探究

"谁执法谁普法"普法责任制改革是新时代中国特色社会主义普法教育模式的重大理论创新,执法机关普法对内有利于提高执法水平,对外有利于营造全民守法的社会环境。公安机关执法

期刊

普法一体化路径

甲硝唑联合重组人表皮生长因子(rhEGF)预防拔牙术后干槽症的疗效观察

目的探讨甲硝唑联合重组人表皮生长因子(rh EGF)预防拔牙术后干槽症的疗效。方法下颌阻生智齿拔除病例800例,随机分为治疗组(400例),牙拔除后牙槽窝内植入甲硝唑联合rh EGF制

期刊

甲硝唑重组人表皮生长因子干槽症

地震后儿童创伤后应激障碍的症状及其治疗

地震灾害作为一种心理应激源与身心健康的关系早已引起了人们的广泛关注。在汶川大地震发生后,本文作者在广东省心理卫生协会心理咨询师专业委员会的组织下,赴四川什邡妇幼保

期刊

地震儿童创伤后应激障碍

分层导学,提高质量——论分层导学对高中政治教学的促进

优化政治课堂,让每一位学生都能获得学习和成长的机会,这是当前我国高中政治教师探究的重点问题。借助分层导学不但可以轻松实现上述目标,同时还能全面调动起学生的学习积极

期刊

高中政治分层导学促进方法

面向大规模HPC新型互连网络芯片体系结构与关键技术研究

与本文相关的学术论文