代价高效的容错片上网络关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：jsdhxmb

【摘要】

：

未来，单芯片集成的处理器数量将会达到数百甚至数千，处理器之间的通信量非常庞大。传统片上互连结构的可扩展性太差，无法满足多核芯片的通信需求。此外，随着CMOS特征尺寸的缩小，门

【作者】

：

陈延仓

【出处】

：

国防科学技术大学

【发表日期】

：

2012年期

【关键词】

：

片上网络路由器硬故障硬件级模拟虚拟输出排队容错路由算法通道切割任务映射

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

未来，单芯片集成的处理器数量将会达到数百甚至数千，处理器之间的通信量非常庞大。传统片上互连结构的可扩展性太差，无法满足多核芯片的通信需求。此外，随着CMOS特征尺寸的缩小，门延时明显降低，而线延时降低的幅度远低于门延时，导致线延时超过门延时。因此，必须精心设计全局互连线或者避免使用全局互连线。片上网络采用局部链路代替全局互连线，具有很好可扩展性，能够满足片上多核处理器通信需求。大于10%的晶体管可能因为工艺偏差等原因而发生硬故障。随着CMOS工艺特征尺寸的缩小，连线宽度变小，发生硬故障的概率增大。硬故障可能导致片上网络瘫痪。现有片上网络仅能容忍少量的硬故障，并且容错粒度较粗导致面积开销大。因此，设计代价高效的容错片上网络成为片上网络研究的重大问题之一。为提高片上网络的容错能力，本文从实现硬件级模拟开发平台着手，深入研究了路由器结构、容错路由算法、细粒度容错片上网络结构和容错任务映射算法，主要取得了如下研究成果：1.设计了一种面向片上网络的硬件级模拟开发平台HardSim。它集模拟和设计验证于一体，能够执行硬件级模拟，比微片级模拟描述更详细的硬件特征。它支持人工合成负载和真实应用程序踪迹模拟。它实现了两种故障注入模式，静态故障注入和动态故障注入。静态故障在模拟启动前产生并且载入网络。动态故障是在模拟过程动态产生并注入网络。2.提出了一种低延时共享输出缓存路由器SOBR。它具有5个重要特征：(1)虚通道(VC)位于输出端口，而不是输入端口；(2)虚通道交换器动态配置访问阵列，提高了可用缓存容量，提升了路由器性能；(3)支持跳步读操作的动态FIFO缓存结构，减少报文阻塞；(4)采用动态分层交换提升路由器性能；(5)所有类型的微片通过路由器的最小延时均为一个时钟周期。基于65nm标准单元库的综合结果表明，SOBR路由器的关键路径仅为24个逻辑门，延时约为0.64ns。由于流水线仅为1个周期，SOBR的平均延时显著低于其他路由器。在4×4mesh和均匀随机通信模式下，SOBR饱和吞吐率高达0.86微片/结点/周期。由于省略了VC分配器和交叉开关分配器等模块，SOBR的面积开销比相同缓存容量的经典输入虚通道路由器减少了9.4%。此外，定性分析结果表明，VC交换器有效提高了SOBR的容错能力。3.提出了一种高效的分布式容错路由算法PR-WF，并且将该算法用于SOBR路由器。PR-WF以西向优先转向模型为基础，采用动态伪接收（DPR）机制，动态启动或关闭向西转向，并且避免网络发生死锁。所谓DPR机制，指的是本地网络接口接收向西转向的报文并且将其转发到西向端口。本地网络接口需要FIFO缓存以存储向西转向报文。PR-WF采用特定优先权原则，为每个端口生成多条优先权队列，并且根据网络链路和邻居路由器端口状态，产生输出端口。PR-WF是一种基于逻辑的分布式容错路由算法，其面积开销远低于基于路由表的容错路由算法。PR-WF算法与网络尺寸无关，因此，具有更好的可扩展性。对于10%的链路故障率，PR-WF仅需废弃1.8%的完好链路就可以避免发生活锁。对于链路故障率为10%的9×9mesh，PR-WF平均跳步次数比最短路径仅增加了8.34%。综上，PR-WF路由算法是一种高效的分布式容错路由算法。4.提出并实现了一种细粒度容错片上网络结构SNoC。SNoC在通道切割的基础上，通过切片接口部件将切片之间相互耦合，使得网络能够以细粒度容忍硬故障。每个路由器包含4个切片，每条链路包含4个子链路和1个备份子链路。SNoC采用一种自适应切片接口部件，能够根据切片和子链路的状态为切片接口提供优化配置。切片均采用SOBR结构和PR-WF容错路由算法。模拟与分析结果表明，SNoC结构大幅减少了有效故障数量。即使在故障率较高的情况下，SNoC结构也取得很好的性能。基于65nm的综合结果表明，SNoC面积开销相比基于通道切割的片上网络增加了约1%。5.提出了一种低开销容错任务映射算法CMAP。现有任务映射算法大都是基于搜索的方法，速度慢，可扩展性差。构造算法根据最优解的特征，从无到有地构造近似最优解。优点是时间复杂度小，运行速度快。CMAP是一种面向任务映射的构造任务映射算法，能够感知拓扑结构，通过构造链表尽可能将权重较大的边映射到单跳步路由路径，或者优先将度数较大的结点映射到局部最优位置，解决了不规则拓扑的任务映射问题。通过两种真实应用和多种任务图对该算法进行了评估，证明了CMAP算法具有较高的准确性、效率、扩展性和容错能力。

其他文献

钢铁厂工业废弃物的综合利用

文章介绍了八钢近年来在工业废弃物综合利用方面做出的成绩 ,通过比较指出了与国内先进企业之间的差距 ,并提出改进建议

期刊

工业废弃物污泥钢渣

量子点系统量子关联和几何相点接触探测的理论研究

二十世纪之初,在试图对微观世界的物理现象进行描述时,人们发现已经完善的经典力学理论在解释微观实验现象时变得十分荒谬。人们逐渐意识到微观世界的运行规律和经典的宏观世

学位

Bloch主方程几何相位量子discord库仑相互作用粗粒噪声退相干点接触探测器

扩径延缝射孔技术在深层特超稠油油藏开发中的应用

冷家油田原油属特超稠油,储层埋藏深,物性差,部分油井热采注汽压力高,干度低,影响了吞吐效果.通过采取扩径延缝,增大射孔孔径,并利用解堵弹分段燃烧形成的脉冲高压对地层的造

期刊

扩径延缝射孔脉冲加载增压特超稠油注汽压力吞吐效果应用:冷家油田compound perforation pulse load boosting de

合同法在当代市场经济体系中的作用探析

我国于1981年颁布了经济合同法，1999年开始实行到现今，合同法已经成为我国用于合同的最基本、最重要的法律。它受到了海内外专家的一致好评，并且也经过了司法实践的雅阁检验，是我

期刊

合同合同法市场经济作用

突出重点突破难点提高小学数学教学有效性

在小学数学教学过程中,把握好重难点是提高教学有效性的前提,采用同化、类比、牵引、分解、化抽象为形象等教学方法是突出重点、突破难点,提高教学有效性的的关键。

期刊

小学数学教学突破重难点有效性

面向特征的SystemC模型产品线的开发和形式化功能验证技术研究

随着芯片系统的功能日益复杂,上市时间却越来越短,越来越多的芯片系统希望实现为片上系统(SoC)。SoC是指集成有包括微处理器、存储器等各种硬件模块,以及运行于它们之上的嵌

学位

面向特征的编程SystemC事务级模型软件产品线形式化功能验证组合安全性验证micMac自动机属性保持

试论马桥文化鸭形壶的来源与传播

此文首先通过马桥文化鸭形壶的特征与中原二里头遗址发现的一件鸭形鼎相比较,指出尽管两地的器物整体造型相近,但检索二里头文化至今鸭形鼎仅出土过一件,显然不是其典型器物,

期刊

马桥文化长江下游地区提梁壶黄土仑二里头遗址二里头文化

超市与消费者、农业企业的利益均衡——基于不完全契约与博弈论的分析

在机会主义等假设条件下,超市与消费者的利益均衡取决于消费者维权成本和超市罚金的高低;超市与农业企业的子博弈精炼纳什均衡是双方在经济原则下行为相机调整的结果。增强消

期刊

超市农业企业消费者不完全契约博弈论

阿奇霉素抗感染作用在儿科的应用研究进展

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

会议

阿奇霉素抗感染

代价高效的容错片上网络关键技术研究

与本文相关的学术论文