面向众核通信的高效能片上路由架构及其优化技术研究

来源 :国防科学技术大学 | 被引量 : 1次 | 上传用户：lifengjun001

【摘要】

：

技术进步和应用需求推动着微处理器设计进入“多核”甚至“众核”时代。“众核”环境下核间通信规模的日益增大、面积与功耗约束的愈发紧迫、故障发生概率的持续增长均对片上

【作者】

：

汤先拓

【出处】

：

国防科学技术大学

【发表日期】

：

2017年01期

【关键词】

：

众核通信片上网络路径预构时空局部性环回传输容错路由低开销死锁恢复

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

技术进步和应用需求推动着微处理器设计进入“多核”甚至“众核”时代。“众核”环境下核间通信规模的日益增大、面积与功耗约束的愈发紧迫、故障发生概率的持续增长均对片上通信架构在其可扩展性、性能、面积和功耗开销、可靠性等方面提出了更高的要求,传统的片上互连方式由于自身固有的局限性已无法满足当前以及未来片上高速增长的通信需求。为有效适用片上通信环境与通信需求的变化,NoC技术应运而生,并以其优良的可扩展性、低延迟、GALS时钟特性、较高的带宽和较强的可重用性等优点而成为当前众核系统片上核间通信的范例。然而,工艺技术和应用环境的持续变化使得NoC亦面临着愈加严峻的性能、面积、功耗和可靠性等方面的挑战。本课题即针对NoC面临的上述挑战,围绕NoC内部片上路由架构的高效能实现及优化技术来展开一系列相关研究,为未来众核微处理器的发展提供高效能的通信支持。论文主要工作及创新点如下:(1)面向消息往返通信性能优化的返程路径预构机制大规模多核、众核微处理器往往需要采用一定的Cache一致性协议来维持共享数据的一致性和完整性。在Cache一致性协议作用过程中,应用通信将以一定的概率呈现出一种消息往返通信模式。针对消息往返通信模式下报文网络传输过程的专门优化处理,目前国内外尚未发现相关研究成果或文献。为此,本文围绕消息往返通信模式下应答报文的路由传输过程展开专门优化,构建了一种适用于应答报文传输优化的返程路径预构机制(BRPCM)。BRPCM机制的基本思想是在请求报文网络传输的同时在其经历的各中间路由器内部分别预构一条适用于应答报文优化传输的返程路径,在相应的路由算法、虚通道分配管理、路径重用与终止机制的支持下,以期实现后续的应答报文甚至其他报文在满足相应匹配条件的情况下可以直接利用返程路径执行交叉开关的传输,进而旁通部分路由流水站(SA),加速报文的路由传输进程。人工合成负载以及真实应用踪迹负载通信下的实验结果表明:BRPCM机制在降低报文传输延迟以及提高网络吞吐率等方面相较于其他传统片上路由器结构均具有明显的优越性。(2)面向时空局部性通信性能优化的热点路径预构机制应用程序通信中报文在网络中传输时均会呈现出一定的时空局部性通信特性。传统的路径预构方法针对通信的时间局部性特性提出了一种伪电路机制(Pseudo_Circuit)用于加速报文在路由器内部的传输进程,但该方法在网络通信初始阶段以及网络注入率较大时均会存在着预构路径有效率以及重用概率不高、通信性能提升有限等问题。针对这一问题,本文首先针对维序路由模式下报文网络传输的空间局部性特性,提出了一种面向空间局部性通信优化的直通路径预构机制(SFRPM)。在此基础上,综合考虑应用通信的时空局部性通信特性,构建了一种适用于时空局部性通信优化的热点路径预构机制(HRPCM)。HRPCM机制可根据路由器各输入输出端口的实时通信状态实现热点路径在伪电路与直通路径之间的动态切换,以期提高预构路径的有效率以及重用概率,进一步降低报文平均延迟。人工合成负载以及真实应用踪迹负载通信下的实验结果表明:HRPCM机制在降低报文平均延迟以及提高网络吞吐率等方面相较于传统片上路由器结构以及路径预构方法均具有明显的优越性。(3)基于故障端口环回传输的细粒度容错路由算法VOQ缓存机制下各输入端口的VC仅能为特定的输出端口服务以及VC与I/O通道之间具有紧耦合关系的固有特性,使得VOQ路由器的通信性能以及容错效率非常敏感于节点内部VC以及I/O通道的故障。传统的容错路由策略由于难以有效适应VOQ缓存下对于节点内部VC和I/O通道故障的细粒度容错需求,存在资源利用率低、容错性能有限等问题。为此,本文围绕基于VOQ缓存的片上路由架构的容错设计,首先根据VOQ缓存的特点构建了一种细粒度网络故障模型,将节点故障细化至节点内部的VC和I/O通道层面。在此基础上,我们提出了一种基于故障端口环回传输的容错路由算法(FFR_FPLT),其通过利用输入故障链路端口中被废弃的正常VC和通道资源来克服节点内部部分通道故障对于网络性能造成的消极影响,以期提高网络资源利用率以及容错性能。人工合成负载以及真实应用踪迹负载下的实验结果表明:FFR_FPLT机制相对于传统容错路由策略能以相对较小的硬件开销换取报文最优输出端口转发概率、网络吞吐率、报文延迟和平均跳步数等网络性能的较大提升。(4)面向低开销NoC的单向Mesh网络架构对于可扩展的多核、众核微处理器系统,设计复杂度、面积和功耗开销已成为其片上互连架构设计的主要限制要素。为了克服功耗和面积开销的不利影响,本文提出了一种面向低开销NoC的单向Mesh网络架构(UniMESH),以此来实现一种低开销和低复杂度的网络架构。相对于传统的2D-mesh网络架构,UniMESH架构简化了路由器结构设计,仅使用半数的路由通道来构成一个全相连的拓扑网络,并采用了全新的路由算法和死锁恢复策略来维持网络性能。由此,UniMESH能够有效减少NoC设计的复杂性和面积开销,同时显著地降低不必要的功耗。实验结果表明:UniMESH相对于Ring架构在平均延迟、总功耗等方面均具有明显的优势;而相对于2D-Mesh架构可节约57.4%的路由器面积开销以及39.3%的总功耗,并仅增加4.5个时钟周期的额外延迟。

其他文献

海洋赤潮藻球形棕囊藻在氮磷富营养下的细胞增殖(英文)

利用常见海洋赤潮微藻球形棕囊藻(Phaeocystis globosa)为试验研究材料,以f/2海洋微藻营养液为对照(1P1N:磷质量浓度为5×10-3g·L-1,氮质量浓度为75×10-3g·L-1),设置3组富

期刊

球形棕囊藻(Phaeocystis globosa)细胞增殖磷氮

基于CAN总线的船舶机舱监控系统的设计与实现

随着船舶工业的发展,舰船测控技术不断提高,各种智能传感器被广泛应用于机舱监控领域。以现场总线为基础的分布式监控系统已成为船舶自动控制领域的发展方向。本文使用以太网

学位

船舶机舱监控CAN总线以太网冗余ST32

明清时期汉江流域中药材地理初探（1368-1911）

南北朝至清代,汉江流域作为防己、雷丸、千年艾、黄精、厚朴、绿毛龟、白花蛇、贝母、穿山甲等动植物药材的地道产区,享有极高声誉；石斛、枳实、鹿茸、麝香等常见药材在唐代以

学位

中药材分布贸易

深圳体育赛事取向研究

本文运用文献资料法、专家问卷法等,在对“影响城市体育赛事取向”内外环境因素确定的基础上,运用SWOT分析方法,对深圳个案研究分析,归纳得出如下结论：1.深圳体育赛事取向受城

学位

深圳体育赛事SWOT分析取向

促进我国中小企业发展的税收优惠法律问题研究

随着世界各国经济的飞速发展,中小企业在各国国民经济中日益占据更加重要的地位。事实证明,中小企业这股促使经济增长的强劲力量,不仅在国民经济中发挥着巨大作用,在社会生活

学位

中小企业税法税收优惠税收征收管理税收法定原则

医保处方监控系统的设计与实现

随着上海市医疗保险覆盖面的不断扩大,各医院门诊医保处方数量急剧增加,对医保处方监控能力的要求越来越高。面对每天成千上万张的医保处方信息,传统的医院信息系统已经无法

学位

社区医院医保处方监控数据挖掘

无核荔枝采前落果原因分析及应对措施

无核荔枝采前落果现象十分普遍,是影响该品种发展的主要制约因素.本文分析了影响无核荔枝采前落果的主要原因,包括品种特性、树体营养、水分管理、天气影响及病虫害防控等

期刊

无核荔枝采前落果应对措施

Tat融合蛋白制备和初步长期毒性研究

目的:制备HIV-1 TatE-pET32a融合蛋白,研究Tat融合蛋白(Tat Fusion Protein, Tat-FP)与弗氏佐剂乳化对SD大鼠的免疫原性和毒性反应,明确Tat-FP的毒性反应的严重程度和可逆性,

学位

Tat融合蛋白HIV-1疫苗安全性评价SD大鼠

红旗渠成为旅游胜地

被誉为“人造天河”、“世界第八奇迹”的河南省林县红旗渠,如今又增添了旅游功能。自1991年起,林州市(原林县)先后对红旗渠景区进行全面规划和建设,以旅游的眼光整

期刊

旅游胜地红旗渠旅游功能

电力营销反窃电技术及解决策略

当前,我国存在很多电力用户窃电的情况,但是有关部门由于缺乏有效的经营管理方式,造成全国每年被窃电电量越来越多,进而使得电力企业的经济利益受损,导致供用电秩序混乱,造成

期刊

电力营销反窃电技术解决策略

面向众核通信的高效能片上路由架构及其优化技术研究

与本文相关的学术论文