论文部分内容阅读
集成电路工艺技术日新月异的发展,极大地提高了芯片集成度,基于传统总线的片上系统(System on Chip,SoC)架构的诸多弊端日趋突出,片上网络(Network on Chip,NoC)架构应运而生。其中,资源应用需求作为NoC系统发展的核心动力,对系统总体性能提出了更高的要求,使NoC系统规模逐年增长。但由于芯片特征尺寸的降低,内部功耗密度的增大以及芯片面积的限制,导致NoC芯片的内部缺陷逐渐增多,严重影响到系统运行时的性能和可靠性,设计故障感知的资源管理方案刻不容缓。因此本文以NoC系统为背景平台,重点研究NoC故障模型并进行相应的故障建模工作,针对NoC系统故障、性能和功耗多优化目标下的任务管理问题,分别设计了基于故障模型的NoC容错映射算法,以及具备故障感知能力的NoC低功耗动态任务映射方案。首先,本文通过对NoC故障原理进行分析,以及对NoC生命周期故障模型进行改进的基础上,建立了基于NoC拓扑结构的角落(Corner Router,CornerR)、边界(Side Router,SideR)和中间(Middle Router,MiddleR)三类路由器故障模型,并根据故障节点的位置及方向、故障节点的数量等进行了进一步的分类研究;同时还建立了NoC横向和纵向两类链路故障模型,并结合任务映射问题进行了详细的分析研究。然后,在研究国内外现有感知故障的NoC容错方法,建立运用于本文研究的映射平台,以及建立相应的映射算法性能评估体系的基础上,本文设计了一种基于故障模型的NoC容错映射算法FMA(Fault-tolerant Mapping Algorithm,FMA),旨在针对本文提出的三类路由器故障模型和两类链路故障模型进行容错。在算法设计中,提出了基于宽度优先遍历的考虑多优先级的优化任务排序算法,旨在映射准备阶段优化网络通信性能;设计了考虑邻居节点故障情况的首节点优化方法,以完成映射区域选择的优化;在进行任务映射时,对故障区域进行避让来实现容错功能。该算法面向具体的故障模型进行容错,具有较强的针对性。紧接着,通过分析现有任务映射算法缺陷和不足的基础上,本文建立了一种新型的基于备用核技术的故障模型;基于备用核故障模型并以NoC系统故障、功耗和系统性能为多优化目标,本文设计了故障感知的低功耗动态任务映射方案FLDMA(Fault-aware Low-issipation Dynamic Mapping Algorithm,FLDMA)。在算法设计中,提出了最小映射区域选择方法,旨在降低网络的拥塞程度,来提高NoC系统的通信性能;设计了首节点优化策略,并考虑了节点故障率来优化备用核数目及具体位置,对映射区域的选择进行了优化;在进行动态任务映射时,提出了一种实时感知NoC系统状态、并根据发生故障节点的状态来设置备用核的数量和具体位置、实时进行任务迁移的映射方案,在不影响已运行应用的基础上,尽最大可能地降低故障对运行应用的影响,并降低NoC系统的通信总能耗。最后,通过所搭建的NoC仿真平台,对本文提出的算法和方案分别进行仿真验证及评估。结果显示,本文第三章提出的FMA容错映射算法与当前较优的容错映射算法相比,其平均网络发包延迟有近19.8%的优化,网络吞吐量有近27.7%的优化,表明其具有较好的容错和系统性能优化能力;本文第四章提出的FLDMA故障感知低功耗映射方案具有较好的整体性能,与当前较优的故障感知映射算法相比平均加权曼哈顿距离AWMD值优化了近11.2%,平均网络发包延迟有近5.8%的优化,网络吞吐量优化了近5.1%,NoC系统的能量利用率有了近1.32%的提升。说明FLDMA算法具有较好的性能优化,能够及时感知故障并使用备用核技术来进行任务迁移,使NoC系统的网络通信性能达到一个较优的状态,从而实现了对NoC系统故障容忍度、功耗和系统性能的多优化目标。