高效的片上网络体系结构:核内路由

被引量 : 0次 | 上传用户:Eryuelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着生产工艺的不断改进,单芯片多处理器(Chip Multi-Processor,CMP)成为了提升计算机性能的主要途径。核心数量的不断增多,核间通信量的不断增大,使得越来越多的研究者从片上网络(Network on Chip,NOC)出发研究核间通讯。目前NOC上的研究大部分集中在对路由器各个部件的性能优化方面,这些研究都是以路由器位于处理核心外部为基础,未能充分利用NOC各处理核心所具有的存储、带宽等资源。本文通过对路由器内部存储的研究,针对处理器核具有一定的片内存储、丰富的片内线宽资源的特点,将路由器集成到处理核心内部。这样可通过对缓冲区的加速、对数据包传输过程的优化,形成高效节能的核内路由。本文首先分析了片上网络与现实中的宏网络(Macro Network)的差异性,然后对路由器的内部缓存进行了分类和研究,提出了一种将片上网络路由器集成到处理器核心内部,以提升片上网络性能的解决方案。同时本文实现了片上网络核内路由器设计,将该路由器集成到每一个单独的核中,并利用处理核心片内存储,以及路由在核内执行的特点,对缓冲区的使用与数据包的传输提出了四种优化策略(发送Buffer优化策略、退出Buffer优化策略、提前发送Head Flit策略和消除Tail Flit策略),以降低网络的平均延迟和能耗。模拟实验表明,发送Buffer优化和提前发送Head Flit优化策略在Buffer深度较高时可以有效地提升网络的性能,最好可以降低24.3%的平均延迟和9%的网络能耗。在Buffer深度较低的情况下,混合使用退出Buffer优化、消除Tail Flit优化的改进方案,最终可降低30.5%的平均延迟和37.8%的网络能耗。据测算,本文提出的核内路由体系结构,可以比传统片上网络节省9.3%的芯片面积。综上所述,本文提出的片上网络核内路由解决方案——将路由器集成到处理器核内,以及相应的四种优化措施是可行、高效的,不但节省了芯片面积,而且有效地降低了网络的平均延迟和能耗。
其他文献
高职高专学生英语写作能力培养一直是困扰大学英语教学的关键问题。作者通过采用"主题合作式"教学法来进行英语写作教学改革的尝试,该方法不仅能有效提高学生的写作水平,而且
运用委托——代理理论分析了股权激励对公司绩效的作用机理,提出了股权激励对公司绩效显著正相关的假设,并以我国上市公司为样本,用多元回归模型进行实证分析。实证结果表明,
文章用几个焊接结构实例,分别讨论了合理配置热源;采用热对称结构;双层壁结构和开胀缝等减少热变形的措施。图6幅。
大学生是社会生活当中最活跃的元素,高校也因此而成为我国思想政治教育的前沿阵地。从工作实践来看,高校辅导员思想政治教育工作的实效性受辅导员、大学生和沟通途径三个方面
近年来,中职学校的物流专业得到了飞速发展,物流专业也陆续开发了多项实训教学,其中尤以叉车实训最为普遍,且最受学生、学校以及企业的重视。本文从叉车教学过程中需要注意哪
本文就Alex Gilmore的Authentic Materials and Authenticity in Foreign Language Learning进行了评介。在简要回顾了真实性这个模糊的概念之后,文章就四个主要问题展开了讨
目的探讨老年类风湿关节炎(RA)并发间质性肺病的临床特点、实验室、肺功能、影像学检查,加深对RA肺间质病变的认识。方法回顾我院2003年1月至2008年4月期间26例RA并发间质性
动物疫情报告和统计是一项十分重要的工作,是上级部门制定政策、了解情况最基本的依据,其在动物防疫工作中的地位和作用重大。近年来,党中央、国务院各部门对这方面的工作要求越
本文针对考虑水影响的沉管隧道振动台实验,基于相似理论,对实验设计中涉及的主要相似比进行了推导。基于矩阵方法采用量纲分析推导相似比。本文的研究成果,为后续进行沉管隧