三维多核处理器存储关键技术研究

被引量 : 0次 | 上传用户:fitye228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着芯片集成度的提高,数字集成电路出现了两个重要的发展趋势:由利用指令级并行的单核处理器向利用线程级和数据级并行的多核处理器发展,由传统2D集成电路向多层堆叠的3D集成电路发展。存储子系统是片上多核处理器的最重要组成部分之一。片上存储器不但占用了大量的芯片面积和功耗开销,而且影响着多核处理器的性能。随着芯片上集成核数的增多,处理器核处理能力的提高,对并行数据访问的需求也将不断增大。传统单核处理器系统中的“存储墙”问题在多核处理器领域仍然存在,并且有进一步加剧的趋势。将片上多核处理器与3D集成电路技术相融合,通过堆叠高速缓存和主存到处理器层之上,并利用大量的层间垂直互连以增大存储带宽,可以减少存储器的访存延时,提高多核处理器的性能。3D集成技术有希望解决多核处理器“存储墙”问题。本文就是围绕着3D多核处理器存储系统设计问题,从该领域的若干关键问题入手,研究了两种有代表性的3D多核处理器:3D通用多(大核)处理器(Three Dimensional Chip Multi-Processor,3D CMP)和3D通用(众核)图形处理器(Three Dimensiona General Purpose Graphics Processing Unit,3D GPGPU)的存储架构及控制策略。试图找出3D多核系统的瓶颈,并改进其整体性能。论文主要包括以下几部分:本文研究了堆叠最后级缓存和主存对3D CMP性能的影响。针对网格(mesh)结构的3D多核片上网络(Multi-core Network on Chip,McNoC),提出了一种紧密集成的非均匀缓存架构(Tightly Mixed Non-Uniform Cache Architecture, TM-NUCA)。相比直接堆叠NUCA的3D CMP,采用TM-NUCA结构的3D CMP能最大提升31.71%的系统性能,并可最多减少15.74%的网络通信功耗。集成主存的3D CMP可采用非均匀存储访问(Non-Unform Memory Access, NUMA)架构。本文面向3D CMP,设计了一种可扩展的NUMA结构,片上主存被分为私有、共享及特殊目的存储器,并分布于多个处理器节点上。其中私有存储器访问延时不随处理器数量的增加而增加,对共享主存的访问延时取决于处理器与数据的相对距离。为了实现多处理器对共享存储器的协同并行访问,讨论了同步和存储器同一性的实现。通过实验验证,该分布式NUMA结构可有效支持3D多处理器对存储器的并行访问,并提供高效的系统加速比。高速缓存利用了数据的空间局部性和时间局部性,减少处理器对慢速存储器的访问,降低平均访存延时。当多处理器的缓存保持共享数据时,会带来缓存不一致的问题。因此缓存一致性是多处理器存储系统的重要研究课题。本文实现了一种基于微代码的软硬件结合的缓存一致性方案。并进一步提出了面向大规模3D CMP的基于簇的层次化一致性协议。通过分析,该协议相比扁平目录的一致性,具有更小的通信和目录存储开销。GPGPU是目前及未来有前途的众核处理器。本文分析了访存延时对GPGPU应用的影响,进而提出了堆叠主存的3D GPGPU架构设计。实验表明,相比2DGPGPU,堆叠主存的3D GPGPU可最大提升124.1%,平均提升55.8%的系统性能。通过功耗分析,堆叠主存的3D GPGPU比2D GPGPU有更好的存储系统功耗效率。通过热量分析,3D GPGPU的运行温度介于60到85摄氏度之间,属于3D集成电路可接受的温度范围。据我们所知,这是第一个从性能、功耗和温度方面研究堆叠主存的3D GPGPU架构设计。不同GPGPU应用对本地存储器(包括寄存器、共享存储器、1级高速缓存)有不同的需求。本文面向3D GPGPU提出了一种可重构的本地存储器系统。以GPGPU应用的内核为粒度,动态的将重构存储器配置成寄存器、共享存储器或1级数据缓存。通过实验验证,采用可重构存储器的3D GPGPU可有效的提升系统性能,相比未采用重构存储器的参考3D GPGPU’性能最大提升52.22%,平均提高15.87%。随着3D GPGPU本地存储空间的增大,部分应用分配到不同流处理器上的负载会变得不均衡。为了解决这个问题,本文进一步提出了一种Greedy-Lazy混合线程块调度策略。该调度策略分为Greedy和Lazy两个模式,在Greedy模式下可充分利用本地资源以提高系统性能,而当任务分配可能出现不均衡时,切换到]-azy模式以降低潜在的任务调度不均衡性。通过实验,Greedy-Lazy混合任务调度策略可以有效的降低任务分配的不均衡性,提升3D GPGPU的整体性能。
其他文献
毛泽东工业化思想是建立在科学的理论基础上的,这个基础就是马克思列宁主义工业化理论。毛泽东继承了马克思恩格斯关于落后国家要独立自主地探索适合本国国情的工业化道路的思
互联网进入了Web2.0时代,信息技术的快速发展使网站、微博、博客、微信等社会化媒体发挥着越来越重要的作用,全球经济开始进入了信息化时代,消费者的消费环境与方式都发生了
根据商圈、顾客群及消费购买习惯以及服务差异化等,药店可以细化为便利性店、药妆店、健康美丽店、专业性药学服务药店、综合性药店等几种类型,连锁企业可以结合自身门店的顾
<正>1月5日,北京市疾病预防控制中心称,北京已进入以甲型H1N1流感病毒为主导毒株的流感活动高峰期,未来一段时期内将维持在较高的流感活动水平,预计将会持续到春节。2009年曾
期刊
研究目的:现有的加速跑训练和教学方式存在着很多不足,传统的训练方法只重视运动员身体单独部位的训练,忽视了运动员动力链能量传递的作用,导致了运动员尽管力量素质很好,却在
目的探讨三阴型乳腺癌(TNBC)临床病理特征及预后。方法选择2003年4月至2008年12月在该院进行治疗的乳腺癌患者539例,对其病理资料中的临床病理特征、5年生存率以及预后进行分
教师论文写作既有形式结构,也有实质结构。其形式结构由题目、署名、摘要、关键词、正文与参考文献等构成,而其实质结构则是由研究问题、新颖观点与分析论证等构成。教师论文
运用调查、逻辑思维和实践等方法,对足球专修课程改革进行了深入的研究.认为在修订教学大纲时首先必须对足球专修课程予以准确定位,包括课程目标、层次、特色定位;教学大纲修
由于我国企业在管理中针对于绩效考核这项工作产生了一系列的问题,本文对此深入探讨我国经济情势下房地产行业企业管理中的人力资源管理,以我国当下的各行业各类型企业为对比
抢劫罪是指以非法占有为目的,以暴力、胁迫或者其他方法,强取公私财物的行为。该罪在社会生活中案发率极高,且在具体司法适用上存在诸多难题,值得我们深入研究。文章行文近4