基于SMP的CC-NUMA类大规模系统中Cache一致性协议研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:cxdong54321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对高性能计算需求的日益增强,对高性能计算机的架构与实现提出了越来越高的要求。提高系统的可编程性、可用性和系统综合效能,成为当前高性能计算机的设计目标。分布共享存储多处理机系统以其方便的编程环境和较好的可扩展性而成为高性能计算机体系结构发展的主流,CC-NUMA(Cache Coherent Non-UniformMemory Access)结构成为高性能计算领域实现高效能的重要体系结构。构造大规模CC-NUMA系统受诸多因素制约,其中Cache一致性协议是限制系统可扩展性的关键因素,同时也对系统性能产生重要影响。由于Cache一致性实现的复杂性,当前多数CC-NUMA系统规模较小,可扩展性有限。许多高性能计算平台利用CC-NUMA计算机构建集群,但这样严重影响了大系统的可编程性。因此为大规模CC-NUMA系统设计扩展性好、简洁高效的Cache一致性协议十分必要。本论文主要工作是针对基于SMP(Symmetric Multi-Processors)结点的大规模CC-NUMA新系统——SCCMP(Scalable Cache Coherence Multi-Processors)的要求,分析其体系结构特点,设计了可扩展、低复杂性和高效的Cache一致性协议,设计了可扩展的目录结构,实现并优化了与Cache一致性处理紧密相关的目录访问,提供了Cache一致性的高效消息传递通信支持,最后验证了协议的正确性及高效性。论文的具体工作和创新点如下:(1)研究了SCCMP的构成层次和结构特点,设计和实现了可扩展、高效的混合Cache一致性协议——HYSCC(HYbrid Scalable Cache Coherence)协议。HYSCC协议通过融合监听协议特点的可扩展目录协议实现,有效支持了SCCMP系统内部两个不同层次的Cache一致性实现要求,降低了协议设计的复杂性,实现协议的简洁高效。HYSCC协议通过多虚信道网络传输技术、非阻塞并发处理和精简协议消息类型等技术实现协议自身的高效性。HYSCC协议增加一类专门处理SMP结点内部脏数据共享的命令类型和协议处理方法,降低了SMP结点因内部共享导致脏数据副本写回所带来的协议处理复杂性,大大简化了SCCMP结点控制器内部协议设计的复杂度。(2)通过分析SCCMP系统中分布共享I/O访问对系统Cache一致性实现的影响,在HYSCC协议中设计和实现了支持I/O属性访问的Cache一致性命令类型和协议处理流程,设计和实现了I/O访问数据一致性的硬件维护机制,高效实现了全局共享I/O的并发访问。(3)研究了目录结构的可扩展实现方法,设计了符合SCCMP系统特点的有限指针(Dir5NB)和组合粗向量CCV(Combined Coarse Vector)的混合表示——Dir5NB+CCV的目录结构。该目录结构兼具指针和位向量表示的优点,在不同共享度时采用与之对应的共享信息表示格式,合理地减少了目录存储的开销。Dir5NB+CCV通过混合的多元化表示,在一定程度上降低了共享信息的非精确性,减少多余的失效开销,并且利于高速的硬件实现。(4)为缓解因目录访问而带来的数据访问冲突,设计了双体并行访问存储器结构和双目录Cache访问结构,优化目录访问和处理。SCCMP系统没有采用单独的目录存储器,利用双体并行访问存储器结构使得存储数据和对应目录的访问并行进行。为缓解由此带来的存储器访问压力,设计和实现了与双体并行访问存储器对应的双目录Cache结构,引入目录Cache访问层次,利用程序访问的局部性对目录访问进行优化。实验结果验证了双体并行访问存储器和双目录Cache结构对性能有大幅提升作用。(5)为高效支持消息传递编程模型,研究了在SCCMP系统中有效实现共享存储和消息传递相结合的通信方法,提出了层次的一致性消息通信模型。在SCCMP结点控制器一级提供消息传递通信接口,实现了无死锁的消息通信协议,实现了基于硬件的一致性块传输机制,支持高效的消息传递通信。(6)基于FPGA实现完成了SCCMP结点控制器的逻辑设计和协议验证。在四个结点的FPGA原型系统上进行NAS NPB等应用测试,验证了HYSCC协议的正确性。用ASIC实现了验证后的SCCMP结点控制器,并在64结点的ASIC原型系统上进行了性能测试。测试结果表明NAS NPB等应用运行正确;EP、SP、FT、MG等对存储带宽要求很高的应用在ASIC原型系统上呈现出良好的可扩展性;通信测试表明点点通信最大带宽在1.3GB/s以上,应用测试最大带宽在1.1GB/s以上,基于硬件一致性块传输实现使NPB MPI应用测试获得了更高的性能。(7)本研究成果适用于基于SMP超结点的CC-NUMA类型的大规模系统,并已在某重点工程中得到成功应用。
其他文献
《中共中央关于全面深化改革若干重大问题的决定》(以下简称《决定》)提出,紧紧围绕建设美丽中国深化生态文明体制改革,加快建立生态文明制度,健全国土空间开发、资源节约利用、生
研究了捕食者与食饵均具有线性密度制约的Ivlev型捕食模型的平衡态问题,寻找两种群能够共存的条件.利用线性算子的特征值理论、扰动理论和分歧理论,以扩散系数为分歧参数,证
基于泰勒级数展开法提出了求解一维定常对流扩散方程非均匀网格上的高精度紧致差分格式,该格式具有3~4阶精度.通过对边界层和大梯度问题的数值实验,验证了该方法的精确性和有效性
2015年7月及8月对甘肃省迭部县多儿国家级自然保护区鸟类群落结构及多样性进行调查.结果显示保护区分布有繁殖鸟类8目29科95种,在沿海拔梯度分布的4类生境中,阔叶林中鸟类多
膀胱肿瘤是泌尿生殖系统中最常见的肿瘤,近年来发病率有上升趋势,对于浸润性膀胱癌,由于恶性程度较高易复发和远处转移,常采取膀胱全切,对其有较好的疗效,可明显提高生活质量。但是
研究一类四阶非线性泛函差分方程的周期解和次调和解的存在性..首先建立四阶差分方程的变分泛函,然后将四阶差分方程周期解和次调和解存在性问题转化成相应的泛函临界点的存在性
微生物燃料电池(MFC)的阳极对提高MFC产电性能有至关重要的影响.利用竹炭比表面积大、吸附能力强等特性,将其作为“三合一”膜电极MFC的阳极填充材料,通过增大阳极比表面积来提
医疗废物中含有大量病原微生物,具有高传染性、难降解性和其他危害性,在国外被视为“顶级危险”废物。近年来,新闻媒体不断曝光医疗废物丢弃、堆积、买卖事件,影响了医疗机构
Internet短短二十年的发展所达到的地位和其产生的影响都不同于本世纪和上世纪所提出的任何一种技术。随着网络应用范围的迅速扩大和应用程度的深入,Internet变得越来越庞大,越
膀胱癌是泌尿系统最常见的肿瘤。其中上皮性肿瘤占95%以上。高发年龄为50-70岁,男女比例为4:1。目前手术治疗是膀胱肿瘤最主要的治疗方法。术后应用膀胱药物灌注,通过抗癌药的细