分片式流处理器体系结构

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:rinimalebi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纳米工艺所带来的功耗、线延迟和设计复杂度等问题制约了处理器体系结构的发展,分片式结构设计是解决这些问题的一种方法。分片式流处理器作为一种面向数据密集型应用的处理器结构,可以利用摩尔定律的发展带来的丰富而廉价的晶体管资源,实现处理器结构的可扩展。分片式结构设计的基本思想是将计算、存储和互连资源组织成片式的基本结构单元,这些片式单元是相对简单的、分布式控制且可重用的;大量的片式单元由高能效、可扩展的片上网络连接起来。分片式流处理器的性能是否也具有可扩展性依赖于其支持的编程模型、片上存储层次、片上互连网络以及计算模型。本文分别从分片式流处理器的计算模型、指令系统、体系结构、流编程模型映射四个方面开展研究。主要研究内容和成果包括以下四个部分。(1)研究了类数据流计算模型的原理,提出了一种适合组织分片式流处理器中计算资源的单块多数据(Single Block Multi Data, SBMD)计算模型,设计了支持此计算模型的指令系统DISC-D。SBMD指在一个超块内部处理多份数据,每份数据根据自己对应的数据流依赖关系执行。谓词技术把程序中每份数据所对应的控制流依赖转化为数据流依赖,在超块内部消除控制流转移,这样每份数据可以按照不同的控制流路径执行。SBMD模型支持程序中循环体间显式的消息传递。(2)设计了一种分片式流处理器体系结构TPA-PD。TPA-PD采用类数据流驱动的计算模型来组织计算资源,使用软件管理的片上存储层次开发应用中的数据局部性。TPA-PD采用分片式的设计思想,使用多个片上互连网络把片上的各种资源互连起来。(3)设计并实现了流编程模型在TPA-PD上的映射。TPA-PD支持流编程模型StreamC/KernelC。StreamC/KernelC是为Imagine流处理器开发的,为了能在TPD-PD上运行StreamC/KernelC语言编写的代码,我们实现了流级翻译器和kernel级二进制翻译器,把在Imagine平台上的流级指令信息和kernel级微码翻译到TPA-PD平台上,翻译后的代码膨胀率小于2。(4)实现了TPA-PD的软件模拟环境,并评估了类数据流驱动计算模型及TPA-PD体系结构设计的有效性。文章讨论了物理块资源、计算资源、网络资源的可扩展性,分析了流访存部件的参数设置,提出了优化单个超块执行时间的机制,研究了指令调度算法对程序性能的影响。通过在模拟器上做实验,我们发现TPA-PD在结构可扩展的同时,性能上超过集中控制计算资源的流处理器。
其他文献
本试验通过饲养试验和消化代谢试验,研究饲粮中不同粗蛋白质水平对莱芜猪生长性能、血清生化指标、营养物质表观消化率以及体内蛋白质沉积的影响,建立各阶段蛋白质需要量析因
考总复习是高中教学的一个重要环节,它是在学生学完了中学的全部内容之后,进行的一次系统地、全面地回顾与整理、以达到将各部分知识进行有机的整合、构建知识的结构体系、形成
测绘工作是我国现代城市建设中不可分割的部分,测绘质量的好坏不论是对当前我国国民经济的发展,还是对我国社会主义的可持续进行都起着极其重要的作用。在开展测绘工作时,所测得
技工教育是在义务教育的基础上培养大量技能型人才与高素质劳动者,本文就当前技师院校物理课堂存在的问题进行分析,并提出改进的办法,以及就如何提高课堂教学效果进行说明。
要让学生喜欢体育,热爱体育,就需要教师创设和谐互动的体育课堂,让学生积极主动地参与到课堂当中,培养兴趣,激活思维,实现新课堂教学的多维目标,从而提高课堂教学的实效。
唐代及其前期人物绘画的本体理论主要是指这一时期基于人物绘画的审美心性和生命体征而生成的切入艺术本体的认识论和方法论。因为唐代及其前期是中国古典人物绘画的建构时期
手机的出现在为大学生提供便利发挥积极作用的同时,手机铃声、手机游戏、手机搜索等功能也对大学生课堂造成了消极的负面影响。本文针对大学生课堂使用手机做了积极影响与消极
从课程教学改革的角度出发,运用SolidWorks软件并结合多媒体技术进行教学,讲解机械制图教学中的重点、难点问题,从而提高课堂教学效率。主要针对机械制图空间三维实体的讲授问题
比较研究饲料中添加微生态制剂组合,对母猪发情配种、妊娠、分娩产仔、泌乳等繁殖性能,以及对哺乳仔猪、保育猪和生长育肥猪生长性能和健康状况的影响,为微生态制剂替代抗生
对于环境法的立法目的,一直以来有着"一元论"和"二元论"之争,不管是立法的一元目的还是二元目的,片面的强调某一方面都是不符合现时需要的,现行环境立法目的在社会追求单一的