高效能GPU微体系结构关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ydfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拥有强大运算能力和高能效的多核/众核处理器是提升高性能计算机系统性能的关键。本文探索一种新型众核处理器体系结构,使得其能够满足未来高性能的需求并兼顾高能效,从而能够应用于下一代E级超级计算机系统中。本文对众核处理器中一个最常用的处理器GPU进行了深入研究,取得的研究成果主要包括以下几个方面:1.提出了基于局部性保护和延迟隐藏的线程束调度方法。本章在现有的线程调度器基础之上,设计和实现了一个性能更优的调度器,它能够更好地维持数据局部性和隐藏长访存延迟。此方法在不同测试程序中能获得相对基准方法平均2.2%的性能提升,而总的硬件开销可以忽略。2.提出了一种基于指令PC(Program Counter)的cache内的数据局部性保护方法,用来保持数据局部性。本章对传统的LRU替换策略进行了改进,设计了一种基于PC信息的局部信息收集器。此外,还设计了一个与改进后的LRU单元协同的cache分配单元,来更好的分配cache块中的优先级,优化逐出策略。它可以在低硬件开销下得到超过基准方法平均5.0%的性能改善。3.本文提出了一种协同的cache管理和线程束调度方法。它利用cache收集的局部性信息来同时指导cache管理和线程束调度的过程。本文利用局部性信息收集器的信息,提出了两种线程束调度方法,一种是基于重用信息的线程束重排方法(CWLP),另一种是基于重用信息的线程束限流方法(CTLP)。CWLP能够获得相对最新调度方法平均4.8%的性能提升。CTLP方法能将平均的性能提升13.6%。
其他文献
工作不积极、不服从公司管理、违反公司规章制度,像这样的员工能开除吗?对于“解聘”这件事,还是有些地方要注意的。真旷工可解聘,乱认旷工算违法小宋是科技公司的软件工程师.201
【正】 1. 词类互换(conversion)是近代英语中常见的、继续发展的一种语言现象,它是一般语言学家和语法家们所经常接触到的老问题。在近代英语中同一个词可以不借助于任何构
<正>日本“满洲移民”乃是日本侵略中国的国策。日俄战争后, 日本帝国主义将其势力伸向了中国东北地区,控制了旅大和“满铁”附属地。如何巩固和扩大日本在华势力,防御俄国的
会议
云南省的县域经济虽然取得了一定程度的发展,但是与全国其他地区相比,发展差距依然悬殊,云南省的县域经济总体实力不高,经济发展缺乏活力。从数据统计来看,云南省县域经济生
目的探讨多层螺旋CT(MSCT)联合超声心动图诊断复杂性先心病的临床价值。方法回顾性分析我院收治的86例复杂性先心病患儿的临床资料。患儿均行MSCT、超声心动图检查。以手术病
通过文献资料法、问卷调查法、数据分析法,对广西科技师范学院体育学院2013级、2014级、2015级的学生进行调查,以此为例,研究高校体育学生职业技能的实践教学现状和存在问题,
会解题、会计算、会证明,不是数学学习的全部,数学理解要求学习者还要进一步反思为什么要这样做、怎样做,运用了什么样的思想方法等。课题从数学理解的内涵、价值,促进儿童数
全面推进依法治国是以习近平为总书记的党中央确定的重要战略部署。党的十八大召开以来,习近平围绕全面推进依法治国展开了系列论述,从战略定位上明确了法治是治国理政的基本
要想快速提高小学语文教学质量,就要有效利用创新教学手段,构建小学语文高效课堂。小学语文是基础学科,搞好小学语文教育对小学其他学科有着积极的促进作用,因此,我们有必要
唐代民间私社的活动比较普遍,除了以修寺、造像、诵经、设斋等奉事僧佛的社邑外,以营葬活动为主,兼及其他经济互助活动的社邑是唐代民间私社的主体.除社祭功能外,唐代民间私