以数据为中心的多核处理器软硬件协同优化关键技术研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:liongliong421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未来的超大规模计算系统设计面临着两个很重要的挑战:能效性和以数据为中心的应用负载。片上多核处理器作为构成未来超大规模计算系统的基础之一,其设计和应用也需要向“低功耗高能效”和“以数据为中心“的需求转变。本文采用”以数据为中心“的设计思想,从片上多核处理器设计和应用的多个层面出发,使用软硬件协同优化设计的方法,以应用驱动设计,来提高片上多核处理器的能效性、并行扩展性和对不同应用的适应性。具体而言,在处理器内核层面,针对目标应用从计算和数据两个方面进行定制化设计和软硬件协同优化;在片上多核处理器多核互连层面,实现了硬件支持的片上消息传递机制;在片上多核处理器并行编程模式层面,针对不规则应用提出一种“计算趋近数据”的计算模式,提高了不规则应用在片上多核处理器上的计算性能和并行扩展性,并降低了功耗;最后,在多线程调度层面,提出了“以数据为中心”的推测多线程调度机制。本文的主要创新点包括:1.针对Stencil计算,采用将常规的软硬件优化手段跟基于目标应用定制设计相结合的思路,从一个简单可定制核开始,构建了一个低功耗高能效的处理内核。设计中使用了一系列软硬件结合的优化方法,提高了计算并行性和数据传输效率,减少了数据传输。2.针对片上多核处理器的片上消息传输机制设计了专门的消息引擎负责片上消息传递,并完成了消息引擎RTL级的实现。本文从减少数据无效复制、提高大消息传输效率、降低复杂通信开销三个方面对片上多核处理器的片上消息传输机制进行了优化。3.针对不规则应用在片上多核处理器上的执行瓶颈和挑战,提出In Place计算模式,实现计算向数据的趋近。通过减少数据在片上的移动,提高了处理器的执行效率;通过“划分”和“代理”机制避免了对不规则数据的竞争访问;通过构建“核间流水”提高了并行度和对带宽的利用。对于典型不规则应用在片上多核处理器上的执行,In Place模式提高了性能和并行扩展性,并降低了功耗。4.针对片上多核处理器单线程性能弱的问题,在片上多核处理器上实现了“兼容性”的推测多线程机制,能够利用片上空闲资源提升单线程能力。针对线程数据在片上多核处理器片上的不均匀分布,提出了“以数据为中心”的推测多线程调度机制,有效地提升了推测多线程机制在片上多核处理器上的执行效能。
其他文献
忆阻器在新型非挥发性存储器、逻辑电路、神经网络等很多领域有广泛的应用前景。器件的成功商业化,很大程度上得益于对它的内在机理有一个比较深刻的理解。对忆阻器的机制的
<正>医学禁忌是医学理论、临床与社会生活禁忌的结合,是医学本身理念的体现,同时也受到社会和文化的影响。自汉代张仲景以来,历代医家对黄疸病患应当注意的饮食、用药和生活
主要介绍了兰州石化60万t/a连续重整装置降低重整反应氢油比工业试验,经过3个多月的运行,试验结果表,明重整进料在60 t/h时,反应氢油比从2.78mol/mol降低至2.09mol/mol后,产
金属有机配位聚合物作为一类新型的有机-无机复合材料,由于具有高的比表面,尺寸可调控,易功能化等特点,进而在催化、气体存储、生物传感、光学和磁性等领域有着潜在的应用,已
从上世纪40年代开始,社会信息化进程飞速前进,传统的无机电子器件面临新的挑战,新兴的有机电子学得到了迅猛发展。作为一种新型的半导体器件,有机光电耦合器件(OOC)具有良好
视频点播系统中的流媒体播放服务是近年来最热门的互联网服务之一。这类服务通常建立在大规模服务器集群上,以保障对大量用户需求的及时响应。在传统的自建型数据中心中,对流
基于光纤的时频同步技术具有同步精度高、可靠性强的优势,在高精度时钟比对、射电干涉测量、深空探测等领域发挥着日趋重要的作用。本论文回顾了时频传输与同步的发展历程,针
综述了高脂血症的病因病机 ,认为饮食不节、脾虚湿困、心脾两虚、情志所伤、肾气虚衰、痰瘀阻络皆可导致机体的功能减弱或失调 ,致膏脂的代谢紊乱 ,发生高脂血症。
通过普通钢筋混凝土框架结构、钢筋混凝土框架-剪力墙结构和钢支撑-混凝土框架结构在高烈度地区的对比试算,研究了3种结构体系在多地震作用下的受力特征和在罕遇地震作用下的