【摘 要】
:
为了让CPU更快,人们设计的CPU变得越来越复杂且不规整,如增加乱序执行单元、超流水线、分支预测和投机等等技术;不幸的是,这些技术已经基本没有潜力可挖掘,而且也无法很好的控
【出 处】
:
浙江大学计算机科学与技术学院 浙江大学
论文部分内容阅读
为了让CPU更快,人们设计的CPU变得越来越复杂且不规整,如增加乱序执行单元、超流水线、分支预测和投机等等技术;不幸的是,这些技术已经基本没有潜力可挖掘,而且也无法很好的控制功耗。至少在近几年摩尔定律始终还在起作用,如何来利用单位面积上不断增加的晶体管呢?现在的一个主要技术是在片上设计更多的相对简单的核(众核)来取代较少的相对复杂的核(多核)。另一方面,当前的主流应用程序基本上是单线程的,或者是不能很好地扩展的多线程程序。这意味着这些应用程序并不能有效地利用额外的核,因为他们并不含有很多的并行来扩展。所以,与复杂的大核比较,他们基本上只能在简单的小核上较慢的运行。基于这些原因,研究者从两方面提出了很多方案来解决这个问题:一方面是通过编译技术的支持来创建更小单元的线程单元,如OpenMP技术、投机线程和软件流水等;另一方面是通过体系结构的支持,如事务cache、核融合(core fusion)和复杂的指令级分发器(多核的指令级平行挖掘)等。本文在调研了多核、众核的体系架构和在编译技术支持的并行技术上,提出了一种基于分段的块级硬件调度众核体系结构。本技术的两个主要特征是:一是编译支持的基于块的硬件并行调度器,能减少线程负荷和线程池的软件调度开销,主从结构设计使处理单元间的协作通信更有效;二是十分适用于众核架构,对众核本身的小而多的核可以很好的扩展与共享,即核组内紧耦合、核组间松耦合共享的众核特性,且对各种并行技术都得以有效挖掘和扩展。通过实验验证在三方面表现了本架构的优缺点,第一是与OpenMP比较在执行性能上的改进,在开销上的对比分析;第二是一些基准测试程序的加速比和芯片的使用率情况;第三是分析在众核结构上的资源可共享性和可扩展性上的优势,以展望众核技术的发展。
其他文献
伴随着数据规模的急剧增长,集中式数据库在存储和计算等方面的局限性日趋显著,数据管理向分布式发展已成为趋势。为了对目前广泛应用的MySQL、PostGreSQL等开源数据库提供分
随着计算机技术、数字图像处理技术以及微电子技术的飞速发展,以FPGA为核心的图像处理系统已被广泛的应用在各个领域当中。本文以FPGA作为平台对视觉计算中的印刷体数字识别
随着高等教育的不断发展,高校数字化校园已经发展成为学院重要的组成部分,在现阶段高校数字化校园中,信息资源是最重要的资源,能否拥有及时、准确、全面的信息已经成为衡量一
Web服务作为新一代基础平台技术,已经得到了广泛的研究和应用。它一改传统的面向过程、面向对象和面向构件的软件开发方式,逐渐成为网络分布计算、互操作和协作领域新的里程
互联网时代,web中的文本数量和访问这些文档的人数一直在海量增加,对这些数量巨大的文本信息,人们要想找出一些相关主题的内容,仅靠人工的分类方法已经不能符合实际需要了。
随着信息技术的不断发展,信息推送技术成为了即时发布和获取信息的一种重要方式。它不同于传统的信息拉取方式,能够将信息主动实时推送给用户,满足人们及时获取有用信息的需
随着移动终端和地理位置服务的普及,互联网用户的位置信息更容易被获得和积累。分析潜藏在大量用户数据中的区域信息能使企业更好地实现资源管理、人员分配和服务站点建设,减
随着信息社会的发展,互联网上的信息飞速的增长并开始呈现出复杂性和多样性。这时传统的基于关键字的信息检索技术再也不能满足人们的信息查询需求。其问题主要表现在,传统的
随着数据挖掘技术的发展,人们尝试将该技术运用于Web,形成了Web挖掘技术,Web使用挖掘就是其中一个重要的分支。Web使用挖掘通过对Web日志的分析,获取Web上隐藏的用户感兴趣的
图像分割在图像处理领域中是一种基本且重要的技术,也是进行目标识别和图像分析的前提和关键,其结果的好坏对后续的识别和分析过程有很大的影响。图像分割被广泛应用在人脸识