并行众核集群模拟器的研究与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:yaer7201982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多核处理器取代单核处理器成为商业主流,但随着处理器小核数量的增多,多核处理器体系结构的发展遇到问题。物理设计的限制、可扩展性的要求以及功耗等因素催生了众核体系结构的诞生。众核体系结构的出现,为处理器设计研究人员带了新的方向,然而,这一体系结构的有效性仍然需要进行验证。   在研究体系结构的过程中,模拟器凭借其开发周期短、实现简单以及可以较好符合真实硬件设计等众多优点受到工业界和学术界的青睐。模拟器中有两个关键因素:精度和速度。一般而言,模拟器的这两个因素不能兼顾,在保证模拟精度的同时必然增加通信同步开销,导致模拟速度的降低,反之亦然。   本文针对中科院计算所自主产权的GAS串行众核模拟器平台(64个小核),提出了一种方法,通过互连网络,将16个GAS模拟器以集群的方式进行连接,并使用采用了PDES技术的SimK并行模拟框架将原串行模拟器并行化,使其可以充分发挥宿主机平台上多处理器的性能优势。本文的主要贡献有如下三点:   第一,实现了一个快速的、精确的集群模拟,能够模拟至千核的规模。在当今的学术界和工业界中,模拟器成为研究体系结构的重要工具,但模拟器始终面临着速度和精度两个方面如何平衡的问题。希望同时兼顾模拟器的速度和精度两个方面,是一个挑战。我们借助基于PDES机制开发的SimK并行模拟框架,将原有的串行模拟器并行起来,获得加速的同时也保证时钟精确的模拟。   第二,在众核集群模拟器中,实现了多线程和多进程两个版本,并对其进行了对比。基于GAS众核模拟器,我们将其并行化,使得GAS可以利用多核宿主机的性能优势,充分发挥其并行性,获得速度的提升;之后以并行的众核模拟器为基础,采用同样的方式,将众核模拟器以集群的形式组合起来,得到众核集群模拟器,在多线程下依然得到了加速。之后,为验证结构的可扩展性,我们还采用了多进程的方式进行模拟,为今后进行更大规模的模拟打下基础。   第三,在当今主流的并行编程环境中,选择了MPI+Pthread的混合编程环境,在众核集群模拟器上移植了MPI,使其可以运行MPI程序。在充分利用到众核集群特征的同时,实现更好的并行粒度,解决了由于内存、带宽及延迟限制造成的可扩展性不好的问题。
其他文献
直接体绘制是科学计算与可视化中用于显示三维数据场的一种重要方法,它为体数据场中的每个体素赋予一定的光学属性参数(如颜色、不透明度等),这一赋值过程称之为传递函数,并且通
描述逻辑是一种适合表示结构化数据的形式语言.通过将某种数据模型表示到描述逻辑,可以利用描述逻辑本身的推理机制对数据模型满足的各种性质进行推理,并为各种异构的数据模型
集成电路自发明以来,在摩尔定律作用下集成电路的设计也变得越来越复杂。为了让产品快速上市,获得更大的市场份额,基于标准单元的半定制设计方法成为了产品设计方法的首选。  
团簇结构的优化问题是一个NP问题,其主要难点在于局部极小值的个数随着原子个数的增加而呈指数增长,且局部极小值与全局最小值很接近,使算法容易陷入局部极值。其中,LJ问题和
随着海量数据时代的到来,能够有效的存储和处理大规模数据的平台受到越来越广泛的关注。这些平台大多利用了集群的分布式处理和节点的多核并行计算能力。其中以MapReduce编程
基于串联质谱技术的蛋白质鉴定已经成为蛋白质组学的主流技术,而数据库搜索已经成为鉴定串联质谱数据最常见的方法之一。目前已经有许多数据库搜索软件,如SEQUEST、Mascot和pFi
三维运动捕获技术目前已经成为运动数据获取的一项重要技术,准确有效的从三维运动捕获点集序列中重建人体运动是计算机视觉领域和虚拟现实领域富有挑战性的研究课题之一。光学
随着世界各国对海权和海洋资源的日益重视,长期、连续、实时的海洋数据采集技术成为学术界和工业界的研究热点。该技术可为海洋科学研究提供基础数据,预报海洋自然灾害;也可为
随着嵌入式技术和网络技术迅速发展,普适计算逐渐深入人们的生活,它们利用通信网络搜集普适环境中的服务,然后进行服务组合,同时管理环境上下文信息及其变更、负责控制和监督应用
普适打印,是将普适计算的思想引入打印服务,为移动终端用户提供“随时随地”的打印服务。为了实现普适打印,需要解决两个问题,第一是如何为用户随时随地发现可用的打印服务,第二是