Intel Bensley平台FSB竞争对高性能计算程序性能影响分析

来源 :南京大学 | 被引量 : 0次 | 上传用户：by_huang

【摘要】

：

并行计算机体系结构的一个发展趋势是SM P(Symmetric Multiprocessor)集群系统。它们是由拥有多个处理器的SMP节点和连接各节点间的快速网络构成的多级体系结构。SMP集群系统

【作者】

：

毛晓炜

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2008年期

【关键词】

：

Intel Bensley平台 SMP节点集群系统并行编程工具高性能计算程序性能

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

并行计算机体系结构的一个发展趋势是SM P(Symmetric Multiprocessor)集群系统。它们是由拥有多个处理器的SMP节点和连接各节点间的快速网络构成的多级体系结构。SMP集群系统因其良好的性价比、卓越的可扩展性与可用性，逐渐成为当前高性能计算机领域的主流结构。在单个SMP节点中，总线和内存带宽是否满足CPU的需求对于访存密集型应用的性能影响很大。　　 Intel Bensley平台目前广泛应用在高性能计算SMP节点，其独有的双独立FSB(Front-sideBus，前端总线)架构在某种意义上解决了部分原先单共享总线架构在前端总线上的性能瓶颈。不过随着多核技术的发展，在最新的Bensley双路四核Clovertown平台上，其双独立FSB架构同样成为访存密集型应用的性能瓶颈。　　 MPI(Message Passing Interface)是目前最重要的一种基于消息传递的并行编程工具，它具有可移植性好、功能强大、效率高等优点，被并行计算机界广泛地接受。MPI目前已经在Windows操作系统的PC机上、UNIX系统的工作站以及并行机上得到实现。　　本文的主要研究工作有：　　 1.分析FSB事件流水线执行方式，并结合访存密集型高性能计算MPI应用的特点，研究访存密集型高性能计算MPI应用运行时的FSB特性。　　 2.针对Intel Bensley双路四核平台特性，给出了FSB竞争对访存密集型高性能计算MPI程序性能影响的计算模型。为了建立这个性能影响模型，我们引入了一个叫做性能降幅(Speeddown)的变量来描述由于FSB竞争导致的程序性能的影响。一般来说，一个复杂的高性能计算MPI程序可以分割成若干个基本块，其中每个基本块内部在运行时对FSB有持续均衡的压力。　　 2.1.以基本块作为突破口，通过分析FSB压力和程序读写内存次数的关系，研究单一基本块程序绑定在核心0上时的地址总线压力和数据总线压力，推导出当创建2/4/8个基本块程序并绑定在特定数量核心上，由于FSB竞争导致的程序性能降幅。　　 2.2.对于复杂访存密集型高性能计算MPI程序，我们主要集中讨论其计算部分时间由于FSB竞争导致的性能影响。因为计算部分时间可以分成并行和串行两部分，借助Amdahl定律和先前推导的单一基本块的结果，分别对其并行和串行部分分析性能降幅。然后介绍一种方式将两者合并形成最终的性能影响的计算模型。　　 2.3.通过编写MPI例程验证单一基本块程序的性能影响模型，实验结果与预期高度吻合。同时，利用NPB(NAS Parallel Benchmark)基准测试的其中五项(BT，EP，IS，LU和MG)作为高性能计算实例来验证访存密集型MPI应用由于FSB竞争带来的性能影响模型。实验结果同样符合我们的预期。

其他文献

计算可枚举度中的嵌入研究

可计算性理论产生于对算法概念的数学研究，主要研究目标是可计算性对象的计算复杂性和不可计算对象的数学结构。本文研究了计算可枚举图灵度中的嵌入扩充的一个问题，证明了对任

学位

计算可枚举度嵌入扩充嵌入非扩充代数结构

大气效果实时绘制加速算法的研究

以地球为中心的空间环境仿真系统中，大气效果的实时绘制对于系统的视觉效果以及仿真结果的真实性都起到重要作用。　　大气散射是引起各种大气效果的主要原因，对其模拟是大气

学位

大气效果实时绘制大气散射模型双重查询表自适应多分辨率控制

基于资源类型的网格资源发现机制研究

本文在对现有网格资源发现方法进行分析的基础上，进一步结合了集中式与非集中式网格资源发现方法的优点，给出了一种具有较高资源发现性能的非集中式网格资源发现方发—树型网格

学位

网格资源发现对等网负载均衡资源类型

空间邻近问题的异步并行算法研究及实现

本论文依托课题组承担的空间信息服务系统预研项目，进行空间计算基本算法的并行化研究。重点研究了空间邻近问题中的“所有最近邻居问题”和“Delaunay三角剖分问题”，设计并实

学位

空间邻近异步并行算法远邻关系近邻算法多核体系结构

并行最优路径算法及K优路径算法研究

最优路径问题是计算机科学、运筹学、工程设计等领域众多问题的基础。它的应用十分广泛，涉及网络路由、电路设计、交通运输、机器人运动规划、事务调度中关键路径的计算以及VL

学位

网络路径最优路径并行算法网络划分

面向农业信息服务平台的挖掘技术研究

随着计算机网络技术和信息技术的迅速发展,人们生产和搜集数据的能力得到了大幅度提高,同时也推动了数据库技术的极大发展。如何从海量的数据中提取有用的信息和知识为人类服

学位

数据挖掘聚类分析向量空间模型关键词参照库

基于半马尔科夫条件随机场的命名体识别及其关系抽取研究

随着互联网和电子化办公的发展，出现了大量的文本资源。信息抽取技术可以帮助人们快速获取大规模文本中的有用信息。命名体识别与关系抽取是信息抽取的两个基本任务。本文在调

学位

中文命名体识别实体关系抽取信息抽取半马尔科夫条件随机场

网络测量技术研究与系统实现

近年来，计算机网络迅速发展，各种网络应用层出不穷，各种网络性能面临挑战。对网络流量进行识别和分类，对网络性能进行测量和分析，已成为计算机网络的一个新兴课题。网络测量能够了

学位

计算机网络网络测量系统流量测量性能测量

基于NUTCH的新闻服务系统的研究

据调查显示，新闻阅读是人们上网的一个重要目的，然而众多的新闻网站使得人们难以选择浏览自己感兴趣的新闻。新闻服务系统在很大的程度上解决了这个问题，但是这些商业新闻系统的

学位

新闻服务系统开源搜索引擎插件系统新闻主题内容提取新闻协同推荐

基于策略的Web应用服务器安全授权系统的设计与实现

随着我国经济的发展，信息技术得到广泛应用，很多网络应用开发者在开发应用时面临着复杂的安全需求。基于J2EE规范的安全中间件为应用提供了基于角色的访问控制服务，但是这种机制

学位

Web应用服务器安全授权访问控制安全策略

Intel Bensley平台FSB竞争对高性能计算程序性能影响分析

与本文相关的学术论文