并行程序的指令级并行优化探讨

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:whitejet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  尽管高性能计算机性能提升越来越快,但由于其体系结构的复杂性和微处理器的复杂性,并行应用程序普遍存在性能问题,许多实际应用的持续性能通常只能达到机器峰值性能的5~10%,因而并行应用性能优化一直是高性能计算领域关注的焦点之一。本文主要从如何提高并行程序的单任务执行效率角度进行并行程序优化的探讨,以基于JASMIN 框架实现的Euler 为例,探讨并行程序在Xeon 微处理器平台上的具体性能问题和指令级性能优化方法,并完成了Euler 程序的优化。优化后程序中的核心模块gas1dapproxy 执行时间缩短了一半以上,总运行时间减少了21~34%。性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进。
其他文献
  生物序列比对是生物信息学领域重要的研究工具,主要用于确定序列的生物属性。由于该领域应用的广泛性、计算的复杂性以及海量数据特征,对计算机性能提出越来越高的高求,迫切
面对国外大型金融集团的纷纷涌入,我国保险公司要想在越来越激烈的市场竞争中取胜,需积极调整经营战略,金融集团模式,即金融控股公司作为一种已经受住考验的成功的金融企业组
  虽然云计算在科学计算和互联网应用上已经取得了很大的收益,但是由于规模庞大,不论是其拥者还是用户都将节省开销作为首要目标。然而,相关工作大多只考虑了拥有者的运营开销
  本文提出了一种SSD内部多通道之间的写操作调度策略.该策略记录每个通道的数据写入量,每次数据刷新选择数据写入量最小的通道.DRAM被划分为两部分,分别作为读缓存和写缓存,
随着国际间航海事业的发展,海上运输以运输量大、方便、运费低廉的优点已成为国际运输的主要方式。繁忙的海上运输,载货客量大、航程远、沿途寄港多、人员来往频繁,因而带来
游泳是一项很好的体育运动,不仅能增强体质,而且可以锻炼意志,对于身心健康是有益的。因此,每到夏季,人们成群结队地到天然水域或人工游泳池,进行游泳锻炼。但是,相对地医院
  提出一种面向大规模同时多线程处理器可扩展高速缓存的动态划分方法.将文献所提的机制扩展到多体高速缓存中.线程的内存访问特征变化迅速,因此在运行时收集同时多线程的缺
  目前GPU已经成为提高算法性能的一个重要途径,OpenCL 是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU 或其他类型的多核/众核处理器组成.本文主要介绍基于OpenC
  身份认证技术作为信息安全门户之一,对于提高网络通信安全性具有重要意义。传统身份认证技术在通信过程中会直接或间接地传输用户相关的机密信息,由于认证系统本身存在漏洞
  可扩展性和短直径是设计大规模并行计算机系统互连网络的两个重要因素。基于Octagon 拓扑结构的短直径和Torus 拓扑结构的可扩展性,提出了一种新的互连网络拓扑结构,称为Oc