反馈指导的流水计算性能调优

来源 :中国科学院计算技术研究所 | 被引量 : 4次 | 上传用户:liangchq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显式并行语言和自动并行化编译是高性能计算平台上并行软件开发的主要途径。无论哪种程序设计模式,编译器的一个重要工作就是充分发掘和优化程序中的并行性。并行语言的优化编译器,对用户显式指出的并行性进行优化;自动并行化编译工具,则自动挖掘串行应用程序隐藏的并行性,简化了并行软件的开发,并解决了遗产代码的可重用问题。计算平台的复杂性和多样性以及应用程序中动态特性的增加,使得目前的并行优化效果不是很理想,平台的适应性是我们要着力解决的问题。分布式存储体系上的应用,其性能受底层通信系统的影响尤为明显。并行程序性能优化是一项必不可少的工作,但是,手工的性能调优烦琐且冗长;优化策略的选择或关键参数的确定跟程序行为、计算平台等都密切相关;反馈指导的适应性编译,通过获取面向目标平台的程序动态信息,实现对于程序的自动的性能调优。本文从一个特定优化出发——把反馈编译应用于流水计算的性能调优,探索了适应性优化的技术可行性问题。流水计算是获得科学计算中常出现的DOACROSS循环的并行性的优化技术之一,流水粒度是获取良好性能的关键。对于流水计算的性能调优,本文的主要贡献:1)比较了不同通信方式对流水计算的执行性能的影响,建立了一个基于非阻塞发送/阻塞接收通信模式的一维流水性能代价模型,从流水分块的执行特性推导整个流水循环套的执行时间,动态刻画流水计算的执行过程。2)提出并实现了以反馈指导方式进行的流水性能调优的框架,该框架结合静态估算方式和运行时优化的优点。利用典型分块收集程序片段的运行时信息,准确度较高。我们着重初始分块、临界分块的选择策略,这对有效减少插桩运行的开销问题是非常重要的。在不同计算平台的对NAS的NPB1.0中三个准应用级程序的测试数据表明,本文提出的适应性优化框架,具有好的平台适应性,能获得较好的流水并行性能,也同时证明流水并行的代价模型具有相当的准确性。
其他文献
随着现代工业技术的不断发展,机械设备运行周期越来越长,速度也不断变快,人民对于其安全性的要求也不断提高,为此,一种能够实时地检测出机械设备健康状况的方法就显得十分有必要。
目前,以SMP服务器作为结点的机群系统被普遍采用。由于单个结点上多个CPU的使用,机群对结点间的通信带宽提出更高的要求。虽然目前的高性能通信网络得到迅速的发展,但因受物
本文主要研究了设计模式组合技术及其使用,提出了采用UML及其扩展机制表示的用于支持设计模式组合方法的三个模型:模式级模型、带接口的模式级模型和细化的模式级模型,
随着人们对地理信息需求的不断增长和网络技术的飞速发展,GIS技术与网络技术相互融和形成了网格GIS技术。虽然目前网格GIS技术已越来越多地应用于各个领域,但国内农业灌区领
关联规则挖掘首要解决的是效率与伸缩性问题。由于数据挖掘任务所面对的数据集通常是由数以百万计的记录所构成的大型数据库或数据仓库,因此如何提高从大型数据库中挖掘关联
本文从以下几个方面进行了研究:1.汉英双语句对短语结构对齐的研究。利用词对齐、句法分析的结果进行短语结构对齐。研究了两种不同的结构对齐方法:第一种方法只对
本文主要目的是研究适合于交互式语音应答系统的关键词识别技术.研究内容主要包括:1.基于连续隐马尔可夫模型(CHMM)框架下关键词识别声学模型的建立.要想设计一个好的关键词
视频通信存在两大问题,一是网络异构性,二是传输的可靠性。在视频编码方面,分层编码用来解决网络传输异构性问题,多描述编码是解决传输可靠性的有效手段,而多描述分层编码则
本文针对XML数据的"内容相关性",给出了一个基于此的存储策略,同时研究了该存储策略上的相关数据操作.XML数据元素不仅具有层次关系,数据元素之间及数据元素与路径之间同样存
本文的主要内容就是纸币清分机软件系统的研究与实现,包括清分程序与控制程序两个主要部分.由于纸币清分机本身对于速度有较高的要求,文中在很多方面都采用了特殊的处理方法