并行化编译相关论文
该文通过分析C程序中非局部跳转控制流的特点,提出了一个通过等价程序变换消除非局部跳转流的方法,并对该方法在不同情况下的正确......
该文在迭代空间变换的基础上,提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法.首先针对循环并行粒度的问......
人类对计算能力的需求永无止境,高性能计算水平逐渐成为世界强国竞相追逐的焦点。并行化编译作为高性能计算中不可或缺的一部分,能够......
随着多核处理器的发展,并行化编译技术,特别是循环体的并行化编译技术,越来越受到重视。TLS(Thread level speculation)编译,即猜......
数组私有化是并行化编译中的重要技术,该文针对现有数组私有化方法的不足, 分析了数组私有化的本质,提出了一个新的数组私有化方法......
针对开源编译器Open64存在MPI不能自动并行化的问题,对Open64中面向Cluster的MPI代码自动生成进行了研究。分析了MPI代码自动生成......
在分布式并行机上,数据布局的质量极大的影响着应用程序的执行性能.以往的研究一般将自动数据布局优化问题近似分解为数据对准优化......
<正>并行变换是并行化编译过程中的重要组成部分,它对源程序进行等价重构,使其获得更多并行机会。传统的并行变换技术主要侧重干循......
针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优......
针对多变量数组下标表达式之间的相关性不能有效测试的问题,提出了一个分解算法。运用该算法,在一定条件下可以将一个多变量的数组下......
本文给出的方法是对Anderson-Lam方法的改进和发展。本文方法在循环分布之后对程序进行DOALL循环的内移和分布变换,使得所有DOALL循环都位于最内层的紧嵌套......
提出了一种并行化编译中统一处理递归标量的通用方法。该方法将递归标量的处理转化差分方程(组)的求解。然后利用Z变换与反Z变换来求解......
对于已知n维距离向量矩阵的多重串行循环,过去的并行编译研究还缺乏寻找使循环外层并行化的幺模矩阵的可行算法,文章介绍了多重串行循......
本文提出一种面向分布存储器多机系统的并行化编译方法,针对分布存储并行系统的特点,作者采用的基本优化策略是,折衷并行性与数据引用......
提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法.该方法利用了给定二重循环的相关向量集的某些性质,将外......
数组归约的识别是提高并行化编译能力的有效方法,单模是开发程序并行性的重要手段。然而,由于归约语句间相关的特殊性,影响了单模变换......
针对应用自动单模变换的两大困难,如何自动 使多重不并行化的恰当的单模变换矩阵以及如何解决防碍模国计算的非常数归约相关距离,提......
数组私有化是并行化编译中的重要技术,该方针对现有数级私有化方法的不足,分析了数组私有化的本质,提出了一个数组私有方法:相关-覆盖方......
在计算机体系结构的发展过程中,并行结构的出现与不断发展将高性能计算机系统的峰值速度一次又一次推向新的高峰。但与硬件的峰值......
高性能计算机的广泛应用使得人们对高效并行软件的需求急剧增加。面对庞大、复杂且对时效性要求极高的计算任务,如何充分利用高性能......
当今世界上主流的高性能计算机系统大多提供了丰富的并行机制,其中分布存储结构、共享存储结构及SIMD短向量功能部件等可支持不同级......
数据和计算分解是并行化的基础,对应的数据分布和计算划分是并行化编译的重要组成部分。自动数据分布需要同时考虑程序的并行性、......