循环分块相关论文
随着异构平台的兴起,高性能计算领域获得快速的发展。基于CPU+GPU的异构平台在以生物信息学、医学成像和计算流体力学等为代表的诸......
在许多通信应用程序中,例如信号和图像处理程序,大部分运行时间花费在了计算密集的循环嵌套中,多面体模型作为一种优化的程序表示......
伴随能在GPU上高效执行的应用类型的不断增加,原来作为专业化的图形加速器变得越来越通用化。作为科学计算的一种形式模板计算应用......
高级程序变换是提高程序性能的重要手段,很多涉及到优化参数的选择问题,如为循环分块选择适当的分块因子,由于优化参数搜索问题本......
本文对经典矩阵相乘A*B算法提出多种优化方法:根据局部性原理,提出对矩阵B进行转置;根据计算机缓存的大小与矩阵A与矩阵B的规模进......
循环分块技术可以提高Cache的命中率,而循环分块的规模是该技术的决定性因素。利用粒子群优化算法可以优化循环分块的规模,获取合适......
首先研究了LU循环分块算法,然后讨论了传统粒子群优化算法并针对用于循环分块方面的不足加以改进,最后把优化的粒子群优化算法用于......
提出了循环分块在MPI系统中的块分配方案--列组分配方案,并给出了在不同并行体系结构下依据列组分配方案计算块分配大小的算法。实验......
为了加快气溶胶光学厚度(AOD)反演计算速度,基于SYNTAM串行算法,提出了循环分块划分和聚合通信的策略,利用消息传递模型,在中国气......
当计算划分层迭代数目较大,或是循环体单次迭代工作量较大,但可用的并行线程数目较小时,传统的基于循环分块的流水粒度优化方法无......
具有病态规模的嵌套循环程序在进行循环分块时容易忽略分块因子对向量化的影响,导致非对齐数据访问,降低分块后循环代码的性能。提......
循环分块是一种提升程序局部性的循环变换技术.多面体模型中实现了简单的平行四边形分块,但这种分块形状无法有效进行分块之间的并......
高速缓冲存储器(Cache)是高性能计算机的重要部件。循环分块是一种提高Cache命中率的技术。循环分块的大小是决定循环分块效率的关键......
在深亚微米工艺下,通过持续增大芯片规模来提升计算能力,会导致芯片工作频率降低、功耗剧增、计算效率下降等问题。因此,利用3D集......
基于多面体模型的编译技术发展近30年,已经在多个开源编译器和商业编译器中得到了应用和实现与传统的编译优化模型相比,多面体模型具......
循环分块是一种广泛用于改善数据局部性和开发并行性的程序变换优化技术.主要分为2类:固定分块技术和参数化分块技术,系统地总结了......
多核架构已成为当今的主流,而大量传统的串行程序和遗留软件无法充分利用多核处理器的并行计算性能.人工改写这些遗留软件工作量繁重......
本文对经典矩阵相乘A*B算法提出多种优化方法:根据局部性原理,提出对矩阵B进行转置;根据计算机缓存的大小与矩阵A与矩阵B的规模进行嵌......